从AIGC 的飞轮效应,到伟大的商业模式——对话丁磊
导语
AI 思维的底层逻辑——其基础在于数据,核心在于模型,实现在于算力,具体应用在于业务场景。
数据、模型、业务形成飞轮效应
图片来源:DeepMind官方网站
《复旦金融评论》:ChatGPT 等人工智能机器人通过交互界面走进大众视野。而实际上人工智能的概念早在1956 年达特茅斯会议就诞生了,当下人工智能所用的算法也是 20 世纪五六十年代就有的。为什么发展和应用了这么多年的决策式 AI 没有像生成式 AI(或 AIGC)一样引发这么大的轰动效应呢?
丁磊:作为一名从事模型相关工作近 20 年的人,我认为有必要先简要介绍一下什么是模型。模型是人工智能通过从数据中不断学习和总结得出的一种类似于人脑的思考方式,可以将其理解为知识和逻辑的数字化载体。与存储数据或信息的数据库不同,模型更接近人类的思维过程,通过分析和推理来完成各种任务。
人工智能发展了这么长时间,最近才引起了更大的公众层面关注,可能是因为现在的模型发展到了一个新的阶段。现在的这些大模型,如 GPT-4,已经初步具备了成年人的通识和逻辑能力,我们可以利用这些模型研发大量的相关应用。从这一角度来说,人工智能对人类社会的生产和工作具有重大意义。
《复旦金融评论》:在 2020 年的专著《AI 思维》和最近的这本《生成式人工智能》中,您提到目前可以观察到的人工智能应用只是人工智能领域的冰山一角,那么您认为冰山的内核是什么呢?
丁磊:2020 年《AI 思维》这本书更多关注的是决策式 AI,而我们现在新的大模型主要是生成式 AI。这两者可以看作人工智能的两个主要分支。无论是哪种人工智能,我认为其内核都是 AI 模型驱动的运营模式。换句话说,人工智能的内核是基于数据、模型、业务三者的相互作用所形成的飞轮效应。
也就是说,随着数据的不断积累和模型的持续训练,模型的智能程度不断提高,进而在业务中产生更大的价值。在业务的运行过程中,又会积累更多的数据来训练模型,从而数据、模型、业务之间形成了一种正反馈的飞轮效应。就像是一个飞轮不停地转动,数据越来越多、模型越来越聪明,业务所带来的价值也会越来越大。
因此,基于这种飞轮效应可以构建出伟大的商业模式。例如,亚马逊、天猫的推荐引擎可以有效促进消费者的购买行为;字节跳动捕捉到目标受众的需求和兴趣的能力越来越强,抖音推荐的内容越来越精准,让人 “上瘾”;自动驾驶通过数据的自学习反馈变得越来越智能,可以实现无人员干预的驾驶;当前非常流行的图片生成工具,如 Midjourney,虽然其团队规模很小,但却通过数据和模型的正反馈效应,使其生成的图片越来越符合人类需求。
《复旦金融评论》:您能不能给我们再解释一下,为什么到了生成式人工智能这样兴起的一个阶段,会有这样的一个正反馈效应?随着生成式人工智能的兴起,人工智能领域是否会加速发展?
丁磊:飞轮效应并不仅限于决策式 AI 或生成式 AI。实际上,它是人工智能的一种本质学习属性,可能带来正反馈机制。但要实现这种效应,须建立完整的数据、模型、业务闭环,否则效应难以实现。
展开来说,决策式 AI 更像是在做选择题,分类是它的强项。人脸识别就是一个典型的案例,决策式 AI 对实时获取的人脸图像进行特征信息提取,再与人脸库中的特征数据匹配,从而实现人脸识别。当然,现在人脸识别模型的基数是非常大的,动辄处理成百万、上千万的人脸数据,并进行相应的识别。
生成式 AI 则擅长做简答题,以创作为长处。我们所说的生成式 AI,其核心在于生成内容。而“内容”是一个相当广义的概念,不仅仅指常见的文本、图片、视频、音乐等形式,还包括日常工作中所涉及的方案、策划、程序、代码。在人工智能的发展过程中,无论是决策式 AI 还是生成式 AI 都需要飞轮效应的推动。
那么,为什么决策式 AI 之前没有受到太多关注呢?作为从事 AI 相关研究并在企业中开发应用的人员,我发现决策式 AI 一直以来的特点是难以呈现的。比如,我之前在 PayPal、百度金融使用决策式 AI 来优化业务,这种优化很难被可视化展示出来。这也在一定程度上解释了为什么决策式 AI 之前没有引起更多的关注,除非在一些相对细分的领域,如自动驾驶。决策式 AI 应用通常属于企业后端,可以说是企业的决策大脑,这些领域吸引了大量的研究,因为它们具有成熟且实体的产品。但普通消费者可能无法很好地理解或看到。
相比之下, 生成式 AI 则可以让人们看到它生成的内容。例如,ChatGPT 等生成式 AI 可以让用户与之简单交互,这也是生成式 AI 能够吸引更多人的原因之一。
《复旦金融评论》:未来对于算力的竞争是否会成为各个国家和地区以及平台之间竞争的关键?
丁磊:要训练出真正功能强大的人工智能,除了处理算力这一重要的资源,还需要数据、模型和业务模式。只有当这四个要素相互促进形成闭环的时候,才能真正训练好人工智能。这是一个复杂的过程,仅仅依靠算力和训练数据的投入是不够的。
AGI 有多远
《复旦金融评论》:GPT-4 之后的生成式 AI 模型已经发展到跨模态的阶段。您之前在 2020 年出版的《AI 思维》一书中描述当时的人工智能还处于“弱人工智能”的阶段,您觉得目前到了什么阶段?如果我们要迎接 AGI(通用人工智能)还需要多久?
丁磊:ChatGPT 的“横空出世”让普罗大众对人工智能的突破有了新的认识。目前的自然语言处理技术和大型语言模型确实展现出了一些 AGI 的影子,但我认为距离真正的 AGI 还很远。因为 ChatGPT 等模型虽然已经具有智能对话、语言翻译、文本生成等使用功能,但它们仍然缺乏某些关键的特征和能力,如跨模态感知、多任务协作,以及自我学习与适应、情感理解、超级计算能力等。
第一,跨模态感知。我们将平时接触到的每一个信息来源域称为一个模态,这些来源可以是文字、声音、图像、味觉、触觉等。随着信息技术和传感器技术的发展,模态的范畴也变得更广。跨模态感知涉及两个或多个感官的信息交互,如最基本的图像检索就是一种从文本到图像的感官转换。反过来,从图像到语言的转换,可以帮助有视觉感官缺陷的人们,强化感知环境的能力。人类天然具有跨模态感知能力,能够对来自多种感官的信息进行整合和理解。当前,绝大部分的人工智能系统只能单独地运用其中的一项作为传感器来感知世界,对于不同的模态,需要设计不同的专有模型。例如,根据文本生成图像的模型,采用的是将文本和图像进行联合编码的专有模型,这种模型无法适配声音生成等其他任务。各种模型之间无法真正打通是走向 AGI 的一大痛点。
第二,多任务协作。人类能够同时处理多个任务,并在不同任务之间进行协调与转换。当人们面对机器人时,一句简单的吩咐,比如“请帮我热一下午餐”,这些指令听上去简单,执行时却包括了理解指令、分解任务、规划行走路线、识别物体等一系列动作,针对每一个细分的动作都有专门的系统或模型的设计。这就要求机器人具备多任务协作的能力。
第三,自我学习与适应。人类具有学习和适应能力,能够通过不断学习和经验积累来提高自己的能力。因此,研究如何让人工智能系统具备自我学习和适应能力也是实现 AGI 的必要步骤。其中主要包括增量学习、迁移学习和领域自适应三个方向。
《复旦金融评论》:相对于人类的思维方式,人工智能的局限性以及其认知背后的逻辑是什么呢?
丁磊:人工智能模仿的是人脑,但又不同于人脑。人类侧重于从经验中学习,而人工智能则依靠模型从数据中学习。
那么,人工智能的天然优势是什么呢?首先,其优势在于拥有强大的算力支持,使它的学习能力没有上限。研究表明,即使是勤奋的人每天最多也只能接受 2 兆容量的信息。此外,人工智能的学习速度非常快,只要有充分的数据和足够的算力,它就可以在短时间内学习接近无限量的数据。其次,人工智能善于掌握“有迹可循”的规律,快速处理规律性强的任务。
人类的优势是社交智慧、创造力、精细感知和操作能力。社交智慧是人与人交互的技能,包括同理心、谈判能力、社交洞察力等情感能力,对应的职业主要是教师、销售、心理咨询师、管理人员、社工等;创造力指的是原创能力和艺术审美能力,对应的职业主要是艺术家、作家、研发工程师等;精细感知和操作能力指的是手指灵敏度、协调操作能力和应付复杂工作环境的能力,包括专业能力、行业经验、工作效率、完成效果等,对应的职业主要是律师、医生、司机、美发师、急救人员、电工等。
因此,人工智能在处理不面对人、创新性和变通性较低的工作时,效率更高、稳定性更好,而面对需要情感交互、相对复杂场景或者需要创新性高的工作时,就表现得不那么令人满意了。
《复旦金融评论》:超级人工智能是否会对人类社会造成威胁?在 2023 年 4 月,马斯克等人曾发表联名声明,呼吁暂停比 GPT-4 更强大的模型的训练。您认为背后的原因是什么?
丁磊:人工智能和其他技术一样,本身是中性的,其风险取决于人们如何使用它。我们应始终秉持“科技向善”的理念,并从法律和伦理角度引导人工智能朝着这个方向发展。要保证模型朝着科技向善的方向发展,就需要在模型训练时,注意训练所需要的数据“原料”要更广泛、更全面;在算法方面,要贯彻公平正义、透明可验证的原则。
当然,法律不应成为限制技术进步的桎梏。法律的推进虽然往往滞后于科技发展的速度,但仍应积极做出回应,正如中国国家互联网信息办公室起草的《生成式人工智能服务管理办法(征求意见稿)》,即将立法审议,旨在促进生成式人工智能技术健康发展和规范应用,进一步促进科技进步,确保“科技向善”,助力行业发展,实现产业升级。
《复旦金融评论》: 美国当地时间 2023 年 5 月 16日,美国参议院首次就人工智能的隐私、技术和法律问题举行听证会。人工智能领军者 OpenAI 呼吁政府介入监管,发布实施“注册制”或“许可制”。中国在这方面可以做一些借鉴吗?
丁磊:我认为这肯定是个方向,不仅仅在国家层面,像抖音这样的大型平台也在生成式 AI 领域出台了一些指引性办法。它要求当生成式 AI 为创作者时,必须注明这是由算法生成的作品,并打上相应的数据标签,以便清楚地表明这是由算法生成的,而不是人类创作的。因此,无论在国家层面还是平台层面,都应有相应的规定来引导人工智能向更健康、更良性的方向发展,最终实现“科技向善”的目标。
替代业务流程,重塑商业模式
图片来源:Unsplash官方网站
《复旦金融评论》:如果以 2022 年 ChatGPT 引爆生成式人工智能为起点,2023 年初中外各类科技公司都纷纷发布了自研的模型和插件,进入“百模大战”的阶段,而目前的关注度逐渐转移到应用方面。您是否能给我们介绍一下生成式 AI 从模型侧向应用侧转移的基本情况?
丁磊:从短期来看,我认为生成式 AI 的商业价值是提升效率。其实,如今已经有不少中小企业开始使用生成式 AI,比较显而易见的是通过生成式 AI 工具来提高图片和文案创作的效率。在这个过程中,如果一家企业能够快速地使用 AI,就能够跑赢竞争对手。换言之,一家企业能否很好地利用生成式 AI,将标志着这家企业是否能在千变万化的市场中站稳脚跟、持续保持足够的竞争力。
从中长期来看,生成式 AI 的出现很可能改变现有的业务模式。具体来说,传统行业中的各个职能领域,如研发、生产、供应链、营销和客服等各环节,在生成式 AI 的支持下重塑相应的业务流程,甚至是重构业务模式。这意味着我们可以使用生成式 AI 的程序来替代之前需要人工完成的任务,从而提高业务流程的效率和质量,促进业务的发展和进步。
另外,生成式 AI 的涌现可能会掀起新的商业模式浪潮。举个简单的例子,现在许多时尚达人和主播已经被数字人所取代。数字人主播可以 24 小时在线,不间断地为客户提供货品推荐介绍及在线服务,由其打造出的 IP 资产也是品牌自身的资源。同时,数字人主播不受人为情绪、健康等影响,更加稳定和可靠。在我看来,这将为生成式 AI 产业带来长远的价值。
《复旦金融评论》:您之前在 PayPal 创立了人工智能平台,也曾经在百度金融担任首席数据科学家,您能否结合多年深厚的经历,为我们分享大数据、人工智能等技术的应用对于金融领域有怎样深刻的影响,比如在营销、风控、投顾、投研等方面的实际应用是否有效可行?行业的发展已经到了什么阶段?
丁磊:我可以分享一下过去一些我自己实际操盘过的案例。
之前在 PayPal 工作的时候,PayPal 作为一个硅谷公司,拥有丰富的数据资源,但是在应用人工智能方面并不是很早。这是因为它也是一个具有金融属性的公司,与其他像谷歌之类的公司对应的发展方向并不相同,所以在人工智能领域的应用落后了很多。我则负责构建基于人工智能的数据科学平台,用于分析公司全球范围内数亿消费者的数据。通过分析这些数据,我们可以预测消费者下一步的行为并对其进行定向营销。
由此,我们建立了消费者行为预测引擎,通过它精准地预测了消费者未来可能购买哪些商品、关注哪些商家。以便我们提前将相应商品的信息或者一些折扣信息带到消费者面前,促进消费者在适当的时间购买。通过这种精准的 AI 营销,我们为 PayPal 带来了巨大的收益,公司的营销活动响应率提高了两到三倍。可能原来有 10 个人响应一次的营销活动,现在会有 20 个或者 30 个人响应。这是在 PayPal 进行了 AI 营销方面的一个实践。
在百度我主要负责金融风险控制模型。众所周知,金融行业中最关键的是风险控制,绝对没有风险的贷款行为是不存在的。通过海量的数据分析,我们构建了精准的消费者风险模型。根据画像、行为等因素,我们能够较好地评估风险,进而控制风险。例如,一些人的行为稳定,向他们提供贷款是非常安全的;一些人的行为则会导致较高的逾期风险。
通过该风险控制模型,百度金融取得了长足的发展。 2015 年它的放贷规模只有 50 亿元,到 2018 年时达到了1500 亿元,提升了 30 倍。这背后的原因就是大量使用了人工智能技术进行精准的风险控制,提升了业务的规模,使整体风险维持在极低水平。
那么,人类又该做什么
图片来源:VEER
《复旦金融评论》:您提到了在精准营销和融资效率方面的应用,随着生成式 AI 的兴起,会带来一个怎样的新变化呢?
丁磊:我刚刚所说的主要还是决策式 AI,而生成式 AI 可以从两个方面来解读。一方面,生成式 AI 可以精简、优化既有的业务流程。通过分析大量的数据,识别常见模式和规则,生成式 AI 能够生成与业务流程相契合的自动化程序,提高组织生产效率和自动化水平。大大减少人工的干预,进而解放人力、降低成本,同时还可以提高业务流程的执行效率。
举例来说,现在开发人员已经开始用 ChatGPT 来编写代码了,只要开发人员给的要求和提示足够完整, ChatGPT 甚至可以编写完整的代码。ChatGPT 同时还能阅读已有代码,添加注释或者纠错,如此一来便可极大地提升代码、文档的编写和审查效率。
另一方面,基于生成式 AI 的新流程可以替代原有的人力所承担的业务流程。在原先人力不足的情况下,只能将业务外包,效率并未提升,成本却在逐步上升。有了可以胜任业务的生成式 AI,自然就可以替代原有的业务流程。智能客服就是其中一个典型的案例。
此时,人类要做好“一前一后”的工作。在内容生成之前,人需要与生成式 AI 合作,明确内容方向和业务节奏;在内容生成后,人需要对生成的内容进行评估、修正和优化,并与下游业务对接。因此,人需要发挥自身的主观能动性,完成好“一前一后”的工作。
从实现角度而言,可以将生成式 AI 工具与公司内部的 ERP(企业资源计划)系统集成,形成端到端的解决方案,以全局化的方式优化业务流程。如自动生成项目排期计划;又如可以将ChatGPT 用于低代码平台,通过对话聊天的方式自动构建流程框图等。在这个过程中,生成式 AI 与这些管理系统不是并行关系,而是将整体业务流程融合。随着搭载生成式 AI 的解决方案走入更多的企业和组织,生成式 AI 也将带领它们迈入更高效的业务流程时代。
《复旦金融评论》:在未来 5 年内,我们这些普通人应该做些什么?除了技术人员以外,是否每个人都需要学会 GPT 的操作和应用,以便在学习和研究中使用这些 AI 工具呢?
丁磊:其实真正被人工智能取代的工作很少,但是绝大部分职业都会受到影响。根据普华永道 2018 年 12 月发布的《人工智能和相关技术对中国就业的净影响》估算,未来 20 年,中国现有约 26% 的工作岗位将被人工智能及相关技术取代,但是人工智能及相关技术通过提高生产率和实际收入水平,能够产生约 38% 的新工作岗位,最终将净增约 12% 的工作岗位。因此,人工智能带来的影响并不是简单地取代工作岗位,而是对职业结构的影响。
与其说人工智能将取代从业者,不如说它完成的是枯燥繁重的工作内容。它淘汰的不是人类,而是落后的生产力。对个人而言,人工智能不是竞争对手,而是我们的工作伙伴,它将成为必要的生产要素,使生产力倍增。我们应该做的是训练和使用人工智能,让人工智能为我所用,与人工智能一起工作( Work with AI)!
首先,应该拥有 AI 思维。所谓 AI 思维,本质上是一种“数据驱动”的思维,就是从大量数据中形成模型,进而对未知的情况做出最佳预测。在 AIGC 的应用中,则是从大量数据中形成模型,自动生成全新的内容。无论是决策式 AI 模型还是生成式 AI 模型,其基础逻辑都是一致的,只靠逻辑和经验难以推导,需要海量的数据进行训练。我们需要理解 AI 思维的底层逻辑——其基础在于数据,核心在于模型,实现在于算力,具体应用在于业务场景。拥有 AI 思维能够避免经验主义带来的主观、片面和限制,具有积极的意义。
其次,需要拥有 AI 工具思维。掌握数据化思维,掌握使用人工智能、训练人工智能的方法,使其具有更强的适配性,将我们从繁杂的事务中解放出来。未来,人人都可以是 AI 的使用者和训练师。
*本文仅代表受访者个人观点,仅供读者参考,并不作为投资、会计、法律或税务等领域建议。编辑:潘琦。