回顾一下人类历史上的几次工业革命:
第一次工业革命以蒸汽机的使用为标志,人类进人蒸汽时代。
第二次工业革命以电力的使用为标志,人类进入电气时代。
第三次工业革命则以原子能、电子计算机与互联网的使用为标志,人类进入生产力空前发展的时代。
长期以来,人工智能被寄予掀起第四次工业革命的厚望。一方面,人工智能系统在各个领域(棋类游戏、电子竞技等)不断挑战人类的纪录;另一方面,人工智能系统在落地的时候往往因缺乏常识、容易犯错等而被称为“人工智障”。在人工智能的发展史上,高潮和低谷总是相伴而行。
在这种起伏的过程中,科学家们不断重提通用人工智能(AGI)的概念。他们满怀希望地向社会描绘这一人工智能系统发展的长期目标,认为技术的“奇点”将最晚在2050年来临。到那时,智能系统会在以下能力上达到人类的水平:
近十年来,图形处理器(Graphics Processing Unit,GPU)的发展为深度学习解决了算力障碍,大数据为深度学习解决了训练数据问题,使得深度学习技术在人脸识别、自动驾驶、语音助手等产品中得到广泛的应用。然而,这些产品在安全性、常识性等方面也常犯“低级”错误,表现出来的性能与人类相比可以说是相去甚远。因此,从科学界到工业界,仍然有部分科学家对这种人工智能系统的主流实现方法持保留态度,他们质疑这种堆叠神经元的“暴力美学”能否真的模拟人类的能力。
但是,这种质疑在2022年到2023年年初的时间里几乎销声匿迹了。2022年11月,OpenAI发布了对话大语言模型ChatGPT。 GPT是生成式预训练模型的简称,自2018年发布第1版之后,4年间经过了4轮主要的迭代,最后一个版本GPT-3.5的参数量达到了 1750亿。基于这一版本,OpenAI开发了多个微调后的分支, ChatGPT分支是专门用于对话的,它的多轮对话记忆能力、逻辑推理能力、意图理解能力和表达能力达到了前所未有的高度。
这一次有什么不同?
站在后验的视角,我们可以发现,原先的质疑背后的哲学基础是“还原论”,即如果不能理解系统的每个部分的功能,就无法建造更好的系统。而近两年出现的以ChatGPT为代表的这些大模型,其背后的哲学理念是“进化论”。创造这些大模型的团队有这样的信念:如果一项能力是重要的,那么它就会在模型“进化”的过程中自然而然地出现,创造者需要做的,是赋予它足够大、足够复杂的结构,让这种能力有存在的空间。
OpenAI创始人兼CEO Sam Altman的一条推文非常适合作为这种信念的一个注脚:“我是‘随机鹦鹉’,你也是。”“随机鹦鹉”一词出自谷歌前研究员的论文“On the Dangers of Stochastic Parrots : Can Language Models Be Too Big?”,在该论文中,作者认为大语言模型仅仅基于随机概率信息将语言形式的序列随意拼接在一起。他们不无讽刺地把大语言模型比喻为“随机鹦鹉”,即学舌学得很像,却没有真正习得语义、思想等人类特质。对此,Sam Altman的观点是,若一个事物从各个角度看起来像,那么它就是。机器写的语言,如果足够像人类的自然语言,那么它就是自然语言,它就具备传递情感、交流思想等功能。这也是他写下这条推文的原因。正是这种对大模型的坚定追求,使得以OpenAI为代表的公司抢占了新一轮人工智能热潮的先机。
同时,与以往的技术仅在技术和产品圈子有广泛的影响力不同,AIGC这一次成功“出圈”,引起了全社会的广泛关注和追捧。我们可以用一个案例来说明。2016年,DeepMind开发的AlphaGo在与世界顶级围棋手李世石的对弈中胜出,标志着AI再次攻下一城,当时也引发了广泛的热议。但是热度过后,人们发现,即使围棋的搜索空间相当复杂,也是封闭的。于是人们普遍认为,AI适合在封闭规则下找到最优解,但是不擅长在开放性的领域做富有创造力的事情。然而,AIGC颠覆了人们对AI的刻板印象。人们惊讶地发现,人工智能在创作图片、生成音乐、写故事甚至创作视频方面,表现出了和人类相近的水平(但是生产速度却比人类提高了两个数量级)。
AIGC
阿尔文·托夫勒在《第三次浪潮》中提出“产消合一”的趋势,即产品的消费者本身也是产品的生产者。随着工业化大规模生产的产品日益满足人们基本的消费需求,人们对产品个性化、定制化的需求越来越高,而这些需求需要消费者参与到产品生产的过程中。比如使用3D打印技术可以将生产和消费合二为一。消费者可以使用3D建模软件创建他们想要的产品模型,然后使用3D打印机将其打印成实体产品。这种生产模式不仅可以节省制造商的成本和时间,还可以让消费者更快地获得他们需要的产品,同时也为个性化和定制化的生产提供了更好的支持。
“产消合一”的趋势不仅出现在产品生产领域中,而且在内容创作领域同样如此。AI作为新兴生产力,能够自动生成、高效提供边际成本更低的内容,更符合人们对个性化、定制化的需求,从而创造出独特价值和独立视角。AI的应用逐渐从单纯的“降本增效”转向了更为复杂、高级的“创造价值”。
随着AI创造能力的飞速提升,从UGC(User Generated Content,用户生产内容)到PGC(Professional Generated Content,专业生产内容),再到AIGC(Artificial Intelligence Generated Content,AI生产内容),内容生产领域有了巨大的发展。AIGC大大降低内容创作的门槛,帮助人们摆脱单调的重复性工作、突破生产瓶颈,让更多人参与创作。AIGC的应用生态迎来了一波大爆发,使得AI不再是“辅助人类生产内容”,而逐渐从“AI与人类共生创作”阶段进化到“AI独立完成内容创作”阶段
AGI带来的生产效率革命
AGI将大大解放生产力,在AI的新纪元,许多工作的生产效率将迎来革命性的变化。举例如下。
1.文员类型工作
微软将最新功能Copilot整合到办公软件中,包括Word. PPT、Excel等,协助用户执行各种工作任务,如安排会议、撰写电子邮件和创建待办事项清单等。例如,如果用户在聊天中讨论一个会议,Copilot可以根据与会者的时间提供会议安排。如果一个用户正在写电子邮件,Copilot除了能根据信息的内容给出回应外还能基于用户与客户的对话记录快速生成一篇文稿。同样,如果用户在使用PPT时向Copilot描述需求,并附上相关的Word文档,明确PPT样式及页数,则Copilot能迅速生成满足需求的PPT。此外,在Copilot的帮助下,输入函数和公式生成图表、筛选分类等进阶功能也变成“小菜一碟”。
2.软件开发工作
GitHub在2021年首次接入Copilot作为编程工具,而在接入 GPT-4之后,它的功能远胜于最初简单的补全代码建议。它可以识别开发人员输入的代码,显示错误消息,向开发人员解释代码块的用途,生成单元测试,甚至获得对错误的修复建议。从阅读文档到编写代码,再到提交拉取请求等,该工具大大缩短了软件开发周期,让想法流畅地变为现实。
3.艺术设计工作
2022年在美国科罗拉多州博览会的艺术比赛中,画作《太空歌剧院》夺得第一名,奖项一经公布,立刻引起了轩然大波,因为这张画的署名是Jason Allen via Midjourney。Jason Allen是一家游戏公司的CEO,而Midjourney则是一款AI绘图软件。如今,越来越多的设计师加入AI绘图的大军中。
4.文学创作工作
亚马逊电子书平台上悄悄刮起了一场“AI写作书籍”的热潮。生活在美国纽约州罗切斯特市的Brett Schickler只是一名普通的销售员,但在2022 年年底ChatGPT推出之后,他终于得以实现自己多年的作家梦。借助ChatGPT,他在几小时内就写出了一本30页的儿童插图电子书。他写的这本书名为《聪明的小松鼠:储蓄与投资的故事》,讲述了一只松鼠向它在森林中的朋友学习如何储蓄的故事。这本书已经于2023年1月通过亚马逊的Kindle自助出版部门出售。
通过上面的例子我们可以看到,AI技术已经从“旧时王谢堂前燕”变为“飞人寻常百姓家”。过去,AI技术是有业务需求的公司和应用开发的专属工具,现在,即使是普通用户也可以使用AI技术提高自己的生产效率了。从开发周期来看,一个想法从诞生到变成现实的周期将缩短为传统开发周期的十分之一;从开发团队来看,单个用户的生产力将可以匹敌一个传统的开发小组。更进一步地,在不远的将来,当我们给AGI装上传感器和机械臂时,科幻电影中的超级机器人将成为现实。我们正在经历的,是一场方兴未艾的生产力革命。
AGI重新定义脑力劳动
以前我们认为被AI取代的顺序是蓝领>低技能白领>高技能白领>创造性工作,而且普遍认为创造性工作很难被取代。而在1.2节中我们看到,今天被AIGC工具解放生产力的,大多属于脑力劳动。人们带着欣喜而忧虑的复杂心情,看着AIGC展现出接管创造性工作的态势。从文艺青年到理工男,从文化创造者到数据创造者,从设计、分析到转译,从管理员、记录员到接待员,AIGC堪称全方位的白领“杀手”。人们不禁忧虑,脑力劳动者会大幅度地被AI所取代吗?脑力劳动者在AI新纪元何去何从?
我们分两个层次,逐步深入地研究这个命题。
第一个层次:脑力劳动中也包含着大量的体力劳动。举两个例子来说明。
第一个例子是“码农”。“码农”这个词是对程序员的另一种称呼,虽然他们坐在现代化的办公室里,但是部分程序员每天的工作内容就是从互联网上寻找各类现成代码组装到自己的项目中,然后调试跑通代码。这样的工作简单且机械。另一个例子是AI开发中的“脏活”。有过AI系统开发经历的人都知道,训练模型的第一步是清洗数据等“脏活”,而模型选择的过程中,往往都是网格化地搜索最优参数。这样的工作简单且机械,以往都是相实习生解决的。
我们举这两个例子,旨在说明在看似复杂的脑力劳动中存在着大量的“体力劳动”。在AGI时代,真正需要创造力、富有创造性的工作岗位仍然需要人来担任,AI可以充当人的高级助手,但是无法完全取代人。因此,我们对这个问题的回答是,真正的脑力劳动者不会被AI所取代,因为界定是不是脑力劳动将以能不能被AI取代为标准。如果AI能取代某项工作,那么这项工作本质上是体力劳动。
第二个层次:人在真正需要创造性的脑力劳动部分如何继续保持先进性?
这个问题又可以细分为两个角度。
第一个角度是掌握工具。让每个人学习并掌握AI工具是本书写作的第一个初衷。正如不会使用计算机是这个时代的“文盲”一样,不会使用AI工具将是未来AI时代的“新文盲”。会使用AI工具的人,将比不会使用的人获得更多的职业可能性和上升空间;会使用AI工具的企业和组织,将比不会使用的企业和组织获得更大的用户群体和更高的市场价值。
第二个角度是超越工具。人的创意的基础,很大部分是由经验组成的。我们固然可以使用AI工具全面接管重复性的劳动,但是,如果完全脱离了这些劳动,我们就不能深刻理解背后的原理和细节,创意也就成为无源之水、无本之木。举例来说,有志于影视创意的人员在传统的培养过程中,每周都需要产出多篇原创的策略,通过这个过程锻炼自己的脑力和格局,从而逐步成长为一个有眼力、有视野的“老猎手”。在AI的加持下,创作能力无疑将迎来井喷,原创内容也会大量增加,因为AI可以把创作者从简单的劳动中解放出来,让他们只需专注于做出审美选择。但是正如评论家不能完全取代创作者一样,审美选择也不完全等同于创作过程。如果仅满足于使用AI工具并进行修改,会让年轻创作者失去磨炼和成长的必要过程,这样做并不能培养出创作人,而是会培养出投机取巧的工作秘书,从而导致真正原创内容的贫乏。在自媒体高速发展的过去几年里,我们已经见过了这种危险。这并不能归咎于AI技术的进步,而应该归咎于人类惰性。事实上,大量创作者的技能仅限于搬运、剪切与粘贴,使得自媒体充斥着大量垃圾信息。
AGI带来的社会分工调整
进入工业革命以来,个人作坊的模式被社会化分工所取代,一个完整的生产过程被分解为若干个相互协作的环节,由不同的人或组织承担不同的环节,从而降本增效。在不同的历史发展时期,由于技术的特点,时代的主角各不相同。