之江实验室图计算中心副主任
人工智能(AI)的由来可以追溯到20世纪50年代,而人类第一台通用电子计算机埃尼阿克(Electronic Numerical Integrator and Computer,ENIAC) 于1945年诞生。当时,科学家们突发奇想,开始探索如何将人类的智能和思考方式运用到计算机中,以实现类似于人类智能的行为和思维。
这些早期的研究集中在推理、学习、规划、自然语言处理等领域,并在此基础上逐步建立起了AI的基础理论。著名的图灵测试是由人工智能之父艾伦·图灵于1950年提出的一种测试,用于评估计算机是否能够表现出与人类相同的智能水平。在图灵测试中,一个人与一个计算机程序进行对话,如果这个人不能确定他/她在与另一个人还是计算机程序进行对话,那么这个计算机程序就通过了测试。
这个测试成为衡量人工智能是否能够达到人类智能水平的标准。图灵提出这个测试的目的是探讨“机器思考”这一问题,他认为如果一个计算机能够通过这个测试,那么它就可以被认为具有了人类的智能水平。
随着计算机技术的不断发展,图灵测试逐渐成为人工智能领域的重要指标和研究方向。很多研究人员致力于开发能够通过图灵测试的计算机程序,以此来实现人工智能的梦想。
到了20世纪70年代,科学家们开始使用逻辑推理和规则来实现智能,这被称为“符号主义AI”(Symbolic AI)。“符号主义AI”主要基于人类专家的知识,将这些知识表示成一系列的规则和公式,然后使用逻辑推理来解决问题。例如,人类专家可以提供一个疾病的症状和治疗方法的知识库,计算机程序可以使用这些规则和公式来推断出一个病人的病因和治疗方案。然而,“符号主义AI”很难处理不完备或不确定的信息,需要明确的规则和公式来解决问题,所以无法处理一些复杂的现实问题。
20世纪80年代,AI进入了一个新的发展阶段,即“连接主义AI”(Connectionist AI)。它的灵感来源于生物神经网络(neural networks),通过建立大量的神经元之间的连接来模拟人类大脑的工作方式。“连接主义AI”的核心思想是学习,通过处理大量数据并自动调整神经网络的权重和参数,来完成各种不同的任务,如图像识别、语音识别、自然语言处理等。这种方法强调了从数据中学习和发现模式,而不再是依赖人类专家提供的规则和知识。
真正引爆AI新浪潮的关键节点是在2012年,由杰弗里·辛顿(Geoffrey Hinton)等人开发的AlexNet深度神经网络,在ImageNet图像识别挑战赛上以远超第二名的成绩获胜,将图像识别错误率从当时的26%降至15%,引领了图像识别领域的新一轮革命。
仅仅三年后,在2015年,AI就首次在图像识别领域超越了人类。当时,一个名为ResNet的深度神经网络在ImageNet挑战赛中取得了比人类更高的图像分类准确性,错误率仅为3.57%。自那时起,随着更深层次和更高级别的神经网络的出现,AI在图像分类、目标检测、人脸识别等方面的准确性不断提高,逐渐在更多任务里超越了人类的表现,AI也因此被推广到各个领域大放异彩。
车站的人脸识别机器或者是家里的智能音箱那样看得见摸得着的存在,也有可能藏在科技巨头的服务器里,潜移默化地影响着使用产品的每一个人。例如,电商企业利用AI分析用户的购物历史和行为习惯,向消费者精准投放广告,推荐更符合他们需求的商品。
在自动驾驶领域,车辆使用各种传感器和计算机视觉技术,感知道路上的物体和行驶的车辆,进行路径规划和决策。
在医疗领域的医学影像数据分析中,AI技术可以帮助医生快速、准确地发现疾病部位、病变程度等信息 ; 在手术中,AI技术可以通过图像识别、语音识别等技术,为医生提供实时辅助,从而提高手术的准确性和安全性。
在金融领域,AI可以通过对大量数据的分析和比对,帮助银行和金融机构更好地控制风险和防范欺诈行为。同时,AI还可以通过分析和预测市场趋势,帮助投资者做出更加明智的投资决策。在教育领域,AI可以通过对学生的学习情况和表现的分析,为教师提供更加精准的评估和教学建议,为学生提供更加个性化的学习辅助,帮助学生更好地掌握知识。在制造业领域,AI可以通过对生产流程和设备状态的监控和分析,帮助企业实现更加智能化和高效化的生产管理,提高生产效率和产品质量。
AI已经在多个领域大放异彩并深入我们的日常生活中。从围棋领域的AlphaGo到预测蛋白结构的AlphaFold,从2022年兴起的AI绘画再到如今的ChatGPT,人工智能作为一种新兴的颠覆性技术,正在逐步释放科技革命和产业变革积蓄的巨大能量,并深刻改变了人类的生活和思维方式。这不禁让我们感慨AI的无限可能。
另一个AI最前沿的应用是元宇宙。其实元宇宙和AI是两个密切相关的技术领域,它们之间存在着多重关系。首先,AI可以为元宇宙提供智能化的支持和增强。在元宇宙中,用户可以创造虚拟世界、角色、物品等,这些虚拟实体需要具备一定的智能化和自主性,以模拟现实世界中的行为和互动。例如,虚拟角色需要具备AI的语音识别、自然语言处理、情感计算等技术,以更加自然和智能地与用户互动。
其次AI还可以为元宇宙提供智能化的监控和管理,以确保虚拟环境的安全和稳定。再次,元宇宙也可以为AI提供更加多样化和真实的数据和场景,以加速AI的训练和应用。在元宇宙中,用户可以模拟不同的场景和情境,生成大量的真实数据,这些数据可以为机器学习算法提供更加多元化和全面的训练样本。
最后,元宇宙中的虚拟世界还可以为机器学习算法提供一种低成本、低风险的测试环境,以验证算法的有效性和稳定性。
预测未来无疑是困难的。《财富》杂志最新的报道里调侃道:“多年来,埃隆·马斯克一直警告我们,未来某一天人工智能会淘汰人类。得益于ChatGPT,这一天可能比我们预想的更早到来。”
在商业世界,比起讨论AI会取代哪些人类职业,更加迫切的现实问题是,AI已经被用于公司裁员。《华盛顿邮报》最新的报道中指出,根据人力资源分析师和劳动力专家的说法,AI已经被用于帮助决定谁被裁员。在一项对300名企业人力资源总监进行的调查中98%的受访者表示,软件和算法将帮助他们在今年做出裁员决定。同时,微软的Azure云服务持续融合人工智能服务于工作场景中。HR部门可以用ChatGPT来改良文件查看流程、创建新职缺描述及辅助沟通;新加坡政府用它作为项目办公室的人机互动接口;合约管理软件企业则将之集成到商业合约查看及总结功能。
微软还将ChatGPT集成到其他消费及企业产品,包括GitHub Copilot使用ChatGPT开发商OpenAI的AI模型加速开发、Teams付费服务加入智能总结(intelligent recap)及AI分章节功能、员工社交及协同平台Viva Sales服务用AI提供邮件内容建议及查看业务资料,还有企业界人人皆知,但还未必都已用上的必应聊天机器人(Bing Chat)和Microsoft 365 Copilot。
AI的商用路径也需探索,曾执掌斯坦福大学16年,同时是微处理器技术专家、2017年图灵奖得主的约翰·亨尼斯(John Hennessy)在路透社的采访中表示,大型语言模型等人工智能的对话成本可能是传统搜索引擎的10倍以上。他认为类似谷歌这样的大公司必须降低此类人工智能的运营成本,但这一过程并不容易,“最坏的情况是需要几年时间”。