京东探索研究院院长、京东科技智能服务与产品部总裁何晓东表示,生成式AI在今年取得了巨大的进展,可以做到文本生成、代码生成、图片生成、视频生成等,产生了生产力的变革。他认为,大模型带来了AI流行的机遇,从传统的基于某一个场景、某一个应用定制AI模型,进入到一个大的通用的模型可以服务于多个场景。
“一方面模型本身的成本是提高了,因为我们都知道,大模型本身需要大量的算力,需要大量的数据,需要一个很大、很强的综合性团队。在另一方面它的部署成本其实极大地降低了,因为一个模型可以部署到更多的地方。”何晓东说,“这就像我们进入工业时代,虽然工具更昂贵了,但它生产产品的效率反而提升了。”
何晓东表示,希望AIGC能加入更有创作力的领域,比如图像绘画生成等,“京东通过打造一站式的人工智能应用平台言犀平台,集成大量AI从感知到认知到生成的技术,使得我们可以在各个层次组合出各种各样丰富的应用式产品,服务各行各业。各行各业都能从这一次的人工智能技术进展中得到真正的提升。”
京东探索研究院院长、京东科技智能服务与产品部总裁何晓东发表讲话
梅涛指出,目前主流的视觉模型的能力边界基本都在几十亿参数的区间,在图像生成方面,人脸细节、手指细节、物体细节等问题都还没有解决,还有很多工作要做。
“我们想做的一件事就是问问自己,到底我们有没有可能把现在视觉多模态的基础模型,从它现在能力对标GPT-2.0的时代,走向GPT-3.0的时代。当然这也是我们HiDream的一个初心。”梅涛说。
九章云极联合创始人尚明栋则谈及人工智能基础设施的变革。他表示,大模型的产生并非一蹴而就,而是需要完整的基础设施升级,无法依靠单独一个大模型解决更多的问题。他指出,基础设施的构成包括算力、数据和软件等方面。
尚明栋提到,美国初创公司CoreWeave在最近使用3584张H100芯片,仅用时11分钟就完成GPT-3模型的训练,整体开销约2万美元。但在2020年训练GPT-3模型需要450万美元,在2022年依然需要45万美元。“我们看到,随着算力和并行的一些基础软件的演进,我们算力的成本在持续下降。而算力成本下降的速度,我们判断也会快于模型大小增长。所以,以后算力将不会构成大模型计算的一个鸿沟。”
他指出,训练更高质量、更高效的模型,就需要质量更好的数据,“我们也知道,受限于数据的边界,考虑到数据隐私、数据安全等多方面因素,我们很难让它直接在通用的数据中流通。所以我们需要构建垂直领域大模型,结合从算力、数据到基础软件去赋能于千行百业。”
九章云极联合创始人尚明栋发表讲话
在基础软件方面,尚明栋认为,基础软件的核心价值在两点,一是高效地调度、管理数据和算力,将原先复杂的大模型构建变得更加容易。二是通过对基础软件高效的工程化、模块化和自动化,提高训练的效率。基础软件效率的提升意味着算力的节省和成本的降低。
“所以,大模型未来的挑战在于,我们希望大模型能够落地各行各业,那么落地于千行百业就需要和各个行业的业务结合在一起,并结合行业的业务知识。”尚明栋说。
“AI存在风险,但我们不应该因噎废食”
然而,AIGC的发展也面临诸多争议,从发展的门槛和壁垒到AI的风险和安全性都受到颇多质疑。对此,在“聚焦·大模型时代AIGC新浪潮论坛”的圆桌讨论环节中,多位专家指出,生成式AI发展可能面临诸多挑战和风险,但我们不能“因噎废食”,需要在长期的发展中寻找应对的方案。