奥运冠军全红婵:百度相当于我的半个教练

时隔四年,中国科技行业年度盛会——百度世界大会,终于真正意义上回归了线下。

十几年前还在我上学的时候,就每年关注百度世界大会。在办会之初,百度世界大会就不仅仅是百度的一个活动,更是行业的一场思想盛宴。

与此同时,百度世界大会还是一场前瞻行业发展趋势的大会。举个例子,现在互联网行业最火的概念无非就是“人工智能”“大模型”“自然语言生成”“机器学习”等等,早在2015年的百度世界大会,百度就发布了对话式人工智能秘书度秘,这款产品通过语音识别、自然语言处理和机器学习,让用户可以使用语音、文字或图片,以一对一的形式与度秘进行沟通。后来,很多对话式的数字人产品,都学习了度秘的产品形态。

今年的百度世界大会,处在特殊的历史时期,受到了更广泛的业界关注。奥运冠军全红婵等跳水明星的登台分享,更是将大会气氛推向了高潮。

在大会上,百度掌门人李彦宏宣布文心大模型4.0正式发布,开启邀请测试。李彦宏认为文心大模型4.0是迄今为止最强大的文心大模型,实现了基础模型的全面升级,在理解、生成、逻辑和记忆能力上都有着显著提升,综合能力可以媲美GPT-4。

可能是现场座位数量有限,有很多媒体人没来。有一位没有入场参会的媒体朋友找我,希望我能帮忙总结下这场大会的亮点,以及行业意义。我爱莫能助,因为2023百度世界大会的信息量太大了,涉及了方方面面的内容,很难“总结出来几条亮点”。况且,详细的媒体报道,早已经铺天盖地。

我仅仅把我感兴趣的几个维度提炼出来,分享给了这位朋友,现在也给大家分享出来。

1、文心4.0是重中之重 生成视频前景无限

今年的大会有什么重点?文心大模型肯定是重中之重。我和那位朋友说,文心一言的发展速度超越预期。可以横向对比一下ChatGPT,ChatGPT从成立到4.0推出,用了好几年时间。而文心一言虽然有百度AI多年的历史积累,但从推出到现在,达到媲美ChatGPT的水平,只用了半年时间。

我自己做过测试,至少在中文的语言环境下,文心一言表现力不弱于甚至超过了ChatGPT。

我还注意到,李彦宏在演示文心大模型应用时,不再播放提前录制的demo,而是现场演示。这体现了百度对自身技术的高度自信,从效果来看,确实超越预期。

在现场,李彦宏提出了一个关于买房的问题,还故意把问题逻辑顺序搞乱,全场担忧:厂长会不会就此翻车?

他的问题是:“我想回承德买房,能用公积金贷款吗,手续怎么办?我在北京工作。”这个问题,表述不清楚,前后文顺序搞混了,但文心一言针对这个问题还是有利具体的回答。此举,赢得了现场阵阵掌声。

这一次文心大模型升级为4.0,文心一言多项能力迎来大升级。其中,最吸引我的,是它生成视频的能力,这是一大突破。我想,如果这项能力继续升级,将会对当前的短视频时代带来巨大影响,任何人都可以把AI生产的视频内容,发布到抖音、视频号、快手等平台,大大提升了信息传播的力度和广度。

2、百度的数字人已经做到了以假乱真

在大会开始之前,我先和老马等朋友到展区进行了参观。在百度电商的板块,有个电商直播的展台。有人可能纳闷,直播带货,这是当下最烂大街的商业模式,为何也要展出?

那么,先请大家看这张图片,看出来有什么问题吗?

再仔细点,还没发现吗?我揭晓答案吧:图片中卖衣服的女孩是数字人!

她的肢体动作、脸部表情、嘴唇发音,甚至和网友的互动等等,都是通过百度AI技术实现的。整个动作表情很协调、很自然,至少我是看不出和真人有啥区别。

看到我一脸不相信的表情,百度展台一位戴眼镜的小姑娘给我解释,用百度AI进行数字人直播带货,只需简单几步,耗费几分钟,就可完成数字人直播间的制作。

具体来说,就是先找一个真人,录制几分钟形象,简单设置几步,构建数字人形象。然后给这个数字人接入百度AI,打通剧本、商品、问答能元素,商品可以是百度商品也可以是第三方商品。具体在实践中,也可以根据场景需求,用AI替换直播间背景。

我在想,像李佳琦和董宇辉这样的优秀主播,如果他们也能化身10个、100个、1000个数字分身,就可以同时带货更多商品,更大程度上助力中国商品经济的发展和流通。

百度的数字人产品,很可能带动百度实现新的增长。

3、全红婵引爆全场 直言百度AI是半个教练

每个人登台时,会场报以掌声欢呼。其中,全红婵稚嫩且紧张的发言赢得了全程最为热烈的掌声。她说:“百度的AI跳水辅助训练系统可以及时回放、打分,平时训练我会用它来抠动作细节,也相当于我的半个教练。”

事实上,中国国家跳水队与百度的渊源由来已久。陈若琳在现场表示,中国国家跳水队与百度从2019年就开展了深入的技术合作,携手走过了东京奥运会、福冈世锦赛、杭州亚运会等多个大赛。目前正在备战明年巴黎奥运会。“感谢百度一直以来提供的技术支持与服务,未来双方将携手持续用人工智能技术帮助跳水队智能训练,通过科学训练提升竞技水平。”

其实,百度AI助力中国体育赛事还有其他案例值得一看。我之前写过《互联网企业助力北京冬奥会:阿里后端保障,百度AI抢镜》,提到有了百度的AI技术,一切看不懂都将成为“哦,原来如此”。就以谷爱凌的大跳台为例,百度智能云通过“3D+AI”技术打造出“同场竞技”系统,将单人比赛项目变成“多人比赛”,实现了冠、亚军比赛画面的三维恢复和虚拟叠加,方便观众通过一个赛道看到不同选手的实时动作。

同时,通过技术手段对运动员动作进行量化分析,将滑行速度、腾空高度、落地远度、旋转角度等一系列运动数据与原始画面叠加起来,这样普通人都有了裁决胜者和分数的能力。

4、大模型有望重塑所有业务 以百度网盘为例

有人说大模型的发展会颠覆甚至取代现有的一切应用,我说也可以改变和重塑现有的一切应用,让现有的一切变得更好,使用效率更快。

李彦宏也说,大模型时代的AI原生应用不是对移动互联网App和PC软件的简单重复,而是要能解决过去解决不了或解决不好的问题。

大模型到底如何重塑现有应用和业务?还是以我常用的百度网盘举例吧。

我是百度网盘的超级重度用户,这十多年来我的百度网盘空间已经填充了6.7T的内容,其中仅仅照片就有超过10万张。随着照片的增多,查找照片成为一件极其困难的事情。

在以前,如果我要找一些某年某月去某地玩的照片,就需要打开网盘的照片类目,辛辛苦苦找寻。有一次,为了找一张十年前参加活动的照片,耗费了好几个小时。

现在好了,用了AI大模型,直接输入相关词汇(哪怕是一个模糊的词汇)就可以找到所需要的照片。比如我要找2021年在河北旅游的图片,我要找证件照,直接输入词汇,就可以出结果,比我自己人工找寻,效率快了何止10倍?

当然,除了找图片,也可以用这种方式找视频。

按照百度的介绍,这个云智能助理“云一朵”,实现从图形界面交互到自然语言交互的转变,增强了多模态信息理解,找图片找视频只是小儿科技术,还能对视频精准定位、一键总结视频内容、提炼金句。

写在最后:AI技术,势不可挡。百度作为行业的先行者,能做的还有很多,我们拭目以待。

THE END
0.百度AI一键生成PPT:夏天的太湖百度AI一键生成PPT是百度文库提供的一个功能,它利用人工智能技术帮助用户快速制作演示文稿。用户只需要输入主题或者上传相关文档,AI就能根据内容自动生成PPT幻灯片,包括但不限于文本内容、图片、图表等元素的排版和设计。 使用百度AI一键生成PPT的步骤: 1. 访问提供AI PPT一键生成服务的网站(百度)。 2. 输入你的PPT主 jvzquC41yy}/onnrkct/ew477lksypy
1.百度图片AI创作批量生成图片并下载create(new ObservableOnSubscribe<Boolean>() { @Override public void subscribe(@NotNull ObservableEmitter<Boolean> observableEmitter) throws Exception { //第一步:POST访问https://image.baidu.com/aigc/generate //参数:query=水杯图片 querycate=8 width=512 height=512 modelParameter[quality]=0 modeljvzquC41yy}/lrfpuj{/exr1r168hj943g=:7n
2.百度AI图片助手:免费在线图像处理工具百度AI图片助手是百度公司在搜索与大模型技术基础上推出的免费在线图像处理工具,基于文心大模型技术开发,面向普通用户和创意工作者提供“一键式”AI 修图服务。 分类:图像设计 修图 抠图 优化修复 去水印丨查看: 1028 官网直达 › 详细介绍 百度AI 图片助手是百度公司在搜索与大模型技术基础上推出的在线图像处理工jvzquC41yy}/rjsngnk/exr1c1713;
3.OpenAI开放色情内容生成?百度AI怎么做【附内容审核方案百度AI怎么做【附内容审核方案 色情内容在网络中几乎无处不在,但由于保护机制、风险规避等原因,很多色情内容会被屏蔽或删除。 可是,据 Wired 报道,OpenAI发布了一份文档草案,透露出他们正在探索色情和其他露骨内容领域。“我们正在探索是否能够通过 API 和 ChatGPT 负责任地提供在适合年龄的环境中生成 NSFW 内容的jvzquC41dnuh0lxfp0tfv8_PPT`OP[4ctvodnn4fgvgjn|435;728::9
4.百度AIAPI调用代码3、生成文件 二、通用文字识别API调用 1、代码 获取access_token # encoding:utf-8importrequests# client_id 为官网获取的AK, client_secret 为官网获取四、百度翻译API调用 1、代码 importhttp.clientimporthashlibimporturllibimportrandomimportjson appid='20210117000674265'# 填写你的appidsecretKey='Tva0OjFgTjvzquC41yy}/lrfpuj{/exr1r1j3hl=;8flg5@
5.百度AI图片助手:AI智能图像处理平台(免费,有点香)百度AI图片助手是百度推出的智能图像处理工具,集成AI绘画、老照片修复、人像动漫化等特色功能。基于百度文心大模型技术,提供一键生成、智能优化等便捷操作,特别适合快速处理日常图片需求。支持多端使用,中文界面友好,操作门槛低。 工具性质 国产 操作终端 PC网页 界面语言 中文 是否免费 基础功能免费+高级功能付费 核心jvzq<84cffrpq7hqo1hbkmzckv{qkjs0jvsm
6.iPhone16和百度合作?网友:完了,Siri要收费了!|Siri|百度|文心因此黑马大胆开麦:此次苹果和百度的合作,大概率只是阶段性合作。 今年3月,苹果发表了一篇论文,公布自己研发的MM1多态大语言模型,共分为三个参数规模,其中最大的拥有300亿参数。 库克宣布iOS18将体现苹果的生成式AI技术(图片来源:苹果官网) 前几天,库克在接受采访时表示:“苹果的生成式AI,在今年晚些时候会有新闻宣布”。也就是说苹果 jvzq<84m0uooc7hqo0io1jwvkerfa><857?88<=a37=9;A:6827:2:=6:w4ivvq
7.百度AI大模型“上车”极越01再次升级起跑百度智能驾驶事业群组首席研发架构师、IDG技术委员会主席王亮告诉记者,基于大模型,百度打造了先进的智驾数据生产线、LLM赋能的自动驾驶数据索引;与此同时,通过生成式AI技术,百度也具备高效处理长尾数据的能力,“这些都是推动端到端自动驾驶技术发展的重要数据引擎”。 jvzq<84|sd4d{xq0eqs0j}rn146366561370p€3F336129isph`49762672a<22:0nuo
8.百度文库“一站式AI内容创作平台”再上新!重磅发布“跨模态AI漫画目前,行业在“AI绘制漫画”上仍存在一定痛点,诸多AI漫画创作工具往往只能生成单图、四宫格图片,在场景关联性、人物一致性、剧情还原度上都有待完善,画面也存在一定程度的硬伤,通常只能通过大量后期工作去补救。 而百度文库全新的“智能漫画”,不止于解决“绘制”单一环节的问题,而将AI封装于整个工作流程,在“指令生jvzq<84yyy4kllpd0et04976/2:03B4ea3922@<3;2:/j}r