薛弘扬博士:首先提出视频问答多模态任务研究者,推动技术发展实现应用落地

薛弘扬博士是多模态人机交互领域的专家,并于去年12月以合伙人身份加入一知智能,担任虚拟人业务研发团队负责人。薛博士毕业于浙江大学,在2017年与浙大人工智能所赵洲教授一起开创性地提出首个视频问答这一重要的多模态任务,并在该领域取得了杰出的科研成果,然而在薛博士看来,研究成果终将需要载体实现落地才能发挥科技应有的价值,因此在毕业后一直致力于将AI应用于各行各业,让科技变成真正有价值的生产力。

丰硕研究成果,开创视频问答领域先河

自本科开始薛弘扬博士就在浙江大学计算机学院一路耕耘,后进入计算机辅助设计与图形学(CAD&CG)国家重点实验室直接攻读博士学位,并受到何晓飞和蔡登教授的亲自指导。在博士期间的研究成果丰硕,他的勤奋和才华也赢得了各项荣誉的认可,其中包括博士研究生国家奖学金、ARM奖学金以及浙江省优秀毕业生等荣誉称号。

薛博士专注于计算机视觉和多模态相关研究,深度探索3D计算机视觉、图像补全、视频问答等不同的研究方向。其中最引人瞩目的是开篇提到的与赵洲教授联手,共同提出的视频问答这一重要的多模态任务,后来相继创新性地提出一系列创新性的注意力机制,如统一注意力机制和基于语法树上注意力机制的模型等,在视频问答这个领域取得了当时SOTA的研究成果,并在CCF A类期刊与会议上发表多篇论文。这一系列的研究成果为薛弘扬博士后来的职业生涯奠定了基础,近几年已被广泛应用于多个场景领域,实现了科研成果的商业转化。

薛博士正进行研究工作

以AI赋能游戏,打造智能决策新高度

博士毕业后,薛弘扬博士将热情和智慧投入人工智能领域最前沿,即强化学习的研究和应用,并以游戏为载体,探索AI在智能决策中的理论与实践。而且他的众多研究成果都已被广泛应用于网易等知名公司的游戏产品中,为游戏注入了优秀的陪玩机器人和竞技AI,赋予游戏更丰富的趣味性。这不仅在用户粘性和游戏收益上有显著提升,更是节省了传统游戏陪玩机器人开发所需的大量人力和资源。这种方式大幅降低了开发游戏AI的成本,进一步提升整体效能,为整个游戏产业带来了无法估量的价值。

薛弘扬博士也正是在这一期间,开始实现把学术界的最新成果逐渐应用于实际的游戏AI问题中,摸索并构建了一整套落地的方法论和流程。同时,在谷歌于2020年举办的全球AI足球比赛(GRF)中,薛弘扬博士凭借其强化学习算法,成功指导队伍在全世界千余支队伍中取得了令人瞩目的第四名成绩,这再次证明了他在AI领域的优秀实力和前瞻视野,也代表着薛博士一直以来追求的技术与应用的链接更进了一步。

薛博士正在研读文献

数字人算法研究成果引领行业进步

除了探索人工智能在游戏领域的应用,在加入一知智能后的薛博士开始积极投身于数字人产品的相关算法技术研究。其研究内容涵盖了语音驱动口型、人脸生成、人脸融合、AIGC 等多个方面,并且大量的研究成果已经成功转化到公司的数字人相关产品中。更值得一提的是,薛博士在短短数月内,就攻破了目前数字人音唇同步准确率不高的难题。

在数字人产品中,语音和图像两个模态特征的融合与关联能力是决定音唇同步准确率的关键。由薛弘扬博士主导自研的数字人算法模型,可以精准地将不同模态特征进行关联,而且特征关联的模块具备强大的泛化能力,仅需少量数据进行模型训练,数字人便能实现业界领先的音唇同步效果,其同步精度达到了近乎99.9%,超过业界其他同类型产品,这在国内属于顶尖水平。

此外,算法同时具备极高的泛化能力和鲁棒性,能够支持全球一百多种语言,即使在使用外语语音驱动的情况下,数字人的效果也与汉语没有差异。并且该算法还能兼容包含背景噪声、背景音乐的语音,在这些情况下,大部分时候也能合成非常逼真的数字人视频,满足在歌唱等多样化场合的应用需求。不仅如此,该数字人算法还能支持实时交互,能够在用户察觉不到的延迟内,与人进行流畅自然的沟通,达到与真人无异的效果。目前,该创新研究成果已经应用于一知智能的数字人产品中,包含短视频制作、数字人直播等,其效果赢得了业界同行与用户的一致称赞和好评。

一知智能芽势数字人自今年3月推出以来已凭借其独特优势迅速占领市场高地,渠道网络覆盖全国各个省份,为各大品牌赋能。通过与各类企业的深度合作,芽势数字人已在短短几月内实现了多元化业务的拓展和应用,这都得益于薛博士和一知智能团队的创新研发和不断努力。

薛博士和一知小伙伴

推动数字人技术发展,助力社会进步

未来,薛弘扬博士表示将继续致力于数字人相关算法的研究与优化,不断提高数字人的智能性和真实度。他希望通过降低数字人运行成本,使这项技术成为新时代与每个人息息相关的基础设施,让所有人都能体验到数字人所带来的便利。

薛弘扬博士坚信,数字人技术能够有效提高社会整体的生产效率,减少日常沟通所需的成本,从而推动社会进步,作为浙大·一知联合研究中心主任的他也期待有更多人能和自己一起投身于这项具有深远影响的科研工作中, 将智能时代的数字劳动真正转变为促进共享发展、实现人类解放的劳动新形态。

THE END
0.展示技术与艺术完美融合出门问问AI数字人此外,「奇妙元」还为用户提供了多种数字形象克隆方案,包括“一张照片驱动”、“2.5D 真人克隆”、“3D 定制及 IP 活化”等,通过一站式数字形象编辑器,能够让企业像做PPT一样轻松制作数字人视频和直播。 除了动捕表演,大模型交互问答、现场 AI 写作也在大屏幕上轮番上演,工作人员现场为观众演示了「序列猴子」企业jvzquC41pg}t0|npc0ipo7hp1u~04975/2?.2=4fgvgjn6no|mt{{w79748227xjvor
1.数字人视频:重塑视觉体验,解锁创意无限无障碍 关怀版 登录 视频加载失败,可以 刷新 试试 00:00/00:00 数字人视频:重塑视觉体验,解锁创意无限 发布于:广东省 2025.02.10 18:14 视频:数字人视频:重塑视觉体验,解锁创意无限 +1 首赞 评论 收藏 分享 万彩动画制作 3188文章 0阅读 +订阅 相关推荐jvzquC41tqrm0|tjw0ipo8f1:7=64>927a733?:48;;
2.数字人素材视频数字人素材高清原创视频下载ai数字人线上平台展示数字人看展参观数字人数字人可以做什么数字人发展数字ip主持人ai数字人导游企业ip数字人数字人讲课绿幕直播数字人素材数字人绿幕素材数字人特效华夏数字人ai数字人直播宣传片数字孪生机器人ai数字人素材数字人说话视频素材数字人训练素材数字人训练素材视频数字人视频素材火柴人素材人的素材人屏互动jvzquC41yy}/zrsrkctdjjsi0eun1|jcten03:83568
3.如何在短视频中合成“虚拟数字人”?视频匹配数字人本文为阿里云智能媒体服务IMS「云端智能剪辑」实践指南第二期,讲述围绕效率化内容生产需求,运用数字人视频合成能力,实现高效、便捷的数字人视频制作体验。 欧叔|作者 随着虚拟数字人技术的发展,越来越多的企业把虚拟人应用到自己的业务场景中,通过创新的内容形态,提升制播效率和智能化水平。 jvzquC41dnuh0lxfp0tfv8[kfguDnxzfVgii1jwvkerf1mjvckrt1:8436952A
4.营销黑科技再升级:百度营销擎舵数字人4.0带来哪些惊喜?此外,声音与画面的和谐程度一直是衡量视频观感的重要指标。擎舵数字人4.0通过对人物面部表情、说话方式完美复刻,生成的唇形更逼真,使得口型与语音拟合度更佳,数字人使用更加自然,进一步提升数字人视频质量,帮助企业向消费者传递更全面的信息,带来更多商业转化。 jvzq<84f0{uvvq3ep1~x5?514284394v42843965a3:96=<8:0nuo
5.以数字人直播赋能数字经济联通元宇宙智播服务正式亮相!目前,联通元宇宙智播的数字人直播业务针对企业/品牌对打造专属数字IP资产,入局元宇宙数字人直播行列、元宇宙创意内容高效输出、传统直播行业痛点解决等需求,推出系列数字人直播产品:AI驱动型数字人直播、动捕驱动型数字人直播、数字人视频制作。 三大数字人产品全向发力,赋能虚拟直播 jvzquC41yy}/ewnk0eun0ls1iz~xy8wo{fh04975245u49752471a=97;39/j}rn
6.商汤:他永远关注人,大于关注技术和商业数字人新浪财经“大家好,我们又见面了。”熟悉的脸庞,熟悉的声音,熟悉的那身西装,商汤科技创始人汤晓鸥如约而至走向年会的舞台中央,说累了举起手边的矿泉水饮了一口。 汤晓鸥数字人参加年会 视频截图 每年年会,汤晓鸥都会用独属他的“汤式幽默”分享自己一年来的思考和感悟。在商汤科技,“有趣的灵魂”是大家对他的评价。 jvzq<84hkpgoen3ukpg/exr0ep5kl|14285/98/345eql2kpcs{tƒr9;481:B3ujvsm
7.创意兔数字人数字人系统数字人短视频数字人制作合伙人 成为创意兔合伙人,开启财富旅途!高额佣金保障,收入上不封顶 四大核心功能·赋能口播视频 视频创作更加高效、便捷,帮助企业和创作者提升内容质量与传播效果 数字人分身营销低成本、高增长 将文字、图片、视频等素材结合AI配音、数字人一键合成短视频 jvzquC41yy}/f~fpujoqkw3eqo5
8.创意兔数字人数字人系统数字人短视频数字人制作创意兔数字人系统,真人形象1:1复刻,原声克隆,支持多国语言输出,助力商家批量生产数字人短视频!jvzquC41yy}/eqzcpijv~3ep1
9.‎SuperAI超级助理图片数字人口播视频写作绘画App在App Store 下载“雪巩”开发的“SuperAI - 超级助理|图片数字人口播视频写作绘画”。查看屏幕快照、评分与评论、用户提示以及更多类似“SuperAI - 超级助理|图片数字人口播视频写作绘画”的游戏。jvzquC41crvt0jurng4dqv4wu1gqr8xwrgx.c|xkuvgov6xoctz.eqfv/duu1ri866>52A528Ar>|q