点击右上角微信好友

朋友圈

请使用浏览器分享功能进行分享

正在阅读:乌镇声音丨百度王海峰:“多模协同”助力数字人技术赋能千行百业
首页> 时政频道> 国内 > 正文

乌镇声音丨百度王海峰:“多模协同”助力数字人技术赋能千行百业

来源:光明网2025-11-07 14:19

  在2025年世界互联网大会乌镇峰会期间,百度“剧本驱动多模协同的高拟真数字人技术”项目获世界互联网大会领先科技奖。该项成果发布人百度首席技术官王海峰在接受光明网记者采访时表示,得益于大模型等技术突破,如今的数字人技术已实现从静态播报到动态交互,将为众多行业、领域注入新的动能。

乌镇声音丨百度王海峰:“多模协同”助力数字人技术赋能千行百业

  百度首席技术官王海峰

  王海峰表示,当前,大语言模型在理解、生成、逻辑、记忆等方面的能力不断增强,尤其在深度思考、自我规划与反思进化等方面表现不断提高。同时,多模态大模型也取得显著突破,例如本次获奖的“剧本驱动多模协同的高拟真数字人技术”,不仅涉及语言,还包括语音、视频等多个模态的生成。

  “过去的数字人技术虽具备形象与声音,但在大幅动作、复杂交互以及语言、声音与动作的协调方面仍存在明显局限。”王海峰介绍,随着大模型技术的快速发展,当前数字人技术已能够流畅完成大幅度动作,并与其他物体和环境进行自然交互。而在表达特定内容时,若想做到语音、表情、口型、肢体动作与语义匹配,“多模协同”至关重要。

  谈及应用前景,王海峰表示,该技术的普及将赋能众多行业、领域。在媒体行业,数字人主播能实现24小时持续工作,播报内容自然流畅;在教育领域,数字人教师可以与学生进行自然互动,创造寓教于乐的教学体验;在客服行业,数字人客服能够实时理解用户话语的含义,做出准确应答与高效交互,为用户提供更好的服务。

  “比如在一场直播中,真人主播在同一时间只能回答一个人的问题,而数字人则可以同时响应多位用户的提问。”王海峰介绍说。

  (拍摄:范子川、曾震宇、田津金 制作/撰文:赵鹏超 统筹:李飞 策划:李政葳)

[ 责编:姜姝琪 ]
阅读剩余全文(

相关阅读

您此时的心情

光明云投
新闻表情排行 /
  • 开心
     
    0
  • 难过
     
    0
  • 点赞
     
    0
  • 飘过
     
    0

视觉焦点

  • 成渝中线高铁全线完成架梁

  • 宁夏银川:行浸式演艺激活旅游消费新场景

独家策划

推荐阅读
4月27日-5月3日光明图片一周见报作品精选
2026-05-06 15:44
安徽省芜湖市繁昌区孙村镇赤沙社区,错落有致的民居、青山、田园与道路,构成一幅和美乡村生态画卷。
2026-05-06 14:43
河北省秦皇岛市海港区迎秋里实验学校联合秦皇岛市红十字会开展“学习应急救护知识 守护生命安全”活动。
2026-05-06 14:39
在广西桂林市阳朔县遇龙河景区,众多游客乘坐竹筏漂流,悠然欣赏两岸喀斯特山水风光。
2026-05-06 14:29
位于安徽省芜湖市繁昌经济开发区的新能源专用汽车总装车间,工人在组装新能源电动清扫车。
2026-05-06 14:19