点击右上角微信好友

朋友圈

请使用浏览器分享功能进行分享

正在阅读:乌镇声音丨百度王海峰:“多模协同”助力数字人技术赋能千行百业
首页> 时政频道> 国内 > 正文

乌镇声音丨百度王海峰:“多模协同”助力数字人技术赋能千行百业

来源:光明网2025-11-07 14:19

  在2025年世界互联网大会乌镇峰会期间,百度“剧本驱动多模协同的高拟真数字人技术”项目获世界互联网大会领先科技奖。该项成果发布人百度首席技术官王海峰在接受光明网记者采访时表示,得益于大模型等技术突破,如今的数字人技术已实现从静态播报到动态交互,将为众多行业、领域注入新的动能。

乌镇声音丨百度王海峰:“多模协同”助力数字人技术赋能千行百业

  百度首席技术官王海峰

  王海峰表示,当前,大语言模型在理解、生成、逻辑、记忆等方面的能力不断增强,尤其在深度思考、自我规划与反思进化等方面表现不断提高。同时,多模态大模型也取得显著突破,例如本次获奖的“剧本驱动多模协同的高拟真数字人技术”,不仅涉及语言,还包括语音、视频等多个模态的生成。

  “过去的数字人技术虽具备形象与声音,但在大幅动作、复杂交互以及语言、声音与动作的协调方面仍存在明显局限。”王海峰介绍,随着大模型技术的快速发展,当前数字人技术已能够流畅完成大幅度动作,并与其他物体和环境进行自然交互。而在表达特定内容时,若想做到语音、表情、口型、肢体动作与语义匹配,“多模协同”至关重要。

  谈及应用前景,王海峰表示,该技术的普及将赋能众多行业、领域。在媒体行业,数字人主播能实现24小时持续工作,播报内容自然流畅;在教育领域,数字人教师可以与学生进行自然互动,创造寓教于乐的教学体验;在客服行业,数字人客服能够实时理解用户话语的含义,做出准确应答与高效交互,为用户提供更好的服务。

  “比如在一场直播中,真人主播在同一时间只能回答一个人的问题,而数字人则可以同时响应多位用户的提问。”王海峰介绍说。

  (拍摄:范子川、曾震宇、田津金 制作/撰文:赵鹏超 统筹:李飞 策划:李政葳)

[ 责编:姜姝琪 ]
阅读剩余全文(

相关阅读

您此时的心情

光明云投
新闻表情排行 /
  • 开心
     
    0
  • 难过
     
    0
  • 点赞
     
    0
  • 飘过
     
    0

视觉焦点

  • 香港赤柱举办国际龙舟锦标赛

  • 西藏山南:在5350米山巅立风机

独家策划

推荐阅读
贵州省黔东南苗族侗族自治州从江县高增乡占里侗寨薄雾萦绕、满目青翠。
2026-06-20 18:03
山东省荣成市石岛管理区海工装备产业基地内一片繁忙。
2026-06-20 18:01
江西省抚州市广昌县千善乡高洲村一片杉树林内,数千只白鹭在此栖息繁衍。
2026-06-20 17:57
端午小长假期间,各地统筹推出传统民俗、文博研学、科技科普、休闲观光等多层次文旅活动,丰富群众假日文化生活。
2026-06-20 17:08
甘肃张掖国家湿地公园雨后景致宜人。
2026-06-20 16:43