点击右上角微信好友

朋友圈

请使用浏览器分享功能进行分享

正在阅读:刘奕群:没有科学评测,大模型安全治理无从谈起
首页> 时政频道> 国内 > 正文

刘奕群:没有科学评测,大模型安全治理无从谈起

来源:光明网2026-04-14 23:37

  光明网香港4月14日电(记者 孔繁鑫)4月14日,2026年世界互联网大会亚太峰会人工智能安全治理论坛在中国香港举行。会上,清华大学计算机系教授、科研院院长、技术转移院院长、互联网司法研究院院长刘奕群表示,安全需要被精准度量,没有科学严谨的评测机制,人工智能大模型安全治理便无从谈起。他提出,要以场景化测试赋能人工智能安全,以“评测即治理”的思路破解大模型安全治理难题。

刘奕群:没有科学评测,大模型安全治理无从谈起

清华大学计算机系教授、科研院院长、技术转移院院长、互联网司法研究院院长刘奕群。光明网记者 潘迪、赵金悦/摄

  刘奕群认为,当前,大模型已从单一文本生成工具,演变为具备强大多模态处理与工具使用能力的通用认知智能体,深度融入社会生产生活全流程,但其安全风险也呈现泛化趋势,突破了传统信息安全范畴,向认知结构与价值判断深层渗透。而当前国内外主流大模型安全评测多依赖于静态测试题库,存在四大核心缺陷:评估目标错位、评估工具失准、风险表达隐蔽、语言识别浅表化,既难以适配本土价值体系与复杂语境,也无法触及深层语义陷阱。

  针对这一行业痛点,刘奕群介绍,清华大学联合中关村国家实验室打造场景化测试总体框架,划定12个核心评测维度,覆盖社会主流价值、文化传承与创新、社会公平与正义三大方向,构建648个细分测试点,实现测试题动态自动生成、回答结果全自动化评测。

  刘奕群提到,基于该框架的测试,揭示了当前中国大模型的核心安全短板:行业在文化传承创新维度表现普遍不佳;对社会公平正义的认知存在偏差;同时,90%的模型在非中文语境下安全得分断崖式下降,暴露出深层价值观与跨语言对齐的脆弱性。

[ 责编:董大正 ]
阅读剩余全文(

相关阅读

您此时的心情

光明云投
新闻表情排行 /
  • 开心
     
    0
  • 难过
     
    0
  • 点赞
     
    0
  • 飘过
     
    0

视觉焦点

  • 习近平会见阿联酋阿布扎比王储哈立德

  • 第十三届中国网络视听大会

独家策划

推荐阅读
我国在东风商业航天创新试验区使用力箭一号遥十二运载火箭,成功将吉星高分07A02星等8颗卫星发射升空,卫星顺利进入预定轨道,发射任务取得圆满成功。
2026-04-14 14:39
安徽省池州市九华山风景区,春雨初霁,山峰在云雾映衬下若隐若现,梦幻缥缈,蔚为壮观。
2026-04-14 14:36
湖北省襄阳市襄阳四中谷山学校首届校园科技节开幕。
2026-04-14 14:35
春日时节,俯瞰山西省运城市黄河一号旅游公路夏县支线(涑水河夏县段),生机盎然。
2026-04-14 14:32
江苏省宿迁市泗洪经济开发区内,务工人员在生产车间赶制出口羽毛球拍订单。
2026-04-14 14:30