点击右上角微信好友

朋友圈

请使用浏览器分享功能进行分享

正在阅读:刘奕群:没有科学评测,大模型安全治理无从谈起
首页> 时政频道> 国内 > 正文

刘奕群:没有科学评测,大模型安全治理无从谈起

来源:光明网2026-04-14 23:37

  光明网香港4月14日电(记者 孔繁鑫)4月14日,2026年世界互联网大会亚太峰会人工智能安全治理论坛在中国香港举行。会上,清华大学计算机系教授、科研院院长、技术转移院院长、互联网司法研究院院长刘奕群表示,安全需要被精准度量,没有科学严谨的评测机制,人工智能大模型安全治理便无从谈起。他提出,要以场景化测试赋能人工智能安全,以“评测即治理”的思路破解大模型安全治理难题。

刘奕群:没有科学评测,大模型安全治理无从谈起

清华大学计算机系教授、科研院院长、技术转移院院长、互联网司法研究院院长刘奕群。光明网记者 潘迪、赵金悦/摄

  刘奕群认为,当前,大模型已从单一文本生成工具,演变为具备强大多模态处理与工具使用能力的通用认知智能体,深度融入社会生产生活全流程,但其安全风险也呈现泛化趋势,突破了传统信息安全范畴,向认知结构与价值判断深层渗透。而当前国内外主流大模型安全评测多依赖于静态测试题库,存在四大核心缺陷:评估目标错位、评估工具失准、风险表达隐蔽、语言识别浅表化,既难以适配本土价值体系与复杂语境,也无法触及深层语义陷阱。

  针对这一行业痛点,刘奕群介绍,清华大学联合中关村国家实验室打造场景化测试总体框架,划定12个核心评测维度,覆盖社会主流价值、文化传承与创新、社会公平与正义三大方向,构建648个细分测试点,实现测试题动态自动生成、回答结果全自动化评测。

  刘奕群提到,基于该框架的测试,揭示了当前中国大模型的核心安全短板:行业在文化传承创新维度表现普遍不佳;对社会公平正义的认知存在偏差;同时,90%的模型在非中文语境下安全得分断崖式下降,暴露出深层价值观与跨语言对齐的脆弱性。

[ 责编:董大正 ]
阅读剩余全文(

相关阅读

您此时的心情

光明云投
新闻表情排行 /
  • 开心
     
    0
  • 难过
     
    0
  • 点赞
     
    0
  • 飘过
     
    0

视觉焦点

  • 探访平陆运河青年枢纽鱼道

  • 第28届上海国际电影节举办首日活动

独家策划

推荐阅读
放慢时光脚步,静待繁花绽放。
2026-06-12 17:43
山东荣成的成山头海岸风光旖旎。
2026-06-12 14:08
文化和自然遗产日来临之际,各地多所校园开展丰富多彩的非遗体验活动。
2026-06-12 13:56
江西一处露天晒场内,工人忙着晾晒酱制品。
2026-06-12 13:13
内蒙古通辽市开鲁县境内的西辽河风光怡人。
2026-06-12 11:15