2025年9月15日,在国家网络安全宣传周主论坛上,《人工智能安全治理框架》2.0版(以下简称《框架》2.0版)正式发布,这是2024年发布的《人工智能安全治理框架》1.0版(以下简称《框架》)的升级版本。针对人工智能迅猛发展带来的治理难点,《框架》2.0版秉持我国一贯倡导的“以人为本、智能向善”的基本理念,强化风险识别精细化,增强框架动态适应能力并提升与国际规则衔接水平。这一新版本为我国人工智能安全治理提供更稳固的治理框架支撑,为产业发展提供明确方向,也为全球治理贡献系统化的中国方案,展现出重要的战略价值。
一、《框架》2.0版出台背景
随着全球人工智能技术发展进入加速期,技术创新与应用落地呈现出爆发式增长的态势,2024年全球人工智能市场规模已经超过2792亿美元,预计到2030年年复合增长率将会达到35.9%。然而技术的快速发展也带来了前所未有的安全挑战与治理难题,在技术层面,人工智能系统的脆弱性正日益凸显,算法偏见问题导致的歧视现象在多个领域已经出现,模型可解释性不足让关键决策过程陷入“黑箱”困境,对抗性攻击技术的出现使AI系统面临新的安全威胁,从应用实践方面来看人工智能安全事件呈现频发的态势。截至2025年4月全球已报告的深度伪造相关事件达179起,超出2024年全年总量,涉及数据泄露等多个方面,这些案件不仅侵犯了个人权益,更对社会稳定和国家安全构成了威胁。2024年发布的《框架》在原则确立与基础构建方面起到了重要作用,但在风险分类精细度、治理措施操作性以及国际规则兼容性等方面有待细化。面对快速迭代的技术发展和日益复杂的安全威胁,迫切需要构建一个更加完善且更具前瞻性的治理体系。在这样的背景下,国家相关部门组织专业力量,在深入开展调研和广泛征求各方意见的基础上制定《框架》2.0版,新框架充分吸收国内外最新研究成果与实践经验,针对当前人工智能发展所面临的最紧迫安全问题提出系统性解决方案。《框架》2.0版的出台既是对技术发展趋势的及时回应之举,也是完善国家治理体系的一项重要举措,体现出统筹发展与安全的战略思维,为人工智能产业健康有序发展提供了制度框架保障。
相较于2024年9月发布的《框架》,此次出台的《框架》2.0版在形式上延续既有总体架构和逻辑体系,也在理念与措施方面作出实质性拓展。《框架》2.0版继续保持风险识别、技术应对、综合治理和安全指引的框架结构,沿用风险分类、可追溯管理等治理工具确保制度一致性和可操作性。在此基础上《框架》2.0版进一步提出“可信应用、防范失控”新原则并构建人工智能科技伦理准则,新增应用衍生风险治理维度且强化开源与供应链安全机制,这些新增内容既回应技术演进带来的新挑战,也让治理目标从“能否实现”转变为“如何负责任地实现”。围绕可信原则,《框架》2.0版将价值约束融入技术流程以确保技术发展可控可信,同时《框架》2.0版强调开源生态、供应链管理和国际接轨推动构建开放协同治理格局,这一转变使“可信”从抽象原则转化为制度化可执行要求,既回应公众对人工智能长期可靠和可控的期待,也为全球治理提供系统化的中国方案。
二、《框架》2.0版呈现全方位多层次保障机制
《框架》2.0版的发布意味着我国人工智能治理体系建设步入新阶段,从整体情况来看,《框架》2.0版主要涵盖安全治理原则与总体框架、安全风险分类、技术应对措施、综合治理措施与安全指引等内容,不仅构建起较为完整的系统和治理体系,更关键的是为人工智能健康发展提供全方位多层次保障机制。
(一)作为系统性治理蓝图的框架全景
《框架》2.0版搭建起多层次全方位治理体系,该体系将安全治理原则与总体框架当作总纲,明确人工智能安全治理基本方向和核心要求。总纲部分以“以人为本、智能向善”作为导向,遵循包容审慎、敏捷治理、技管结合、开放合作、可信应用五大原则,既体现国际共识又结合中国国情,为整个治理体系提供价值导向和理论根基。《框架》2.0版设计14项综合治理措施和4项安全指引,通过系统化设计实现从原则到实践、从技术到管理的有机衔接,形成层次分明、相互支撑的治理蓝图,既考虑当前技术发展水平又为未来技术演进预留空间,充分体现框架的前瞻性和适应性。
(二)伦理先行治理作为价值红线
《框架》2.0版提出构建人工智能科技伦理准则,首次把科技伦理治理系统纳入人工智能安全治理整体框架,确立伦理先行核心原则为技术健康发展划定价值红线,人工智能治理不再局限于算法数据算力技术性监管,而是将生命健康、人格尊严、劳动就业等关涉公共利益和社会底线要素重点保护。与《框架》偏重技术安全不同,《框架》2.0版实现从单纯强调风险防护到技术与伦理并重深度转型,推动人工智能治理进入更成熟阶段,其所确立价值导向与治理路径有效地提升了我国人工智能治理全面性和前瞻性,也在全球范围提供了具有普遍意义的中国经验,为人工智能伦理治理国际对话与规则塑造贡献制度化的参考方案。
(三)可信可控原则成为安全基石
《框架》2.0版清晰明确地提出“可信应用、防范失控”核心原则,系统全面地构建涵盖技术防护、价值对齐与协同治理多层次可信人工智能准则体系,其目的在于确保人工智能技术演进全过程实现安全、可靠与可控,特别关注防范可能威胁人类生存与发展全局性失控风险。通过强化模型鲁棒性、对抗性防御和安全验证等技术保障措施,积极推进人工智能系统与人类意图和价值规范实现深度对齐,同时建立健全跨部门、跨领域协同治理有效机制,最终形成可操作、可审查、可干预的治理闭环,以此确保人工智能在任何阶段都处于人类有效控制范围之内。这一原则的提出以及有效落实,不仅体现中国对人工智能极端风险具有前瞻性应对举措,也为全球人工智能治理提供风险防控与可持续发展并重的重要实践范式。
(四)新增“人工智能应用衍生安全风险”
《框架》2.0版对人工智能风险的认识提升到新高度。在风险分类方面,此次《框架》2.0版保留原有《框架》内生安全风险和应用安全风险后,新增“人工智能应用衍生安全风险”,聚焦技术应用环节且将人工智能可能带来的深层次社会影响纳入治理视野,这一新增维度体现治理视角的拓展与深化,重点包含社会和环境层面的系统冲击以及伦理秩序层面的深远影响。在社会和环境安全方面,《框架》2.0版重点关注人工智能应用对劳动就业结构与资源供需平衡的挑战,在伦理层面,不仅涵盖算法偏见或数据泄露等影响个人合法权益的问题,更关注人工智能在长期运行中对社会结构、认知生态和公共秩序的潜在影响,比如技术对人类情感的扰动、智能体发展对教育创新的冲击与抑制以及大规模技术应用对现行社会秩序和可持续发展的深远影响。
三、《框架》2.0版的意义与展望
《框架》2.0版的发布在我国人工智能治理体系里有承前启后的意义,其不仅延续《框架》所建立起来的基本治理框架,还在制度设计与治理理念方面实现深度扩展。在治理原则上,《框架》2.0版新增“可信应用、防范失控”核心治理原则,把人工智能安全性、可靠性和可控性当作治理底线,确保技术发展始终处在可预期、可管控的轨道之上,为研发与应用奠定更稳固制度保障。在治理理念上,《框架》2.0版明确提出构建人工智能科技伦理准则,并且将“伦理先行”确立成为人工智能治理工作的核心导向,同时把生命健康、人格尊严、社会公平、生态环境和可持续发展等价值嵌入人工智能全生命周期治理当中,进而让伦理审查从原本边缘化的程序转变成为常态化机制,最终真正实现人工智能技术与价值的深度耦合。在风险体系上,《框架》2.0版在原有内生安全风险和应用安全风险基础之上新增应用衍生安全风险,将治理范围从技术研发监管与直接应用问题拓展到社会结构、环境资源和伦理秩序等更深层面,进而让人工智能治理体系实现从短期防护向长期评估的转型,从点状应急走向全局统筹,凸显制度设计整体性与前瞻性。
展望未来,《框架》2.0版的实施会推动我国人工智能治理进入制度化体系化国际化新阶段,在国内层面它会加快人工智能安全标准体系的完善进程,推动研发应用和监管全链条的制度能够顺利落地,并且催生合规审查风险评估伦理咨询等新兴服务产业,形成技术创新与制度供给协同发展的良好格局。同时《框架》2.0版提出的“可信”原则会逐步内化为产业发展核心要求,倒逼企业在技术设计中注重透明性可解释性和责任可追溯性,从而在保障安全与伦理的前提之下推动产业高质量可持续发展。
在国际层面上,《框架》2.0版着重强调开放合作与共治共享,既回应了全球人工智能治理方面的现实需求,也为国际规则竞争提供了相应的制度抓手。随着人工智能于全球范围内得到广泛应用,中国在风险治理、伦理准则以及制度创新方面的实践经验,将为国际社会提供可复制的参考路径。可以预见的是,未来的人工智能治理竞争不只是技术和资本的竞争,更是制度与价值层面的竞争,《框架》2.0版的发布,不仅为中国在全球可信人工智能竞赛里确立制度优势奠定了坚实的基础,也为推动人工智能更好服务人类福祉和可持续发展指明了前进的方向。(作者:张平,北京大学法学院教授,北京大学人工智能研究院AI安全与治理中心主任,北京大学武汉人工智能研究院副院长)