针对强人工智能安全风险的技术应对策略

刘宇擎; 张玉槐; 段沛奇; 施柏鑫<sup>*</sup>; 余肇飞; 黄铁军; 高文

摘要

未来进入强人工智能(AGI)时代,人类可能面临重大安全风险。本文归纳了AGI与传统人工智能的区别,从模型的不可解释性、算法及硬件的不可靠性、自主意识的不可控性三方面研判了AGI安全风险的来源,从能力、动机、行为3个维度提出了针对AGI的安全风险评估体系。为应对安全风险,从理论及技术研究、应用两个层面分别探讨相应风险的防御策略:在理论技术研究阶段,完善理论基础验证,实现模型可解释性,严格限制AGI底层价值取向,促进技术标准化;在应用阶段,预防人为造成的安全问题,对AGI进行动机选择,为AGI赋予人类价值观。此外,建议加强国际合作,培养强AI研究人才,为迎接未知的强AI时代做好充分准备。

单位
北京大学

收藏分享被引浏览

更新时间：2024-04-18 04:36

针对强人工智能安全风险的技术应对策略

摘要

产品服务

站内浏览

服务支持

联系方式

科研之友