谷歌旗下DeepMind近日发布《技术性AGI安全与保障方法》白皮书,提出系统性方案应对通用人工智能(AGI)潜在风险。报告指出,AGI可能在未来数年内实现人类级认知能力,为医疗、教育等领域带来突破,但滥用与目标错位等风险不容忽视。DeepMind倡议通过安全机制设计、透明化研究及行业协作降低危害,并提出组建跨国评估机构和国家级AI风险监测中心等具体措施。
此外,DeepMind强调强化技术研究与部署预警系统的重要性,同时限制AI网络攻击等危险能力。这一倡议得到行业响应,如Anthropic设置能力阈值触发保护机制,Meta推出《前沿AI框架》停止公开高危模型。英伟达也推出NeMo Guardrails微服务套件,实时拦截有害输出,助力硬件领域安全防护。