Anthropic 提出了全新的Anthropic 人工智能监管方案,旨在限制高风险人工智能的使用,同时帮助政府和经济体系为前沿模型的冲击做好准备。其传达的信息十分明确:如果先进 AI 的能力增长如此迅猛,就必须配备能够在造成严重损害之前阻止或遏制危险部署的监管工具。
Summary
Anthropic 的 AI 监管:安全与经济影响之间
Anthropic 在其 Policy on the AI Exponential 项目中提出了两个相互配合的方案。第一个为先进 AI 制定了一个框架,第二个则关注对劳动者的经济影响以及 AI 所创造的金融收益如何分配。核心诉求十分清晰:赋予政府权力,能够对被视为高风险的模型进行预防性干预。
该提案的适用范围界定得很清楚。Anthropic 的 AI 监管将适用于训练时浮点运算量超过 10²⁵ 次的系统。此外,年 AI 收入超过 5 亿美元的公司也将被纳入监管范围。Anthropic 还将每年在 AI 研发上投入超过 10 亿美元的企业纳入其中。
高风险 AI 的监管:透明度、测试与制裁
关键措施包括对模型进行独立审查、提供关于安全性的详细文档,以及由开发者定期提交风险报告。Anthropic 希望独立评估方在拥有充足资源和模型访问权限的前提下,与模型提供方协作,对测试和报告进行核查。目标是在不完全依赖企业自我评估的情况下强化透明度。
该提案还引入了与企业全球年营收挂钩的民事处罚机制,并在重复违规时施加更为严厉的罚款。通过这种方式,Anthropic 试图建立与该行业全球规模相匹配的经济威慑力。公司还要求建立健全且公开说明的安全项目,并提高对相关政府机构的信息透明度。
先进 AI 模型的安全方法与评估方的访问权限
Anthropic 的 AI 政策的另一大重点是保护整个开发环境。开发者必须维持高标准,以防御外部攻击和内部威胁。此外,提案要求独立评估方能够访问模型,以开展真正意义上的实质性审查,而不仅仅是形式上的检查。
Anthropic 指出的四大前沿 AI 风险
Anthropic 指出四个关键风险领域:生物风险、网络风险、系统失控以及由人工智能主导的自动化研究。其潜在后果包括:被恶意用于制造危险病毒,以及对医院、能源基础设施等关键服务造成安全漏洞。
在生物风险方面,提案强调应使用基因合成筛查工具和生物监测系统,以便及早发现预警信号。在网络安全方面,则呼吁加强对关键基础设施的保护,替换存在漏洞的传统遗留系统,并设立专门的政府职能部门来监测新兴的数字进攻性能力。
Anthropic 还指出,有必要进一步完善针对系统失控和自动化研究的控制措施。在这些情形下,公司主张制定法规,使得在造成损害之前就能关闭或限制危险的 AI 系统。
公共韧性与政府对危险 AI 的控制
该提案并不局限于技术安全层面。Anthropic 还提出了一系列措施,以增强社会对先进 AI 冲击的韧性,包括针对生物和技术紧急情况的预防计划,以及更新和保护关键基础设施以抵御网络攻击的策略。
公司呼吁政策制定者加快立法步伐,以免人工智能治理在节奏上落后于技术能力演进的速度。文本中强调了一点:安全不能仅仅依赖透明度和自我监管,而是需要政府、开发者和公民社会的共同投入。
关于 Anthropic AI 监管的常见问题(FAQ)
是什么触发政府阻止某个 AI 的权力?
根据该提案,政府应当拥有对被视为高风险的模型进行预防性干预的权力。不过,文本并未具体说明触发这一权力的操作门槛或详细程序。
独立评估方如何选定和获得资金支持?
文章指出,独立评估方应当拥有充足资源和模型访问权限,但并未详细说明其选拔方式、资金来源或整个监管体系的治理结构。
识别出的主要生物风险有哪些?
Anthropic 提到,AI 可能被恶意用于制造危险病毒。为此,其建议对基因合成进行筛查,并部署生物监测系统。
该提案如何应对网络安全风险?
提案旨在加强对关键基础设施的保护,替换存在漏洞的传统遗留系统,并设立专门的政府职能部门来监测新兴的数字进攻性能力。
对重复违规行为将施加哪些制裁?
Anthropic 建议根据企业全球年营收计算民事处罚金额,并在重复违规时施加更高额的罚款。

