Anthropic 扩展漏洞赏金计划，全面测试下一代 AI 安全系统

近日，一家名为 Anthropic 的人工智能公司发布了一项声明，旨在界定其对“前沿 AI 系统”的理解。该声明着重强调了对“高风险能力”的管控。Anthropic 承诺会特别关注一系列潜在风险，包括网络安全、说服力、保密性和生化（CBRN）威胁等，以期减轻人工智能带来的风险。

在此项声明中，尤其值得关注的是 Anthropic 对自身人工智能模型的定位。声明明确指出，其目标是构建既强大又安全的人工智能系统，并强调对人工智能潜在危害的全面评估。为了实现这一目标，Anthropic 承诺将投入大量资源，用于研究和防范人工智能可能带来的风险。Anthropic 还特别强调，将致力于提前发现并减轻高风险能力带来的潜在危害，并为此投入了超过 15,000 个算力的资源。

根据这份声明，Anthropic 旨在通过制定明确的标准来指导其人工智能开发，从而尽可能减少人工智能带来的潜在风险，并积极管理人工智能技术可能造成的风险。这份声明也明确了 Anthropic 将致力于确保人工智能技术在发展过程中，充分考虑到安全因素，并采取积极措施来应对潜在的安全挑战。

Anthropic 强调，在构建人工智能系统时，必须优先考虑安全性，以尽可能避免人工智能技术被滥用。为此，Anthropic 承诺将不断探索和研究人工智能的安全问题，从而确保人工智能技术的发展能够服务于人类的福祉。