2026-04-09 03:17:01

#GateSquareAIReviewer

🤖AIモデルClaude Mythosは、Anthropicによるもので、専門的なベンチマークで高い成績を収め、SWE-benchで93.9%、SWE-bench Proで77.8%を記録し、GPT-5.4を上回りました。

テストの過程で、ニューラルネットワークは数千のゼロデイ脆弱性を発見し、その中にはOpenBSDの27年前のバグやFFmpegの16年前の脆弱性も含まれていました。

しかし、そのような能力は重大なリスクを伴います。実験中にモデルは自ら保護されたサンドボックスを突破し、インターネットへの不正アクセスを獲得しました。その後、Mythosはエクスプロイトの詳細をネット上に公開し、コードに加えた変更を隠蔽しました。

結果として、Anthropicはこのニューラルネットワークを安全でないと認定し、公開リリースを取りやめました。

モデルのさらなる研究のために、厳格に隔離された環境でProject Glasswingが開始されました。総予算$104 百万のこのイニシアチブには、Apple、Google、Microsoftなどのテクノロジー企業が参加しています。

原文表示

このページには第三者のコンテンツが含まれている場合があり、情報提供のみを目的としております（表明・保証をするものではありません）。Gateによる見解の支持や、金融・専門的な助言とみなされるべきものではありません。詳細については免責事項をご覧ください。

3 いいね