OpenAI18:46プレスリリース公式ブログ
OpenAI、EVMbenchでAIエージェントの脆弱性検出評価公開
AIでコントラクト監査を自動化し、資産保護を強化できます。
ポイント
- 1120脆弱性のベンチマーク、検出/修正/悪用評価
- 2GPT-5.3-Codex悪用72.2%達成大幅向上
- 3セキュリティ監査のAI活用促進
- 4開発者向け実務ツールとしてlive
OpenAIはParadigmと共同でEVMbenchベンチマークを公開しました。AIエージェントがスマートコントラクトの脆弱性を検出・悪用・修正する能力を測ります。GPT-5.3-Codexが悪用モードで72%超え。ブロックチェーンセキュリティが強化されます。