Anthropic、Project Glasswingで1万件超の脆弱性を発見SynthIDがGoogle SearchとChromeに拡大Goal modeがCodex全プラットフォームで利用開始Codex ThursdayでMac遠隔操作機能追加Anthropic、Project Glasswing初期成果を公開Anthropicが脆弱性開示ダッシュボードを更新、修正状況を公開科学向けAIスキルツールを新公開Gemini 3.5 Flashが公開、研究ツール強化Google、ADK for Kotlin/Android 0.1.0公開Gemini 3.5 Flashが正式公開AIが数学の未解決問題を初めて解決Google、Gemini Omniを発表し動画生成・編集を強化Gemini Omniで複数エージェントを活用OpenAIが長期コンピュート保証サービスを導入Gemini for Scienceが研究タスクをAI支援AI生成画像にSynthID透かしと検証ツール追加Google I/O 2026でAI新発表OpenAI、画像の来歴検証を強化し公開ツールを予告KPMG、Claudeを全社展開し税務・法務ツールから開始Google、Gemini APIにManaged Agentsを追加Anthropic、Project Glasswingで1万件超の脆弱性を発見SynthIDがGoogle SearchとChromeに拡大Goal modeがCodex全プラットフォームで利用開始Codex ThursdayでMac遠隔操作機能追加Anthropic、Project Glasswing初期成果を公開Anthropicが脆弱性開示ダッシュボードを更新、修正状況を公開科学向けAIスキルツールを新公開Gemini 3.5 Flashが公開、研究ツール強化Google、ADK for Kotlin/Android 0.1.0公開Gemini 3.5 Flashが正式公開AIが数学の未解決問題を初めて解決Google、Gemini Omniを発表し動画生成・編集を強化Gemini Omniで複数エージェントを活用OpenAIが長期コンピュート保証サービスを導入Gemini for Scienceが研究タスクをAI支援AI生成画像にSynthID透かしと検証ツール追加Google I/O 2026でAI新発表OpenAI、画像の来歴検証を強化し公開ツールを予告KPMG、Claudeを全社展開し税務・法務ツールから開始Google、Gemini APIにManaged Agentsを追加
🔒 公式発表のみ掲載。噂・リーク・情報商材は載せません。
← トップに戻る
OpenAI18:46プレスリリース公式ブログ

OpenAI、EVMbenchでAIエージェントの脆弱性検出評価公開

AIでコントラクト監査を自動化し、資産保護を強化できます。

ポイント

  • 1120脆弱性のベンチマーク、検出/修正/悪用評価
  • 2GPT-5.3-Codex悪用72.2%達成大幅向上
  • 3セキュリティ監査のAI活用促進
  • 4開発者向け実務ツールとしてlive

OpenAIはParadigmと共同でEVMbenchベンチマークを公開しました。AIエージェントがスマートコントラクトの脆弱性を検出・悪用・修正する能力を測ります。GPT-5.3-Codexが悪用モードで72%超え。ブロックチェーンセキュリティが強化されます。