Anthropic、Project Glasswingで1万件超の脆弱性を発見 SynthIDがGoogle SearchとChromeに拡大 Goal modeがCodex全プラットフォームで利用開始 Codex ThursdayでMac遠隔操作機能追加 Anthropic、Project Glasswing初期成果を公開 Anthropicが脆弱性開示ダッシュボードを更新、修正状況を公開科学向けAIスキルツールを新公開 Gemini 3.5 Flashが公開、研究ツール強化 Google、ADK for Kotlin/Android 0.1.0公開 Gemini 3.5 Flashが正式公開 AIが数学の未解決問題を初めて解決 Google、Gemini Omniを発表し動画生成・編集を強化 Gemini Omniで複数エージェントを活用 OpenAIが長期コンピュート保証サービスを導入 Gemini for Scienceが研究タスクをAI支援 AI生成画像にSynthID透かしと検証ツール追加 Google I/O 2026でAI新発表 OpenAI、画像の来歴検証を強化し公開ツールを予告 KPMG、Claudeを全社展開し税務・法務ツールから開始 Google、Gemini APIにManaged Agentsを追加 Anthropic、Project Glasswingで1万件超の脆弱性を発見 SynthIDがGoogle SearchとChromeに拡大 Goal modeがCodex全プラットフォームで利用開始 Codex ThursdayでMac遠隔操作機能追加 Anthropic、Project Glasswing初期成果を公開 Anthropicが脆弱性開示ダッシュボードを更新、修正状況を公開科学向けAIスキルツールを新公開 Gemini 3.5 Flashが公開、研究ツール強化 Google、ADK for Kotlin/Android 0.1.0公開 Gemini 3.5 Flashが正式公開 AIが数学の未解決問題を初めて解決 Google、Gemini Omniを発表し動画生成・編集を強化 Gemini Omniで複数エージェントを活用 OpenAIが長期コンピュート保証サービスを導入 Gemini for Scienceが研究タスクをAI支援 AI生成画像にSynthID透かしと検証ツール追加 Google I/O 2026でAI新発表 OpenAI、画像の来歴検証を強化し公開ツールを予告 KPMG、Claudeを全社展開し税務・法務ツールから開始 Google、Gemini APIにManaged Agentsを追加

🔒 公式発表のみ掲載。噂・リーク・情報商材は載せません。

← トップに戻る

Anthropicガイド・活用法公式ドキュメント

Claude Opus 4.6のサボタージュリスク報告を公開

高権限の自動化を導入する前に、想定リスクと対策を短時間で確認できます。

ポイント

1組織内での自律的な不正操作リスクを定義
2脅威モデルと対策（監視・制約）を整理
3一部は悪用防止や機密で公開版は編集あり

Anthropicは、Claude Opus 4.6に関するSabotage Risk Report（外部公開版）を公開しました。社内で強い権限を持つ環境でモデルを使う際の「自律的な不正操作」リスクを、脅威モデルと対策で整理しています。導入企業が社内ルールや監視設計を考える材料になります。

📎 ソース: 公式ドキュメント