OpenAIがGPT-Realtime-2をAPIで公開、音声エージェント強化（28文字）

リアルタイムで高度な音声AIエージェントを構築し、業務効率を大幅向上できます。

参照確認

参照ソース 3件

確認済み

参照ソース

主要ソース / openai.com

公式ブログ

補足ソース / x.com

公式ブログ

補足ソース / platform.openai.com

公式ブログ

要点整理

1128Kコンテキストで長会話対応。
2ツール呼び出しと回復動作強化。
370言語翻訳とストリーミング転写。
4Playgroundで即テスト可能。

OpenAIはGPT-Realtime-2、GPT-Realtime-Translate、GPT-Realtime-WhisperをRealtime APIで公開しました。GPT-Realtime-2は128Kコンテキスト（入力文字量）とツール呼び出しをリアルタイムで処理可能になり、複雑な会話タスクに対応します。開発者はボイスエージェントを簡単に構築でき、翻訳や転写も低遅延で利用できます。価格は入力$32/1Mトークンなど。

要点

OpenAIは、音声を話すだけの機能ではなく、会話を続けながら考え、翻訳し、文字に起こすAPIをまとめて強化しました。会話の流れを止めにくいのが特徴です。

影響

コールセンター、学習支援、会議の自動記録など、音声を入口にした製品で役立ちます。文字入力よりも自然なやり取りを作りたい開発者に向いています。

何が起きたか

OpenAIはAPIで使える音声モデル群を公開し、話しながら推論・翻訳・文字起こしを行えるようにしました。開発者は、通話型サポートや多言語の会話アシスタントをより自然に作れます。音声体験の品質と遅延の両方を重視した更新です。

このニュースを含むレポート

日刊・週刊・月刊レポートで、前後の流れも確認できます。

月刊 / 2026-05-01 〜 2026-05-31

2026年5月のAIニュース総まとめ｜Claude・ChatGPT・Geminiが実務導入をさらに前へ