Google18:58機能アップデート公式ドキュメント
Gemini APIにマルチモーダル関数呼び出しを追加
画像を含むツール結果をAIが直接扱え、エージェント開発が効率化します。
ポイント
- 1関数結果に画像とテキスト混在対応
- 2スクリーンショットなどの視覚処理
- 3gemini-3-flash-previewで利用可
- 4Pythonガイド公開
Gemini Interactions APIでマルチモーダル関数呼び出しが利用可能になりました。ツールが画像やテキストを返却し、Geminiが視覚データを処理します。エージェント構築が視覚タスク対応に強化されます。