Googleガイド・活用法公式ブログ
Google、Gemma 4を端末内で高速実行するLiteRT-LM解説
端末内で動く生成AIを作りやすくなり、遅延やプライバシー面の不安を減らせます。
ポイント
- 1Gemma 4の端末内実行を想定した構成
- 2CPU/GPU/NPUなど複数バックエンド対応
- 3WebGPUなどWeb側の実行にも言及
GoogleがLiteRT-LMで、Gemma 4をスマホやPCなど端末内で動かす最適化の考え方を解説しました。CPU/GPU/NPUでの実行やWebGPUなど、環境に応じて高速化できる点を示しています。ネット接続に頼らないAI機能を作りやすくなります。端末性能や対応環境で速度は変わります。