Googleが新たなオープンソースモデル「Gemma 4」を公開しました。テキスト、画像、音声をデバイス内で処理し、データはクラウドに送信されません。Apache 2.0ライセンスで無料のAI Edge Galleryアプリで利用可能です。
Googleの新しいオープンソースモデル「Gemma 4」は、テキスト、画像、音声を完全にデバイス内で処理します。エージェント機能により、AIはWikipediaやインタラクティブマップなどのツールに独立してアクセスでき、クラウドは不要です。
このモデルを実行するために必要なGoogle AI Edge Galleryアプリは、AndroidおよびiOS上で無料で利用できます。Gemma 4のリリース以降、このアプリはiOS App Storeの最もダウンロードされている無料生産性アプリの中で4位に上昇し、Claude、Gemini、ChatGPTのすぐ後ろに位置しています。
Gemma 4はGoogleの独自モデル「Gemini 3」と同じ研究に基づいていますが、商用利用に適したApache 2.0ライセンスの下で提供されています。Googleによると、Gemmaファミリーは初世代のリリース以来、400万以上のダウンロードを記録しています。すべてのモデルは140以上の言語でテキスト、画像、音声を処理します。
最新リリースは4つのバリエーションで提供されています。E2BとE4Bはスマートフォン向けに特別に構築されました。「E」は「有効パラメータ」を意味し、推論(inference)中に実際にアクティブなパラメータの数を示します。量子化されたE2Bはデバイス上で約1.3GBを占め、E4Bは約2.5GBが必要です。
より大きい26Bおよび31Bバリアントはサーバーと高性能ハードウェアを対象としています。26Bバージョンは128個のエキスパートを備えた混合エキスパート(mixture-of-experts)アーキテクチャを使用しており、任意の時点で30億個のパラメータのみがアクティブです。密集型の31Bモデルは最大256,000トークンのコンテキストウィンドウを提供します。
GoogleはArmおよびQualcommと協力して、スマートフォンバリアントを現在のモバイルチップ向けに最適化しました。Googleによると、AndroidのGemma 4は前世代より最大4倍高速に動作し、バッテリー消費を最大60%削減します。Armの独自ベンチマークはさらに大きな改善を示しており、SME2命令セット(AIモデルのマトリックス演算をシリコンで直接加速する拡張)を備えた新しいArmチップを搭載したデバイスでは、平均5.5倍の処理速度向上が実現されています。
アプリはAndroid 12またはiOS 17が必要です。スマートフォンサイズの2つのバリアントはRAM要件が異なります。E2Bは量子化時に約1.3GBを使用し、6GBのRAMを搭載するデバイスで実行でき、E4Bは約2.5GBのモデルメモリを必要とし、最低8GBのRAMが必要です。
基本的なチャット、画像認識、音声書き起こしを超えて、アプリはGoogleが「エージェント機能」と呼ぶものを搭載しています。Wikipedia検索、インタラクティブマップ、自動生成される要約、フラッシュカードです。Gemma 4は写真の説明、音声入力の変換も可能です。
