モデルバリエーション
エッジデバイスからワークステーション級の性能まで、用途別に設計された 4 つのバリエーション。すべて Apache 2.0 ライセンスで提供されます。
Dense
Gemma 4 E2B
2B パラメータ·128K コンテキスト
オンデバイスおよびエッジでの利用に最適化された超軽量モデル。コンパクトなサイズでも高い性能を発揮し、モバイルや IoT アプリケーションに適しています。
Use case: モバイルアプリ、エッジデバイス、IoT、リアルタイムのオンデバイス推論
Dense
Gemma 4 E4B
4B パラメータ·128K コンテキスト
品質とサイズのバランスに優れたモデル。リソースは限られつつも高品質な出力が求められる、ノートパソコンやデスクトップでの利用に最適です。
Use case: ノートPCでの推論、デスクトップアシスタント、軽量なサーバーデプロイ
Mixture of Experts(128 エキスパート)
Gemma 4 26B A4B
総パラメータ 26B / アクティブパラメータ 4B·256K コンテキスト
128 個のエキスパートを持ち、推論ごとに 4B パラメータのみを活性化するスパース MoE アーキテクチャ。小型モデル並みの計算コストで、大規模モデルに匹敵する品質を実現します。
Use case: 高スループットなサービング、コスト効率の高い本番運用、マルチテナント API
Dense
Gemma 4 31B
31B パラメータ·256K コンテキスト
全ベンチマークで最先端の性能を発揮するフラッグシップ Dense モデル。最高品質と推論の深さを優先する用途に最適な選択肢です。
Use case: 研究、複雑な推論、プロフェッショナルなコンテンツ生成、エージェンティックワークフロー
モデル比較
| E2B | E4B | 26B MoE | 31B Dense | |
|---|---|---|---|---|
| パラメータ | 2B | 4B | 26B (A4B) | 31B |
| アーキテクチャ | Dense | Dense | MoE (128 experts) | Dense |
| コンテキスト長 | 128K | 128K | 256K | 256K |
| モダリティ | Text, Image, Audio | Text, Image, Audio | Text, Image, Video | Text, Image, Video, Audio |
ハードウェア推奨構成
モデルバリエーションとユースケースに基づいて、Gemma 4 デプロイに適したハードウェア構成を見つけましょう。
📱
スマートフォン / エッジデバイス
Gemma 4 E2B
💻
ノートPC / デスクトップ
Gemma 4 E4B
🖥️
デスクトップ GPU
Gemma 4 26B MoE
⚡
ワークステーション / サーバー
Gemma 4 31B Dense
VRAM Requirements
| Model | BF16 | INT8 | INT4 |
|---|---|---|---|
| Gemma 4 E2B | 4 GB | 2.5 GB | 1.5 GB |
| Gemma 4 E4B | 8 GB | 5 GB | 3 GB |
| Gemma 4 26B (MoE) | 52 GB | 28 GB | 16 GB |
| Gemma 4 31B (Dense) | 62 GB | 33 GB | 18 GB |