モデルバリエーション

エッジデバイスからワークステーション級の性能まで、用途別に設計された 4 つのバリエーション。すべて Apache 2.0 ライセンスで提供されます。

Dense

Gemma 4 E2B

2B パラメータ·128K コンテキスト

オンデバイスおよびエッジでの利用に最適化された超軽量モデル。コンパクトなサイズでも高い性能を発揮し、モバイルや IoT アプリケーションに適しています。

Use case: モバイルアプリ、エッジデバイス、IoT、リアルタイムのオンデバイス推論

Dense

4B パラメータ·128K コンテキスト

品質とサイズのバランスに優れたモデル。リソースは限られつつも高品質な出力が求められる、ノートパソコンやデスクトップでの利用に最適です。

Use case: ノートPCでの推論、デスクトップアシスタント、軽量なサーバーデプロイ

Mixture of Experts（128 エキスパート）

総パラメータ 26B / アクティブパラメータ 4B·256K コンテキスト

128 個のエキスパートを持ち、推論ごとに 4B パラメータのみを活性化するスパース MoE アーキテクチャ。小型モデル並みの計算コストで、大規模モデルに匹敵する品質を実現します。

Use case: 高スループットなサービング、コスト効率の高い本番運用、マルチテナント API

Dense

31B パラメータ·256K コンテキスト

全ベンチマークで最先端の性能を発揮するフラッグシップ Dense モデル。最高品質と推論の深さを優先する用途に最適な選択肢です。

Use case: 研究、複雑な推論、プロフェッショナルなコンテンツ生成、エージェンティックワークフロー

	E2B	E4B	26B MoE	31B Dense
パラメータ	2B	4B	26B (A4B)	31B
アーキテクチャ	Dense	Dense	MoE (128 experts)	Dense
コンテキスト長	128K	128K	256K	256K
モダリティ	Text, Image, Audio	Text, Image, Audio	Text, Image, Video	Text, Image, Video, Audio

モデルバリエーションとユースケースに基づいて、Gemma 4 デプロイに適したハードウェア構成を見つけましょう。

📱

Gemma 4 E2B

💻

Gemma 4 E4B

🖥️

Gemma 4 26B MoE

⚡

Gemma 4 31B Dense

Model	BF16	INT8	INT4
Gemma 4 E2B	4 GB	2.5 GB	1.5 GB
Gemma 4 E4B	8 GB	5 GB	3 GB
Gemma 4 26B (MoE)	52 GB	28 GB	16 GB
Gemma 4 31B (Dense)	62 GB	33 GB	18 GB