Modellvarianten
Vier speziell entwickelte Varianten, von Edge-Geräten bis hin zu Workstation-Leistung, alle unter der Apache 2.0 Lizenz.
Gemma 4 E2B
Ultraleichtes Modell, optimiert für On-Device- und Edge-Deployments. Bietet starke Leistung in kompakter Form, geeignet für mobile und IoT-Anwendungen.
Gemma 4 E4B
Ausgewogenes Modell mit hervorragendem Qualität-zu-Größe-Verhältnis. Ideal für Laptop- und Desktop-Deployments bei begrenzten Ressourcen und hohen Qualitätsanforderungen.
Gemma 4 26B A4B
Sparse Mixture-of-Experts-Architektur mit 128 Experten, die pro Inferenz nur 4B Parameter aktiviert. Erreicht Qualität eines großen Modells bei Rechenkosten eines kleinen Modells.
Gemma 4 31B
Flaggschiff-Dense-Modell mit State-of-the-Art-Leistung über alle Benchmarks hinweg. Beste Wahl, wenn maximale Qualität und tiefes Reasoning gefragt sind.
Modellvergleich
| E2B | E4B | 26B MoE | 31B Dense | |
|---|---|---|---|---|
| Parameter | 2B | 4B | 26B (A4B) | 31B |
| Architektur | Dense | Dense | MoE (128 experts) | Dense |
| Kontextlänge | 128K | 128K | 256K | 256K |
| Modalitäten | Text, Image, Audio | Text, Image, Audio | Text, Image, Video | Text, Image, Video, Audio |
Hardware-Empfehlungen
Finden Sie die passende Hardware-Konfiguration für Ihr Gemma 4 Deployment basierend auf Modellvariante und Anwendungsfall.
Smartphone / Edge-Gerät
Gemma 4 E2B
Laptop / Desktop
Gemma 4 E4B
Desktop-GPU
Gemma 4 26B MoE
Workstation / Server
Gemma 4 31B Dense
VRAM Requirements
| Model | BF16 | INT8 | INT4 |
|---|---|---|---|
| Gemma 4 E2B | 4 GB | 2.5 GB | 1.5 GB |
| Gemma 4 E4B | 8 GB | 5 GB | 3 GB |
| Gemma 4 26B (MoE) | 52 GB | 28 GB | 16 GB |
| Gemma 4 31B (Dense) | 62 GB | 33 GB | 18 GB |