Variantes du modèle
Quatre variantes spécialisées, des appareils edge aux performances de niveau station de travail, toutes sous licence Apache 2.0.
Gemma 4 E2B
Modèle ultra-léger optimisé pour les déploiements sur appareil et edge. Offre de solides performances dans une empreinte compacte adaptée aux applications mobiles et IoT.
Gemma 4 E4B
Modèle équilibré offrant un excellent rapport qualité/taille. Idéal pour les déploiements sur ordinateur portable et de bureau où les ressources sont limitées mais où une sortie de haute qualité est requise.
Gemma 4 26B A4B
Architecture Mixture-of-Experts éparse avec 128 experts, n'activant que 4B paramètres par inférence. Atteint la qualité des grands modèles avec le coût de calcul des petits modèles.
Gemma 4 31B
Modèle dense phare offrant des performances de pointe sur tous les benchmarks. Le meilleur choix lorsque la qualité maximale et la profondeur de raisonnement sont prioritaires.
Comparaison des modèles
| E2B | E4B | 26B MoE | 31B Dense | |
|---|---|---|---|---|
| Paramètres | 2B | 4B | 26B (A4B) | 31B |
| Architecture | Dense | Dense | MoE (128 experts) | Dense |
| Longueur de contexte | 128K | 128K | 256K | 256K |
| Modalités | Text, Image, Audio | Text, Image, Audio | Text, Image, Video | Text, Image, Video, Audio |
Recommandations matérielles
Trouvez la bonne configuration matérielle pour votre déploiement de Gemma 4 en fonction de la variante du modèle et du cas d'utilisation.
Smartphone / Appareil edge
Gemma 4 E2B
Ordinateur portable / de bureau
Gemma 4 E4B
GPU de bureau
Gemma 4 26B MoE
Station de travail / Serveur
Gemma 4 31B Dense
VRAM Requirements
| Model | BF16 | INT8 | INT4 |
|---|---|---|---|
| Gemma 4 E2B | 4 GB | 2.5 GB | 1.5 GB |
| Gemma 4 E4B | 8 GB | 5 GB | 3 GB |
| Gemma 4 26B (MoE) | 52 GB | 28 GB | 16 GB |
| Gemma 4 31B (Dense) | 62 GB | 33 GB | 18 GB |