Variantes del modelo
Cuatro variantes diseñadas a medida, desde dispositivos de borde hasta rendimiento de estación de trabajo, todas bajo la licencia Apache 2.0.
Gemma 4 E2B
Modelo ultraligero optimizado para despliegues en dispositivos y en el borde. Ofrece un rendimiento sólido con una huella compacta adecuada para aplicaciones móviles y IoT.
Gemma 4 E4B
Modelo balanceado que ofrece una excelente relación calidad-tamaño. Ideal para despliegues en laptops y computadoras de escritorio donde los recursos son limitados pero se requiere una salida de alta calidad.
Gemma 4 26B A4B
Arquitectura Sparse Mixture-of-Experts con 128 expertos, activando solo 4B parámetros por inferencia. Logra calidad de modelo grande con el costo de cómputo de un modelo pequeño.
Gemma 4 31B
Modelo denso insignia que ofrece un rendimiento de vanguardia en todos los benchmarks. La mejor opción cuando la máxima calidad y profundidad de razonamiento son la prioridad.
Comparación de modelos
| E2B | E4B | 26B MoE | 31B Dense | |
|---|---|---|---|---|
| Parámetros | 2B | 4B | 26B (A4B) | 31B |
| Arquitectura | Dense | Dense | MoE (128 experts) | Dense |
| Longitud de contexto | 128K | 128K | 256K | 256K |
| Modalidades | Text, Image, Audio | Text, Image, Audio | Text, Image, Video | Text, Image, Video, Audio |
Recomendaciones de hardware
Encuentra la configuración de hardware adecuada para tu despliegue de Gemma 4 según la variante del modelo y el caso de uso.
Smartphone / Dispositivo de borde
Gemma 4 E2B
Laptop / Escritorio
Gemma 4 E4B
GPU de escritorio
Gemma 4 26B MoE
Estación de trabajo / Servidor
Gemma 4 31B Dense
VRAM Requirements
| Model | BF16 | INT8 | INT4 |
|---|---|---|---|
| Gemma 4 E2B | 4 GB | 2.5 GB | 1.5 GB |
| Gemma 4 E4B | 8 GB | 5 GB | 3 GB |
| Gemma 4 26B (MoE) | 52 GB | 28 GB | 16 GB |
| Gemma 4 31B (Dense) | 62 GB | 33 GB | 18 GB |