Variantes do Modelo
Quatro variantes desenvolvidas especificamente, de dispositivos edge a desempenho de workstation, todas sob a licença Apache 2.0.
Gemma 4 E2B
Modelo ultraleve otimizado para implantações em dispositivos e edge. Entrega desempenho forte em um formato compacto, adequado para aplicações móveis e IoT.
Gemma 4 E4B
Modelo equilibrado que oferece excelente relação qualidade-tamanho. Ideal para implantações em laptops e desktops onde os recursos são limitados, mas é necessária uma saída de alta qualidade.
Gemma 4 26B A4B
Arquitetura Mixture-of-Experts esparsa com 128 especialistas, ativando apenas 4B de parâmetros por inferência. Alcança qualidade de modelo grande com custo de computação de modelo pequeno.
Gemma 4 31B
Modelo denso carro-chefe que oferece desempenho de ponta em todos os benchmarks. Melhor escolha quando qualidade máxima e profundidade de raciocínio são prioridade.
Comparação de Modelos
| E2B | E4B | 26B MoE | 31B Dense | |
|---|---|---|---|---|
| Parâmetros | 2B | 4B | 26B (A4B) | 31B |
| Arquitetura | Dense | Dense | MoE (128 experts) | Dense |
| Comprimento do Contexto | 128K | 128K | 256K | 256K |
| Modalidades | Text, Image, Audio | Text, Image, Audio | Text, Image, Video | Text, Image, Video, Audio |
Recomendações de Hardware
Encontre a configuração de hardware certa para sua implantação do Gemma 4 com base na variante do modelo e no caso de uso.
Smartphone / Dispositivo Edge
Gemma 4 E2B
Notebook / Desktop
Gemma 4 E4B
GPU de Desktop
Gemma 4 26B MoE
Workstation / Servidor
Gemma 4 31B Dense
VRAM Requirements
| Model | BF16 | INT8 | INT4 |
|---|---|---|---|
| Gemma 4 E2B | 4 GB | 2.5 GB | 1.5 GB |
| Gemma 4 E4B | 8 GB | 5 GB | 3 GB |
| Gemma 4 26B (MoE) | 52 GB | 28 GB | 16 GB |
| Gemma 4 31B (Dense) | 62 GB | 33 GB | 18 GB |