模型系列
四款模型覆盖从边缘设备到数据中心的全场景需求,满足不同算力预算和性能要求。
高效 Transformer 架构
Gemma 4 E2B
20 亿参数·128K 上下文窗口
超轻量级多模态模型,专为手机和嵌入式设备打造。仅需 2GB 显存即可运行,支持文本和图像理解,是移动端 AI 应用的理想选择。
Use case: 适用场景:手机端 AI 助手、边缘设备推理、IoT 智能终端
高效 Transformer 架构
Gemma 4 E4B
40 亿参数·128K 上下文窗口
轻量高效的多模态模型,在性能与资源消耗之间取得出色平衡。支持文本、图像、视频和音频理解,可在消费级笔记本电脑上流畅运行。
Use case: 适用场景:笔记本端智能助手、内容理解与摘要、多语言翻译
混合专家架构 (128 专家)
Gemma 4 26B A4B
260 亿参数 (MoE)·256K 上下文窗口
采用混合专家 (MoE) 架构,拥有 128 个专家模块,每次推理仅激活 40 亿参数。在保持高性能的同时大幅降低推理成本,堪称效率与能力的完美结合。
Use case: 适用场景:企业级智能助手、复杂代码生成、长文档分析
Dense 全参数架构
Gemma 4 31B
310 亿参数·256K 上下文窗口
旗舰级全参数稠密模型,在各项基准测试中表现卓越。256K 超长上下文窗口可处理整本书籍或大型代码库,是追求极致性能的首选方案。
Use case: 适用场景:专业代码开发、学术研究、复杂推理与数学证明
模型对比
| E2B | E4B | 26B MoE | 31B Dense | |
|---|---|---|---|---|
| 参数量 | 2B | 4B | 26B (A4B) | 31B |
| 架构 | Dense | Dense | MoE (128 experts) | Dense |
| 上下文长度 | 128K | 128K | 256K | 256K |
| 模态支持 | Text, Image, Audio | Text, Image, Audio | Text, Image, Video | Text, Image, Video, Audio |
硬件推荐
根据你的设备类型选择最适合的 Gemma 4 模型,从手机到工作站均可运行。
📱
手机 / 平板
Gemma 4 E2B
💻
笔记本电脑
Gemma 4 E4B
🖥️
桌面级 GPU
Gemma 4 26B MoE
⚡
工作站 / 服务器
Gemma 4 31B Dense
VRAM Requirements
| Model | BF16 | INT8 | INT4 |
|---|---|---|---|
| Gemma 4 E2B | 4 GB | 2.5 GB | 1.5 GB |
| Gemma 4 E4B | 8 GB | 5 GB | 3 GB |
| Gemma 4 26B (MoE) | 52 GB | 28 GB | 16 GB |
| Gemma 4 31B (Dense) | 62 GB | 33 GB | 18 GB |