모델 변형
엣지 디바이스부터 워크스테이션급 성능까지, 목적에 맞게 설계된 4가지 변형을 모두 Apache 2.0 라이선스로 제공합니다.
Dense
Gemma 4 E2B
2B 파라미터·128K 컨텍스트
온디바이스 및 엣지 배포에 최적화된 초경량 모델입니다. 컴팩트한 크기로 모바일과 IoT 애플리케이션에 적합한 강력한 성능을 제공합니다.
Use case: 모바일 앱, 엣지 디바이스, IoT, 실시간 온디바이스 추론
Dense
Gemma 4 E4B
4B 파라미터·128K 컨텍스트
품질 대비 크기 비율이 우수한 균형 잡힌 모델입니다. 자원이 제한적이지만 고품질 출력이 필요한 노트북 및 데스크톱 배포에 이상적입니다.
Use case: 노트북 추론, 데스크톱 어시스턴트, 경량 서버 배포
Mixture of Experts (전문가 128개)
Gemma 4 26B A4B
총 26B / 활성 4B 파라미터·256K 컨텍스트
128개 전문가를 갖춘 희소 Mixture-of-Experts 아키텍처로, 추론당 4B 파라미터만 활성화됩니다. 소형 모델 수준의 연산 비용으로 대형 모델의 품질을 구현합니다.
Use case: 고처리량 서빙, 비용 효율적 프로덕션, 멀티 테넌트 API
Dense
Gemma 4 31B
31B 파라미터·256K 컨텍스트
모든 벤치마크에서 최첨단 성능을 제공하는 플래그십 Dense 모델입니다. 최고 품질과 깊이 있는 추론이 중요할 때 최선의 선택입니다.
Use case: 연구, 복잡한 추론, 전문 콘텐츠 생성, 에이전트 워크플로
모델 비교
| E2B | E4B | 26B MoE | 31B Dense | |
|---|---|---|---|---|
| 파라미터 | 2B | 4B | 26B (A4B) | 31B |
| 아키텍처 | Dense | Dense | MoE (128 experts) | Dense |
| 컨텍스트 길이 | 128K | 128K | 256K | 256K |
| 모달리티 | Text, Image, Audio | Text, Image, Audio | Text, Image, Video | Text, Image, Video, Audio |
하드웨어 권장 사양
모델 변형과 사용 사례에 따라 Gemma 4 배포에 적합한 하드웨어 구성을 찾아보세요.
📱
스마트폰 / 엣지 디바이스
Gemma 4 E2B
💻
노트북 / 데스크톱
Gemma 4 E4B
🖥️
데스크톱 GPU
Gemma 4 26B MoE
⚡
워크스테이션 / 서버
Gemma 4 31B Dense
VRAM Requirements
| Model | BF16 | INT8 | INT4 |
|---|---|---|---|
| Gemma 4 E2B | 4 GB | 2.5 GB | 1.5 GB |
| Gemma 4 E4B | 8 GB | 5 GB | 3 GB |
| Gemma 4 26B (MoE) | 52 GB | 28 GB | 16 GB |
| Gemma 4 31B (Dense) | 62 GB | 33 GB | 18 GB |