모델 변형

엣지 디바이스부터 워크스테이션급 성능까지, 목적에 맞게 설계된 4가지 변형을 모두 Apache 2.0 라이선스로 제공합니다.

Dense

Gemma 4 E2B

2B 파라미터·128K 컨텍스트

온디바이스 및 엣지 배포에 최적화된 초경량 모델입니다. 컴팩트한 크기로 모바일과 IoT 애플리케이션에 적합한 강력한 성능을 제공합니다.

Use case: 모바일 앱, 엣지 디바이스, IoT, 실시간 온디바이스 추론

Dense

4B 파라미터·128K 컨텍스트

품질 대비 크기 비율이 우수한 균형 잡힌 모델입니다. 자원이 제한적이지만 고품질 출력이 필요한 노트북 및 데스크톱 배포에 이상적입니다.

Use case: 노트북 추론, 데스크톱 어시스턴트, 경량 서버 배포

Mixture of Experts (전문가 128개)

총 26B / 활성 4B 파라미터·256K 컨텍스트

128개 전문가를 갖춘 희소 Mixture-of-Experts 아키텍처로, 추론당 4B 파라미터만 활성화됩니다. 소형 모델 수준의 연산 비용으로 대형 모델의 품질을 구현합니다.

Use case: 고처리량 서빙, 비용 효율적 프로덕션, 멀티 테넌트 API

Dense

31B 파라미터·256K 컨텍스트

모든 벤치마크에서 최첨단 성능을 제공하는 플래그십 Dense 모델입니다. 최고 품질과 깊이 있는 추론이 중요할 때 최선의 선택입니다.

Use case: 연구, 복잡한 추론, 전문 콘텐츠 생성, 에이전트 워크플로

	E2B	E4B	26B MoE	31B Dense
파라미터	2B	4B	26B (A4B)	31B
아키텍처	Dense	Dense	MoE (128 experts)	Dense
컨텍스트 길이	128K	128K	256K	256K
모달리티	Text, Image, Audio	Text, Image, Audio	Text, Image, Video	Text, Image, Video, Audio

모델 변형과 사용 사례에 따라 Gemma 4 배포에 적합한 하드웨어 구성을 찾아보세요.

📱

Gemma 4 E2B

💻

Gemma 4 E4B

🖥️

Gemma 4 26B MoE

⚡

Gemma 4 31B Dense

Model	BF16	INT8	INT4
Gemma 4 E2B	4 GB	2.5 GB	1.5 GB
Gemma 4 E4B	8 GB	5 GB	3 GB
Gemma 4 26B (MoE)	52 GB	28 GB	16 GB
Gemma 4 31B (Dense)	62 GB	33 GB	18 GB