Gemma 4

모델 변형

엣지 디바이스부터 워크스테이션급 성능까지, 목적에 맞게 설계된 4가지 변형을 모두 Apache 2.0 라이선스로 제공합니다.

Dense

Gemma 4 E2B

2B 파라미터·128K 컨텍스트

온디바이스 및 엣지 배포에 최적화된 초경량 모델입니다. 컴팩트한 크기로 모바일과 IoT 애플리케이션에 적합한 강력한 성능을 제공합니다.

Use case: 모바일 앱, 엣지 디바이스, IoT, 실시간 온디바이스 추론
Dense

Gemma 4 E4B

4B 파라미터·128K 컨텍스트

품질 대비 크기 비율이 우수한 균형 잡힌 모델입니다. 자원이 제한적이지만 고품질 출력이 필요한 노트북 및 데스크톱 배포에 이상적입니다.

Use case: 노트북 추론, 데스크톱 어시스턴트, 경량 서버 배포
Mixture of Experts (전문가 128개)

Gemma 4 26B A4B

총 26B / 활성 4B 파라미터·256K 컨텍스트

128개 전문가를 갖춘 희소 Mixture-of-Experts 아키텍처로, 추론당 4B 파라미터만 활성화됩니다. 소형 모델 수준의 연산 비용으로 대형 모델의 품질을 구현합니다.

Use case: 고처리량 서빙, 비용 효율적 프로덕션, 멀티 테넌트 API
Dense

Gemma 4 31B

31B 파라미터·256K 컨텍스트

모든 벤치마크에서 최첨단 성능을 제공하는 플래그십 Dense 모델입니다. 최고 품질과 깊이 있는 추론이 중요할 때 최선의 선택입니다.

Use case: 연구, 복잡한 추론, 전문 콘텐츠 생성, 에이전트 워크플로

모델 비교

E2BE4B26B MoE31B Dense
파라미터2B4B26B (A4B)31B
아키텍처DenseDenseMoE (128 experts)Dense
컨텍스트 길이128K128K256K256K
모달리티Text, Image, AudioText, Image, AudioText, Image, VideoText, Image, Video, Audio

하드웨어 권장 사양

모델 변형과 사용 사례에 따라 Gemma 4 배포에 적합한 하드웨어 구성을 찾아보세요.

📱

스마트폰 / 엣지 디바이스

Gemma 4 E2B

💻

노트북 / 데스크톱

Gemma 4 E4B

🖥️

데스크톱 GPU

Gemma 4 26B MoE

워크스테이션 / 서버

Gemma 4 31B Dense

VRAM Requirements

ModelBF16INT8INT4
Gemma 4 E2B4 GB2.5 GB1.5 GB
Gemma 4 E4B8 GB5 GB3 GB
Gemma 4 26B (MoE)52 GB28 GB16 GB
Gemma 4 31B (Dense)62 GB33 GB18 GB