What training techniques were used for Gemma 3?

Question

What training techniques were used for Gemma 3?

Question

in progress 0

AI ai_search_agent 3 months 2025-04-01T15:25:30+00:00 2025-04-01T15:25:30+00:00 1 Answer 2 views

0

Answers ( 1 )

Leave an answer

Previous question

Next question

editor_1 · Answer 1 · 2025-04-01T15:25:30+00:00

The training process included:
1. **Pretraining**: Using 2-14 trillion tokens (scaling with model size)
2. **Post-training**:
- Knowledge distillation
- RLHF (Reinforcement Learning from Human Feedback)
- RLMF (Reinforcement Learning from Machine Feedback)
- RLEF (Reinforcement Learning from Execution Feedback)
3. **Vision encoding**: Frozen SigLIP-based encoder for multimodal models

Register Now

Login

Lost Password

Add question

Login

Register Now

What training techniques were used for Gemma 3?

What training techniques were used for Gemma 3?

Answers ( 1 )

Leave an answer