Welcome Gemma - Google’s new open LLM

概要

  • 性能
    • Gemma-7BはLLama 70Bに匹敵するレベルの性能!
  • Model Architecture
    • transformer decoderベース
    • Multi-Query Attention(2B)
    • RoPE Embeddings
    • GeGLU Activations
    • Normalizer Location