들어가며2026년 4월 5일, Meta가 Llama 4를 공개했다. Google Gemma 4 출시(4월 2일) 불과 3일 만이다. Google Gemma 4 완벽 정리 먼저 보기 Llama 시리즈 최초로 MoE(Mixture of Experts) 아키텍처를 도입했고 Google Gemma 모델의 역사와 진화, Scout 모델은 10M(천만) 토큰 컨텍스트 윈도우라는 업계 최대 기록을 세웠다.이 글에서는 Llama 4의 두 공개 모델 Scout와 Maverick, 그리고 미공개 Behemoth의 아키텍처, 성능, 실전 활용법을 정리한다.1. 모델 라인업모델활성 파라미터총 파라미터전문가 수컨텍스트 (IT)특징Scout17B~109B1610M단일 H100 GPU 가능Maverick17B~400B1281MGP..