들어가며지난 세 편에서 Claude Skills, MCP 서버, Agent Teams로 AI 파이프라인을 구축하는 방법을 다뤘습니다. 구축까지는 그래도 할 만합니다. 진짜 문제는 "올리고 난 뒤"부터 시작되죠.금요일 밤에 갑자기 API 비용이 평소 대비 10배가 찍혔다는 슬랙 알림. 분명 같은 코드인데 이번 주 PR 리뷰 품질이 이상하게 떨어졌다는 피드백. CRITICAL을 남발하는 보안 에이전트. 로그를 뒤져봐도 이게 "버그"인지 "모델이 이상해진 건지" 판단이 안 섭니다.이 글은 프로덕션에 올린 AI 에이전트 파이프라인을 안정적으로 운영하는 방법에 대한 이야기입니다. 주요 축 세 가지 — 로그 분석·비용 이상 탐지·품질 드리프트 모니터링 — 를 하나씩 짚습니다. 일반 백엔드 시스템과 뭐가 다르고, 어..