들어가며지난 5월 신규 트렌드 정리에서 다섯 가지 흐름 중 "가장 먼저 도입해야 할 안전망"으로 비용 자가 관리를 꼽았습니다. 다른 트렌드(장기 자율 실행·영구 메모리·A2A·Computer Use)를 도입할 때마다 비용은 기하급수적으로 늡니다. 자가 관리가 안 깔려 있으면 Uber $3.4B 사고 같은 패턴이 자기 회사에서 그대로 재현됩니다.오늘은 이 추상적인 "자가 관리"를 실제 코드로 풀어봅니다. Spring Boot 4 + Resilience4j 조합으로 다음 세 가지 패턴을 구현합니다.모델 캐스케이드 - 작업 난이도 판정 후 Haiku → Sonnet → Opus 단계별 호출예산 가드 - 일/시간 단위 비용 한도 + 한도 초과 시 자동 다운그레이드/차단캐시 우선 - 동일 질의 재호출 방지로 토큰..