들어가며5월 트렌드 안전망 시리즈의 세 번째입니다. 비용 자가 관리·영구 메모리가 깔린 다음, 이제 진짜 위험이 큰 영역 — 장기 자율 실행 — 으로 들어갑니다. 5월 트렌드 정리에서 "인간이 잘 시간에 사고를 칠 수 있다"고 짚었던 그 영역이죠.장기 실행 에이전트의 가장 흔한 사고 시나리오는 이렇게 흘러갑니다. "12시간짜리 마이그레이션 작업이 8시간 지점에서 LLM 5xx로 죽었다. 처음부터 다시 시작하면 또 8시간. 중간 결과는 어디 있는지 모름. 일부는 이미 외부 API에 보내서 되돌릴 수도 없음."이 글은 그런 사고를 막는 세 가지 코드 패턴을 다룹니다.Checkpoint: 작업 단위마다 진행 상태를 영구화 → 어디서 깨졌는지 정확히 안다Resume: 마지막 성공 지점부터 재개 → 처음부터 다시..