개발 일상 | 백엔드 김승원의 실무 노트

  • 홈
  • 태그
  • 방명록

OpenAI API 1

LLM 보안 가드레일 실전 - PII 스캐너·프롬프트 인젝션 탐지·탈옥 방어를 코드 레벨로

들어가며지난 두 편에서 방어선 구축으로 비용·폭주·드리프트를 잡았고, LLM-as-Judge로 품질을 자동 감시하는 구조를 만들었습니다. 이제 남은 마지막 축은 "안전"입니다.운영하는 AI 에이전트가 사고를 내는 방식은 크게 세 가지입니다.개인정보 누출: 주민번호·전화·카드번호가 프롬프트에 섞여 공급자 서버로 흘러감프롬프트 인젝션: 악성 입력이 시스템 지시를 덮어써 도구를 멋대로 호출탈옥(Jailbreak): 정책 우회 패턴으로 금지된 응답을 유도오늘 글은 이 세 가지를 입구·본체·출구 3단 가드레일로 막는 실전 코드입니다. 최신 방어 기법과 오픈 소스(NeMo Guardrails, Rebuff, Presidio)까지 다룹니다.1. 위협 모델"뭘 막아야 하느냐"부터 정리해야 가드레일이 과잉도 부족도 안 ..

최신 트렌드 2026.04.22
이전
1
다음
더보기
프로필사진

개발 일상 | 백엔드 김승원의 실무 노트

3~7년차 백엔드 개발자를 위한 실무 의사결정 노트. Spring/JPA/Kafka/아키텍처/AI 통합 등 현업에서 부딪힌 선택과 트레이드오프를 정리합니다.

  • 개발 일상 N
    • Java
    • Spring Boot
    • JPA
    • Architecture
    • Database
    • DevOps
    • Kafka
    • CS
    • QueryDSL
    • AI
    • 최신 트렌드 N
    • AI 시대 생존기 N

Tag

GPT-5.4, claude code, spring ai, MCP, LLM, spring boot, PostgreSQL, docker, ai 에이전트, 백엔드, DevOps, 오픈소스 AI, ai agent, codex, Java, openai, JPA, AI 코딩, github actions, Anthropic,

최근글과 인기글

  • 최근글
  • 인기글

최근댓글

공지사항

Archives

Calendar

«   2026/05   »
일 월 화 수 목 금 토
1 2
3 4 5 6 7 8 9
10 11 12 13 14 15 16
17 18 19 20 21 22 23
24 25 26 27 28 29 30
31

방문자수Total

  • Today :
  • Yesterday :

Copyright © AXZ Corp. All rights reserved.

티스토리툴바