Guardrails

정의

LLM/Agent의 입출력을 검증하고 안전하지 않은 행동을 차단하는 보호 장치. 입력 검증(악성 프롬프트 필터링), 출력 검증(유해 콘텐츠 차단), 행동 제한(허용 도구 목록) 등.

관계

상세

(소스 ingest를 통해 확장)

실무 적용

(소스 ingest를 통해 확장)

미해결 질문

  • (위키 성장과 함께 추가)