콘텐츠로 이동

16. Guardrails로 안전한 대화

Guardrails

  • Guardrails Node는 에이전트의 응답을 필터링하는 역할을 함.
  • 설정 옵션:
    • Personally identifiable information (PII): 개인 식별 정보 (예: 이름, 주소 등) 필터링
    • Moderation (검열): 부적절한 내용 필터링
    • Jailbreak (탈옥): 에이전트가 프롬프트를 무시하고 응답하는 것을 방지
    • Hallucination (환각): 사실과 다른 정보 제공 방지
    • Continue on error (오류 발생 시 계속 진행): 필터링 오류 발생 시에도 워크플로우를 계속 진행

실습 내용

워크플로우

workflow

Guardrails

  • Name: Safe
  • Input: input_as_text
  • Personally identifiable information: True
    • Email address: True

User approval

  • Guardrails의 Fail와 연결
  • Configurations
    • Name: 개인 식별 정보 포함 승인
    • Message: 사용자의 입력에 개인 식별 정보(PII)가 포함되어 있습니다. 계속 진행하시겠습니까?

Agent

  • Guardrails의 Pass 및 User approval의 Approve와 연결
  • Configurations
    • Output format: Text
    • Display response in chat: True
    • Write to conversation history: True

End

  • User approval의 Reject와 연결 (Optional)

질문 예시