16. Guardrails로 안전한 대화
온라인 강의 수강 (인프런)
본 내용은 인프런에서 온라인으로 수강 가능합니다. 👉 인프런 강의 바로가기
Guardrails
- Guardrails Node는 에이전트의 응답을 필터링하는 역할을 함.
- 설정 옵션:
- Personally identifiable information (PII): 개인 식별 정보 (예: 이름, 주소 등) 필터링
- Moderation (검열): 부적절한 내용 필터링
- Jailbreak (탈옥): 에이전트가 프롬프트를 무시하고 응답하는 것을 방지
- Hallucination (환각): 사실과 다른 정보 제공 방지
- Continue on error (오류 발생 시 계속 진행): 필터링 오류 발생 시에도 워크플로우를 계속 진행
실습 내용
워크플로우
Guardrails
- Name:
Safe - Input:
input_as_text - Personally identifiable information:
True- Email address:
True
- Email address:
User approval
- Guardrails의 Fail와 연결
- Configurations
- Name:
개인 식별 정보 포함 승인 - Message:
사용자의 입력에 개인 식별 정보(PII)가 포함되어 있습니다. 계속 진행하시겠습니까?
- Name:
Agent
- Guardrails의 Pass 및 User approval의 Approve와 연결
- Configurations
- Output format:
Text - Display response in chat:
True - Write to conversation history:
True
- Output format:
End
- User approval의 Reject와 연결 (Optional)
질문 예시
나의 이메일 주소는 [email protected] 입니다.오늘 날씨 어때?
