콘텐츠로 이동

OpenAI Agent School

16. Guardrails로 안전한 대화

교육, 대회 및 행사 문의

16. Guardrails로 안전한 대화

온라인 강의 수강 (인프런)

본 내용은 인프런에서 온라인으로 수강 가능합니다. 👉 인프런 강의 바로가기

Guardrails

Guardrails Node는 에이전트의 응답을 필터링하는 역할을 함.
설정 옵션:
- Personally identifiable information (PII): 개인 식별 정보 (예: 이름, 주소 등) 필터링
- Moderation (검열): 부적절한 내용 필터링
- Jailbreak (탈옥): 에이전트가 프롬프트를 무시하고 응답하는 것을 방지
- Hallucination (환각): 사실과 다른 정보 제공 방지
- Continue on error (오류 발생 시 계속 진행): 필터링 오류 발생 시에도 워크플로우를 계속 진행

실습 내용

워크플로우

Guardrails

Name: Safe
Input: input_as_text
Personally identifiable information: True
- Email address: True

User approval

Guardrails의 Fail와 연결
Configurations
- Name: 개인 식별 정보 포함 승인
- Message: 사용자의 입력에 개인 식별 정보(PII)가 포함되어 있습니다. 계속 진행하시겠습니까?

Agent

Guardrails의 Pass 및 User approval의 Approve와 연결
Configurations
- Output format: Text
- Display response in chat: True
- Write to conversation history: True

End

User approval의 Reject와 연결 (Optional)

질문 예시

나의 이메일 주소는 [email protected] 입니다.
오늘 날씨 어때?