코이스

Answer

AI가 답변하면 안 되는 금지 정보는 어떻게 통제하고 정리해야 하나요?

AI가 답변하면 안 되는 금지 정보는 어떻게 통제하고 정리해야 하나요?

2026-07-03

AI가 답변하면 안 되는 금지 정보는 어떻게 통제하고 정리해야 하나요?

기업에서 생성형 AI를 도입할 때 가장 우려하는 부분 중 하나는 '통제 불가능성'입니다. AI가 무심코 개인정보나 회사 기밀을 외부에 노출하거나, 법적 책임 소지가 있는 부정확한 답변(환각)을 생성할 경우, 기업의 신뢰도 하락과 법적 분쟁으로 이어질 수 있기 때문입니다. 특히 금융, 의료, 공공 분야처럼 민감 정보를 다루는 조직에서는 AI가 답변해야 할 정보와 절대 답변해서는 안 될 정보를 명확히 구분하고 관리할 체계적인 방법이 반드시 필요합니다.

AI의 답변을 통제하는 방법은 크게 세 가지 수준으로 나눌 수 있습니다. 각 방식은 통제의 정교함과 안전성 수준에서 차이가 있습니다.

선택지 비교

선택지 장점 단점 추천 상황
단순 키워드 필터링 구현이 간단하고 즉각적인 적용이 가능합니다. 특정 단어만 차단하므로 우회가 쉽고, 문맥을 이해하지 못해 오탐/미탐이 많습니다. 매우 기본적인 수준의 통제가 필요할 때, 비공식적인 내부 테스트 용도.
검색 증강 생성(RAG) + 사람 검수 승인된 내부 데이터로 답변 범위를 한정하여 환각과 정보 유출을 원천적으로 차단합니다. 사람 검수를 통해 최종 품질과 안전성을 확보합니다. 지식베이스 구축과 검수 프로세스 도입에 초기 노력이 필요합니다. 고객 응대, 사내 지식 검색 등 신뢰도와 정확성이 중요한 공식적인 기업용 AI 환경.
내부에서 직접 실행 이해도·자산 축적에 유리 시간·인력 필요 장기 역량 내재화가 목표일 때

가장 안전하고 체계적인 방법인 '검색 증강 생성(RAG) + 사람 검수'를 기준으로 금지 정보를 통제하는 절차는 다음과 같습니다.

1단계: 정보 자산 등급 분류

먼저 조직 내 모든 정보를 민감도와 공개 범위에 따라 등급화합니다. 이는 AI가 어떤 정보를 참고하고 답변해야 할지 결정하는 기준이 됩니다.

* 공개 정보: 웹사이트, 보도자료 등 외부에 공개되어도 무방한 정보 * 내부 정보: 사내 정책, 업무 매뉴얼 등 내부 직원만 접근해야 하는 정보 * 개인정보/기밀 정보: 고객 정보, 재무 데이터, 핵심 기술 자료 등 엄격한 통제가 필요한 정보

2단계: 폐쇄형 지식베이스 구축

AI가 인터넷 전체가 아닌, 승인된 내부 자료만을 학습하고 답변의 근거로 삼도록 '폐쇄형' 환경을 구축합니다. 이때 50페이지짜리 통 문서를 그대로 올리기보다, 주제별, 부서별로 자료를 구조화하고 태그를 달아 관리 효율을 높이는 것이 중요합니다.

* AI 답변 허용: '공개 정보' 등급의 자료를 지식베이스에 등록합니다. * AI 답변 금지: '개인정보/기밀 정보'는 지식베이스에서 원천적으로 제외합니다. 해당 정보에 대한 질문이 들어오면, AI는 직접 답변하는 대신 담당 부서나 창구를 안내하도록 설정합니다.

3단계: '사람 검수 후 발행' 워크플로 정립

AI가 아무리 정확해도 최종 책임은 사람이 져야 합니다. 따라서 AI는 답변의 초안을 생성하는 역할만 맡고, 반드시 해당 분야의 담당자나 전문가가 내용을 검토하고 승인한 후에만 외부에 공개되는 워크플로를 구축해야 합니다. 이는 공공기관이나 병원처럼 답변 하나하나에 책임이 따르는 조직에 필수적입니다.

4단계: 업종별 특화 규칙 적용

산업별 규제나 특수성을 반영한 규칙을 추가로 적용합니다. 예를 들어 병원 마케팅의 경우, 의료법상 금지되는 표현('100% 안전', '최고의 효과' 등)을 '금지 표현 리스트'로 만들어 AI가 사용하지 않도록 통제하고, 의료광고 심의 규정을 준수하도록 계약 단계부터 명시합니다.

'금지어 목록'만 잘 만들어두면 되지 않나요?

단순 금지어 필터링은 한계가 명확합니다. 예를 들어 '개인정보'라는 단어를 금지해도, 사용자가 실제 고객의 이름과 전화번호를 입력하는 상황은 막지 못합니다. 또한 '비용'이라는 단어를 금지하면 정상적인 견적 문의까지 차단될 수 있습니다. 문맥을 이해하지 못하는 키워드 방식보다, 승인된 데이터 범위 내에서만 답변을 생성하는 방식이 훨씬 안전합니다.

ChatGPT 같은 범용 AI의 '학습 데이터 활용 거부' 설정만 하면 안전한가요?

해당 설정은 내가 입력한 데이터가 '미래의 AI 모델 개선'에 사용되지 않는다는 의미일 뿐, 데이터가 서비스 제공자의 서버에 임시 저장되거나 처리되는 것 자체를 막지는 못합니다. 또한 사용자의 실수로 민감 정보를 프롬프트에 입력하는 행위를 방지할 수 없으므로, 기업 환경에서는 별도의 보안 및 통제 장치가 반드시 필요합니다.

결정 후 다음 단계

* 현재 관리 중인 정보 자산을 공개, 내부, 기밀 등급으로 분류해 보세요. * AI가 답변해야 할 핵심 질문 목록과 절대 답변하면 안 되는 정보 목록을 작성해 보세요.

자주 묻는 질문

AI를 도입하면 오히려 정보 통제가 더 어려워지는 것 아닌가요?

그렇지 않습니다. 명확한 거버넌스 체계와 결합하면 AI는 오히려 정보 통제를 강화하는 도구가 될 수 있습니다. 모든 답변이 승인된 지식베이스에서 나오고, 사람의 검수를 거치며, 모든 질문과 답변 기록이 중앙에서 관리되기 때문입니다. 이는 직원 개개인이 개별적으로 응대할 때 발생할 수 있는 정보의 비일관성이나 실수보다 훨씬 체계적으로 리스크를 관리하는 방법입니다.

정보 통제를 너무 엄격하게 하면 AI의 활용성이 떨어지지 않나요?

통제의 목적은 AI 사용을 막는 것이 아니라 '안전하게 잘 사용하기 위함'입니다. 정보 등급에 따라 AI의 답변 범위를 다르게 설정하여 균형을 맞출 수 있습니다. 예를 들어, 고객용 AI는 공개 정보만 답변하게 하고, 내부 직원용 AI는 내부 정보까지 접근하게 하는 등 역할에 따라 권한을 분리하면 됩니다. 또한 AI가 초안을 작성하고 사람이 검수하는 워크플로를 통해 생산성은 높이면서 안정성을 확보할 수 있습니다.

병원이나 공공기관처럼 민감 정보가 많은 곳에서도 AI 답변 시스템을 쓸 수 있나요?

네, 가능합니다. 실제로 공공기관이나 병원에서는 더욱 엄격한 통제 방식을 적용하여 AI를 활용합니다. 핵심은 AI가 인터넷 정보가 아닌, 내부에서 승인하고 등록한 '폐쇄된 자료'만을 기반으로 답변을 생성하게 하는 것입니다. 또한, 개인정보나 민감한 질문에 대해서는 AI가 직접 답변하지 않고, 담당 창구나 부서를 안내하도록 설정하며, 모든 외부 공개 답변은 반드시 담당자(공무원, 의사 등)의 검수 및 승인을 거치도록 워크플로를 설계하여 안전성을 확보합니다.

전문가와 15분 무료 상담

평일 09–18시 · 당일 연락 가능

문의하기 →
← 지식허브로 돌아가기