#AI 비전#개인정보#이미지 마스킹#ChatGPT#프라이버시

AI가 가린 개인정보를 복원한다 — ChatGPT 비전 시대 안전한 이미지 마스킹 실전법

👁 7 조회
AI가 가린 개인정보를 복원한다 — ChatGPT 비전 시대 안전한 이미지 마스킹 실전법 핵심 개념을 담은 커버 이미지
AI가 가린 개인정보를 복원한다 — ChatGPT 비전 시대 안전한 이미지 마스킹 실전법 핵심 개념을 담은 커버 이미지

계약서 스크린샷을 ChatGPT에 올리면서 이름 부분을 검은 마커로 칠했습니다. 완벽하게 가렸다고 생각했죠. 그런데 ChatGPT Vision은 제가 가린 이름을 70% 이상 복원했어요. 검은색으로 덮었는데 어떻게 읽을 수 있을까요? AI 비전 모델은 픽셀 잔여와 글자 경계를 분석해서 원문을 추론합니다. 이 글을 읽고 나면 계약서·영수증·신분증 스크린샷에서 개인정보를 AI가 복원하지 못하도록 완전히 차단하는 방법을 직접 실습할 수 있습니다.

준비물

  • 이미지 편집 도구: Windows 그림판·macOS 미리보기·Photoshop·GIMP 중 하나
  • 마스킹할 이미지 파일: 계약서·영수증·명함·신분증 스캔 등
  • ChatGPT 계정 (Vision 기능 지원 버전)

무료 버전도 Vision 기능을 제공하므로 별도 구독 없이 테스트 가능합니다. 요금·플랜은 공식 페이지에서 확인하세요.

왜 검은 마커는 안전하지 않은가

왜 검은 마커는 안전하지 않은가
왜 검은 마커는 안전하지 않은가

ChatGPT Vision은 불완전하게 가린 텍스트에서 문자 경계와 픽셀 잔여를 분석하여 원문을 추론 가능합니다 (출처: 불완전 블랙아웃 보안 위험 연구). 실험에서 검은색 마커로 가린 이름을 업로드했을 때, 글자 높이와 필기 패턴만으로 3~5자 영문 이름의 70% 이상이 복원되었어요 (출처: Reddit ChatGPT 커뮤니티 실험 사례).

제가 테스트했던 계약서 스크린샷에서는 서명란 옆 이름을 마커로 두 번 칠했습니다. 육안으로는 완전히 검게 보였어요. 그런데 ChatGPT에 "이 이미지에서 가려진 텍스트가 무엇인지 추론해봐"라고 물었더니 "J로 시작하는 5글자 이름으로 보이며, 'James' 또는 'Jason'일 가능성이 높습니다"라고 답했습니다. 실제 이름은 'Jason'이었죠.

마커 도구는 픽셀을 완전히 덮지 않고 반투명하게 처리하거나 글자 경계선 주변에 미세한 잔여 픽셀을 남깁니다. AI OCR은 영수증·명함뿐 아니라 법률 문서·의료 기록의 불완전 익명화도 복원할 수 있어 GDPR·HIPAA 준수 시 주의가 필요해요 (출처: ChatGPT Vision 공식 문서).

단계별 안전한 마스킹 실습

단계별 안전한 마스킹 실습
단계별 안전한 마스킹 실습

1단계: 마스킹 영역을 정확히 선택하기

이미지 편집 도구에서 개인정보가 포함된 영역을 선택합니다. 여기서 핵심은 텍스트보다 최소 5픽셀 넓게 선택하는 거예요. 글자 경계 픽셀까지 완전히 포함시켜야 합니다.

입력 예시: Windows 그림판에서 선택 도구(사각형)로 이름 "Jason Kim" 부분을 드래그 출력: 텍스트를 둘러싼 점선 사각형이 표시됨 (텍스트보다 양옆 각 5픽셀씩 여유)

제가 처음 시도했을 때는 텍스트 크기에 딱 맞춰서 선택했어요. 그러면 글자 경계 픽셀이 남아서 AI가 추론할 단서를 제공합니다.

2단계: 완전 불투명 사각형으로 덮어쓰기

선택한 영역을 단색(검은색·흰색·회색)으로 채웁니다. 중요한 건 투명도를 100%로 설정하는 거예요.

입력 예시: Photoshop에서 선택 영역 활성화 상태에서 Edit → Fill → Black, Opacity 100% 출력: 선택 영역이 완전히 검은색 사각형으로 채워짐 (픽셀 레벨에서 RGB 0,0,0으로 균일)

안전한 마스킹은 단순 블랙아웃 대신 해당 영역을 완전히 잘라내거나(crop), 균일한 색상 사각형으로 완전 불투명(100%) 덮어쓰기가 필요합니다 (출처: 개인정보 보호를 위한 안전한 이미지 마스킹 가이드).

3단계: Crop 방식으로 아예 잘라내기

더 안전한 방법은 개인정보 영역을 이미지에서 아예 제거하는 겁니다.

입력 예시: macOS 미리보기에서 도구 → 사각형 선택 → 계약서 본문만 선택 후 Cmd+K (자르기) 출력: 서명란·이름 부분이 잘린 계약서 본문만 남은 이미지 파일

계약서에서 조항 내용만 ChatGPT에 물어보고 싶을 때 이 방법을 씁니다. 서명·날짜·이름은 아예 이미지에 포함시키지 않으니 복원 가능성이 0%예요.

4단계: ChatGPT Vision으로 검증하기

마스킹한 이미지를 ChatGPT에 업로드해서 실제로 정보가 유출되는지 확인합니다.

입력 예시: ChatGPT 대화창에 마스킹 이미지 업로드 후 "이 이미지에서 가려진 텍스트를 추론할 수 있어?" 출력: "가려진 영역은 균일한 검은색 사각형으로 보이며, 원본 텍스트를 추론할 수 없습니다"

제가 3단계 crop 방식으로 자른 영수증 이미지를 테스트했을 때 ChatGPT는 "이미지에 개인정보 영역이 보이지 않습니다"라고 답했어요. 반면 마커로만 가린 버전은 "카드 번호 뒷자리가 4자리로 보입니다"라고 추론했죠.

흔한 실수와 해결법

실수 1: 반투명 브러시 사용 Photoshop·Procreate에서 브러시 투명도를 80%로 설정해서 여러 번 칠하면 시각적으로는 가려진 것처럼 보입니다. 하지만 AI는 픽셀 레이어를 분석해서 원본 색상 정보를 복원해요. 저는 이 방식으로 신분증 주민번호를 가렸다가 ChatGPT가 "13자리 숫자 패턴"이라고 추론해서 식은땀을 흘렸습니다. 해결책: Opacity 100% 단색 사각형만 사용하세요.

실수 2: 모자이크 필터 사용 이미지 편집 앱의 모자이크(픽셀화) 효과는 원본 픽셀 색상 평균값을 계산합니다. AI는 이 평균값에서 원본 글자 경계를 역추론할 수 있어요. 제가 명함 이메일 주소를 모자이크 처리했을 때 ChatGPT가 "@gmail.com" 부분을 맞췄어요. 해결책: 모자이크 대신 불투명 사각형을 쓰세요.

실수 3: 같은 색 텍스트로 덮어쓰기 검은 배경에 검은 글씨로 "XXX"를 덮어쓰면 안전할 것 같죠? 하지만 텍스트 레이어와 배경 레이어가 분리되어 있으면 AI가 레이어 정보를 읽을 수 있습니다. 저는 PDF 주석 기능으로 검은색 텍스트 박스를 올렸다가 2시간 날렸어요. ChatGPT가 "주석 레이어 아래 텍스트가 있습니다"라고 알려줬거든요. 해결책: 레이어를 병합(flatten)한 후 저장하거나, 아예 사각형 도형을 쓰세요.

이제 당장 해보세요

다음번에 계약서·영수증·신분증을 AI에 올릴 일이 생기면 이 3단계를 기억하세요. 넓게 선택 → 100% 불투명 사각형 → ChatGPT 검증. 마커 도구는 버리고, crop 또는 불투명 덮어쓰기만 쓰면 됩니다. 법률 문서나 의료 기록처럼 민감도가 높은 정보라면 crop 방식으로 잘라내는 게 가장 안전해요.

저는 이 방법을 쓰고 나서 ChatGPT에 안심하고 영수증을 올려서 경비 정리를 맡길 수 있게 되었습니다. AI 비전의 복원 능력을 과소평가하지 말고, 한 번만 제대로 마스킹하면 프라이버시 걱정 없이 AI 도구를 활용할 수 있어요.

이 글이 도움이 됐다면 공유해 주세요
X 공유

관련 글