개인정보 필터 / 벤치마크

상세 비교 · 자체 시험지 + 별도 K-PII 시험지

한국형 필터와
기초 모델의 차이.

자기소개·계약서·의료기록·이메일·업무 채팅·정부 서식 등 13개 시나리오의 한국어 합성 문장과 자체 구축한 K-PII-Masking-300K 챌린지 셋(학습-평가 완전 분리, 비공개 검증용), 두 시험지 모두에서 측정한 결과입니다. 기초 모델은 범용 설계라 한국 고유 카테고리와 한국인 이름 인식에서 큰 격차가 벌어집니다. 이 수치는 기초 모델의 품질이 낮다는 뜻이 아니라, 한국 맞춤 확장이 반드시 필요하다는 의미입니다.

시험지

2,000문장학습에 쓰지 않은 합성 데이터

시나리오

13가지이력서·계약서·의료·금융·로그·메신저 외

카테고리

17가지기초 모델 8 + 한국 전용 9

측정 방식

관대 · 엄격위치만 · 분류까지

비고 · 이 페이지의 OpenAI 는 OpenAI가 2026년 4월 공개한 OpenAI Privacy Filter (오픈소스 PII 분류 모델) 와의 비교입니다. ChatGPT(GPT-4·5 계열 LLM)와의 비교가 아닙니다 — Corepin과 같은 PII 추출 전용 분류기끼리의 직접 비교예요.

측정 방식 두 가지

"찾았는가"와 "올바르게 분류했는가".

한국형 필터의 진가는 두 번째 측정에서 드러납니다. 실전 마스킹 정책(예: 주민번호만 로그에서 삭제)을 운영하려면 정확한 카테고리 라벨이 필수이기 때문입니다.

측정 방식 ①

관대한 채점 위치만

"개인정보 구간을 찾았는가"만 봅니다. 주민번호를 account_number로 잘못 분류해도 구간만 맞으면 정답. 기초 모델에 최대한 유리한 조건입니다.

측정 방식 ②

엄격한 채점 분류까지

"정확한 카테고리 이름으로 분류했는가"까지 봅니다. 주민번호는 kr_rrn으로, 사업자번호는 kr_biz_no로 분류해야 정답. 실전 마스킹 정책에서 중요한 기준입니다.

종합 점수 — 관대 채점

구간만 맞추면 정답인 조건에서도,
기초 모델 대비 +11.8점.

관대 채점에서도 한국형 필터는 정확도·탐지율·종합 점수 모두 최상위. 격차의 절반은 한국인 이름과 날짜 카테고리에서 나옵니다.

① 관대한 채점 위치만

구간 탐지만 채점합니다. 기초 모델이 최대한 유리한 조건입니다.

정확도

찾아낸 것들 중 실제로 개인정보인 비율

한국형 v1.099.96%

OpenAI88.0%

+12.0pt 향상

탐지율

실제 개인정보 중 놓치지 않고 찾아낸 비율

한국형 v1.099.99%

OpenAI88.4%

+11.6pt 향상

종합 점수

정확도와 탐지율을 함께 반영한 F1 지표

한국형 v1.099.97%

OpenAI88.2%

+11.8pt 향상

종합 점수 — 엄격 채점

분류까지 정답이어야 하는 조건에서,
기초 모델은 36점이 빠집니다.

기초 모델은 kr_rrn·kr_biz_no 같은 한국 카테고리 라벨을 출력할 수 없습니다. 모델 구조상 존재하지 않는 라벨이기 때문입니다. 주민번호를 찾아도 account_number로 분류하면 실전 마스킹 정책에서 제대로 작동하지 않습니다.

② 엄격한 채점 분류까지

정확한 카테고리 이름으로 분류해야 정답. 기초 모델의 진짜 한계가 드러나는 지점 — 한국 카테고리 9개에 대해 0점을 받습니다.

정확도

올바른 카테고리로 분류까지 성공한 비율

한국형 v1.099.96%

OpenAI63.1%

+36.9pt 향상

탐지율

정확한 카테고리로 분류된 개인정보 비율

한국형 v1.099.99%

OpenAI63.4%

+36.6pt 향상

종합 점수

엄격 채점 기준의 F1 종합 지표

한국형 v1.099.97%

OpenAI63.3%

+36.7pt 향상

기초 모델 — 측정 방식이 바뀌면

위치만88.2점 → 분류까지63.3점 −24.9점

한국형 v1.0 — 측정 방식 무관 동일

위치만99.97점 → 분류까지99.97점 동일

왜 분류까지 따지면 점수가 떨어질까? 기초 모델의 분류 헤드는 8개 카테고리(

account_number · private_person · private_address · private_email · private_phone · private_url · private_date · secret

)만 출력합니다. 한국 주민번호를 찾아도 그 구간을 account_number로 분류하므로, 엄격 채점에서는 오답 — 실전에서 "주민번호만 로그에서 제거"를 하려면 정확한 라벨이 필수이기 때문입니다.

카테고리별 — 엄격 채점

기초 모델이 0점을 받는
한국 전용 9개 카테고리.

기초 모델이 한국 카테고리 라벨을 가지고 있지 않기 때문. 구간을 찾았더라도 이름을 못 붙이므로 엄격 채점에서는 전부 오답 처리됩니다.

주민등록번호864건

한국형

100%

OpenAI

사업자등록번호125건

한국형

100%

OpenAI

법인등록번호58건

한국형

100%

OpenAI

외국인등록번호59건

한국형

100%

OpenAI

여권번호85건

한국형

100%

OpenAI

운전면허번호68건

한국형

100%

OpenAI

건강보험증136건

한국형

100%

OpenAI

차량번호61건

한국형

100%

OpenAI

IP 주소81건

한국형

100%

OpenAI

카테고리별 — 관대 채점 · 큰 격차

구간 탐지만 봐도,
한국인 이름은 44%를 놓칩니다.

엄격 기준을 내려놓고 구간 탐지만 보더라도 여전히 한국인 이름에서 큰 격차. 기초 모델은 영어권 인명에 최적화되어 있어 한국 고유 이름의 약 44%를 놓칩니다. 1.0는 한국어 합성 데이터의 인명 분포로 통합 학습해 이 격차를 해소했습니다.

한국인 이름2,686건

한국형

99.9%

OpenAI

55.4%

날짜·생년월일666건

한국형

100%

OpenAI

60.9%

카테고리별 — 관대 채점 · 기초 모델이 강한 영역

기초 모델이 이미 잘 잡는 영역도,
한국형이 마무리합니다.

보편 숫자·패턴은 기초 모델이 이미 잘 탐지합니다. 한국형은 남은 5~7pt 격차를 채우면서, 동시에 올바른 한국 카테고리 이름을 부여합니다(주민번호를 account_number가 아닌 kr_rrn으로). 카테고리 이름 차이는 관대 채점에는 반영되지 않습니다.

주소도로명/지번/아파트589건

한국형

100%

OpenAI

93.1%

차량번호예: 12가 345661건

한국형

100%

OpenAI

93.5%

웹 주소(URL)81건

한국형

100%

OpenAI

92.5%

IP 주소IPv6 포함81건

한국형

100%

OpenAI

93.0%

주민등록번호864건

한국형

100%

OpenAI

96.3%

운전면허번호68건

한국형

100%

OpenAI

96.9%

외국인등록번호59건

한국형

100%

OpenAI

95.9%

전화번호010/02/+821,099건

한국형

100%

OpenAI

95.8%

건강보험증136건

한국형

100%

OpenAI

99.1%

계좌·카드번호255건

한국형

100%

OpenAI

98.1%

사업자등록번호125건

한국형

100%

OpenAI

99.8%

이메일779건

한국형

100%

OpenAI

99.7%

법인등록번호58건

한국형

100%

OpenAI

100%

여권번호85건

한국형

100%

OpenAI

100%

비밀번호·보안키93건

한국형

99.97%

OpenAI

99.2%

학습 반복 추이

v0.1에서 v1.1까지,
하나씩 잡아낸 격차들.

버전별 엄격 채점 종합 점수 추이. 자체 2,000건 시험지(녹색)에서는 v0.4 부터 99점대로 진입해 v0.5 에서 99.97점으로 안정. 14,195건 K-PII-Masking-300K 챌린지 셋(인디고)에서는 v0.5 까지 78.6점에 머무르다 v0.7~v1.0 에서 99.99점으로 회복. v1.1은 v1.0 의 정확도를 그대로 유지하면서 회사명·기관명과 금액 두 카테고리를 추가하고, 실 운영 환경에서 보고된 함정 패턴(입찰공고번호·파일 ID·정부 사업 공고문 표 머리글)을 부정 학습으로 흡수했습니다.

0.1한국 식별번호 9개 카테고리 확보

자체 시험지

87.2점

OpenAI

63.3점

0.2우회 패턴 9가지 학습

자체 시험지

92.6점

OpenAI

63.3점

0.3일반명사 과탐 억제(150 예외 템플릿)

자체 시험지

95.4점

OpenAI

63.3점

0.4이름 학습 대폭 확장

자체 시험지

99.29점

OpenAI

63.3점

0.45차량번호 회귀 복구

자체 시험지

99.93점

OpenAI

63.3점

0.5정확도 마무리 — 외부 시험지 첫 측정

자체 시험지

99.97점

외부 K-PII

78.6점

OpenAI

63.3점

0.7외부 K-PII 1차 통합

자체 시험지

99.97점

외부 K-PII

99.2점

OpenAI

63.3점

0.9K-PII 학습 비중 확대

자체 시험지

99.97점

외부 K-PII

99.99점

OpenAI

63.3점

1.0외부 일반화 완성

자체 시험지

99.97점

외부 K-PII

99.99점

OpenAI

63.3점

1.1회사명·금액 카테고리 + 실 운영 함정 188종 흡수(현재 가동)

자체 시험지

100.0점

외부 K-PII

100.0점

OpenAI

63.3점

독립 검증 셋

학습 분포 밖 시험지에서
진짜 일반화 능력을 봅니다.

자체 2,000문장 시험지는 학습 분포와 같아 ceiling에 닿기 쉽습니다. Corepin이 자체 구축한 K-PII-Masking-300K (비공개 검증용)의 14,195 챌린지 셋으로 학습-평가 완전 분리 측정합니다. 합성 데이터로 만든 검증 셋이며, 1,251개 동음이의어 함정 단어와 481명 공인 명단으로 인명 과탐을 정밀히 검사합니다.

시험지

14,195문장K-PII-Masking 챌린지 셋

검증 방식

합성 데이터학습-평가 분리 셋

하드 네거티브

3,682건인명처럼 보이는 일반어 함정

공인 언급

1,222건본명 등장하지만 태그 금지

엄격 채점(분류까지 일치)

기초 모델 60.3

v0.5 78.6

v1.0 99.99

v1.1 100.00

하드 네거티브 오탐률

기초 모델 24.0%

v0.5 19.7%

v1.0 0.00%

v1.1 0.00%

공인 본명 오탐률

기초 모델 22.8%

v0.5 11.0%

v1.0 0.00%

v1.1 0.00%

v0.5의 외부 일반화 갭이 v1.0에서 해소됐고, v1.1에서 새 카테고리 두 종이 같은 정확도로 정착했습니다. 자체 시험지 99.97점 → v0.5 외부 78.6점은 분포 차이로 인한 21점 갭이었지만, v1.0은 외부 99.99점 + 자체 시험지 99.97점으로 양쪽 모두 perfect. 하드 네거티브 3,682건 + 공인 본명 1,222건 모두 0건 오탐 — v1.1에서도 그대로 유지. v1.1 신규: 회사명·기관명(KOSPI/KOSDAQ 2,770종 + 정부·금융·의료·교육 주요 기관 240종)과 금액(₩·KRW·$·USD 11종 표기) 카테고리 추가, 실 운영 환경에서 보고된 함정 패턴(입찰공고번호·파일 ID·정부 사업 공고문 표 머리글) 188종을 부정 학습으로 흡수. 학습은 OpenAI Privacy Filter에서 새로 시작해 K-PII-Masking train 178천 + 자체 합성 60천을 5 epoch 통합 학습했습니다.

모델 스펙

기초 모델 그대로 두고,
출력 헤드만 바꿨습니다.

한국형 필터는 OpenAI Privacy Filter의 핵심 엔지니어링 — 양방향 어텐션, 경계 제약 Viterbi 디코더, 128k 컨텍스트 — 을 그대로 활용합니다. 재학습으로 바꾼 것은 출력 분류 헤드 단 한 부분: 8개 카테고리를 19개로 확장(v1.1, 회사명·기관명 + 금액 추가)하고 한국어 6만 문장으로 파인튜닝했습니다.

왜 기초 모델을 그대로 쓰는가

OpenAI Privacy Filter의 양방향 어텐션·BIOES 경계 제약 디코더·128k 컨텍스트 같은 핵심 엔지니어링은 이미 매우 정교합니다. 1.5B 전체 / 50M 활성이라는 희소 MoE 구조 덕분에 저가형 GPU 한 장으로 실시간 동작합니다.

한국형 필터가 손댄 부분은 출력 분류 헤드 단 한 부분 — 기존 8개 카테고리를 19개로 확장(v1.1). 양방향 어텐션, Viterbi 디코더, 128k 컨텍스트 등 기초 모델의 핵심은 그대로 활용합니다.

결과적으로 온디바이스 배포 가능성이 그대로 유지됩니다. 고객 데이터를 외부 API로 보낼 필요가 없어, 본질적으로 개인정보보호에 유리한 아키텍처를 그대로 계승합니다.

# 기초 모델(원본 유지) ── OpenAI Privacy Filter 2026 ── 기초 모델: openai/privacy-filter 전체 파라미터: 1.5B 활성 파라미터: 50M (128 중 4 활성) 트랜스포머: 8개 블록 어텐션 구조: 양방향 · 유효 범위 257 컨텍스트 길이: 128,000 토큰 디코더: BIOES + Viterbi 제약 토크나이저: tiktoken o200k_base # 재학습으로 변경한 부분(v1.1, 2026-05-29) ── 한국 확장 ── 출력 헤드: 8 → 19개 카테고리 v1.0: 17개 · v1.1: 회사명·기관명 + 금액 추가 학습 데이터: 23.8만 문장 통합 K-PII-Masking 17.8만 + 자체 합성 6.0만 실제 이름 보강: KLUE-NER 5,309명 + K-PII 인명 분포 회사명 보강: KOSPI/KOSDAQ 2,770종 + 주요 기관 240종 금액 표기 보강: 11종 포맷 (원·만·억·₩·KRW·$·USD·€·¥·£·약식) 실 운영 함정: 188종 부정 학습 (입찰번호·파일 ID·공고문 머리글) 유명인 예외: 약 200명 학습 횟수: 5 에폭 · BF16 # 서빙 요건 실행 환경: PyTorch 2.8 + Triton 3.2 필요 GPU: NVIDIA L4 24GB 이상 처리량: 초당 약 4,000 토큰 모델 파일 크기: 2.8 GB

실제 데이터로 직접 확인해보세요

가입하면 API 키가 즉시 발급됩니다. 분당 60회·월 1,000회까지 무료, 카드 등록 없이 시작.

무료로 시작 → 라이브 데모 제품 소개

한국형 필터와기초 모델의 차이.

"찾았는가"와 "올바르게 분류했는가".

관대한 채점 위치만

엄격한 채점 분류까지

구간만 맞추면 정답인 조건에서도,기초 모델 대비 +11.8점.

① 관대한 채점 위치만

분류까지 정답이어야 하는 조건에서,기초 모델은 36점이 빠집니다.

② 엄격한 채점 분류까지

기초 모델이 0점을 받는한국 전용 9개 카테고리.

구간 탐지만 봐도,한국인 이름은 44%를 놓칩니다.

기초 모델이 이미 잘 잡는 영역도,한국형이 마무리합니다.

v0.1에서 v1.1까지,하나씩 잡아낸 격차들.

학습 분포 밖 시험지에서진짜 일반화 능력을 봅니다.

기초 모델 그대로 두고,출력 헤드만 바꿨습니다.

왜 기초 모델을 그대로 쓰는가

실제 데이터로 직접 확인해보세요

한국형 필터와
기초 모델의 차이.

구간만 맞추면 정답인 조건에서도,
기초 모델 대비 +11.8점.

분류까지 정답이어야 하는 조건에서,
기초 모델은 36점이 빠집니다.

기초 모델이 0점을 받는
한국 전용 9개 카테고리.

구간 탐지만 봐도,
한국인 이름은 44%를 놓칩니다.

기초 모델이 이미 잘 잡는 영역도,
한국형이 마무리합니다.

v0.1에서 v1.1까지,
하나씩 잡아낸 격차들.

학습 분포 밖 시험지에서
진짜 일반화 능력을 봅니다.

기초 모델 그대로 두고,
출력 헤드만 바꿨습니다.