📌 가명처리(Pseudonymization) vs 비식별화(Anonymization)
구분 |
가명처리 (Pseudonymization) |
비식별화 (Anonymization) |
정의 |
식별자를 대체값으로 바꾸되, 복원 가능성 있음 |
식별자를 완전히 제거하여 복원이 불가능하도록 처리 |
목적 |
데이터 분석 가능성과 보안 균형 |
개인정보 보호 강화, 재식별 방지 |
복원 가능성 |
O (대체값 → 원본 가능) |
X (완전 삭제 또는 범주화) |
예시 |
암호화, 가명 생성, 데이터 스왑 |
라운딩, 범주화, 마스킹 |
📌 보기별 상세 설명
① 암호화 (Encryption)
- 정의: 알고리즘과 키를 이용해 원본 데이터를 암호문으로 변환.
- 특징: 복호화 키가 있으면 원본 복원이 가능.
- 용도: 정보 보호, 데이터 전송 보안.
- 가명처리로서 적절성: 가명처리의 일환으로 활용 가능하지만, 키 관리에 따라 비식별성이 약해질 수 있음.
- 분류: ✅ 가명처리
② 라운딩 (Rounding)
- 정의: 값을 범주 또는 구간으로 단순화하여 정밀도 제거.
- 예시: 나이 27세 → 20대, 소득 4,450,000 → 4백만 단위.
- 특징: 원본 값의 일부 손실 발생, 식별 가능성 낮춤.
- 용도: 통계 데이터 처리, 비식별화.
- 가명처리로서 적절성: ❌ 복원 불가능하므로 가명처리보다는 비식별화에 해당.
- 분류: 🚫 비식별화 (정답)
③ 교환 (Swapping)
- 정의: 서로 다른 레코드 간 동일 필드 값을 교체.
- 예시: 사용자 A의 생년월일과 사용자 B의 생년월일을 맞바꿈.
- 특징: 데이터 전체 분포 유지, 직접 식별이 어렵게 됨.
- 용도: 개인정보 보호와 통계 정확성 간 균형.
- 가명처리로서 적절성: ✅ 적절한 가명처리 방식.
- 분류: ✅ 가명처리
④ 휴리스틱 가명화 (Heuristic Pseudonymization)
- 정의: 일정 규칙 또는 알고리즘에 따라 가명을 생성.
- 예시: 이름 "김영희" → "사용자001", 주민번호 → 난수 기반 ID
- 특징: 복원 가능한 형태로 변환하면서도 원본과의 직접 연관 제거.
- 용도: 분석 가능한 형태로 개인정보 처리.
- 가명처리로서 적절성: ✅ 규칙 기반으로 가명처리가 가능하여 적절.
- 분류: ✅ 가명처리
✅ 최종 정답: ② 라운딩(rounding)
→ 원본 데이터 복원이 불가능하므로 비식별화 기법에 해당하며, 가명처리 방식으로는 부적절