메인 콘텐츠 바로가기주메뉴 바로가기

데이터 비식별조치

글자크기
데이터 비식별조치

비식별화 관련 주요 용어 정의

1. 개인정보(개인정보보호법)
살아있는 개인에 관한 정보로서 성명, 주민등록번호 및 영상 등을 통하여 개인을 알아볼 수 있는 정보를 말합니다.
- 해당 정보만으로 특정 개인을 알아 볼 수 없더라도 다른 정보와 쉽게 결합 하여 알아볼 수 있는 것도 포함됩니다.

2. 비식별화
개인정보의 일부 또는 전부를 삭제하거나 다른 정보로 대체함으로써 다른 정보와 결합하여도 특정 개인을 식별하기 어렵도록 하는 일련의 조치를 말하며 가명처리, 총계처리, 데이터삭제, 범주화, 마스킹 등의 방법이 있습니다.

3. 재식별화
일반적으로 비식별화된 정보가 다른 정보와의 연계(매칭) 등을 통해 특정 개인을 알아볼 수 있는 개인정보가 되는 것을 말합니다.

보건의료 빅데이터 비식별조치(안) 비식별조치는 각 기관별 비식별 조치방법을 준용하며, 데이터 연계 후 재식별 가능성이 있을 경우 필요에 따라 다음과 같은 방법이 추가적으로 적용될 수 있습니다.

보건의료 빅데이터 비식별조치 - 비식별조치, 내용(예시)로 구성
비식별조치 내용(예시)
그룹화
  • 연령(5세 단위, 80세 이상 단일그룹화), 생년월일 (분기로 범주화-YYQQ)
  • 보험료 가입자구분(지역가입자, 직장가입자, 직장피부양자, 의료급여로 구분)
  • 허가병상 수(0-29, 30-99, 100-299, 300이상)
  • 요양기관 표시과목코드(내과계, 외과계, 기타)
  • 종합장애 등급코드(1-3등급/4-6등급/미해당)
  • 치료재료코드(9자리) → 범주화(5자리)
마스킹/삭제
  • 사망일자(사망년월로 마스킹)
  • 지급불능관련정보(삭제-요양급여비용 지급 건만 제공)
  • 의약품 표준 및 품목코드(삭제)
  • 대행청구단체코드(삭제)
  • 보장기관코드(삭제)
  • 심사조정코드 및 조정단계구분코드(삭제)
대체키
  • 요양기관기호(임의의 연번으로 변환)
  • 요양기관시군구코드(시도코드로 변환)
  • 명세서 ID(임의의 연번으로 변환)
  • 처방전교부기관코드(임의의 연번으로 변환)
유효숫자 2자리 변환
  • 신장, 체중, 혈압, 공복혈당, 콜레스테롤 등 검진결과 수치
  • 의사, 전문의, 치과의사, 한의사, 간호사, 약사 수 등
기타
  • 주소코드(시군구 단위로 제공)