보건의료 빅데이터 통합 플랫폼

플랫폼 소개

공공 보건의료 데이터 활용을 통한 국민건강 향상을 비전으로, 보건의료 빅데이터와 분산연구 네트워크 사업을 통합하여
보건의료 질 향상 및 정책개선, 개방 등 그리고 보건의료 데이터의 안전하고 투명한 활용을 목표로 합니다.

보건의료 빅데이터는 고유 식별번호 활용하며 제3의 신뢰기관이 발급한 랜덤키값 결합해 사용, 분산연구 네트워크는 공통데이터모델 CDM으로 변환하여 통합결과 분석결과만 제공(협력기관들), 보건의료 빅데이터와 분산연구 네트워크의 공통사항으로는 사무국 통합사전검토 및 연구평가위원회, 데이터 제공기관 심의 결과를 통해 연구자 데이터 제공합니다.
		        			보건의료 빅데이터는 정보시스템으로서 가지는 기능은 다음과 같습니다. 보건의료 빅데이터 이용신청/심의결과 확인/TTP랜덤키값 결합사용/연계자료 폐쇄환경 열람/비식별화,
		        			분산연구 네트워크는 연구 수행하는 체계로서 지원 관리하는 내용은 다음과 같습니다. 분산네트워크 이용신청/연구자 샘플DB를 활용한 분석실행파일 산출/분석실행파일 & 결과 전송/사무국 자료제공 심의/연구정보 관리
보건의료 빅데이터는 고유 식별번호 활용하며 제3의 신뢰기관이 발급한 랜덤키값 결합해 사용, 분산연구 네트워크는 공통데이터모델 CDM으로 변환하여 통합결과 분석결과만 제공(협력기관들), 보건의료 빅데이터와 분산연구 네트워크의 공통사항으로는 사무국 통합사전검토 및 연구평가위원회, 데이터 제공기관 심의 결과를 통해 연구자 데이터 제공합니다.
보건의료 빅데이터는 정보시스템으로서 가지는 기능은 다음과 같습니다. 보건의료 빅데이터 이용신청/심의결과 확인/TTP랜덤키값 결합사용/연계자료 폐쇄환경 열람/비식별화
분산연구 네트워크는 연구 수행하는 체계로서 지원 관리하는 내용은 다음과 같습니다. 분산네트워크 이용신청/연구자 샘플DB를 활용한 분석실행파일 산출/분석실행파일 & 결과 전송/사무국 자료제공 심의/연구정보 관리

운영처리 프로세스

보건의료 빅데이터/분산연구 네트워크 운영처리 과정은 다음과 같습니다. 1.보건의료 빅데이터:연구자PC-데이터 이용신청-데이터 제공범위 확정-기관데이터 요청-기관 심의-데이터 전송-기관 데이터 연계 및 비식별화-연계 데이터 전송 2.분산연구 네트워크:연구자PC-데이터 이용신청-데이터 제공범위 확정-기관 데이터 요청-기관 심의-분석결과 데이터 전송-연구자 데이터 확인
보건의료 빅데이터
  • 연구자PC (OTP 접속인증)
  • 데이터 이용신청 → 연구평가 위원회 심의
  • 데이터 제공범위 확정
  • 기관 데이터 요청
  • 기관 검토 ↔ 보건복지수 랜덤키 발송
  • 데이터 전송
  • 기관 데이터 연계 및 비식별화
  • 연계 데이터 전송
  • 폐쇄망 분석센터 데이터 확인
분산연구 네트워크
  • 연구자PC (OTP 접속인증)
  • 데이터 이용신청
  • 데이터 제공범위 확정
  • 기관 데이터 요청
  • 기관 검토
  • 분석결과 데이터 전송
  • 연구자 데이터 확인

보건의료 빅데이터 통합 플랫폼 자료 연계방식

  • 보건의료 빅데이터에서는 고유식별번호를 활용하며, 이들 정보와 제3의 신뢰기관(TTP*)이 발급한 랜덤키값을 결합하여 사용합니다.
  • * 제3의 신뢰기관(Trusted Third Party) : 각 데이터 제공기관과 분리된 제3의 기관으로서, 안전한 연계 키 발급을 목적으로 하는 기관
  • 분산연구 네트워크에서는 원천 데이터 제공 없이 연구자의 분석실행파일 결과 값을 제공합니다.
  • * 질병관리청, 건강보험심사평가원, 국립암센터, 국립중앙의료원, 국민건강보험공단 5개 기관이 보유한 보건의료 데이터가 OMOP(Observational Medical Outcome Partners) CDM으로 변환되어 있습니다.

폐쇄 분석환경 제공

  • 연구자가 승인된 연계데이터를 분석할 수 있는 환경으로 건강보험심사평가원, 국민건강보험공단, 한국보건의료정보원에서 운영하고 있습니다.
  • 연계된 자료를 연구자가 열람할 때 외부로 데이터를 반출하지 않고, 인터넷으로부터 단절된 폐쇄 분석환경에서만 열람하도록 합니다.
  • 원하는 폐쇄망 분석센터를 지정하여 방문할 수 있으며, 분석 완료 후 개인정보가 포함되지 않은 연구결과만 반출할 수 있습니다.

용어 설명

용어 설명 리스트 테이블로 용어, 설명 항목으로 구성된 표입니다.
용어 설명
TTP Trusted Third Party (제3 신뢰기관)으로 암호화 키 발급 관리를 위한 독립기능으로 구성하고 보건의료 빅데이터에서는 보건복지부가 TTP 역할 수행
랜덤키 TTP에서 연구데이터를 이용신청 단위 (요청 데이터 셋)로 발급하는 난수값
결합키 데이터 제공기관 데이터의 유의미한 결합을 위한 연결 속성 정보로 해시함수로 암호화한 키
통합결합키 각 기관별 데이터를 연구수행이 가능한 의미있는 데이터로 생성하기 위해 결합키를 이용하여 결합하는 작업
개인정보 비식별화 개인정보 보호를 위해 정보의 일부를 삭제, 대체하거나 다른 정보와 결합하지 못하도록 하여 특정 개인을 알아볼 수 없도록 하는 조치
폐쇄망 분석센터 외부로의 데이터 반출 등 보안유지를 위하여 인터넷으로부터 단절된 폐쇄환경으로 연구자는 이 곳에서 연구를 진행하고 개인정보가 없는 분석결과 값만을 반출 가능 * 폐쇄망 분석센터에 관한 자세한 내용은 자주하는 질문을 참조하시기 바랍니다.
상단으로 이동하기