외국은 '재현 데이터' 활용 확대되는데 한국은…
김현태 연세대 교수 "헬스케어 등 건강보건 분야 관심 고조, 국내도 가이드라인 필요"
2023.08.12 05:08 댓글쓰기

데이터 3법 시행 이후 헬스케어‧금융‧보험업계 전반에서 데이터 활용 중요성이 커진 가운데 국내 환경은 이를 따라가지 못하고 있다는 주장이 제기됐다. 


핵심 요인은 개인정보보호에 필요한 데이터 가공 방법인 통계적 노출 제어에 대한 국내 가이드라인 부족이다. 


연세대 응용통계학과 김현태 교수는 최근 ‘데이터 가명・익명처리 기법의 현황과 대안: 재현데이터를 중심으로’ 연구보고서를 통해 재현 데이터 사용 확대를 주장했다. 


재현 데이터는 관측된 원데이터를 생성하는 모집단을 가정하고, 통계적·기계학습모형을 통해 생성한 모의 데이터이다. 


개인정보를 보호하면서 원데이터와 비슷한 수준의 효용을 가지며, 익명 데이터로 분류돼 개인정보 관련 규제로부터 자유롭다는 이점이 있다. 


현재 재현 데이터는 미국이나 유럽 등에서 금융과 헬스케어 분야를 가리지 않고 활발히 사용되는 추세다. 


반면 국내의 경우 법적으로는 익명데이터지만 실무 가이드라인 기준으로는 익명데이터로 인정받지 못해 사용 측면서 한계가 있다. 


그럼에도 건강・보건 관련 데이터 공개는 다양한 건강정보를 활용한 서비스 개발을 가능케 해 보건의료 분야에서도 재현 데이터에 관한 관심이 높은 편이다.


김현태 교수 “암호화된 데이터의 연산을 통해 정보손실 없이 개인정보를 보호할 수 있는 재현 데이터의 활용 확대가 필요하다”며 “현재 널리 사용되는 마스킹기법은 정보 통합이나 변경에 따라 효용 손실이 발생해 분석 목적에 맞게 사용하기 어려운 측면이 있다”고 말했다.


김 교수에 따르면 재현 데이터는 정보손실을 최대한 줄여 가명·익명 처리 등이 가능하다. 개인정보보호와 데이터로서의 효용성을 동시에 챙길 수 있는 이점이 있는 셈이다. 


이에 재현 데이터 활용 확대를 위해 익명데이터의 포괄적 정의를 충실히 포함한 새로운 가이드라인 마련이 절실하다는 견해다. 


김 교수는 “사회 전 영역에 걸쳐 방대한 데이터가 수집되는 우리나라에서 익명정보에 대한 포괄적인 지침 마련이 필요하다”며 “4차 산업혁명시대의 석유라 불리는 빅데이터가 사회 전(全) 분야 데이터 산업 활성화에 큰 도움이 될 것”이라고 밝혔다. 



관련기사
댓글 0
답변 글쓰기
0 / 2000
메디라이프 + More
e-談