개인정보위, 비정형데이터 가명처리 가이드라인 제시
개인정보위, 비정형데이터 가명처리 가이드라인 제시
  • 양대규
  • 승인 2024.02.05 01:05
  • 댓글 0

주요 분야별 가명정보 활용 전 과정 상세 안내
AI 개발 및 활용 기관의 비정형 데이터 안전한 사용 기대
고학수 개인정보보호위원회 위원장
고학수 개인정보보호위원회 위원장

[시정일보 양대규 기자] 개인정보보호위원회(이하 개인정보위)가 AI 기술개발의 핵심 재료인 비정형데이터에 대한 가명처리 기준을 새롭게 마련했다.

비정형데이터는 일정한 규격이나 형태가 없는 구조화되지 않은 데이터로 사진, 이미지, 대화기록 등이 있다.

지난해 IDC는 전 세계 데이터 중 이미지, 영상 등 비정형데이터가 최대 90%를 차지하고 있다고 밝혔으며 점점 그 수요가 증가하고 있는 추세다.

비정형데이터는 가명처리를 함에 있어 개인정보식별의 위험성을 구분하는 데 그동안 명확한 기준이 없었다.

이에 개인정보위는 지난 1년여 동안 정책연구용역과 각 분야 전문가로 구성된 T/F를 운영하는 등 관련된 가이드라인을 마련해왔다.

개정된 가이드라인에는 비정형데이터의 가명처리 과정에서 발생하는 독특한 위험을 통제하는 원칙과 주요 데이터 수요 분야에 대한 시나리오를 명시했다.

특히, 7종의 시나리오는 가명정보 활용 전 과정을 상세히 담아 바이오ㆍ헬스, 인공지능, 데이터 솔루션 개발 등 다양한 분야에서 안전하게 가명처리를 하는 데 유용하도록 했다.

예를 들어 CT 사진 내 개인식별 위험성이 있는 경우에는 메타데이터를 삭제하고 활용한다. CT 사진 내 헤더 정보는 유방암 진단 AI 개발에 불필요하기에 블랙마스킹 처리를 하는 것이다.

반면, 사용자의 환경적 통제를 두고, 별도의 가명처리 없이 데이터를 활용하는 경우도 있다. CT의 경우 각각 다른 각도로 촬영된 사진이 수백장 있으면 전체 신체형상으로 입체적 복원이 가능하다. 이에 인가받은 인원만 데이터 접근이 가능토록 한정적으로 활용하는 것이다.

이처럼 비정형데이터 가명처리 기준은 데이터 처리 목적, 사용 환경 등을 종합적으로 고려해 개인식별 위험을 발견하고 기관별로 합리적인 처리를 실행토록 권고하고 있다. 

완벽한 개인식별 탐지기술이 존재하지 않는 한계로 비정형데이터에 대한 가명처리 기술의 적절성을 확인할 수 있는 근거를 활용기관에서는 작성해야 한다.

외부전문가가 참여한 적정성 검토위원회에서는 비정형데이터의 식별 위험을 감소하기 위해 기관이 실행한 수준과 연구 목적 달성 가능성 등을 검증하도록 했다.

마지막으로 비정형데이터의 식별 위험을 감소했다 하더라도 모자이크 된 사진을 원본에 가깝게 복원할 수 있을 만큼 다양한 복원기술이 개발되고 있기에 해당 데이터 활용시 관련 SW나 시스템의 사용 제한 등의 통제방안을 마련토록 했다.

연구기관들은 AI 서비스 제공 과정에서 정보 주체 권익의 침해 가능성을 지속적으로 모니터링 해야 할 것으로 보인다.

태현수 데이터안전정책과장은 "기업이나 연구기관은 자신들이 실행하는 가명처리 기준에 대해 <사전적정섬 검토>를 통해 확인받을 수 있다. 개인정보위는 전문가들과 함께 신속히 검토해 전달할 예정이며, 관련 사례를 이번 가이드라인에 지속적으로 추가해 모범 사례를 확산시킬 계획이다"고 말했다.

이어 “개인정보전송요구권에 따라 비정형데이터 활용이 가능해지면 가명처리 가이드라인 등에 적용받을 필요가 없을 수 있으나 해당 부분에 대한 기관의 연구와 활용에 있어 관련 법 정비 등은 마이데이터 사업 추진단에서 준비 중에 있다”고 밝혔다.