(사)정보화사회실천연합

악마는 ‘가명’의 디테일에 있다

0 316

‘데이터 3법’이 국회 통과를 눈앞에 두고 있다. 데이터 3법은 2018년 11월 정부가 만들고 여당 의원들이 대표 발의한 데이터 관련 3개 법률 개정안(개인정보보호법, 신용정보법, 정보통신망법)을 말한다. 여야 합의로 일부 수정을 거쳐 국회 상임위원회를 통과했고, 12월5일 현재 법제사법위원회에 계류돼 있다. 반대 의견을 내는 국회의원이 거의 없어 이변이 없다면 곧 본회의에 상정되고 통과될 것으로 보인다.

알아볼 수 있다, 없다

데이터 3법은 국민의 개인정보 보호 수준을 일부 낮춰 공공과 산업적 목적으로 활용도를 높이는 법이다. 그 핵심은 개인정보와 익명정보 사이에 ‘가명정보’라는 회색지대를 신설하고, 가명정보를 “새로운 기술•제품•서비스의 개발 등 산업적 목적을 포함하는 과학적 연구, 통계 작성, 공익적 기록 보존 등의 목적”으로 활용할 수 있게 하는 것이다.

데이터 3법이 통과되면 국민의 개인정보를 보유한 공공기관•기업•단체 등이 각 개인(정보주체)에게 동의를 구하지 않고도 개인정보를 가명 처리해 제3자에게 제공할 수 있다. 신용•금융•통신•의료•질병•소득•소비 등 대부분 영역의 개인정보를 포함한다. 제한적인 방식으로 다른 기관의 가명정보와 서로 결합해 사용할 수도 있다. 현재는 개인정보를 가명 처리하더라도 정보주체의 동의를 구하지 않고 제3자에게 제공하면 법적 처벌을 받는다.

이 법은 산업계와 정부, 여야 국회의원 다수가 찬성하고 있다. 특히 산업계에선 소비자 맞춤형 서비스와 타깃마케팅 등으로 경제가 활성화된다며 반기고 있다. 반대하는 쪽은 주로 참여연대, 경제정의실천시민연합, 진보네트워크센터, 민주사회를위한변호사모임 등 진보 계열 시민단체들이다. 법이 통과되면 개인정보 유출과 악용이 빈번할 것이라고 우려한다.

찬반 논쟁에 여러 쟁점이 있지만 특히 ‘가명정보의 안전성’에 대해 주장이 엇갈린다. 찬성쪽은 추가 정보를 사용하지 않고는 가명정보로 특정 개인을 알아볼 수 없으며, 가명정보와 추가 정보로 개인을 식별하려는 사람을 처벌하는 규정이 있다고 강조한다. 반대쪽은 가명정보로도 얼마든지 특정 개인을 알아볼 수 있다고 반박한다. 양쪽 주장이 서로 모순되는 상태로 수많은 기사가 만들어지고 있다.
왜 이런 논란이 벌어지는 걸까. 기존 개인정보와 익명정보를 나누는 기준이 모호한데 여기에 가명정보까지 더해지며 불확실성을 높이기 때문이다. 가명정보는 개인정보의 하나로 포함됐는데도 익명정보처럼 산업적 활용이 가능하다. 이런 복잡성 때문에 찬성과 반대의 주장도 엇갈린다.

박근혜 정부, 개인정보 변환 사용

좀더 자세히 살펴보자. 개인정보는 현행법상 ①성명, 주민등록번호, 영상 등을 통해 개인을 알아볼 수 있는 정보와 ②해당 정보만으로는 특정 개인을 알아볼 수 없더라도 다른 정보와 쉽게 결합해 알아볼 수 있는 정보를 뜻한다.

익명정보는 개인정보의 반대 개념이다. 쉽게 결합할 수 있는 다른 정보를 더해도 누구인지 알아볼 수 없는 정보다. 그런데 ‘쉽게 결합할 수 있는 다른 정보’가 사람마다 상황마다 다르기 때문에, 익명정보를 엄격히 정의하면 ‘현실에서 동일 정보값을 가진 사람이 2명 이상인 정보’라고 할 수 있다. 예를 들어 {서울 마포구, 25살, 남성}에 해당하는 사람은 최소 2명 이상이라 익명정보라고 할 수 있다.
박근혜 정부도 기업이 개인정보를 산업 목적으로 활용할 수 있게 정책을 폈다. 이때는 가명정보 개념을 도입하지 않고 개인정보를 익명정보로 변환해 사용하게끔 했다. 그 방법은 2016년 6월 국무조정실 등 6개 정부 부처가 공동으로 펴낸 ‘개인정보 비식별 조치 가이드라인’(이하 가이드라인)에 자세히 나와 있다. 기본 모델은 ‘k(케이)-익명성’이다. 개인정보를 익명화해서 공개할 때는 동일 정보값을 가진 사람이 최소 k명 이상 존재하도록 하라는 지침이다.

가이드라인은 ‘k=3’이 안전도를 보장하는 최소한의 수준이라고 밝힌 미국 교육부 기준을 소개하고 있다. 이 말은 ‘{서울 마포구 망원동 거주, 1994년 12월5일 출생, 남성, 고졸, 공인중개사}인 사람의 질병 정보’처럼 구체적인 정보를 제3자에게 제공할 때, 괄호 안의 정보와 일치하는 사람이 해당 데이터 집합에서 최소 3명 이상 되는지 확인하고 제공하라는 뜻이다. 만약 3명 이상 되지 않는다면 개인이 특정될 위험이 있으므로 출생일을 ‘1990년대’로 뭉뚱그리든지 성별을 삭제해 정보의 정확도를 떨어뜨려야 한다.

가이드라인을 보면 ‘k-익명성’을 지켰더라도 개인정보가 노출될 위험은 있으며, ‘엘(l)-다양성’과 ‘티(t)-근접성’ 등 다른 지표를 이용해 보완해야 한다고 안내한다. 그만큼 개인정보를 익명정보로 바꾸기 어렵다는 뜻이다.

개인정보 결합 많아지면 개인정보에 가까워져

데이터 3법은 현행법의 개인정보(앞의 정의①②)에 더해 가명정보를 개인정보의 하나로 포함하고 있다. 가명정보는 “(개인정보를) 가명 처리함으로써 원래의 상태로 복원하기 위한 추가 정보의 사용•결합 없이는 특정 개인을 알아볼 수 없는 정보”다. 여기서 ‘추가 정보’는 “식별자를 임의의 값으로 대체하는 과정에서 사용된 규칙 또는 암호화 방식 등”을 의미한다(2018년 12월 국회 정무위원회 조용복 수석전문위원 ‘신용정보법 검토보고서’).
쉽게 말해 가명정보는 개인정보에서 이름과 연락처 등을 ‘추가 정보’(암호 규칙)를 이용해 알아볼 수 없게 바꾼 것이다. ‘신용정보법 검토보고서’는 해시함수를 통해 이름과 연락처(이순신, 010-4567-9876)를 조합해 암호값(DACE2CCC9459387EAE890D85344)으로 바꾼 예를 들고 있다.

찬반 양쪽은 가명정보를 서로 다르게 인식하고 있다. 찬성쪽은 가명정보가 ‘다른 정보와 쉽게 결합해 특정 개인을 알아볼 수 있는 정보’(개인정보 ②번 정의)를 포함하지 않는다고 말한다. 반대쪽은 그런 정보도 일부 포함할 것이라고 우려한다. 문제는 ‘다른 정보와 쉽게 결합해 특정 개인을 알아볼 수 있는 정보’라는 정의 자체가 워낙 범주가 넓고 모호해 어느 쪽이 맞다고 단정하기 힘들다는 데 있다.

가명정보에 대한 인식
가명정보에 대한 인식

반대쪽 의견부터 들어보자. 온라인에는 나도 모르는 사이 공개된 내 개인정보가 조각조각 퍼져 있다. 학교 졸업생 명단, 종교단체•동호회•학회 명단, 선거인명부, 공공기관•지방자치단체 공개 기록물, 물건 구매 후기, 언론 기사 등이 게시돼 있다. 여기서 이름, 나이, 성별, 생년월일, 주소, 연락처, 전자우편, 출신학교, 소셜네트워크서비스(SNS) 아이디, 소속 회사 등을 손쉽게 구할 수 있다. 이런 정보를 결합하면 {서울 마포구 망원동 거주, 1994년 12월5일 출생, 남성, 고졸, 공인중개사}라는 정보를 가진 개인을 손쉽게 특정지을 수도 있다.

특히 사회적으로 소수에 속하는 특성을 가진 사람일수록 개인 식별 위험이 크다. 대표적으로 희소질환자가 있다. 예를 들어 {제주, 12살, 남, 백혈병} 정보를 가진 사람은 한두 명으로 특정될 가능성이 높다. 소수자가 꼭 사회적 약자를 의미하지는 않는다. ‘연소득 20억원 이상인 사람’이나 ‘20채 이상 다주택자’처럼 그 수가 적은 경우는 모두 해당된다. 평범한 정보라도 두 가지 이상 속성이 결합될 경우 범위가 급격히 좁아지기도 한다. 예를 들어 ‘건설 일용직, 대학원 졸업 이상 학력’이라든지 ‘간호사, 남성’ 등이다.

-이하 생략-


악마는 ‘가명’의 디테일에 있다 한계레21 2019.12.09

글을 남겨주세요.

이 사이트는 스팸을 줄이는 아키스밋을 사용합니다. 댓글이 어떻게 처리되는지 알아보십시오.

이 웹 사이트에서는 사용자 환경을 개선하기 위해 쿠키를 사용합니다. 우리는 당신이 괜찮다고 생각하겠지만, 당신이 원한다면 거절할 수 있습니다. 동의 더 읽기