(사)정보화사회실천연합

빅데이터 플랫폼 및 센터 데이터 품질관리 가이드

0 852

추진 배경

현재는 데이터 시대로 양질의 데이터 확보가 기업 뿐 아니라 국가 경쟁력을 좌우하고 있으며, 애플, 구글, 아마존 등 데이터 보유 기업들이 글로벌 시장을 선도하는 등 이미 주요 선진국은 데이터로 경제적 효과를 창출하는 데이터 경제로 산업 구조를 바꾸고 있다.

한편, 우리나라는 폐쇄적 데이터 축적과 접근성 제약으로 인해 데이터에 대한 인식과 데이터 품질관리 등 기반체계 마련이 미흡한 실정이다. 정부는 데이터 산업 활성화 전략 수립(2018.06), 기획재정부의 혁신성장 전략 투자 분야 선정(2018.08) 등 데이터의 중요성을 강조하고 있으며, 데이터 및 AI 경제 활성화 계획을 발표(2019.01)하여 글로벌 데이터 경쟁에 본격적으로 뛰어들었다.

그 구체적인 실행으로 빅데이터 플랫폼 및 센터 구축을 통해 데이터 축적 및 유통을 활성화하고 데이터 수집, 분석, 유통 체계를 마련하여 데이터 생태계의 경쟁력을 한 단계 높이려 하고 있다.

목적

최근 정부는 데이터 축적 및 유통 활성화를 위해 빅데이터 플랫폼 및 센터 구축 사업을 추진하고 있으나, 아직도 많은 기관 및 기업에서 데이터베이스의 품질 향상을 위해 무엇이 필요하고, 어떻게 해야 하는지 명확하게 이해하고 있지 못하고 있다. 특히, 정보화 사업을 계획하거나 추진하는 데 있어 데이터 품질 관점에서 무엇을 고려하고 어떻게 해야 하는지에 대해 전반적인 인식이 부족한 상황이다.

이러한 상황에서 빅데이터 플랫폼 및 센터에서 구체적인 가이드 없이 데이터 품질관리를 수행할 경우, 데이터 품질관리에 대한 이해 부족으로 인한 시행착오 및 양질의 데이터 미확보, 신규 사업 추진부담 등 여러 가지 부작용이 발생할 수 있다. 그러므로 본 품질관리 가이드는 데이터 품질관리에 대한 이해를 증진시키고 구체적인 품질관리 기법을 제공하여 빅데이터 플랫폼 및 센터 관련 기관 및 기업들이 효율적으로 데이터 품질관리 활동을 수행할 수 있도록 하는 목적으로 제공된다.

본 품질관리 가이드는 빅데이터 플랫폼 및 센터의 데이터 품질관리 담당자가 데이터 품질관리 활동을 수행하는데 활용할 수 있도록 하였으며, 사업에 참여하는 구축 사업자, 운영 사업자 및 감리업자도 품질관리 측면에서 고려해야 할 사항 등을 참조할 수 있다.

품질관리 가이드 구성

품질관리 가이드는 크게 5개 영역으로 구성되어 있다.

Ⅰ 총론에서는 본 품질관리 가이드의 개발 배경과 목적을 제시하고, 품질관리 가이드에 대한 전반적인 구성과 기관의 담당자가 본 품질관리 가이드를 어떻게 활용할 수 있는지에 대해 설명한다. 특히, 데이터 품질관리에 대해 이해도가 높지 않은 점을 고려하여, 데이터 품질관리가 무엇 인지에 대한 개념을 설명한다.

Ⅱ 데이터 품질관리체계에서는 빅데이터 플랫폼 및 센터가 수행하는 데이터 품질관리의 모델과 체계를 제시하고, 각 요소별 의미와 주요 내용을 설명한다. 데이터 품질관리체계는 빅데이터 생애주기를 고려하여 빅데이터 품질관리를 위한 수집, 가공·분석, 활용 단계별 품질관리 기능 및 프로세스를 도출하고, 데이터 품질관리 수행사항에 대하여 설명한다.

Ⅲ 데이터 품질관리 기준에서는 데이터 품질관리의 관점이 되는 데이터 품질관리 지표를 제시하고, 각 지표의 의미, 주요 내용을 설명한다.
데이터 품질관리 기준은 빅데이터 환경을 고려하여 도출된 데이터 품질관리 지표와 각 지표별 세부지표 및 진단기준, 진단기법을 정량적, 정성적으로 설명한다.

Ⅳ 데이터 품질진단 방법에서는 빅데이터 특성을 반영하여 플랫폼 및 센터에서 가시적인 데이터 품질을 향상시키기 위한 품질 진단 및 개선 단계별 절차를 설명하고, 품질관리 담당자가 각 단계별 활동에서 고려해야 할 사항과 주의할 점 등을 설명한다.

Ⅴ 부록은 데이터 품질진단을 수행할 때, 작성해야 하는 데이터 품질진단 산출물에 대한 내용과 데이터 품질진단 규칙을 도출할 때 참고할 수 있는 다양한 예시를 제시하고 설명한다.

본 품질관리 가이드는 각 장별로 품질관리 담당자의 이해를 돕기 위해 안내 팁(Tip), 고려사항, 사례, 예시 등을 포함하였으며, 필요 서식 및 품질관리 활동에 도움이 되는 자료들을 부록으로 첨부하여 필요할 때 참조할 수 있도록 하였다.


붙임자료

빅데이터 플랫폼 및 센터 데이터 품질관리 가이드 2020.2 NIA

글을 남겨주세요.

이 사이트는 스팸을 줄이는 아키스밋을 사용합니다. 댓글이 어떻게 처리되는지 알아보십시오.

이 웹 사이트에서는 사용자 환경을 개선하기 위해 쿠키를 사용합니다. 우리는 당신이 괜찮다고 생각하겠지만, 당신이 원한다면 거절할 수 있습니다. 동의 더 읽기