개인정보, 데이터, 정보화
카테고리

데이터_SW 생태계

빅데이터의 데이터 분류체계

빅데이터의 데이터 분류체계 패싯(facet)은 주제 분야를 구성하는 주요 속성, 관점, 혹은 특성을 의미한다(Ranganathan 1967, 88), 기본 주제를 일련의 공통적인 특성에 따라 여러 개의 기본 범주로 구분할 때 이 범주들을 기본 패싯이라 한다. 기본…

빅데이터의 역설

Xiao-Li Meng의 2018년에 발표한 "빅데이터의 통계적 낙원과 역설 (I)"에 관한 논문은 빅데이터 설정의 불확실성을 정량화하는 매력적인 접근법을 제시하고 있다. 다음은 이러한 아이디어 중 일부를 적용한 극단적인 예와 함께 요약한 내용입니다. 편향된…

머신 러닝을 위한 데이터 검증

검증 과정은 무엇이 잘못됐는지 직접 찾아내지 못하지만, 그 과정은 때때로 우리에게 모델의 안정성에 문제가 있다는 것을 보여줄 수 있다. 데이터는 머신 러닝의 근원입니다. 기계 학습 및 딥 러닝 모델이 아무리 강력하더라도, 나쁜 데이터로 우리가 원하는 것을…

빅데이터 분석에 필요한 데이터 크기

데이터 분석의 전통적인 학문은 통계학이다. 통계학은 모집단의 성질을 파악하기 위하여 표본을 가지고 분석하여 모집단의 모수를 추정 및 검증하는 분석 기법이다. 통계적 분석은 모집단 전체를 조사하는 비용에 비하여 적은 비용으로 효율적으로 결과를 얻을 수 있는 분석…

빅데이터 플랫폼 정보

과기정통부가 공공과 민간이 협업하여 활용도 높은 양질의 데이터를 생산·구축을 위하여 구축된 빅데이터 플랫폼 문화 빅데이터 플랫폼: https://www.bigdata-culture.kr 통신 빅데이터 플랫폼:…

이 웹 사이트에서는 사용자 환경을 개선하기 위해 쿠키를 사용합니다. 우리는 당신이 괜찮다고 생각하겠지만, 당신이 원한다면 거절할 수 있습니다. 동의 더 읽기