ISSUE박성현 | 서울대학교 통계학과 명예교수, 한국과학기술한림원 전임 원장

ISSUE

코로나 이후
사회생활의 변화와
통계 업무의 진화 방향

지난해 12월 말 중국 우한(武漢)에서 시작된 ‘신종 코로나바이러스 감염증(코로나19)’ 전염 사태가 전 세계적인 팬데믹(대유행 전염병)으로 발전되면서 약 9개월 후인 10월 21일 현재 216개 나라에서 4,100만 명 이상이 감염되고 113만 명 이상이 사망했다. 이 엄청난 사건은 아직 그 끝을 모르고 진행되고 있다. 미국이 확진자 850만 명 이상, 사망자도 22만 명 이상으로 가장 피해가 크고, 다음으로 인도(확진자 760만 명 이상, 사망자 11만 명 이상)와 브라질(확진자 520만 명 이상, 사망자 15만 명 이상) 등에서 맹위를 떨치고 있다. 이 전염병을 막을 백신이 나오기까지, 앞으로 얼마나 더 지속될지 예측할 수 없다. 1918년에 발생한 스페인 독감(사망자 5,000만 명 이상)에 이어 거의 100년 만에 발생한 코로나19 팬데믹으로 인해 전 세계가 엄청난 충격을 받고 있다. 코로나19는 전 세계적으로 의료 보건의 위기를 가져왔을 뿐 아니라 우리 삶에 100년 만의 최대 충격을 안겨줄 것으로 예상된다. 이번 위기의 범위는 전 세계를 망라한다. 따라서 사람과 물자의 이동이 제한되면서 글로벌 공급망이 붕괴되고 있다. 역사적으로 고찰할 때 이러한 큰 충격은 인류의 삶의 방식을 바꾸어놓는다. 그러면 코로나19는 우리 사회를 어떻게 바꾸어놓고 있는가?

코로나가 바꾸는 삶의 방식들

우선 재택근무 방식이 급증하고, 사회의 디지털화가 가속화되며, 데이터의 수집·분석·활용 활 동이 증가하고 있다. 코로나로 인한 사회적 거리두기, 비대면 업무, 화상회의 등의 증가로 노트북 과 스마트폰으로 집에서 업무를 처리하는 재택근무가 급증한다. 이로 인하여 디지털 기술(빅데 이터, 인공지능(AI), 사물인터넷 등)의 도입이 빨라지고 사회가 디지털화로 치닫고 있다. 디지털 기술에는 데이터의 활용이 필수적이며, 데이터의 수집, 분석, 활용 등에서 앞서가는 나라가 결국 디지털 기술에서 앞서가게 될 것이다.

두 번째로, 사람들이 외부 활동을 자제하고 집에서 머무는 시간이 늘면서 ‘인터넷 온라인 쇼핑’ 이 증가하고, ‘스트리밍 서비스 콘텐츠’를 이용하는 사람이 증가하고 있다. 또한 많은 대중을 상 대로 하는 비즈니스 플랫폼 기업들(아마존, 구글, 알리바바, 네이버, 카카오 등)의 가치가 올라갈 것이며, 데이터에서 새로운 가치를 창출하는 새로운 비즈니스가 생겨나는 등 산업 생태계에도 변화가 있을 것이다.

세 번째로, 원격 교육이 활성화되어 교육 방식에 변화가 생기고 있다. 인터넷에 의한 온라인 원 격수업이 확대되고 있다. 이로 인해 지방과 수도권 대학 구분이 무의미해지고, 교수 수요가 감소 하며, 지역사회에 대한 대학의 사회교육이 활발해지는 등 대학 구조조정을 촉진할 가능성이 커 지고 있다. 일반 사회인을 대상으로 하는 각종의 오프라인 교육도 온라인 교육으로 그 비중이 재 편될 것이며, 일반인들이 집에서 각종의 원하는 교육을 받을 수 있는 형태로 바뀌어가고 있다.

마지막으로 산업에서는 스마트공장 전환이 빠르게 진행돼 4차 산업혁명이 가속화될 것이다. 산업현장에서는 사람이 적게 일하는 디지털 워크플레이스(digital workplace) 개념이 도입되 면서 AI 기술, 챗봇(채팅 기술), 빅데이터, 태그정보기술, 5G, 가상·증강현실 기술 등이 발전한다. 이에 필요한 데이터와 정보를 순각적으로 활용하는 스마트공장이 빠르게 도입되고, 모든 기업 업무에서 4차 산업혁명의 기술들이 급속하게 접목될 것이다.

결국 코로나 이후의 사회변화상에서 중요한 것은 데이터의 활용 기술이 모든 분야에서 급속히 발전하게 될 것이라는 사실이다.

데이터·AI 경제 시대의 도래에 따른 데이터 컨트롤타워 설치 필요

우리는 ‘데이터 경제’ 시대에 살고 있다. ‘데이터 경제’란 개념은 유럽연합(EU) 집행위원회가 발표한 ‘유럽 데이터 경제 육성책(Building a European Data Economy, 2017)’에서 제시한 것으로, 데이터의 활용이 모든 산업의 발전과 새로운 가치 창출에 촉매 역할을 담당하는 시대의 경제라는 뜻이다. 이 육성책의 골자를 보면, EU 내에서의 데이터의 자유로운 공개와 사용을 보장 하고, 데이터 분석 역량을 강화해 새로운 비즈니스 모델을 발굴하는 데 각국이 역량을 강화하도 록 권장하고 있다.

또한 지금은 데이터 시대이면서 동시에 AI의 시대이다. 모든 분야(과학, 산업, 의료, 문화, 게임 등)에서 AI와 접목된 기술이 발전하면서 AI 기술의 발전은 한 국가의 역동적인 발전에 가장 중요 한 요소가 되었다. 따라서 우리는 ‘데이터·AI 경제 시대’에 살고 있다고 볼 수 있다.

우리 정부에서도 이를 인식하고 2019년 1월 16일 ‘데이터·AI 경제 활성화 계획; 혁신성장 전 략투자’를 발표하면서 대처하고 있다. 또한 정부는 올해 7월 14일 ‘한국판 뉴딜 국민보고 대회’를 열었다. ‘한국판 뉴딜’은 ‘디지털 뉴딜, 그린 뉴딜, 안전망 강화’로 구성되며, 이 중에서 디지털 뉴 딜에서는 2025년까지 데이터댐을 구축하여 공공데이터 14.2만 개를 개방하고, AI 학습데이터 1,300종을 마련하며, 정부도 AI 정부로 가겠다는 의지를 밝혔다.

이런 정부의 움직임에서 가장 중요한 핵심은 데이터의 축적과 활용이다. 행정안전부에서 운영 하는 공공데이터포털(https://www.data.go.kr)이 있는데, 여기에는 3.2만 개 정도(2020년 6월 9일 현재)의 파일 데이터가 공개되어 있다. 또한 통계청의 통계데이터센터(https://data.kostat. go.kr) 에서도 통계청 생산 데이터와 일부 민간자료를 모아 이용자들에게 서비스하고 있다.

우리나라는 현재 통계법에 의하여 통계청이 국가통계의 컨트롤타워 기능을 하고 있으나 분산 형 통계 시스템을 운영하고 있어 수없이 많은 통계작성기관(승인통계 작성기관만 425개)을 가 지고 있다. 따라서 각 기관에서 생산되는 통계데이터의 종합적인 관리, 표준화 및 통합, 개방, 활 용 등에서 미흡한 것도 사실이다. 데이터·AI 경제 시대에 특히 중요한 민간 부분에서 생산되는 데이터의 관리는 중진국 수준을 못 벗어나고 있다.

따라서 우리 사회의 모든 분야(공공, 민간, 개인 등)와 관련된 데이터의 생산·관리·개방·유통· 활용 등을 종합적으로 기획하고 운영하며, 데이터 거래를 위한 인적·물적·제도적 기반 조성을 전 담하면서 데이터·AI 경제 활성화의 효율적인 중심 역할을 담당할 조직으로서의 데이터 컨트롤타 워 설립이 시급하다.

데이터·AI 경제 시대에 가장 각광을 받고 있는 학문은 데이터과학

데이터·AI 경제 시대에 가장 각광을 받고 있는 학문은 데이터과학(data science)이다. 데이 터과학은 데이터의 수집과 저장에 필요한 데이터 프로세싱 기술과 데이터 분석에 관한 지식을 기반으로 다량의 데이터로부터 패턴을 찾아내고, 통계적 추정, 예측 모델링 등을 통하여 필요 한 정보를 창출하며, 이를 실제로 활용하는 것을 연구하는 융합과학으로, 빅데이터가 하나의 중 요한 응용기술이다. 데이터과학에 대해서 좋은 참고문헌은 박성현 외(2018)와 한림연구보고서 (2019)를 참조하기 바란다.

넓은 의미의 데이터과학은 데이터 입력으로부터 통찰력 있는 정보를 담은 결과물을 산출하기 까지의 전 과정을 연구하는 학문으로 인공지능도 여기에 포함되며, 아래 그림은 그 연구영역을 보여주고 있다.

기존 학문의 영역에서는 수학, 통계학, 컴퓨터과학 및 기타 학문분야(사회과학, 공학, 경영 학, 의학, 인문학 등)이며, 데이터과학은 이들을 아우르는 다학제 간 연구(interdisciplinary studies)를 하는 학문이다. 수학·통계학과 컴퓨터과학이 합쳐지는 부분에 있는 데이터 마이닝 (data mining), 기계학습(machine learning), 이산구조(discrete structures) 등은 인공지능 의 핵심적인 방법론이기도 하다.

즉, 데이터과학은 데이터로부터 수학·통계학과 컴퓨터과학의 이론을 기반으로 응용 분야인 기 타 학문 분야의 지식(이를 도메인 지식(domain knowledge)라 칭함)을 활용하여 정보를 창출 해내는 새로운 과학인 것이다.

사회생활상 변화에 따른 새로운 통계작성 방식의 대두

코로나로 사회생활 양상이 변화하고, 데이터과학의 발전으로 우리는 차츰 새로운 데이터·AI 경제 시대에 접어들고 있다. 이 새로운 시대에 통계청에서 주로 하고 있는 국가통계 작성 방법에 도 어떤 변화가 생길 것인가?

중장기로 볼 때에는 반드시 변화가 있을 것이 확실하며, 이런 변화와 관련하여 김정민 외 (2020)과 전영일 외(2020)는 이미 귀중한 연구보고서를 발표하였다. 또한 박재현(2020)은 국가통계 작성에 AI를 활용하는 두 개의 통계청 프로젝트를 진행 중에 있다고 보고하였다.

하나는 국가통계포털(KOSIS)에 AI 챗봇을 도입하여 이용자를 위한 서비스 혁신 방안을 강구 중이며, 또 하나는 산업/직업 분류 자동코딩 시스템의 한계(정확도 하락으로 인한 수동 코딩 비 율 증가)를 극복하기 위해 기계학습 기법을 활용한 고도화를 추진 중이다. 새로운 통계 작성 방식 의 대두에 대하여 다음과 같은 변화가 예상됨을 지적하고자 한다.

❶ 비대면 통계조사의 확대

코로나로 인하여 사람이 직접 만나지 않고도 일을 처리하는 언택트(untact) 비즈니스가 확장 되면서, 통계작성에서도 통계조사원이 직접 사람을 방문하여 대면 작성하는 조사통계의 비중이 줄어들고, 비대면 통계조사의 비중이 확대될 것이다. 예를 들면, 인구총조사에서 이미 일부 온라 인 조사가 시행된 바 있으나, 이러한 비대면 온라인 조사의 비중이 증가할 것이다. 데이터 3법(개 인정보보호법, 정보통신망법, 신용정보법)이 개정됨에 따라 개인의 가명정보는 통계작성이나 빅 데이터 분석에 사용 가능하게 되었고, 이는 비대면 통계조사의 확대에도 도움을 줄 것이다.

❷ AI·빅데이터 기술을 활용하여 기존의 통계 생산 프로세스의 혁신

AI와 빅데이터 기술의 통계 작성 접목은 먼저 기존의 조사통계 생산 과정에 적용될 것이다. 통 계 생산 과정에서 그 효율성과 품질 향상, 시간 단축 등을 위하여 AI와 빅데이터 기술이 활용될 것이다. 예를 들면, 데이터의 품질을 높이기 위해 이상치(outlier) 검색, 데이터 정제(cleaning), 무응답 대체(imputation), 설문 응답에 대한 자동 코드 분류 작성 등에 데이터 마이닝 기법이나 기계학습·심층학습 기법을 통한 AI가 적용되는 것이다. 이런 활동을 ‘AI·빅데이터를 활용한 통계 생산 프로세스의 혁신’이라고 말할 수 있다.

❸ AI·빅데이터 기술을 활용한 신규 통계의 작성

다음 단계로는 기존의 통계 작성 틀에서 벗어나 ‘AI·빅데이터 기술을 활용한 신규 통계’를 만들어보는 것이다. AI나 빅데이터는 과거의 데이터로부터 현재나 미래를 예측할 수 있으며, 이러한 예측된 추정값을 실재 통계값으로 사용하여 통계를 작성하는 방법이 사용될 수 있다. 이는 아직 AI·빅데이터 기반의 분석이나 예측 결과(생산된 통계)에 관한 신뢰가 보편적으로 형성되지 않았으므로 국가통계로 승인하기에는 갈 길이 멀다. 그러나 정부에서 인정한 ‘AI 표준수립기관’에서 ‘AI 통계 품질 기준 및 심사 가이드라인’을 만들고, ‘AI 기술 표준화’에 성공한다면 결국 이러한 신규 통계도 승인통계로서 그 역할을 할 수 있는 날이 올 것으로 예상된다.

외국에서는 AI·빅데이터 기술을 활용한 통계 작성이 차츰 늘어나고 있다. 영국 통계청은 3년 전에 ‘데이터과학국’을 출범시키고, 국가통계 작성에서 데이터과학을 활용하여 GDP 조기지수 추정, 위성 이미지 패턴 분석에 기초한 도시지역 산림 측정, 다양한 경제·사회적 변화 예측 등을 하고 있다.

독일 통계청은 구인·구직 데이터 사이트에 노출된 빅데이터를 기계학습을 활용하여 일자리를 추정하고 있다. 미국 인구통계국은 온라인 데이터를 연계하여 기계학습을 활용한 물가통계를 추정하고 있다. AI·빅데이터를 활용한 이러한 선진국의 통계 작성 사례들은 우리에게 귀중한 벤치마킹 대상이 되고 있다.

미래는 데이터과학자가 되어야 제대로 일할 수 있는 시대

현재 코로나가 극성을 부리고 있지만 이도 언젠가는 종식될 것이다. 그러나 코로나가 우리 사 회에 준 충격은 크며 한국을 포함하여 인류의 사회생활에 큰 변화가 예상된다. 확실한 것은 사회 가 데이터 기반의 디지털화로 빠르게 변화할 것이라는 점이며, 4차 산업혁명의 대표적인 기술인 빅데이터, AI 등이 빠르게 이 사회에서 사용될 것이다. 통계의 중요성은 차츰 더욱 증대될 것이며, 이 사회는 데이터·AI 경제 시대로 접어들게 될 것이다. 이에 따라 학문으로서의 데이터과학이 대 학에서 중요한 학문으로 자리 잡을 것이며, 이 사회에서 데이터과학자들의 활동 영역이 넓어질 것이다.

통계청과 같은 통계 작성기관에서도 빅데이터와 AI 기법(기계학습, 심층학습, 챗봇 등)들이 차 츰 그 활용도를 증가시킬 것이며, 통계 전문가들도 앞으로는 데이터과학자가 되어야 제대로 일 할 수 있는 시대가 올 것이다. 통계 업무에 종사하는 모든 분이 이러한 변화 추세를 읽고 미래를 대비해주기를 당부하고 싶다.

PageTopBtn
PageDownBtn

(35220) 대전광역시 서구 한밭대로 713(월평동)
통계센터 통계교육원 | E-mail : stimaster@korea.kr

Copyright(c)2014 Staticstis Training Institute.
All Rights Reserved.