통계탐방안향숙 | 통계청 통계데이터기획과 사무관
통계탐방
빅데이터 시대··· 가장 핫한 대회가 생겼다
통계빅데이터 분석 활용대회
요즘 빅데이터가 단연 화제이다. 이런 시대에 대응하고자 통계청은 「통계빅데이터센터」를 설립하여 산·학·연 및 일반 국민이 활용할 수 있도록 통계빅데이터를 제공하고 있다고 한다.
통계빅데이터센터는 통계빅데이터를 연계·활용할 수 있는 데이터 분석 플랫폼으로 엄격한 보안체계가 갖춰진 공간에서 자유롭게 데이터를 분석할 수 있도록 지원하는 곳이다. 통계청 정부혁신 차원으로 2018년 말부터 본격 운영을 시작하여 현재 서울·부산·대전에 설치되어 있다(http://data.kostat.go.kr). 여기서 빅데이터를 활용하고 이런 대회에 응모도 할 수 있다니 이것이 바로 꿩먹고 알먹고가 아닌지 모르겠다. 몰랐다면 이제 알고 가자.
‘제1회 통계빅데이터 분석 활용대회’ 어떻게 진행되었나
•목적 ⇢ 정부혁신의 일환으로 통계빅데이터센터 자료 분석 기회를 제공하여 데이터 기반의 의사결정 문화 확산 및 통계빅데이터센터 이용 활성화
•주제 ⇢ 데이터로 통하는 세상!
공공데이터와 민간데이터를 융·복합하여 사회·경제적 현상 분석 및 정책 의사결정 모델 발굴, 창업 아이디어 등 제안
•지원자격 ⇢ 개인 또는 팀(3명 이하)의 형태로 누구나 참여 가능
*외국인의 경우 개인 참가는 어려우며, 한국인을 포함한 팀으로 참가 가능
•대회기간 ⇢ ’19. 6. 3.(월)~8. 2.(금)
•활용데이터 ⇢ 통계빅데이터센터 제공자료, 공공·민간데이터
•타출처의 데이터와 연계 분석 가능
•통계빅데이터센터 제공자료
- 행정통계자료(통계등록부(10종), 행정통계(8종)), 민간자료(SKT 빅데이터)
‘제1회 통계빅데이터 분석 활용대회’ 결과는
학생, 연구원 등 다양한 분야의 141개 팀이 참여하여 최종 61건의 보고서를 제출하였다. 제출된 보고서 중 주제의 참신성, 데이터 활용성, 분석 수준 등을 고려하여 전문가 심사위원회를 통해 최종 7편의 수상작을 선정하였다.
최·우·수·상
골목식당을 중심으로 살펴본 방송 프로그램의 골목 시장 활성화 효과 평가
•분석취지 ⇢ 방송 프로그램을 통한 특정 가게의 문제점 개선과 방송노출이 주변 지역의 상권 활성화에 미치는 효과를 분석하고자 한다.
•활용데이터 ⇢ 통계청 통계빅데이터센터에서 제공하는 민간자료 중 성·연령별 유동 인구 자료와 업종별 매출 자료를 이용하였다.
•분석방법 ⇢ 식당의 위치와 유동인구 혹은 매출을 측정한 관측 지점 간의 거리를 이용하여 지역을 구분한 후 방송 시작 전후 시점을 비t교하는 이중차분법 연구설계를 통해 ‘골목식당’ 방송의 효과를 추정하였다.
•분석결과 ⇢ 추정결과 ‘골목식당’ 방송은 유동인구와 음식업 매출을 증가시키는 효과가 나타났고 특히 유동인구는 장기적(6개월 후)으로 유지되는 경향을 보여주었다. 다만, 영향범위는 200m 수준으로 제한적이며, 매출의 효과는 음식업 이외 상권 활성화로 이어지는 것은 아닌 것으로 나타났다.
우·수·상
신도시 타당성 요인분석
•분석취지 ⇢ 기존 1, 2기 신도시 개발 효과를 분석하여 최근 발표한 3기 신도시 개발의 방향성에 대해 제언하고자 한다.
•활용데이터 ⇢ 통계청 통계빅데이터센터에서 제공하는 통계기업등록부, 민간데이터(성·연령별 유동인구, 매출액, 상권정보) 및 이용자 보유자료를 사용하였다.
•분석방법 ⇢ 신도시 성공기준은 계획인구와 현 거주인구의 일치 또는 상회 여부로 간주하였고, 교통, 상권, 자급능력을 영향요인으로 채택했다. 분석에는 주성분분석과 표준화 거리를 이용한 k-근방 분류를 사용했다.
•분석결과 ⇢ 분석을 통해 1기 신도시에 반해 2기 신도시는 성공한 신도시의 요인인 교통, 상권, 자급능력 부분에서 아직 상대적으로 부족함을 확인했다. 3기 신도시 목표 완수를 위해 부천(중동)신도시 연구, 지하철 신설 및 확충 또는 기존노선 연장 등을 제안한다.
우·수·상
지역의 사회구조적 특성이 빈집 형성에 미친 영향에 관한 패널분석
•분석취지 ⇢ 농촌 뿐 아니라 도시 빈집도 증가하는 사유는 저출산·고령화 이외에 사회구조적 취약성이 영향 미치는지 분석하고자 한다.
•활용데이터 ⇢ 통계청 통계빅데이터센터에서 제공하는 행정통계자료 중 등록센서스 인구DB, 가구DB, 주택DB 및 통계기업등록부DB를 활용하였다.
•분석방법 ⇢ 읍면동 다년도 패널데이터를 구축하고 고정효과에 따른 포아송 모델로 분석하였다.
•분석결과 ⇢ 빈집 발생 및 증가 현상은 인구구조 특성 외에도 주택 상황* 및 경제적 상황, 생활편의 수준이 복합적으로 작용한 결과로 분석되었다.
* 아파트수, 오피스텔수, 취약주택수,연면적, 건축연도,
노후주택수, 신축주택수
‘통계빅데이터센터’를 이용하려면
통계빅데이터센터는 이용자가 공공데이터를 편리하게 이용하고 민간자료 및 외부 반입 자료와 연계·융합이 가능하도록 구축된 데이터 플랫폼이다.
이용방법