통계광장김준래 | 통계의 창 객원기자
통계광장
통계로 들여다보는
바이러스와 인간의 전쟁
전염병 공포가 다시 세계를 강타하고 있다. 중증급성호흡기증후군(SARS)와 중동호흡기증후군(MERS)에 이어, 이번에는 코로나바이러스감염증(COVID-19)까지 등장하여 전 세계를 공포의 도가니로 몰아넣고 있다.
물론 희망도 보인다. 이글을 쓰는 시점에서 우리나라를 비롯한 전 세계 의료진들의 헌신적인 노력으로 급증하던 환자 수는 조금씩 줄어들고 있고, 사망자도 감소 추세를 보이고 있다. 문제는 이 상황이 끝난다 하더라도 전염병에 대한 사람들의 생각이 이전과 같지 않으리라는 점이다. 전염병은 단순히 건강에 위협을 가하는 병원체가 아니라, 언제든지 우리의 생활을 근본적으로 뒤흔들 수 있는 공포의 대상으로 여겨질 것이기 때문이다.
이런 전염병이 주는 공포를 이겨내려면 치료에 집중하는 것도 중요하지만, 앞으로 이런 전염병이 다시 창궐하지 않도록 다양한 대처 방안을 마련하는 것이 무엇보다 필요하다고 전문가들은 입을 모은다.
그렇다면 전염병이 유행하지 않도록 하려면 인류는 어디에서 답을 찾아야 할까? 이에 대해 전문가들은 역사와 통계가 답을 제시해줄 것이라고 조언한다. 역사적으로 유행했던 전염병들의 정체를 되짚어보고, 그 과정에서 파악한 통계로 전염병에 대처해나가야 한다는 것이다.
전염병 역사는 인류의 역사
전염병의 역사는 가히 인류의 역사라 할 수 있을 만큼 오래되었다. 사료를 살펴보면 기원전 430년경에 그리스의 도시 국가인 아테네에서 전염병이 발생했다는 기록이 남아 있다. 그로부터 20년 후인 410년경에는 ‘히포크라테스 선서’로 유명한 그리스의 의사 히포크라테스가 독감의 증상을 처음 기록에 남겼다.
이처럼 오랜 역사를 가진 전염병 중에서도 인류의 생존에 치명상을 가한 전염병으로는 흑사병과 스페인독감 그리고 콜레라 및 결핵 등이 대표적 사례로 꼽힌다. 이들 전염병은 적게는 수천만 명에서 많게는 수억 명까지 사람의 생명을 빼앗아 지금까지도 최악의 전염병으로 기록되어 있다. 흑사병은 몸이 새까맣게 변하면서 서서히 죽어간다고 해서 붙여진 이름이다. 들쥐가 갖고 있는 페스트균에 의해 발생하기 때문에 ‘페스트(Pest)’라고도 불리는 이 전염병은 14세기 중반에 등장하여 순식간에 유럽 전역으로 퍼져나가면서 당시 유럽 인구의 3분의 1인 1억 명 정도를 죽음으로 몰아넣었다.
흑사병은 체액이나 분뇨에 의해 전염되는데, 흑사병에 걸리면 초기에는 두통, 발열, 오한 등의 증상을 보인다. 이후 피부가 검은색으로 변하며 몸 전체에서 괴사가 일어나게 되는데, 전염성이 매우 강해 감염되면 대부분의 사람들이 끔찍한 모습으로 죽게 된다.
흑사병이 중세 유럽에서 퍼진 당시에는 별다른 치료방법이 없었으나, 항생제가 탄생하면서 본격적인 치료가 가능하게 되었다. 다만 흑사병은 발병 이후 증상이 빠르게 진행되기 때문에 조기에 치료할수록 완치 효과가 높다.
흑사병의 대유행 이후 한동안 잠잠하던 전염병은 19세기 들어 콜레라와 결핵이 등장하면서 연이어 전 세계를 공포의 도가니로 몰아넣었다.
콜레라는 콜레라균(Vibrio Cholerae)의 감염에 의해 나타나는 급성 전염병으로, 대표적 증상은 설사다. 급성 설사가 자주 유발되어 탈수가 매우 빠른 속도로 진행되다가 결국에는 사망에 이르게 된다.
콜레라는 원래 인도 갠지스 강 유역에서 나타난 풍토병이었다. 하지만 19세기 들어 이 지역을 식민지화했던 영국으로 전염되기 시작했고, 결국에는 러시아와 아프리카 등지로 퍼져나가면서 약 1,500만 명의 사망자가 발생했다.
콜레라가 우리에게 낯설지 않은 이유는 조선 순조 시절에 역시 한반도 전역을 휩쓸었기 때문이다. 당시 괴질(怪疾)이라 불렸던 이 전염병은 순조 21년인 1821년부터 유행하기 시작하여 수백 년간 백성들을 괴롭혔다.
당시 평안도 감사였던 김이교가 작성했던 기록을 살펴보면 “최근 들어 갑자기 발생한 괴질로 인해 백성들이 설사와 구토를 하면서 순식간에 죽어버렸다”라고 언급하고 있다. 그러면서 “불과 10일 만에 일천여 명이 죽었으나, 치료할 약과 방법이 없어 절망적이다”라고 적은 것을 보면 당시 상황이 얼마나 어려웠는지를 조금이나마 느낄 수 있다.
이처럼 전 세계를 초토화시켰던 콜레라는 당시의 과학 수준에서 볼 때 병원균이 공기를 떠돌아다니면서 사람들을 전염시키는 것이라고 생각했다. 하지만 영국의 한 의사는 공기가 아닌 오염된 물에 의해 콜레라가 전염된다고 주장했다.
그의 주장은 당시 학계에서 많은 논란을 불러일으켰지만, 수많은 실험 끝에 결국 이 의사의 주장이 사실이라는 점이 밝혀졌다. 많은 희생을 치렀지만 콜레라의 유행으로 인해 상하수도 시설 보급 및 공중위생 확립을 제공하는 계기가 되었다.
19세기의 최대 재앙이 콜레라 감염이라면 20세기의 재앙은 스페인독감(Spanish flu)의 창궐이다. 이 전염병은 1918년부터 1920년까지 2년 동안 전 세계에서 5천만 명 이상의 사람들을 죽음으로 몰아넣었다.
의료 기술의 수준이 과거와는 비교가 되지 않을 정도로 발전한 시기였지만, 이토록 많은 사람들이 목숨을 잃은 이유는 스페인독감만이 가진 무서운 특징 때문이었다. 딱히 이렇다 할 증상이 나타나지 않는 무증상 감염이 대부분이라 치료 시기를 놓치는 경우가 대부분이었던 것이다.
스페인 독감에 걸리면 처음에는 감기에 걸린 듯한 증상을 보이다가 시간이 흐를수록 몸에서 급격하게 열이 나면서 보랏빛으로 변해 죽어갔다. 이런 증상 때문에 스페인 독감은 ‘3일 열병’이라고도 불렸는데, 그 이유는 3일 내외로 짧은 열병 증상을 보이다가 급격히 상태가 악화되는 경우가 많았기 때문이다.
스페인 독감도 콜레라처럼 조선시대에 한반도까지 전염된 기록이 남아 있다. 일제강점기 시절인 1918년에 발간된 조선총독부 통계연감에 따르면, 조선의 총인구 1,670만 명 중 44%인 742만 명이 독감에 걸렸고 그중 14만 명이 사망한 것으로 기록되어 있다.
무섭게 전 세계로 번지던 스페인 독감도 1920년에 접어들면서 자연스럽게 잦아들기 시작했고, 사람들은 전염병의 공포에서 벗어날 수 있게 되었다. 과거의 전염병들과 다른 점이라면 치료제보다 예방접종을 강화하여 처음부터 질병에 걸리지 않도록 하는 예방 문화가 생겨났다는 점이다.
마지막으로 결핵(Tuberculosis)은 역대 가장 많은 사망자를 낸 전염병으로 유명하다. 처음 발병이 시작된 19세기 초반부터 지금까지 200여 년 동안 약 10억 명의 사망자가 발생한 것으로 알려져 있다. 결핵은 사람의 입에서 미세한 침방울에 들어 있던 결핵균이 상대방의 코와 입을 통해서 전염되는 감염병이다. 지금의 신종 코로나 바이러스와 유사한 감염 경로를 갖고 있다고 볼 수 있다.
결핵균은 지난 1882년 세균학자였던 로베르트 코흐(Robert Koch)에 의해 발견되었고, 그해 3월 24일 베를린에서 개최된 학회에서 발표됐다. 그 이후 3월 24일은 ‘세계 결핵의 날’로 지정되어 지금까지 매년 관련 행사가 열리면서 결핵에 대한 경각심을 일깨워주고 있다.
결핵균에 감염되면 한 달 이상 기침이 지속되고, 가슴에 통증이 나타나며, 기침 후 피가 섞여 나오는 증상을 보인다. 또한 추위를 타거나, 식욕감퇴 및 체중감소 등의 증상이 동반되기도 한다.
결핵이 본격적으로 유행하기 시작한 19세기 후반만 하더라도 환자들은 맑은 공기를 마시면 병이 치유된다고 믿었다. 이 때문에 공기가 좋기로 유명한 스위스의 다보스 지역은 결핵 환자를 위한 요양지로 유명해졌고, 그 결과 경제적 풍요로움을 누리는 혜택을 보면서 다보스 포럼 같은 국제적 행사를 많이 유치하고 있다.
전염병 퇴치에 활용된 통계
전염병 퇴치에 통계가 활용되기 시작한 것은 콜레라가 유럽에서 창궐하던 19세기부터다. 특히 피해가 컸던 영국에서는 콜레라가 주기적으로 몇 번씩 발생하면서 수많은 사람이 목숨을 잃었다.
영국의 의사들과 과학자들은 하루에도 수천 명씩 사망하는 피해를 방지하기 위해 콜레라의 발병 원인을 찾기 위해 애를 썼다. 하지만 당시의 과학기술 수준으로는 세균의 존재를 정확히 알 수 없었기 때문에 콜레라가 정확히 어떻게 전염되는지를 알 길이 없었다.
콜레라 발병의 원인과 관련하여 당시 유럽에서 가장 인정받았던 가설은 콜레라가 길거리에 버려진 쓰레기에서 발생하는 악취에 의해 전염되므로 악취를 제거해야 한다는 것이었다. 그래서 사람들은 거리에 쌓인 쓰레기들을 모두 강물에 흘려보내는 캠페인을 벌였는데, 그런 노력에도 불구하고 콜레라 환자는 더욱 늘기만 했다.
이때 존 스노(John Snow)라는 젊은 의사는 콜레라의 전염 원인이 악취로 가득한 공기라는 주장에 대해 의문을 품었다. 만일 콜레라가 공기에 의해 감염되는 것이라면 같은 공기를 마시는 사람들은 모두 병에 걸려야 하지만, 그렇지 않다는 점이 스노를 의심하게 만들었다.
그때부터 스노는 콜레라의 발생 원인에 대해 조사하기 시작했는데, 이를 위해 도입한 방법이 바로 통계였다. 그는 우선 콜레라로 생명을 잃은 사람들의 주변을 철저히 조사했다. 그리고 동일한 환경에서도 콜레라에 걸리는 사람과 걸리지 않는 사람들 사이에 어떤 차이가 있는지를 수치로 비교했다. 이렇게 분석한 결과를 그는 지도 위에 일일이 기록했다. 콜레라를 앓고 있는 환자와 앓다가 죽은 사망자의 숫자를 집계하여 기록하자, 지역 별로 일목요연한 통계치가 생성되었다.
스노는 지역과 질병 관련 통계치의 상관관계를 분석하다가 놀라운 사실을 발견했다. 바로 런던에 위치한 여러 개의 급수 시설 중 특정한 급수 시설을 이용하고 있던 사람들의 사망률이 다른 급수 시설을 사용하는 사람들의 사망률보다 무려 여덟 배나 많다는 점을 발견한 것이다.
그는 수차례 지도와 통계치를 비교해 보면서 콜레라 전염의 원인이 공기가 아닌 급수 시설이라는 점을 확신했다. 이후 스노는 자신이 정리한 통계 자료를 근거로 런던시청에 특정한 급수 시설의 폐쇄를 요청했다.
처음에는 반신반의하던 시청 공무원들이었지만 눈앞에 놓인 통계 자료를 보자 믿지 않을 수 없었다. 이후 특정 급수시설이 폐쇄되었고 며칠이 지나자 거짓말처럼 환자수가 줄기 시작했다. 살기등등하던 콜레라의 기세를 꺾고 이를 퇴치할 수 있는 반전의 기회를 한 젊은 의사의 집념이 만들어낸 순간이었다.
그로부터 30년 후 독일의 세균학자인 코흐가 콜레라 세균을 발견하고, 그 세균이 물과 밀접한 관계를 맺고 있다는 것을 발견하여 학계에 보고했다. 이로써 그때까지만 해도 가설 수준에 머물렀던 스노의 통계를 기반으로 한 주장은 과학적 증명을 통해 옳다는 점을 인정받았다.
놀라운 점은 스노가 의사였지만 세균이나 병리학에 대한 지식이 거의 없었다는 점이다. 그럼에도 불구하고 스노가 자신의 주장이 옳다고 믿었던 이유는, 스스로 산출한 통계 결과가 콜레라의 발병 원인이 급수 시설에 있다는 점을 명확히 보여주었기 때문이다.
당시만 해도 전염병의 치료는 소위 전문가라고 하는 사람들의 경험과 생각에 의해 좌지우지 되던 시대였다. 하지만 콜레라를 퇴치하는데 있어 통계 시스템이 결정적 영향을 끼침에 따라, 이후부터는 전염병이 유행하게 되면 스노의 통계 방법을 따라 하는 사례가 늘어났다.
전염병 예방 및 치료는 오픈 데이터 시스템에 달려 있다
콜레라의 사례에서 보듯이 19세기부터 전염병 퇴치에 활용되기 시작한 통계 시스템은 오늘날에 와서는 ‘오픈데이터 시스템(open data system)’으로 확대되어 의료 현장에서 활용되고 있다.
대표적으로는 코로나19 사태로 인해 국내에서 탄생하게 된 ‘전염병 관련 공공데이터 시스템’을 꼽을 수 있다. 여러 사회적 협동조합이 힘을 합쳐 만든 공동대응팀이 제안한 이 시스템은 감염병 관련 종합통계 정보를 다양한 시각데이터를 통해 제공하도록 설계되었다.
공동대응팀의 관계자는 이 같은 시스템을 제안한 이유에 대해 “정부가 그동안 투명하게 전염병 관련 데이터를 공개하고 있었으나, 코로나19가 확산되면서 산발적으로 생산되는 데이터를 일반 시민이 일일이 확인하기 어렵다는 문제점이 발생했기 때문”이라고 지적했다.
그러면서 “정부와 공공기관은 보유하고 있는 데이터와 통계치를 제공하고, 민간에서는 다양한 아이디어를 통해 이를 시각화하여 재난이나 전염병 같은 긴급 상황에 대처하고자 한다”라고 밝혔다.
시스템 제안서를 살펴보면 감염병 대응 상황을 종합적으로 파악할 수 있는 ‘종합 통계’를 비롯하여 ‘확진자 및 의심 환자 목록’과 ‘방역대상 장소’, ‘선별진료소 위치’ 같은 데이터가 포함되어 있다. 이들 데이터는 시각화된 정보를 제공할 뿐만 아니라 공유 프로그램을 통해 지도와 결합한 새로운 서비스가 가능하다는 것이 공동대응팀의 설명이다.
이 같은 제안에 대해 건강보험심사평가원 관계자는 “기획재정부를 중심으로 질병관리본부와 건강보험심사평가원, 그리고 한국보건산업진흥원 등 다양한 기관이 모여 데이터 개방을 논의하고 있다”라고 전하면서 “추후에도 지속적으로 민간이 활용할 수 있는 데이터와 통계치를 공개할 것”이라고 말했다.
실제로 공공데이터를 모아 전염병 퇴치에 활용하고 있는 사례로는 최근 들어 국내에서도 다양하게 등장하고 있다. 데이터를 활용하여 마스크 판매점의 위치와 재고 정보를 알려주는 어플리케이션을 비롯하여 지리정보시스템(GIS)을 기반으로 환자의 동선이나 선별진료소 정보 등을 제공하고 있다.
이 중에서도 코로나19 환자 경로 시각화와 관련된 데이터셋(data set)을 오픈소스로 공개한 마인즈랩은 가장 돋보이는 성과를 거두고 있다. 이 회사가 구축한 코로나19 동선 추적 데이터셋은 전염병 퇴치를 위한 거의 모든 데이터와 통계치가 저장된 시스템이라 할 수 있다.
데이터셋에는 확진자의 경로와 연령, 성별 및 진단 날짜 등 기초적인 환자 경로 데이터는 물론, 22가지의 주요 전염병과 16개의 백신에 대한 정보가 들어 있다. 또한 의료 시설 등을 포함한 의료 통계 데이터와 다양한 변수에 따른 시각화된 데이터도 포함되어 있다.
이에 대해 마인즈랩의 관계자는 “해당 데이터셋은 기존 코로나19 관련 오픈 데이터셋들에 비해 데이터의 양과 품질, 그리고 데이터 시각화 부분에서 뛰어난 성능을 자랑한다”라고 소개하며 “이런 차별성으로 인해 미국의 커뮤니티 사이트 중 딥러닝 부문 1위에 오르는 등, 해외 개발자 사이에서도 주목을 끌고 있다”라고 말했다.
이뿐만이 아니다. 과학기술정보통신부와 국토교통부, 질병관리본부는 코로나19 확산 방지를 위해 역학 조사에 필요한 통신 및 카드 사용 정보 등을 수집하는 ‘스마트시티 시스템’을 활용하는 방안을 추진하고 있어 관심이 모아지고 있다.
코로나가 숙제로 던져준 데이터를 통한 감염병 예측
국내에서 오픈 데이터를 이용한 통계 시스템을 통해 전염병 확산 방지에 주력하고 있다면 캐나다의 스타트업인 블루닷(BlueDot)은 확보한 데이터를 이용한 감염병 예측 시스템을 운영하고 있어 눈길을 끌고 있다. 특히 이 회사는 자사 연구진이 개발한 인공지능 시스템을 활용하여 세계보건기구(WHO)보다 열흘 먼저 코로나19 확산 위험성을 미리 경고하여 유명세를 탄 바 있다.
조그만 스타트업에서 만든 인공지능 시스템이 어떻게 신종 전염병의 위험을 더 일찍 발견할 수 있었을까? 그 비결은 바로 이 회사가 개발한 데이터 분석 기술에 숨어 있다. 블루닷은 질병을 추적하는 데 필요한 정보를 SNS가 아닌 항공 탑승권 결제 데이터에서 수집했다. 우한에 체류했던 사람들의 일부가 아시아 각국별로 출국한 것을 확인하고 코로나19가 우한에서 아시아 전역으로 확산될 것을 예측한 것이다.
미국의 하버드대와 MIT 공대 연구진이 빅데이터 기반 전염병 분석 웹사이트인 헬스맵(Health Map)도 있다. 헬스맵 역시 블루닷처럼 에볼라 사태나 메르스 사태 때 WHO보다도 먼저 위험성을 경고해 화제가 되었다. 헬스맵은 지난 2006년 수만 개의 소셜미디어 사이트와 지역뉴스, 그리고 의료진 네트워크에서 질병 발생 정보를 모은 뒤 이 중에서 믿을 만한 내용을 선별하여 웹상에서 지도 형태로 보여주는 시스템이다.
헬스맵의 가장 큰 장점은 역시 신속성이다. 소셜미디어 등을 활용하기 때문에 신뢰도는 떨어질 수 있지만 질병 발생정보가 올라오는 속도는 WHO보다도 훨씬 빠르다. 이런 활약상으로 헬스맵은 현재 코로나19 감염증 발생 지역 등에 대한 정보를 제공하고 있다.
이 밖에도 캐나다 온타리오공과대 연구진이 개발한 병원 감염 예측 프로그램은 산·학·연 협력의 좋은 사례로 꼽힌다. 병원이 환자 데이터를 제공하면 대학이 데이터를 분석하고, IBM 같은 기업이 통계분석 시스템을 제공하는 형태다. 이렇게 분석된 감염병 예측 데이터는 질병에 상대적으로 더 취약한 신생아와 미숙아의 질병 발병 예측 등에 활용되고 있다.