교육이수동 | 한국인포그래픽협회 대표
숫자와 도형을 활용해 단위가 다른
통계 인포그래픽 만들기
최근 공공기관 또는 기업의 경우 국민 또는 소비자 대상으로 설문을 통한 통계데이터 커뮤니케이션을 하려는 흐름이 증가하고 있다. 설문 또는 리서치의 핵심은 어느 항목을 기준변수로 바라보는지가 가장 중요하다. 기주변수는 독립변수(獨立變數, independent variable) 를 의미한다. 예를 들어 독립변수가 하나인 경우는 설문분석이 간단할 수 있으나 독립변수가 2개 또는 그 이상이 나오는 경우는 분석이나 시각화를 할 때도 그려야 할 대상이 증가하게 된다. 통계를 가지고 커뮤니케이션을 잘 한다는 것은 시각화 과정에서 어떤 도해(圖解)써야 하는가가 무척이나 중요한데 해당 호에서는 통계자료를 읽고 요약하는 과정을 통해 어떤 도해를 사용하여 시각화를 하는지 제시 데이터를 통해 제작 과정을 소개한다.
종종 하나의 질문에 다수의 응답 통계가 나오는 경우가 있다. 이때 조사 결과의 종속변수(從屬變數, dependent variable)의 단위가 비율, 배수 등 다르게 나온다면 그래프 표현으로 처리하기 어렵다. 제시된 데이터는 6개 소주제로 이루어진 설문 결과다. 자료를 한 장의 페이지에 어떤 도해로 나타내는 것이 좋은지 ‘데이터 요약부터 최종 레이아웃’까지 단계별 소개한다. 해당 사례는 연구, 전략, 마케팅, 영업 등 모든 부서에서 가장 많이 사용하는 표현방법이기도 하다.
전체 분석
WHO는 “여성은 남성 파트너의 폭력으로 인해 건강에 어떤 영향을 받고 있는가” 에 대한 조사결과를 발표했다. 물리적 폭력, 성적인 폭력, 언어적인 폭력 등 다양한 유형의 폭력이 있으며 이를 통해 여성들이 겪는 고통도 다양하게 나타나고 있다. 첫 번째는 정신건강이다. 파트너의 폭력으로 우울증 증상이 전보다 두배 이상 증가했으며, 두 번째는 알콜중독 위험이다. 폭력 전 보다 거의 2배 증가한 수치를 보인다. 이 밖에 임신에 영향을 미치는 위험 16%, 상해 및 죽음으로 이어지는 위험 역시 42% 증가한 것으로 나타났다. AIDS, 유방암 등 중대한 위험 질병을 얻는 경우도 1.5 배 이상 증가했다. 죽음을 당한 여성의 38%는 남자 파트너가 가해자라는 조사결과는 충격적이다.
조사결과 자료 앞부분에 나오는 기관명칭은 출처가 된다. WHO는 출처로 표시한다. 조사 발표 자료 앞부분의 문장은 대부분 조사의 핵심이 되는 질문과 그에 따른 결과 내용을 일부 요약한다. 따라서 ‘제목’으로 간주할 수 있다.(제목= 여성은 남성 파트너의 폭력으로 인해 건강에 어떤 영향을 미치는가?) 이후 첫 번째, 두 번째, 이 밖에 등의 문장은 넘버링을 하면서 총 개수를 표시한다.(소주제로 간주한다.) 만일 6번까지 넘버링이 됐다면 6개의 소주제로 구성된 통계 자료다. 마지막으로 소주제마다 언급한 통계 단위 값이 하나의 단위로 이루어졌는지 아니면 복수 이상의 단위로 됐는지 확인한다. 해당 제시 데이터의 경우 ‘비율’, ‘배수’ 등 2가지로 이루어진 단위임을 알 수 있다.
데이터 요약
▶ 1단계 문장을 정독하고 불필요한 문장은 제거한다. 세부 통계 자료는 넘버링하며 개수를 확인한다.(=소주제 개수)
WHO(출처)는 “여성은 남성 파트너의 폭력으로 인해 건강에 어떤 영향을 받고 있는가”(주제) 에 대한 조사결과를 발표했다. 물리적 폭력, 성적인 폭력, 언어적인 폭력 등 다양한 유형의 폭력이 있으며 이를 통해 여성들이 겪는 고통도 다양하게 나타나고 있다. (뒤에서 자세히 언급하므로 해당 문장은 제거한다)
① 첫 번째는 정신건강이다. 파트너의 폭력으로 우울증 증상이 전보다 2배(배수) 이상 증가했으며,
② 두 번째는 알콜중독 위험이다. 폭력 전 보다 거의 2배(배수) 증가한 수치를 보인다.
③ 이 밖에 임신에 영향을 미치는 위험 16%(비율),
④ 상해 및 죽음으로 이어지는 위험 역시 42%(비율) 증가한 것으로 나타났다.
⑤ AIDS, 유방암 등 중대한 위험 질병을 얻는 경우도 1.5 배 이상(배수) 증가했다.
⑥ 죽음을 당한 여성의 38%(비율)는 남자 파트너가 가해자라는 조사결과는 충격적이다.
▶ 2단계 선택한 데이터만 다시 요약한다.
1원인+ 6결과로 이루어진 조사 분석 내용이다. 6개의 소주제를 홈페이지, 한 장의 발표자료 등에 넣으려면 별도의 도해 방법을 생각해야 한다. 예를 들어 파워포인트 슬라이드 4:3 사이즈 기준으로 4개 이상 소주제를 수평 배열하기엔 공간이 협소하다. A4 사이즈 세로형으로 해도 마찬가지다.
*원인&결과 문장은 대부분 인과관계(因果關係) 차트로 나타낸다.
시각화 방법
먼저 도해 방법을 몇 가지 생각하고 이후 디자인을 한다.
개선 전 도해= 현실적으로 6개의 박스를 가로 또는 세로로 한 페이지에 넣기란 쉽지 않다.
개선 후 도해는 실제 6개 박스를 가로 또는 세로로 한 페이지에 넣기 쉽지 않으므로 매트릭스(6개 주제를 3열 2행으로 쌓기)와 6각형 도형 주변으로 배치하는 방법을 선택할 수 있다.
* 최종 레이아웃 예시는 매트릭스 레이아웃으로 선택했다.
•데이터의 단위가 비율(%), 배수 등 2가지로 하나의 ‘그래프’ 표현으론 어렵다.
•6개의 소주제 박스는 동일한 위치에 글, 그림, 수치를 나타내는 것이 가독성에 좋다.
해당 도해를 바탕으로 디자인한 모습은 아래와 같다.
데이터 디자인을 할 때는 다음 3가지를 고려하여 제작할 수 있다.
➊ 육각형을 활용하여 배열하면 정돈된 느낌의 디자인이 가능하다.
➋ 명조체는 안정적인 느낌을 주기 때문에 진지함과 차분함을 실어 정보를 전달할 때 유용하다.