FOCUS

분석은 설득이다.

강양석 | Deep Skill 대표

데이터 분석 강의를 지속하다 보면 사람들이 분석을 어려워하는 진짜 이유를 볼 수 있다. 그것은 하나의 완성된 주장을 해본 경험이 없다는 것이다. 데이터가 없는 것도, 분석 기법에 익숙해지는 것도 시간이 지나면 해결해 줄 수 있는 문제이다.

하지만, ‘이 분석이 과연 설득력이 있을까?’에 대한 스스로 확신을 갖는 것은 다른 문제이다. 상황을 이해하고, 문제를 정의하고, 가설을 잡고, 관점을 구성하고, 어프로치를 설계하여, 그에 맞는 데이터를 수집하고 적절한 분석 기법을 활용하는 과정에서 끝나면 안 된다는 것이다. 설득을 염두하여 논거를 미리 기획하고, 상대방의 질문에 적절히 대응하는 훈련을 반드시 거쳐야 하는 것이다.

데이터 과학이라는 거대한 담론에 과연 이런 지극히 인간적인 작업이 중요할까 싶겠지만, 설득을 염두한 분석과 그렇지 않은 분석은 유효성에 큰 차이를 가져오게 된다. 어찌 보면 ‘분석은 설득이다.’라는 이 문장도 하나의 주장이므로 여러분의 의구심을 미리 예측하고 하나씩 논증해 보겠다.

Q1. 꼭 설득을 지향하지 않는 분석도 있지 않은가?

맞다. 데이터 분석의 종류를 대략 살펴보면 기술, 진단, 예측, 처방 그리고 인지 분석으로 나뉠 수 있다. 통상적으로 기술분석에서 인지분석으로 갈수록 분석의 성숙도가 높아진다고 한다.

기술분석은 무슨 일이 있어났는지를, 진단은 왜 일어났는지, 예측은 무슨 일이 일어날지를, 처방은 그래서 우리는 무엇을 해야 할지를 결론으로 한다. 그리고 종국적으로 다양한 소스와 분석 모델을 활용해 분석 대상에 특화된 해답을 구하기 위해 인지 분석으로 진화한다.

그래프

-기술분석(Descriptive Analytics) 작년 12월 대비 올해 12월에는 얼마나 많은 에어컨을 팔았을까?
-진단분석(Diagnostic Analytics) 작년 12월 대비 올해 12월에는 왜 에어컨 판매량이 감소했을까?
-예측분석(Predictive Analytics) 내년 12월에는 에어컨이 얼마나 판매될까?
-처방분석(Prescriptive Analytics) 내년 판매량 대비 얼마의 핵심 부품을 확보해둬야 할까?
-인지분석(Cognitive Analytics) 급격한 기후 변화에 따라 상품 기획 차원에서는 뭘 고민해야 할까?

이중 기술 분석은 누가 봐도 설명문으로 보인다. 반면, 진단, 예측, 처방, 인지분석은 솔루션을 추구한다는 차원에서 논설문으로 보일 테지만 실상은 그렇지 않다는 것이다. 일단, 정보의 양이 매우 증가한 사회에서는 ‘A는 B이다.’라는 단순한 기술조차도 하나의 주장이 된다. 즉, A를 B라고 말하거나, A 사건은 이런 특징이 있다고 말하는 것 자체가 주장에 가깝다는 것이다.

또한, 오십보백보 양보해서 순수한 설명문이라 한다 하더라도, 기술 분석이 다른 여타 분석의 기초가 된다는 것을 이해한다면 기술 분석은 논설문에 가깝게 된다. 예를 들어, ‘우리 고객의 구매 패턴은 크게 3 가지 종류가 있습니다 라는 분석 결과는 그 자체로만 보면 기술에 가깝지만, 다른 추론 모델의 기초가 된다는 차원에서 3개로 구분할지, 4개로 구분할지 그리고 그 각각을 어떻게 정의할지는 매우 중요한 논설문이 된다.

고객의 구매 패턴을 이용해 마케팅 자동화를 시도하는 경우 자동화 알고리즘 보다 사전적으로 고객 구매패턴을 어떻게 구분하고 있는지가 얼마나 더 중요할지를 생각한다면 더 쉽게 이해가 갈 것도 같다.

Q2. 모든 분석을 설득이라고 봐서 구체적으로 좋아지는 것이 무엇인가?

앞서 설명대로 모든 기술 분석은 다른 유형 모두의 근간이 된다. 그럼 다른 분석을 위해 좋은 재료가 된다는 차원보다 좀 더 근원적인 이유는 없을까? 물론 있다. 분석을 좀더 입체적으로 하게 된다는 것이다. 여기서 입체적으로 한다는 의미는 피상적이지 않고 좀더 깊은 논증을 스스로 시도하게끔 유도한다는 것이다.

모든 주장에는 듣는 이가 있다. 즉, 분석을 기획할 당시부터 상대방을 염두하고 분석하면 당연히 내 결론에 대한 상대방의 질문도 상상할 수 있다. 분석에 있어 상대방의 질문을 미리 상상한다는 습관의 중요성은 아무리 강조해도 부족함이 없을 정도다. 그렇다면 왜 질문에 대응하는 것이 중요할까? 그것은 분석의 궁극적인 특징인 ‘분석은 합의(合意)이다.’를 이해해야 한다. 즉, 모든 분석은 숫자를 다룬다고 해서 언뜻 수학과 비슷해 보이지만, 근본적인 속성은 매우 다르다.

어떤 값을 어떤 의미로 보고, 어떤 결론을 의사결정에 근거로 삼는 모든 과정은 고도의 합의 과정에 가깝다는 것이다. 그래서 오히려 언어영역에 가깝다고 보는 편이 낫다. 즉, 분석은 답을 주는 도구가 아니라, 우리 모두가 원자화된 사실(데이터)을 기초로 종합적인 결론을 내리는 고도의 지적 협업의 과정이라는 것을 이해한다면 ‘분석은 설득이다.’라는 명제를 자연스럽게 받아들이게 된다.

그럼 설득은 무엇일까? 매우 요약적으로 정의하면, 내 주장에 대한 듣는 이의 본능적 방어기제를 어루만져 주는 것이다. 그리고 그 방어기재는 질문의 형태로 표출될 수밖에 없기 때문에 질문을 해소시켜주는 것이 분석 과정에서도 매우 중요한 과정이 되는 것이다.

그런데 문제는 분석은 한번 발을 잘못들이면 쉽사리 그 구조를 쉽게 바꾸기 어렵기 때문에 분석을 기획할 때부터 상대방의 질문을 예상하고 논거의 구조를 설계하는 것이 필수가 되는 것이다. 즉, 설득은 특정 사실의 전달로 이뤄지는 것이 아니라, 상대방의 의구심을 두루두루 해소해주는 것이기 때문이다. 분석은 그 자체로 아름답지 않다. 설득의 도구가 되고 문제 해결의 단초가 되었을 때 그 소명을 다한다는 것을 이해할 때 아예 분석은 설득이라고 여기는 것이 분석의 완성도를 높이게 된다.

Q3. 상대방의 질문을 미리 예상하고 분석을 기획한다는 것이 ‘구체적으로’ 무엇인가?

이상의 모든 내용을 담아 예시로 이해해 보자. 만약 여러분이 낮은 출산률을 고민하는 공무원이라고 생각해보자. 개선을 위해서는 출산율에 영향을 미칠만한 요인을 찾아야 했고 당신이 주목하는 변수는 소득 수준이었다. 즉, 소득이 높아야 마음의 여유가 생기고 출산율이 높아질 것이라는 가설이다.

이를 증명하기 위해 당신은 다음과 같은 데이터 하나를 결론으로 삼았다. 2008년에서 2017년으로 갈수록 출산 중 상대적으로 부유한 사람들의 비중이 늘어나고 있다는 내용이다.

점유율

이 상태에서 이 분석은 더 나아질 수 있을까? 단순히 두 변수 사이의 관계에만 집중하는 사람이라면 유사한 분석과 증거는 얼마든지 더 많을 수 있다. 하지만, 이 분석으로 국민을 설득하고 정책을 수립하고, 예산을 집중하려는 사람 입장에서는 상황이 달라진다. 혹시 있을 수 있는 반론까지 고려해야 합의가 완성되기 때문이다. 그럼 어떤 반론을 예상해야 할까?

일단, 이런 상상은 어떨까? 소득이 원인인 것 맞지만, ‘주요한’ 이유는 아니지 아닐까요?라는 질문에 준비되어 있어야 한다.

출산연령

마치 위의 그림처럼 말이다. 이때 소득과 연령은 출산이라는 결과를 동시에 지향하는 경쟁 원인이 된다. 그러므로, 소득이 출산을 결정한다라는 주장을 하고 싶은 사람은 당연히 소득이 연령보다 더 중요한 이유라는 분석까지 해놔야 하는 것이다. ‘난 그저 소득과 출산의 관계를 밝히고 싶었을 뿐인데요?’라는 변명은 실제 의사결정 상황에서는 안 통한다. 분석은 설득의 재료가 되고 문제 해결문 단초일 때 더욱 의미가 있기 때문이다.

미연에 내 데이터 기반 주장의 사각지대를 이해하고 보강 논리를 잘 구축해 놓는 것이 그 역할을 강화한다는 것이다. 다시 말해, 사실 자체로 상대방이 설득된다라기 보다 사실에 대한 상대방의 의심이 해소될 때 설득이 완성된다는 것을 명심할 필요가 있다.

내 분석에 대한 질문을 사전적으로 예상하다 보면 극단적으로는 내 분석과 정반대되는 데이터가 존재할 확률까지 상상할 수 있게 된다. 가령, 소득이 높을수록 출산률이 (오히려) 낮아질수도 있다는 상상 말이다. 설마 그럴 경우가 있을까? 싶겠지만, 자신의 분석에 확신이 강할수록 본능적으로 이런 스스로 점검하는 과정은 습관이 되어야 한다.

출생아 수

예를 들면, 이런 데이터는 어떨까? 언뜻 보면 소득이 증가할수록 출생아 수도 증가하는 것처럼 보일 수 있지만, 7~10분위 구간에서는 소득이 증가할수록 오히려 출생아수가 감소하는 것을 여실히 확인할 수 있다. 분명 반대 요인이 존재하는 것이다. 이런 발견은 내 분석을 설득 관점에서 스스로 의심해보는 과정이 없으면 나오기 쉽지 않다. 분석가는 분석 과정에서 자신도 모르게 보고 싶은 증거만 찾아보는 습관이 있기 때문이다. 빅데이터의 시대일수록 내 주장이 맞다라고 말하는 데이터가 많은 동시에 틀렸다라고 말하는 데이터도 많다는 걸 반드시 염두해 둬야 한다. 어떤 분석값이나 모델을 도출했다고 바로 설득이 되는 게 아닌 이유이다. 늘 자신의 분석을 객관화하고 스스로 허점을 찾아보는 노력이 필요하다.

Q4. 그렇다면 어떻게 데이터 기반 설득력을 높일 수 있을까?

이상의 내용을 종합하면, 답은 간단하다. 많은 질문을 받아보는 것이다. 그러므로, 좋은 분석은 좋은 질문을 얼마나 많이 받았는가와 직결되어 있다. 그럼 좋은 질문은 어디에 있을까? 그것은 바로 동료에 있다. 동료는 나와 문제를 공유하고 있기 때문이다. 결국, 동료의 비판적 질문이 최고의 분석 기법이라고까지 말할 수 있다.

이런 분석 환경에서 동료의 질문의 중요성은 여러 상황에서 확인될 수 있다. 첫째는 글로벌 컨설팅 회사의 경우다. 경영 컨설턴트들은 대부분 ‘답 없는 문제’를 분석을 통해 해결하는 것에 익숙하다. 이런 고도의 지적 작업이 완성되기 위해서는 역시 동료의 질문이 매우 중요한다. 이를 ‘의무적 회의감’이라고 부른다. 회의감이란 상대방의 의견이 틀렸다고 생각하는 것인데, 의무적이란 말이 붙었기 때문에 ‘당신의 의견은 무조건 틀렸다.’라고 생각해주는 것이다. 만약 회의 시간에 어떤 분석가가 자신의 귀한 시간을 할애해서 당신에게 자신의 분석 내용을 설명했는데 당신이 아무런 말도 안 하고 있으면 당신은 저성과자가 된다는 말이다. 그만큼 동료의 비판의식을 역량평가 항목으로 설정할 만큼 소중한 자산으로 보고 있다.

둘째는 CIA(미 중앙정보국)의 레드팀(Red Team)의 경우를 들 수 있다. 레드팀은 일종의 ‘분석 전문 대항군’으로 분석을 기반으로 엄중한 작전을 수없이 진행하는 조직에 있어 필수 조직이다. 다른 팀의 분석을 전문적으로 비판만 하는 팀이기 때문이다. 이런 사례를 통해 우리가 엿볼 수 있는 시사점은 분석 중심 회사가 되느냐는 구성원의 역량의 문제가 아니라 문화의 문제라는 것이다. 좋은 분석가는 많다. 하지만, 좋은 분석 문화를 조직은 극히 드물다. 4차 산업혁명의 최대 적은 ‘권위주의’라는 말도 이런 맥락에서 충분히 이해될 수 있는 것이다.

많은 조직에서 디지털 환경을 구축한다는 것은 곳곳에서 데이터가 쌓인다는 것을 의미한다. 그런데 데이터의 잠재 능력을 최대한으로 끌어올리기 위해서는 ‘데이터를 기획하는 사람 = 쌓는 사람 = 분석하는 사람 = 분석 결과를 실행하는 사람’이면 일수록 좋다. 이는 데이터가 늘어나는 만큼 조직의 의사결정 기능이 현장으로 간다는 것을 의미하기도 한다.

조직 내 대부분의 사람들이 데이터 기반 생산성을 높인다는 것은 분석 결론으로 기계적인 수행을 하는 사람이 된다는 것이 아니라, 주장하고 변화의 주체가 된다는 것이 된다. 그렇기 때문에 분석을 하나의 정적인 논문으로 보기보다는 조직 내 불어닥치는 거대한 변화관리 차원에서 늘 살아 숨쉬는 ‘연속된 주장’이라고 봐야 한다. 왜냐하면 궁극(definitive)한 분석은 존재하지 않고, 좀 더 나은(Better)이 있을 뿐이기 때문이다. 이런 분석의 한시성(temporary)을 고려할 때 분석을 하나의 주장으로 여기고 검토하고 보살피고 키워나가는 시선이 필수이다. 그래야 분석 결과를 비판하는 힘, 실험하는 힘, 나아가 하나의 제품(Data Product)화 시키는 긴 여정을 갈수 있기 때문이다. 분석은 설득이다.