강양석 | Deep Skill 대표
EDU
‘데이터 분석 제목 달기’
심층 알아보기
데이터 분석 학습을 하는 사람에 비해 정작 실제 분석을 통해 의사결정을 하는 경험을 가진 사람은 많지 않은 것 같다. 이는 실컷 장을 본후 정작 요리를 하지 않는 것에 빗댈수 있다. 조직내에서 이런 현상이 지속되면 불필요한 데이터만 많이 쌓이고 데이터 분석에 대한 실효성에 시작도 전에 의심하는 문화가 생길수 있다. 그렇기 때문에 되든 안되든 실제 분석을 시도해보는 것은 중요하다.
한데, 데이터 분석을 정작 실시하려면 일종의 기획서가 필요하다. 분석 기획서가 그것이다. 얼핏 분석 기획서를 써보라 하면 많은 사람들이 3~4장되는 문서를 한바탕 써내곤 한다. 한데 이런 방식은 뭔가 비효율적이다. 문제는 이렇게 많은 양의 분석기획서를 작성하면서 ‘생각이 정리’되어야하는데 잘 들여다 보면 기획서 작성을 위한 작성이 되곤 한다는게 문제이다. 용어의 일관성, 문제의식의 뚜렷함, 해결 방안의 구체성이 결여된 채 뭔가 글은 많아지지만 더욱 모호해진 상태가 돼버리기 때문이다. 이를 방지하기 위해 내가 주로 사용하는 방식은 ‘제목 달기’이다. 즉,데이터 분석 기획의 제목만 달아보는 것이다. 저번 호에 이어 이 방법에 대해 좀더 구체적인 사례를 바탕으로 그 요령을 공유해보고자 한다. 대기업 임원부터 핵심인재까지 본 방법을 통해 압축적인 분석 기획의 효과를 맛보았다고 술회했기 때문이다.
지난 호에서 설명했듯이, 제목 달기를 위해 우리에게 필요한 개념은 딱 4가지이다. A : 데이터, B : 분석, C : 의사결정내용, D : 비즈니스 임팩트가 그것이다.
그러니 이를 한번에 읽으면 다음과 같이 데이터 분석기획 제목이 되는 것이다. ‘어떤 데이터를 어떤 분석하여, 어떤 의사결정을 함으로써, 어떤 가치를 만들어 낼것이다.’라고 말이다. 언뜻 보면 쉬워보이지만 생각보다 이 넷을 어울리게 작성하는 사람은 많지 않다. 왜 그렇다는 것인지 한번 사례들을 보면서 체험해 보자.
이 제목을 읽어보면 약간 혼란스러운 곳이 있다. 정확히 분석의 대상(objet)과 현상이 어떻게 구분되는지 분간이 안되기 때문이다. 이런 현상은 이런 실습을 해보면 왕왕 볼수 있다. 글을 길게 쓸때는 잘 드러나지 않지만, 글을 짧게 쓸 때 나타나는 묘미중에 하나이다. 자신이 어떤 대상의 어떤 현상을 어떤 쟁점으로 분석하고자 하는지가 ‘일단 글 자체의 모호함’ 때문에 잘 안보이는 것이다. 명확한 글쓰기가 중요한 이유는 생각이 정리되지 않은채 데이터에 손을 대는 것은 위험하기 때문이다. 왜냐하면 자칫 데이터가 생각을 끌고 가는 현상에 빠져 분석을 해도해도 갈피를 못잡는 경우가 발생할수도 있기 때문이다. 그래서, 자신이 생각이 정리되었는지 아닌지 또는 적어도 그 글을 다른 사람이 이해하는지 아닌지를 알기 위해서라도 글을 명확히 써보는 연습이 모든 이야기의 시작중에 시작이 된다.
이 제목달기는 어떤 점을 개선할 필요가 있을까? 언뜻 보면 글도 잘 이해가 가고 분석의 대상과 현상을 잘 구분한듯 보인다. 그럼에도 한가지 작지만 중요한 딴지 아닌 딴지를 걸자면 바로 D 부분의 ‘마케팅 방안 발굴’이라는 표현에 있다. A, B, C는 뭔가 섬세하게 잘 구성하였지만, 정작 D가 마케팅 방안 발굴이라 적히면 분석의 목적이 지나치게 광범위해 지는 것이다. 예를 들면, MAU 또는 DAU 증가와 같은 구체적인 목적을 필요로 한다는 것이다. 왜냐하면 고객을 어떤 특성에 따라 분류하는 것 그 자체(C부분)는 그 자체로 목적이 될 수 없기 때문이다. 실제로 분석을 해보면 뚜렷한 목적 하에서 기준이 생기고 그 기준이 분석 실무에 강하게 영향을 준다는 것을 알 수 있다. 그러므로 조직의 상위 직급자일수록 이 D부분을 명확하고 구체적으로 정해주는 것에 공을 들여야 한다. 마케팅 방안 발굴 그 자체는 너무 광범위한 분석 목적이다.
이 제목에서 가장 중요한 단어는 단연 ‘원인’이라는 단어이다. 원인을 밝힌다는 것은 흔히 말해 인과관계 분석을 한다는 것이다. 그런데, 인과관계는 여간해서는 과거 데이터 추이에서는 밝히기 어렵다. 상관관계는 경향을 다루고, 인과관계는 영향을 다루는데 그 영향력의 크기는 아이러니컬하게도 그 원인이 없었더라면 결과는 어느정도였을까?라는 모호한 질문에 답이 되어야 하기때문이다. 흔히 말해, 결혼이 행복에 얼마나 기여했을까의 영향력을 알기 위해서는 결혼을 안했더라면 행복감이 얼마일지를 알아야 결혼의 행복 기여를 정확히 알수 있다는 말이다. 그래서 이런 복잡한 관계의 비교 가능성을 확보하기 위해 과거 데이터 분석으로 쉽게 얻어지기가 어렵다.
이 기획은 이 둘을 구분하지 못한 표현이라고 볼수 있다. 다시 말해, 과거 고객의 이탈 원인 경향성이 반드시 이탈 방지책이 될 수는 없다는 것이다. 이럴 경우 그러면 어떻게 해야할까? 인과추론을 위한 분석 기획을 해야 맞을 것이다. 인과와 상관을 구분하는 것은 데이터 과학에서 굉장히 중요한 주제이다. 그러므로 이런 쟁점을 간단한 제목달기에서만이라도 느낄 수 있다는 것은 나름 의미가 크다 하겠다.
마지막으로 분석 기획 시 자주 드러나는 실수 유형이 분석의 결과와 결론이 연관이 없는 경우이다. 실은 분석 결과와 결론이 어떤 차이인지도 인지하지 못하는 경우도 많다. 분석 결과는 데이터 분석 내에서의 결과이고 이를 어떤 의사결정으로 끌어내느냐는 별개의 문제이다. 지금 이 생각 프레임워크를 중심으로 설명하면 B부분과 C부분이 엇박자가 나는 경우라고 하겠다. 이게 무슨 말인고 하니, 기존 제품의 데이터 분석으로는 새로운 추가 상품 니즈가 완성되지 않는다는 것을 의미한다. 그도 그럴 것이 어느 편의점에서 할인율에 따른 우유의 판매량 민감도 분석을 통해 초콜릿의 추가 판매 가능성을 알수는 없다는 뜻이다. 언뜻 들어도 쉽지 않아 보이는 이 분석 기획 사례가 은근히 많이 나오는 실수 중 하나가 되겠다. 물론 우유를 사는 고객과 초콜릿을 사는 고객이 실질적으로 동반 구매한다는 사전 분석이 있으면야 가능하겠지만 이 분석 기획 내용만으로는 해당 내용을 알수가 없기 때문에 보강이 필요하다는 것이다.
자, 정리해 보자. 데이터 분석을 기획하라하면 많은 사람들이 어떤 분석기법을 쓸까를 고민하는 흔적이 많다. 하지만, 분석 기법 보다 더 중요한 쟁점들이 기획단계에서 제법 많다. 앞서 살펴본 현상과 대상의 구분, 상관관계와 인과관계의 구별, 결과와 결론의 정렬, 목적의 모호함 등은 그 중 대표적인 사례만을 소개해 보았다. 이렇게 짧게 분석 기획을 하다보면 오히려 이런 더 근원적인 쟁점에 다가갈수 있다는 장점이 있다. 그러니, 너무 긴 기획서를 쓰려고 하기 보다 짧더라도 수미일관하고 뚜렷한 방향성이 있는 기획을 해보도록 노력해 보자.