강양석 | Deep Skill 대표
FOCUS
분석은 질문이다 ··· 챗GPT에게 묻다
챗GPT로 인해 우리는 특이점(과학 기술의 항구한 가속적 발전으로 인해 인류 역사에 필연적으로 발생할 가능성이 높은 획기적인 변곡점)을 경험하고 있다. 이 인공지능을 경험한 모든 사람은 하나같이 ‘세상이 정말 빨리 변하고 있어서 정신이 없어요.’라는 말을 하고 있으니 말이다. 더한 혁신은 계속해서 나오고 있지만, 분명 그 경험의 강도는 스마트 폰이 처음 생겼을때의 충격을 가볍게 넘어서고 있는듯 하다.
잘 알겠지만, 챗GPT는 언어를 학습한 언어 인공지능이다. 들리는 소식에 의하면 가장 많이 학습한 언어는 영어, 그 다음으로는 (추정컨데) 파이썬이라고 한다. 파이썬? 아마 많이 들어봤을 단어이다. 이는 데이터 분석 도구임과 동시에 컴퓨터 언어이기도 한 것이다. 그렇다면 챗GPT는 단순히 채팅 인공지능임을 넘어 분석 도구로써의 성능 또한 뛰어날 것이라는 예상을 해볼 수 있는데, 아니나 다를까 매우 그렇다. 그래서, 챗GPT와 몇몇 분석을 해가며 과연 우리는 어떤 데이터 역량에 집중해야 하는지를 정리해 보았다.
사례1. 챗GPT는 얼마나 통찰적인 데이터 해석을 할 수 있는가?
첫 번째로 얼마나 통찰적인 데이터 해석을 할 수 있을지를 물어봤다. 다음의 데이터를 주며 ‘국내 테마파크 산업의 특징은 무엇인가요?’라고 물어보며 말이다. 그리고 아래와 같은 답을 얻을 수 있었다.
나는 똑같은 질문을 약 3만여명의 사람들에게 물어본 경험이 있는데, 매우 흥미로운 점은 사람의 답변과 챗GPT의 답변이 거의 유사하다는 것이다. 당연히 사람의 말과 글을 학습한 인공지능이기때문에 이렇게 답하는 것이 당연할지 모르겠지만, 문제는 지금부터 발생한다. 그럼 우리 인간은 어떤 데이터 학습을 해야 할 것인가 말이다. 즉, 데이터에 버젓이 드러난 사실을 캐내는 방식의 해석 능력은 이제 안타깝게도 기계에 그 자리를 내줘야 한다는 것을 의미한다. 즉, 우리의 데이터 학습의 방향은 ‘챗GPT가 할 수 있는 것과, 챗GPT가 할 수 없는 것을 구분’하는 데에서부터 시작된다.
그럼, 챗GPT가 할 수 없는 해석이란 어떤 것일까? 예를 들면 이런 답변 말이다. ‘어? 2007년 롯데월드의 입장객 추이가 심각하게 하락했지만, 에버랜드가 전혀 미동도 하지 않네요? 아마 둘이 서로 경쟁관계가 아닌가봐요?’라는 이런 통찰 말이다. 기계는 의심을 하지 않지만, 사람은 한다. 다만, 이런 의심이 ‘사실인 것도 아니고, 사실이 아닌 것도 아닌 중간 지점’에 걸쳐 있지만 우린 이런 모호한 상태의 의심과 호기심을 두껍게 가지고 있어야 한다. 그래야만, 같은 데이터를 보고 더 많은 사실과 통찰에 접근할 수 있기 때문이다. 그리고, 이렇게 데이터를 보고 단순히 숫자를 획득하는 것이 아니라, 더 많은 의심과 추론으로 더 넓은 사실성의 세계로 스스로를 안내하는 해석 습관은 절대 기계에 대체되지 않는다. 이제 기계와 동급이거나 대체될 만한 역량에 크게 힘을 기울일 필요가 없다는 것이다.
사례2. 챗GPT로 분석할 때 정말 중요한 능력은 무엇일까?
이번에는 챗GPT와 좀 더 고급진 분석을 시도해 보았다. 분석데이터의 생성, 분석, 그리고 의미 해석까지 전 과정을 함께 했으니 말이다. 단순히 코드를 간결하게 압축한더던지, 새로운 코드를 짜주는 선을 넘어 함께 띵킹파트너(thinkingpartner : 생각동무)의 역할을 어느정도까지 해주는지가 알고 싶었다. 그 첫번째로, 간단한 회귀 분석을 위한 데이터 생성을 시도하였다. 다행히도 질문자의 의도를 정확히 알아듣고 원천 데이터를 스스로 생성하는 모습을 볼 수 있었다. 매우 놀라운 일이다. 이런 방식대로라면 어떠한 요건을 주어주고 그 요건에 맞는 훈련 데이터를 얼마든지 스스로 챗GPT가 생성할 수 있다는 것을 의미하므로, 우리가 간단한 분석 기법을 연습할 때는 챗GPT의 생태계 내에서 기승전결을 모두 해결할 수 있다는 것을 의미한다.
섬세하게 자신이 생성한 원천데이터의 요약까지 해주는 모습을 볼 수 있다.
여기서 본격적인 분석 질문을 하게 된다. 비록 예시에서는 독립변수와 종속변수라는 다소 전문적인 용어를 사용했지만, 다른 경험들에 비춰 봤을 때 이런 전문 용어를 쓰지 않아도 챗GPT가 충분히 분석의 구조를 이해할 수 있다는걸 확인 할수 있다. 이때, 매우 흥미로운 점은 챗GPT가 질문자의 질문을 수정하려고 한다는 점이다. 즉, 나는 선형 회귀모델을 주문했으나, 챗GPT가 스스로 판단하여 로지스틱 회귀 분석을 추천하고 그 이유를 친절하게 설명하는 모습을 볼수 있다. 이 과정이 현장에서 데이터 분석을 실시하는 사람들의 입장에서 보면 다소 충격으로 다가올수 있다. 왜냐하면 데이터 분석을 할 때 사람들이 초창기에 가장 힘들어 하는 부분이 ‘기법의 선택’이기 때문이다. 그런데 그 심리적 저항감이 한번에 해소되는 것을 의미하기 때문이다.
결국, 챗GPT는 자신이 추천한 분석 기법을 기반으로 명확한 분석 요약을 하며 이 대화는 끝나게 되었다.
인공지능시대 생각하는 힘, 질문하는 힘에 집중
자, 이런 일련의 과정을 보며 우린 어떤 감정을 추스려야 할까? 그것은 이제 ‘모두의 분석’의 시대가 한층 가까워져 왔다는 것을 의미한다. 분석을 하기 위해서는 크게 2가지 역량이 필요하다고들 한다. 하나는 소프트 스킬(생각하는 힘)과 하드스킬(기법/도구를 다루는 힘)이 그것이다. 사실 우린 기존의 대부분의 학습을 영어든, 수학이든, 데이터 과학이든 하드스킬 중심으로 해왔던 게 사실이다. 그리고 하드스킬에 능통한 사람이 더 권위자인 것으로 인정받아왔던 것이 사실이다. 그런데, 챗GPT의 등장은 과감히 ‘생각하는 힘, 질문하는 힘’에 집중해라고 우리에게 말하고 있다. 간단한, 대화형 명령을 통해 높은 수준의 분석 및 가공을 수월하게 해내기 때문이다. 하지만 단순히 편해졌네?에 그치면 안될 것이다. 챗GPT가 하지 못하는 영역에 집중하는 것이 우리의 시작이 되기 때문이다. 첫번째와 두번째 간단한 챗GPT 기반 데이터 이해 및 가공 사례를 통해 보면 이제 우리에게 필요한 역량은 ‘어떤 질문을 할 것인가?’로 귀결된다. 예를 들면, 첫번째 케이스에서 통찰적인 의심을 해야, ‘혹시 2007년에 롯데월드에 무슨 일이 있었니?’라는 새로운 사실로 확장이 가능하고, 두번째 케이스에서 ‘인사팀에서 이런 분석 기법으로 주로 다루는 주제가 무엇인지 알려줄래?’와 같은 적극적인 학습이 가능해질 테니 말이다.
데이터가 많아질수록 인간은 판단하기 힘들어 한다. 이 아이러니를 잘 극복하기 위해서는 점점 인공지능에 자신의 판단을 맡기는 현상은 가속화 될 것 같다. 여기서 경계해야 하는 점은 바로 ‘판단의 양극화’이다. 누군가는 챗GPT를 넘어서 무궁한 의심으로 그야말로 기계를 기계답게 부릴 것이고, 누군가는 심각한 의존 상황에 빠져 이치를 스스로 따지는 힘을 급속도로 잃어 갈 것이다. 그리고 이런 판단력의 양극화는 부와 지식의 양극화보다 훨씬 해소하기 어려운 심각한 사회적 문제가 될 것 같다. 챗GPT가 맹위를 떨치는 2023년 그 성능에 놀란 마음을 잠시 접어두고 과연 이 기술이 나를 어디로 데려갈지 곰곰히 생각해 봐야 할 것이다. 분석은 가공이 아니라 질문하는 힘이란 것을 이해할 때 그 생각의 끝이 조금 보일 것이다. 데이터와 데이터를 잘 병합해서 새로운 데이터를 만드는 사람보다, 데이터를 보고 새로운 의심과 이치를 따질 줄 아는 사람이 더 크게 드러나는 시대가 왔기 때문이다. (문의 이메일 : stephen.kang@deepskill.io)