통계광장이광석 | 서울과학기술대학교 IT정책대학원 교수
통계광장
‘탈진실’과 가짜뉴스 시대,
통계의 사회적 역할
미디어가 내보내는 뉴스는 보통 사실들 가운데 가장 객관적인 지표가 되어야 하고, 사실과 진실에 다가가기 위한 중요한 판단 기준이어야 한다. 하지만 오늘날 이도 옛말이 됐다. 미디어들은 특종과 속보 과열 경쟁으로 사실 확인 없이 상호 베끼거나 정보의 출처마저 철저히 다루지 못하면서 잘못된 사실들을 전달하거나 오류로 가득 찬 뉴스를 생산하는 일이 비일비재 하다.
무엇보다 인터넷 환경이 열리고 어느 누구나 제 목소리를 낼 수 있는 뉴스 생산 문화가 되면서 영향력 있는 누리꾼들이 퍼 나르는 소문, 뒷담화, 가짜정보 등이 이들 대중매체와 뒤섞이고 뒤엉켜 더 큰 오류가 만들어지는 거짓 세계를 생성하고 있다. 게다가 특정의 알고리즘 학습 기제를 통해 인공지능이 뉴스를 자동 생산할 수 있게 되면서 ‘딥페이크(deepfake)’라 불리는 가짜 이미지와 영상 가공물이 범람하고 자동 생성되는 가짜뉴스 ‘봇(bot)’들이 활개 칠 공산이 더 커졌다.
가짜 뉴스가 범람하는 이유
각종 이미지, 정보, 영상 데이터에 의한 대중 왜곡이 범람하고 그러다 보니 이에 대응해 ‘팩트 체크’가 일상인 현실을 우린 살아가고 있다. 사회적 사건에 대한 노이즈(소음)의 왜곡 데이터들이 증가하면서 이를 설명하는 뉴스와 정보들은 주어진 사건과 역사에 대한 사실과 진실 값을 얻기 위한 콘텐츠로 기능하기 보다는 사실과 진실을 흐리는 사악한 ‘더미(허수)’로 기능한다. 이들 데이터의 자의적 왜곡이 문제인 것은 우리의 의식을 호도해 사실상 이전에는 크게 도전받지 않던 진실 값을 계속해 뒤흔들고 있기 때문이다. 가짜는 진실이 존재하고 진실이 밝혀지더라도 진실의 공신력에 위해를 입힌다. 그것이 가짜 기호로 무장한 오정보와 가짜뉴스들이 범람하는 이유이기도 하리라.
대중은 이들 과잉 정보와 가짜뉴스로 인해 피로감을 호소하게 되고, 진실에 대한 판단 자체를 대부분 유보하게 된다. 현실로부터 진실을 찾는 행위를 쉽게 포기하는 것이다. 오늘 ‘탈진실(post-truth)’의 목표는 바로 여기에 있다. 즉 탈진실을 옹호하는 이들은 우리 대부분이 현실로부터 기꺼이 행하는 진실 찾기 행위에 스스로 무기력하게 되고 포기 상태로 이르는 것을 진정 바란다.
탈진실의 효과
옥스퍼드 영어사전의 정의에 따르면, ‘탈진실’은 “여론을 형성할 때 객관적인 사실보다 개인적인 신념과 감정에 호소하는 것이 더 큰 영향력을 발휘하는 현상”을 뜻한다.1) 사실의 진위와 상관없이 진실을 무력하게 만들고 외려 특정 신념이나 감정이 영향력을 발휘하도록 한다는 것은, 무엇보다 대중 의식을 끌어들일 흡인력이 없으면 불가하다. 사실상 그 흡인력이란 것은 대중매체의 온갖 강렬한 자극의 ‘황색 저널리즘’에서 올 수도 있지만, 대개는 우리 주위 뉴스원의 권위에 대한 신뢰에서 유래한다.
국가 통치자의 트윗 메시지, 주류 대중 매체 언론보도, 메이저 포털 뉴스, 소셜미디어의 인플루엔서, 스타 유튜버 등이 가장 큰 대중 흡인력을 지닌 출처이자 권위의 근원이다. 아이러니하게도 이들은 권위의 출처이지만 탈진실의 탄생지이기도 하다.
먼저 탈진실의 출처는 변방의 누군가 이름 없는 이들의 거짓 소문들로부터 시작된다기보다는 이렇듯 말과 정보의 독점적 권위를 갖고 이를 확산할 메가폰을 쥔 이들에 의해 주조된다. 권위적 통치자의 입, 가짜 댓글 알바부대, 무분별한 언론 속보 과열 경쟁, 포털의 연예뉴스와 댓글, 글로벌 기업들의 후원 뉴스 등 사회 엘리트의 언설이 포스트진실의 중요한 근원이다. 이들은 기후위기를 부정하기 위해, 전쟁의 명분을 만들기 위해, 각종 사회 비리를 감추기 위해, 역사의 진실을 은폐하기 위해 가짜와 페이크 유사과학이나 사실들을 대거 유포한다.2) 그들의 목소리가 효과적인 이유는 이를 마치 ‘바이러스 전염(바이럴)’마냥 실어 나르는 대중의 빠른 전달력이다. 오늘날 ‘소셜’미디어의 가치는 인간관계의 재구성 가운데서도 특정 정보나 사실을 빠르게 전달해 거대한 정서적 교류를 이어나가는 능력에 있다. 탈진실 효과는 이렇게 소셜 테크놀로지를 통해 쉽게 번식하고 엘리트 권력의 여론 통제에 중요한 요소로 활용된다.
둘째, 가짜뉴스는 우리에게 ‘초현실(hyperreality)’ 효과를 더한다. 즉 “리얼리티에 더 가까이 다가간 것 같을수록 영상들은 그만큼 더 흐릿해지고 더 흔들린다.” 3) 사건들을 얘기하는 수많은 영상과 이미지 정보나 뉴스들은 마치 사태의 정확성을 얘기하는 듯 보이지만, 오히려 우리가 ‘진실의 색’을 읽을 수 있거나 판단할 수 있는 능력을 갉아먹는 효과를 낸다. 빅데이터 시대에 뉴스와 정보는 폭발 지경이지만, 반대로 인간의 판단 능력이 점점 더 약화되고 상황 파악이나 인식 능력이 점차 고갈되는 형국이다.
셋째, 이와 같은 초현실을 더욱 부채질하는 데는 기술적으로 ‘필터버블(filter bubble)’ 효과가 그 배경에 있다. 필터버블은 맞춤형 데이터에 익숙해져 그것의 과잉 정보 수취가 이루어지면서 각자가 편향된 정보 거품에 갇히게 되는 효과이다.4) 소셜미디어에서 특히 이런 현상이 강화된다. 내 주위의 ‘소셜’ 인적 네트워크에 연결된 이들이 비슷한 성향을 유지하면서 스스로 무오류성의 착시 감옥에 갇히고, 다른 판단 가능성을 배제하는 일이 흔해진다. 알고리즘의 현실은 이 필터버블 효과를 더 극대화한다. 개인이 지닌 성향에 따라 자동화된 맞춤형 예측 서비스를 제공하는 인공지능 알고리즘 기제는, 현대 인간이 소비하는 대부분의 데이터와 정보 콘텐츠를 개인 취향의 소소한 세계로 가둔다. 진실이 흐려짐과 동시에 거기에 도달하기 위한 정보의 도관(導管)도 얇아지고 납작해지는 형국이다.
마지막으로, ‘실재의 소멸’ 효과가 궁극적으로 발생한다. 탈진실, 초현실, 필터버블의 3중 효과는 모든 역사적, 인본적, 사회적인 가치들의 자명한 질서를 불완전하고 비결정적인 지위로 만들어버린다. 우리가 알고 지내던 분명한 듯 보이는 실재가 저 멀리 달아나는 것이다. 그러다 보니 오늘날 상징 권력은 특정의 가치와 담론을 자명한 질서로 내세워 억지로 강요하기보다는, 혼돈 속 여럿 가짜들을 기술적 알고리즘으로 자동 생성하거나 댓글알바를 고용해 만든 가짜 더미 속에 진실의 가치를 뒤섞는데 골몰한다. 이와 같은 거짓과 허구는 우리의 진실처럼 군림하지만 실제 어떠한 소통도 행하지 못하면서 계속해 우리가 시도하려는 현실의 비판적 인식을 방해한다.
탈진실의 가짜뉴스 시대에는 어찌 보면 오정보와 노이즈(소음)를 대거 발산하는 쪽에 승산이 있다. 이를테면 누군가에 대한 흑색선전이 법리적으로 ‘근거 없다’는 법적 판단에도 불구하고 계속해서 비상식적으로 비방과 악플이 계속해 진행되는 것은 이와 같은 연유에서다. 결국 데이터 과잉과 오정보의 질서는 특정의 사안에 대한 진실이 저 멀리 사라지고 수많은 다른 가짜 해석들에 대중들을 노출시키면서, 어떤 사안에 대해 우리 스스로 사색하는 것을 불안정하고 어렵게 만드는 데 그 목적을 지닌다.
가짜뉴스는 여론과 정서의 조정과 변조 방식에 큰 관심
데이터과잉과 가짜뉴스가 대중의 진실에 대한 판단을 포기하게끔 하면서 결국 엘리트 권력은 우리 마음속 깊숙이 가라앉은 욕망, 정서, 선호, 취향 흐름의 조절과 통제에 직접 개입하고자 한다. 정보 과잉의 질서 속에서 이성적 판단이 어려워지면, 그다음 대중이 판단할 수 있는 선택지는 본능과 직관일 수밖에 없다. 합리적이고 비판적 추론에 따른 진실 찾기 과정이 점차 힘들어지면서, 진실의 지위는 흐릿해지고 대중은 진실이나 사실보다는 직관과 감성적 판단에 친숙해진다.
인터넷에서 수없이 흐르는 감정과 정서의 흐름과 패턴들에 관심을 지닌 오늘날 엘리트 권력은, 대중 여론 이전의 여론, 즉 입소문과 비공식적 ‘뒷담화’를 집요하게 관리하는 수준에 이르렀다. 동시대 권력은 대중 정서의 흐름을 이러저러하게 너울거리게 하고 여론과 정서의 물꼬를 바꾸는 조정과 ‘변조’(modulation) 방식에 큰 관심을 보인다. 가짜와 탈진실 정보의 범람과 이의 특정한 변조는 대중 정서적 차원에서 또 다르게 엘리트 권력이 미치는 범위를 넓히는 새로운 기법이 되어가고 있는 것이다. 오늘날 인공지능과 결합된 알고리즘 기계 장치는 순수한 데이터공학의 오류 없는 숫자의 세계인양 포장하면서도, 동시에 수많은 가짜와 거짓 정보들을 퍼뜨리며 판독 불가능한 현실 질서를 공고히 한다.
최근 인공지능 기술은 거짓과 탈진실을 방조하거나 이를 강화하는 동영상 기법에 응용되면서, 가짜 이미지와 동영상 제조에 줄곧 쓰이고 있다. 가령, ‘딥 페이크’(deep fakes)와 ‘싸구려 페이크’(cheap fakes)가 무한 확대되는 현실을 보라. 싸구려 페이크는 말 그대로 포토샵 작업 등으로 실제가 아니라는 느낌이 남아있는 아마추어 이미지나 영상이라면, 딥 페이크는 인공지능의 딥러닝 기술을 활용해 실제 사람 얼굴의 일부를 변형하거나 합성해 만들어 가짜와 실제의 경계가 거의 사라진 경우다. 딥 페이크는 ‘진실보다 더 진실한’ 거짓 혹은 가짜의 고해상도 이미지나 영상인 경우가 흔하다. ‘펙트 체크’를 통한 가짜들의 공식 판별 방식은, 아직까진 인공지능 봇들에 의한 가짜 이미지와 영상의 자동 생성에 비하면 진실게임 싸움에서 양적으로 밀리고 질적 판단 능력에서 소박하기 그지없다.
또 다른 가짜뉴스의 문제는 사회적 소수에 집중
‘증거의 정치학(the politics of evidence)’적 견지에서 봐도, 정교한 페이크 상징들은 점점 더 사회에서 일반적으로 수용되던 사실 ‘증거’ 능력을 소멸시키는 대신 불확실한 현실을 주조하는 측면이 크다.5) 자칭 진짜라 주장하는 딥 페이크들로 인해 현실은 점점 불투명해지고 생성되는 이들 가짜정보 양의 방대함으로 인해 참고할 진실의 정황은 점점 희박해간다. ‘탈진실’의 또 다른 문제는 이 정교한 거짓 조작과 혐오 대상들이 주로 여성, 인종소수자, 난민 등 사회적 소수에 집중된다는 데 있다. 가짜에 휘둘리는 표적들이면서 가짜들이 노리는 주된 제물들이 바로 현실 속 힘없는 이들이란 점을 기억해야 한다.
아이러니하게도 이 모든 가짜와 탈진실의 질서를 작동시키는 수면 아래에는 첨단의 기술네트워크와 인공지능 알고리즘을 기반으로 해 현실의 모든 것을 예측하려는 인공지능과 데이터과학의 최첨단 과학의 세계가 있다. 대중 의식은 스펙터클과 혼돈의 탈진실로 향하는 반면, 정보 권력의 최첨단 세계는 빅데이터 분석을 통해 과학적 투명성을 추구한다. 가짜뉴스에 의해 크게 영향받는 대중의 불투명한 현실 세계와 달리, 반대로 엘리트 통치 영역은 그들을 비추는 투명한 세계에 기초한다.
언제 어디서든 개별 시민들의 신원을 투명하게 확인하고픈 권력 욕망은 오늘날 안면인식 기술과 생체 기술이나 개인 신체 프로파일링의 극한 수집 도구를 창안해낸다. 지문, 홍채, 생체 안면 인식, 신체 동작, 신체 이식 칩의 알고리즘 자동화는 불투명한 현실로부터 정보 권력의 자리를 굳건히 보장받고 사물의 질서를 보다 예측 가능하게 하는 일이기도 하다. 탈진실 시대야말로 정교한 신체 데이터 프로파일링 관리를 통해 통치 권력을 유지하려는 욕구가 더 크게 작동한다. 우리가 대체로 사건과 진실의 올바른 이면을 보지 못하는 불투명한 상태에 놓인다면, 반대로 엘리트 계급은 우리 각각을 투명하게 비추는 스크린을 원한다. 가령, 이를 위해 중국은 14억에 육박하는 국민 모두를 관리하기 위해 ’사회신용체제’(social credit system)를 도입하고 그들의 개인차를 안면인식으로 확인하고 24시간 관리하는 빅브라더 구상을 진행하려 한다. 결국 가짜와 거짓 뉴스로 인해 대중의 진실 이해력은 퇴화하지만 반대로 권력이 우릴 비추는 능력은 계속해 확장된다. 오늘날 자본주의의 탈진실은 결국 서로 상반된 듯 보이는, 진실의 불투명성 대 개별 신체의 투명성이란 쌍두마차에 의해 유지된다.
가짜뉴스 시대 점점 중요해 지는 통계의 사회적 역할
최근 비정규직 노동 인구 실태 파악과 관련한 통계 자료가 공개됐다. 이로부터 이제까지 수면 위에 잡히지 않던 비정규직 노동자 숫자가 크게 늘었다. 몇 가지 관련 통계 질문들이 추가되면서 통계치에 잡히지 않았던 노동 인구가 더 추가된 것이다. 물론 결과적으로 잘 된 일이다. 왜냐면 부정확한 통계값을 바로잡아줌으로써 실제 비정규직 노동자 숫자를 명확하게 시민에게 알리게 됐기 때문이다. 물론 이는 고용 상황에 민감한 정부의 고용 성과 홍보에 상당히 불리하게 작용할 수도 있다. 하지만, 여러 우려에도 불구하고 우리가 잘못 알고 있는 현실의 교정과 진실에 좀 더 다가갈 수 있도록 통계 오류를 바로잡았다는 점에서 충분히 긍정적 의의를 지닌다.
전통적으로 통계에서 제시되는 숫자는 특정 편견의 개입과 데이터 왜곡이 일어날 수 있는 영역으로 고려해 다들 의심을 거두지 않았다. 반면, 이번 노동 통계 사례는 가짜 뉴스가 범람하고 진실과 가짜를 구분하기 어려운 시대에서 통계값이 지닐 수 있는 사실에 다가갈 수 있는 힘 또한 증거하는 경우로 볼 수 있다. 즉 갈수록 사회에 점점 널리 퍼지는 편견과 오류를 제거하고 사안의 객관적 정황 증거를 제시하는 출구로서 통계의 사회적 역할을 확인할 수 있었다. 더군다나 이번 통계치로 인해 한 사회 비정규직 노동자들의 보다 정확한 실태와 그 지형을 확실히 인식할 수 있게 됐다는 점에서 향후 통계의 사회적 역할이 보다 선명해졌다고도 볼 수 있다. 예컨대 사회적으로 잘 파악되지 않는 약자들의 그림자 노동과 복잡한 고용 계약으로 인해 그 숫자가 제대로 잡히지 않거나 분류가 잘못된 노동층에 대한 오류을 걷어내는 작업에 통계의 역할을 찾을 수 있는 것이다. 다시 말해, 거짓과 혐오가 일상이 되더라도 그 반대편에서 사회적 약자와 타자가 놓인 비가시적 영역들을 지속적으로 찾아 드러내는 보편 통계 과학적 접근이 강조된다.
궁극적으로 시민의 데이터 리터러시 능력의 향상 필요
수없이 증가하는 가짜들 앞에서 이를 판별해내는 팩트 체크 전문 언론기관이나 통계 과학의 검증 역할은 점점 중요해진다. 하지만 하루에도 수없이 발생하는 가짜 데이터의 공습을 막기에 이들 기관의 대응은 현실적으로 수적 한계에 봉착할 수밖에 없다. 궁극적으로 시민의 ‘데이터 리터러시(문식력)’의 향상 없이는 향후 대중의 현실 판단력이 흐려질 확률이 높다. 시민들 자신이 오늘날 복잡한 가짜의 바다들로 인해 파생되는 심층의 관계들을 파악할 수 있는 최소한의 지식이나 통제력 혹은 비판적 판단 능력을 배양하도록 해야 한다. 예를 들어 기존의 규격화된 문화와 데이터 소비를 벗어나서 데이터와 숫자에 대한 비판적 인식과 시민 자신의 지혜를 확장할 수 있는 데이터 리터러시 교육 논의가 사회적으로 본격화되어야 한다. 가짜와 탈진실에 대적할 ‘데이터 시민권’적 사회 설계 논의 또한 필요하다. 그럴 때만이 온갖 가짜뉴스와 오정보의 늪에서 허우적거리는 우리 자신을 구할 수 있다.