[그건 정말 그 때문일까③] “우린 조사된 정보만 알 수 있다”


10
글자크기 설정
최대 작게
작게
보통
크게
최대 크게

저번 편(바로가기)에서는, 인과추론의 재료가 되는 관찰 대상의 대표성이 왜곡될 때 어떻게 선택 바이어스가 발생하고, 그로 인해 판단이 어긋날 수 있는지를 함께 살펴보았습니다.

이번 편에서는 정보 바이어스를 들여다보려 합니다. 

우리가 ‘실제’를 보고 있다고 믿는 그 정보 안에서 무엇이 빠져 있고, 무엇이 과장되어 있는지를 짚어봅시다.

*   *   *   *

갑상선암이 늘었다는 말, 한 번쯤 들어 보셨을 겁니다. 실제로 1990년대 후반부터 2010년대 초까지, 한국의 갑상선암 진단 건수는 15배 이상 증가했습니다. 하지만 이상하게도, 같은 기간 동안 사망률은 거의 변하지 않았습니다.

이 현상은 의료 기술의 발전, 특히 초음파 검사가 건강검진에 포함되면서 시작됐습니다. 예전 같으면 지나쳤을 작은 결절들까지 암으로 진단되기 시작한 것입니다. 암이 실제로 ‘더 많이 생긴 것’이 아니라, 더 많이 발견되기 시작한 것’이었습니다.

이런 현상을 우리는 정보 바이어스의 한 형태인 감시 바이어스(surveillance bias)로 설명합니다. 건강의 본질이 아니라, 건강을 바라보는 구조가 바뀌었기 때문에 생긴 변화였던 겁니다.

그렇다면, 이제 우리는 이런 질문을 던져야 합니다.

“우리가 알고 있는 정보는 실제를 말해주고 있는가?”

이러한 사고 과정을 반려동물, 가축, 야생동물의 현장의 예시를 통해서 알아보겠습니다. 말해진 정보가 어떻게 판단의 방향을 바꾸는지, 그리고 그 판단이 구조적으로 어긋날 수 있는 이유를 살펴보려 합니다.

    

여기에서, 많은 임상수의사분들께 익숙할 수 있는 한 장면을 예시로 들어보겠습니다. 진료실에서 보호자분들은 종종 이렇게 말씀하십니다.

“어제까지 밥 잘 먹었어요.”

이 말은 간단하지만, 진료의 흐름을 바꾸는 데 중요한 단서가 되기도 합니다. 그 한 문장만 듣는다면, 현재의 증상이 갑작스럽게 시작된 것처럼 받아들여지기 때문입니다.

하지만 진료를 이어가다 보면 며칠 전 사료를 바꾼 일, 간식을 많이 주셨던 날, 예방접종을 미루셨던 기억 등이 말씀에서는 빠져 있는 경우도 종종 있습니다. 이건 일부러 숨기려는 게 아닙니다. 단지, 말하지 않는 것이 더 자연스럽게 느껴지는 정보가 있을 뿐입니다.

또 어떤 경우엔 보호자분 스스로 이미 의심하고 있는 질병이 있다면, 그 병과 관련된 증상만 더 선명하게 기억나기도 합니다.

이렇게 특정 정보만 더 또렷하게 떠오르고, 관련이 없다고 느껴지는 정보는 흐려지거나 잊혀지는 현상을 우리는 회상 바이어스(recall bias)라고 부릅니다. 진단에 혼선을 주는 구조 중 하나입니다.

예를 하나 더 들어보겠습니다. 제때 먹여야 하는 약이 있었지만, 실제로는 며칠 빠뜨렸음에도 ‘잘 챙겨줬다’고 말씀하시는 경우도 있습니다. 이런 경우는 사회적으로 바람직한 보호자상에 맞추어 자신의 행동을 약간 수정해 전달하는 사회적 바람직성 바이어스(social desirability bias)의 한 모습입니다.

물론 고의는 아니지만, 그 작은 어긋남 하나로 인해 수의사 입장에서는 약효가 없거나 기대보다 떨어진다고 판단하게 되고, 다른 치료 경로를 고민하게 될 수도 있습니다.

말씀해주신 증상과 상황 하나하나는 모두 사실입니다. 하지만 그 사실들이 어떤 순서로, 어떤 강조로, 어떤 맥락에서 말해졌는지를 보지 않으면, 우리는 다른 실제를 상상하게 됩니다.

임상수의사 분들께서는 이미 직관적으로, 이런 상황을 정보 바이어스의 흐름으로 인식하고 진료에 반영하시고 있을 것이라 생각합니다.

   

이번에는 반려동물을 넘어, 가축 감염병 이야기를 해보겠습니다.

소 결핵은 임상 증상만으로는 진단하기 어렵고, 결핵 피부 반응 검사나 도축 후 병변 검사를 통해서만 확인됩니다. 그렇게 우리가 마주하는 정보는 늘 단 하나입니다.

“이 개체는 결핵 양성입니다.”

하지만 이 한 문장에는 그 개체가 언제 감염되었는지는 담겨 있지 않습니다. 몇 달 전 감염일 수도 있습니다. 감염의 시간 정보가 빠진 채, 우리는 ‘지금’이라는 진단 시점을 기준으로 조사와 판단을 시작하게 됩니다.

그러면 접촉 추적은 애매해지고, 감염의 경로를 따라가려는 노력의 결과도 흐릿해집니다. 역학 조사에서도 감염 시점과 감염 위치를 구분하지 못한 채 진단된 장소만 기록되고, 대응의 타이밍도 어긋나기 시작합니다.

정보는 틀리지 않았습니다. 양성이라는 결과도, 진단 시점도 모두 사실입니다. 하지만 그 정보는 시간이 잘려 나간 상태로 존재합니다. 그래서 우리는 결국 ‘진단된 날, 진단된 곳’에서 감염이 일어난 것처럼 판단하게 됩니다.

그러나 그 판단은, 감염의 실제 흐름이 아니라 진단 정보의 구조 위에서 만들어진 것이며, 결국 감염병 동역학을 이해하는 데 구조적 오류를 만들게 됩니다.

   

야생동물로 시선을 옮겨보겠습니다.

야생동물 분야에서 수집되는 정보는 대부분 폐사체, 분변, 간헐적인 관찰을 통해 들어옵니다. 그 중에서도 폐사체는 가장 자주 수거되는 정보의 형태이지만, 사실상 가장 많은 불확실성을 안고 있는 단서이기도 합니다. 폐사 시점을 정확히 알 수 없는 경우가 많기 때문입니다.

발견된 위치가 그늘이었는지, 햇볕이었는지, 습도는 어땠는지, 주변 곤충의 활동은 어땠는지에 따라 부패 속도는 전혀 다르게 진행됩니다. 같은 날 폐사한 개체라도 놓인 환경에 따라 며칠 차이가 나는 것처럼 보일 수 있습니다. 실제로 폐사한 날과 우리가 기록한 ‘발견일’ 사이에는 늘 시간의 간극이 존재합니다.

물론 예외적인 경우도 있습니다. 예를 들어, 교통사고로 폐사한 개체는 사람의 눈에 쉽게 띄기 때문에 상대적으로 빨리 수거되기도 합니다.

하지만 그와 같은 폐사체는 전체 야생동물 정보 중 극히 일부일 뿐입니다. 대부분의 폐사체는 며칠 혹은 몇 주가 지나서야 발견되며, 그 사이 정확한 시간 정보는 이미 사라지고 없습니다.

ASF(아프리카돼지열병)이나 HPAI(고병원성 조류인플루엔자) 같은 야생동물 질병 조사에서도 이러한 구조는 그대로 반복됩니다.

야생멧돼지 폐사체에서 ASF 양성이 검출되었을 때, 우리는 종종 “지금 이 지역에 바이러스가 퍼지고 있다”는 식의 판단을 하게 됩니다. 하지만, 그 폐사체가 언제 폐사했는지, 언제 감염되었는지, 그 전에는 어떤 경로를 거쳐 이동했는지, 이 모든 정보는 비어 있습니다. 결국 우리는 ‘지금 발견된’ 그 시점을 기준으로 ‘지금 여기서 위험이 진행 중’이라는 해석을 하게 됩니다.

하지만 실제로는, 그 정보는 이미 지나간 흔적일 수도 있고, 경로에서 벗어난 지 오래된 감염 잔존물일 수도 있습니다. 그럼에도 불구하고 ‘지금 여기’라는 느낌은 우리 판단을 흐리게 합니다.

HPAI의 경우엔, 공간적 불확실성까지 더해집니다. 철새의 분변에서 HPAI 바이러스가 검출되면 “이 지역에 유입됐다”, “여기가 위험하다”는 반응이 뒤따릅니다.

하지만 그 분변이 언제 배설된 것인지, 어떤 개체에게서 나온 것인지, 지금도 이 지역에 그 개체가 머물고 있는지는 알 수 없습니다. 철새는 수백 킬로미터 이상을 이동하고, 한 지역에 잠시 머물렀다가 떠나기도 합니다.

그러니까 그 분변은 이미 떠난 새의 흔적일 수도 있고, 이전에 머물렀던 감염 지역의 흔적이 여기까지 흘러들어온 것일 수도 있는 겁니다. 그런데도 우리는 ‘검출됐다’는 그 한 문장으로 ‘위험이 지금 여기 있다’는 판단을 하게 됩니다.

지금까지 이야기한 것처럼, 우리는 정보 자체를 의심할 필요는 없습니다. 다만 그 정보가 어떤 구조에서 만들어졌는가를 질문해야 합니다.

정보는 사실입니다. 하지만 어떤 정보든 누가, 언제, 어떻게 관찰했는지를 함께 보지 않으면 사실은 쉽게 실제처럼 보이게 되고, 우리는 그것을 근거로 판단을 내리게 됩니다.

*   *   *   *

지금까지 저희는 보호자의 기억, 농장 진단, 폐사체, 야생조류의 흔적 등 다양한 정보의 장면들을 살펴봤습니다. 하지만 이런 정보 바이어스는, 단순히 표본 수를 늘린다고 해서 사라지지 않습니다. 이건 1편에서 살펴봤듯, 애초에 관찰의 구조가 왜곡되어 있는 상태이기 때문입니다.

하지만 그 사실이 어떤 구조에서 수집되고, 구성되고, 전달되는지를 보지 않으면 우리는 너무 쉽게, 그 정보를 실제라고 믿게 됩니다. 그 믿음 위에서 진단도, 대응도, 판단도 세워지게 됩니다. 그래서 우리는 질문해야 합니다.

“조사한 정보를, 실제 사실로 믿을 수 있을까?”

이 질문은 정보를 의심하자는 뜻이 아닙니다. 그 정보가 어떤 구조 위에서 만들어졌는지를 함께 보자는 요청입니다. 사실을 더 정확하게 쓰기 위한 회의, 더 나은 결정을 위한 질문입니다. 정보 그 자체가 아니라, 정보가 만들어지는 구조에 대한 감각을 갖는 것. 그것이 우리가 방점을 찍어야 할 곳입니다.

이런 질문은 지적 유희로 흐를 수 있습니다. 남들이 보지 못한 구조를 발견하고, 그 안에서 오류를 짚어내는 경험은 작은 희열로 다가오기도 합니다. 하지만 바이어스의 이름을 알고, 그 개념을 이해하는 것으로 충분하다고 느끼는 순간, 목적을 잃게 됩니다.

바이어스를 인지하는 것의 목적은 ‘올바르게 판단하는 것’입니다. 그래서 우리는 스스로에게 조금 더 엄격해질 필요가 있습니다. 단순히 바이어스 이름만 나열하며 한계를 집어내는 부정적이고 파괴적인 회의주의가 아니라, 이를 통해 좀 더 나은 의사결정을 내리는 긍정적이고 건설적인 회의론자가 되어야 합니다.

이제까지 선택 바이어스와 정보 바이어스, 두 가지 구조를 함께 살펴보았습니다. 각각은 다른 방식으로 판단을 흔들지만, 실제 우리 삶에서는 자주 함께 작동합니다. 그렇다면, 이 두 가지를 함께 떠올리며 한 번쯤 일상 속 장면을 다시 살펴보는 건 어떨까요?

예를 들어, 이런 말 한 번쯤 들어보셨을 겁니다.

“어느 학과는 술을 정말 잘 마셔.”

이런 말들이 반복되다 보면 대한민국 모든 학과가 술을 잘 마시는 것처럼 느껴지기도 하고, 대학 진학률을 생각하면 ‘한국인은 술을 잘 마신다’는 말도 그럴듯하게 들릴 수 있습니다. 저 역시 수의학과가 술을 잘 마신다는 이야기를 참 많이 들었습니다.

그런데 재미있는 건, 경영학과도, 체육학과도, 연극영화과도, 공대도, 사회복지학과도 돌아보면 어느 학과나 그런 이야기를 누군가는 하고 있었습니다. 처음엔 그게 그냥 분위기를 띄우기 위한 말인 줄 알았습니다. 하지만 어느 순간부터 이런 생각이 들었습니다.

“왜 학과는 계속 바뀌는데, 결론은 항상 같을까?”

그냥 웃자고 하는 농담이지만, 가만히 들여다보면 의외로 그 안에는 우리가 어떻게 판단하고 기억을 구성하는지가 고스란히 들어 있습니다.

 그 자리에 나오는 사람들은 애초에 술을 어느 정도 마시는 분들이고, 마시지 않거나 아예 그런 자리에 오지 않는 사람들은 처음부터 관찰되지 않습니다. 즉, 선택 바이어스가 있습니다.

그리고 그 자리에서도 유독 잘 마신 사람만 기억에 남습니다. 즉, 정보 바이어스가 있습니다, 특히 리콜 바이어스죠. 이렇게 반복된 기억은 확인해본 적도 없는 결론을 낳습니다.

“그 학과는 원래 다 술 잘 마셔.”

그래서 마지막으로, 이 질문을 다시 우리 앞에 놓아두고 싶습니다. 우리가 조금 더 나은 결정을 하도록, 조금 더 오래 멈춰 서보도록 이끄는 질문.

일상 속에서, 진료실에서, 그리고 현장에서 조금 더 나은 의사결정을 위해 건설적이고, 긍정적인 회의론자가 되어보는 건 어떨까요?

[임준식 수의사의 그건 정말 그 때문일까] 다른 칼럼 보러 가기

[그건 정말 그 때문일까③] “우린 조사된 정보만 알 수 있다”

Loading...
파일 업로드 중 ...