안녕하세요. 서울대학교병원에서 데이터과학자·엔지니어로 일하고 있는 수의사 고진형입니다.
저는 지난해 7-8월 동안 MIT 의료공학 및 과학연구소(Institute of Medical Engineering and Science, IMES)에 방문연구원으로 다녀왔습니다. MIT 연구원 소속으로 하버드의대 의료진과 연구할 기회를 얻었으며, 현재도 공동연구를 계속하고 있습니다.
임상수의사로서는 흔치 않은 기회였던 만큼, 향후 수의학 데이터 사이언스의 발전과 후배 수의사 선생님들의 진로를 넓히는데 도움을 드리기 위해 저의 경험을 공유하고자 합니다.
* * * *
데이터 사이언스에 입문하게 된 계기
MIT는 의료 데이터과학자로서 간 것이기 때문에 우선 이에 대한 설명이 필요할 것 같다.
데이터 사이언스에 입문하기 전에 나는 이미 소프트웨어 개발자였다. 소프트웨어 개발에 입문하게 된 계기는, 예과 1학년 시절 들었던 ‘정보기술의 이해’라는 수업이었다. 프로그래밍과는 전혀 관련 없는 개론 수준의 수업이었지만 굉장한 흥미를 느꼈고, 그렇게 소프트웨어 개발을 시작하게 되었다.
예과 시절 동기들도 저마다의 적성을 찾아 여행을 다니며 세상에 대해 알아갔지만, 나는 이쪽 세상이 마음에 들었다. 흥미를 따라서, 웹개발의 하위 분야인 백엔드 개발 분야를 집중적으로 공부해 실력을 키워나갔다. 각종 개발대회에서 입상하고, 몇몇 스타트업과 제약회사에서 개발자로 일하기도 했다.
그러던 중 수의학과의 융합을 위해선 데이터 사이언스를 공부하는 것이 유리하리라 생각이 들었다. 그렇게 데이터 사이언스에 입문하게 되었다. 결과적으로 수의사 면허를 떼어놓고 보더라도, 소프트웨어 개발 경력이 있는 독특한 경력의 데이터 과학자가 되었다.
무작정 미국에 가기로 결정하다
작년은 수의영상의학과 석사과정 중이었다. 장기간 영상의학과의 치프를 맡으며 한동안 개발에는 손도 못대기도 했다.
우리 영상의학교실(지도교수 건국대 엄기동 교수)은 졸업을 앞둔 마지막 학기에는 논문에 집중하도록 배려해주어 진료의 비중을 줄이고 연구에 몰두할 수 있었다. 지도교수님께선 논문을 일찍 쓰게 되면 마지막 1개월가량의 시간을 자유롭게 쓸 수 있도록 배려를 해주셨는데, 이때 무엇을 할까 고민하다 예전부터 생각해오던 ‘실리콘밸리 탐방’을 가기로 했다.
개발자로 활동하며 우리나라에서도 정말 열심히 사는, 실력이 뛰어난 개발자들을 많이 보았다. 도대체 실리콘밸리 개발자는 얼마나 대단할까, 그들과의 차이점은 무엇일까 스스로 알아내고 싶었다.
그래서 무작정 6월말에 출발하는 샌프란시스코행 비행기편을 끊고 논문 작성에 매진했다. 이런 무계획적 미국탐방은 EO 스튜디오를 설립한 김태용 대표님의 이야기에서 영감을 많이 받았다.
MIT가 주최하는 대회에 참여를 결정하다
당시 나는 석사논문을 쓰면서 TEU MED라는 프로그램에 참여하고 있었다. 동그라미재단(안철수 출연)이 주최하는 이 프로그램은, 의공학 분야의 혁신가를 양성하기 위한 교육 프로그램으로, 의학·공학 분야의 다양한 전문가들이 선발되었다.
그 중 한 명이 전승호 개발자였는데, 당시 서울대학교병원에서 자연어처리를 담당하고 있었다. 나 또한 수의학에서 거대언어모델을 활용하는 방법에 대해 연구를 하고 있었기 때문에 이야기가 잘 통했다.
전승호 개발자는 ‘MIT와 서울대병원에서 주관하는 의료데이터 분석대회가 한국에서 열리니 같이 참가하자’고 제안했다. Korea Clinical Datathon 2024로, 국내외 전문가들이 참가하는 대회였다.
고민이 됐다. 당시 석사논문 작성과 TEU MED 프로그램으로 인해 거의 매일 같이 밤을 새고 있었고, 대회를 준비할 시간을 계산해보면 단 1주일밖에 주어지지 않았다. 심지어 1박 2일간의 밤샘 대회 일정 후 바로 다음 날이 미국으로의 출국날이었다. 체력적으로, 시간적으로 어려움이 예상됐다. 하지만 좋은 경험이 될 것 같아 참가를 결정했다.

전승호 개발자는 이미 실리콘밸리 기업에서 근무한 경험이 있는 유능한 개발자였다.
Korea Clinical Datathon 우승
TEU MED를 수료한 이후 일주일 동안 대회준비에 매진했다. Korea Clinical Datathon(KCD)에서는 마취과와 중환자의학과에서 다루는 vital sign과 관련된 데이터를 주로 다뤘다. 영상의학 전공인 내가 그동안 다루던 데이터와는 차이가 있었다. 따라서 해당 데이터셋 등을 분석하고, 대회 중에 사용될만한 개발 프레임워크 등을 미리 공부해갔다.
대회에는 국내외의 임상의, 개발자들을 비롯한 뛰어난 인재들이 많이 있었다. 의료데이터 연구는 의학, 공학을 아우르는 다양한 전문가들의 분석이 필수적이다. 이는 이번 대회에서 있었던 사례에서도 드러났다.
A병원의 vital, 혈액검사 데이터를 기반으로, 머신러닝을 통해 환자의 수술 후 사망률을 예측해보았다. 그랬더니 예측률이 형편없었다. 사망률에 영향을 미치는 인자 또한 경향성이 없었다. 그렇다면 이 인공지능 모델 설계가 잘못된 것일까?
물론 그런 것일 수도 있지만, 동일한 모델로 B병원의 환자 데이터를 분석했을 땐, 예측률도 높았고, 사망률을 예측하는데 사용한 지표 또한 기존의 중환자 분류체계와 부합하는 면이 많았다.
공학적으로 보면 이 인공지능 모델의 성능이 B병원에만 편향되었다 볼 수도 있지만, 사실 B병원 surgeon들의 수술 실력이 A병원보다 좋은 것일 수도 있다.
A병원에선 (surgeon들의 실력 문제로) 환자가 경향성 없이 사망했지만, B 병원에서는 vital이 원래부터 안 좋았던, 즉 사망할 가능성이 원래 높았던 환자들만 사망한 것일 수 있다. B병원이 수술을 잘하는 병원이란 해석도 가능한 셈이다.
이처럼 의료 데이터 사이언스는 같은 결과를 두고도 공학자와 각 분야의 전문가들의 끊임없는 의견 교환이 필요하다. 이번 대회에서도 국내외에서 모인 공학자, 의학자들간의 토의와 피드백이 밤새도록 이어졌다.
그 중에는 MIT와 하버드의대에서 교수를 하고 있는 Leo Anthony Celi 교수님도 있었고 나 또한 많은 의견을 교류하며 피드백과 도움을 받았다. 대회에서 사용 중이던 AI 통역기가 고장이 나는 바람에, 통역사 경력이 있던 내가 영어발표를 진행하고 간단한 통역을 맡기도 했다.
우리는 수술전 검사를 통해 수술후 사망률을 조기에 예측하는 모델을 개발하여 우승을 차지했다.
Leo A. Celi 교수님께, 내가 마침 미국에 갈 예정임을 설명하고, MIT에 방문해도 될지 여쭈었다. Celi 교수님께선 흔쾌히 허락하며, 본인이 있는 7-8월간 함께 연구를 하자고 제안해주셨다.
그렇게 우리 팀은 회식을 하고 나는 밀린 잠을 몰아서 잤다. 그리고 다음날 일어나서 3개월간의 미국행 짐을 1시간만에 싸고 샌프란시스코행 비행기에 올랐다.

Cambridge에 도착해서
미국행의 소기의 목적은 ‘실리콘밸리 기업과 개발자들은 무엇이 다른가?’를 탐구하는 것이었다. 우선 첫 1개월여 동안은 발품을 팔며 샌프란시스코, 시애틀, 뉴욕의 테크기업들을 방문했고 종사자들과 많은 이야기를 나누었다. 나름의 해답을 가진 채 MIT가 있는 Cambridge에 도착했다.
숙소는 MIT와 찰스강을 낀 건너편에 있는 Back Bay에 마련하였다. MIT가 위치한 Cambridge 지역은 MIT와 하버드 학생들로 밀집해있어 비쌌기 때문에 이곳에 숙소를 마련했는데, 오히려 좋은 선택이었다. Back Bay 지역은 앞으로 연구를 하게 될 MIT와 하버드 의대캠퍼스의 중간지점에 위치하기 때문이다.
MIT와 하버드 의대는 HST Program을 운영하고 있다. Harvard-MIT Health Sciences and Technology Program(HST)이라 불리는 이것은 두 대학간의 의생명공학 분야 협력체계이다. 의생명공학 분야에서는 두 대학이 거의 한 몸처럼 움직이고 있었다.
의료AI의 중요성이 커지다 보니 국내에도 이를 벤치마킹하여 2023년부터 아산병원 협력의대인 울산의대와 UNIST가 HST Program을 운영하고 있다.
Harvard-MIT HST는 1970년부터 시작되어 벌써 55년이나 되었고, 방문연구원으로 머무르는 동안 두 대학의 교류가 무수히 자유롭게 이루어지는 것을 보았다.
보스턴에 오기 전 록펠러대학에서 연구를 하고 있는 친한 형을 만나고 왔는데 여기서도 비슷한 사례를 보았다. 최근 뉴욕시가 Roosevelt island 라는 길다란 섬에 공과대학을 유치했고, 코넬대가 선정이 되어 입주하였다. 뉴욕시에는 코넬대, 록펠러대 병원을 비롯해 세계적인 병원, 연구소가 즐비한데 비해 공대는 그렇게 많지 않았다. 이번 유치·설립으로 인해 코넬대 공대는 이 병원들과 단 5분거리에 위치하게 되었다.
이런 모습을 보면 누구나 예상할 수 있듯 의학과 공학의 융합은 실제로 이루어지고 있었고, 미국은 이미 상당히 잘 해내고 있다는 생각이 들었다. 또한 이 모습이 우리나라의 수의학에서도 나아갈 방향이란 생각이 들었다.
당시 미국 공항은 MS Cloud 정전사태로 인해 비행기표가 취소되는 등 아수라장이었다. 때문에 나는 5시간이나 소모하며 뉴욕에서 보스턴으로 기차로 이동을 할 수 밖에 없었다. 그렇게 하루를 소모하고, 나머지 하루 동안은 MIT에 출근하기 전 필요한 논문들을 읽었다.

출근 전까진 논문을 읽느라 정작 가보지는 못했다.
누구를 가르치라고요?
사실 MIT에 연구를 하러 간다는 것은 긴장되는 일이었다. 뛰어난 엔지니어와 연구자들이 많을 텐데, 잘 해낼 수 있을까 생각이 들었다. 한국에서 수의사가 가는 게 아마 처음이었을 텐데, 우리나라와 후배들에게 누가 되고 싶진 않았다. 한편 ‘이곳에서도 성과를 보인다면, 앞으로 어디를 가든 잘할 수 있지 않을까?’ 하는 도전의식도 생겼다. 그래서 미국여행을 하는 동안에도 틈틈이 연구실에서 진행되는 연구를 따라잡고, 관련 기술을 공부해갔다.
MIT의 캠퍼스 자체는 공과대학위주이기 때문에 생각보다 작았다. 내가 가게 될 Institute of Medical Engineering and Science(IMES)은 Kendall Square 끝자락에 있었다. Computational physiology 연구실에 도착한 뒤, 동료 연구원들과 인사를 주고 받고 서로 무슨 연구를 하였는지 이야기를 하며 담소를 나누었다.
지도교수님인 Celi 교수님은 이제 막 출장에서 돌아온 터였다. Celi 교수님은 MIT와 더불어 하버드 의대에서도 교수를 역임하고 있었고, 이번에 하버드 보건대학원에서 수업을 하게 되었다고 했다. 수업명은 ‘BST 209 – Collaborative Data Science for Healthcare’로, 이제 막 의료AI 연구를 시작하려는 하버드의대 부속병원의 펠로우들을 대상으로, MIT 엔지니어들이 가서 교육을 하는 것이었다.
그런 것이 있구나 생각을 하며, 나는 2주 전에 전달받은, 내가 하게 될 연구에 대해 생각하고 있었다. 그러던 중 교수님께 뜻밖의 소식을 듣게 되었다.
“진형, 우리와 함께 이 수업에서 수업조교를 하며 그들의 멘토가 되어줘. 하버드 출입증도 지금쯤 나왔을 거야.”
‘… 누구를 가르치라고요?’
(2부에 계속됩니다)
