[인터뷰] 수의과대학으로 온 데이터 과학자, 이영희 서울대 교수

등록 : 2022.05.26 08:25:13   수정 : 2022.05.25 15:32:20 윤상준 기자 ysj@dailyvet.co.kr

올해 서울대 수의대에는 ‘동물정보관리학’이라는 다소 생소한 이름의 과목이 생겼습니다.

4차산업혁명, 빅데이터, 인공지능이라는 말을 흔하게 접하는 오늘날, 데이터를 만들고 해석하는 데이터 리터러시(data literacy)는 수의사가 갖춰야 할 중요한 역량으로 꼽히는데요,

국내 1세대 생물정보학자로서 미국 의대에서 생명의료정보학의 융합적 연구와 교육을 모색하다 서울대 수의대에 합류한 이영희 교수를 데일리벳이 만났습니다.

이영희 서울대 교수

Q. 늦었지만 임용을 축하드린다. 간단한 자기소개를 부탁한다.

건국대학교를 졸업한 후 생물정보학을 처음 시작한 것은 1999년이다. 당시 국립보건원에서 처음으로 생물정보학 인력을 키워내는 1년 집중교육 인턴십 프로그램을 마련했다. 해당 프로그램에 참여하면서 생물정보학을 접했다. 초등학교 시절 최초의 애플 개인용 컴퓨터(8bit)에서 단순 연산프로그래밍을 경험해보긴 했지만, 본 교육프로그램에서 본격적으로 코딩을 배우기 시작했다.

이후 이화여대에서 전사체 데이터를 이용한 인간 유전체 분석 분야로 박사학위를 받고 곧장 미국에 건너갔다. 시카고대학 의과대학에서 박사후연구원을 거쳐 연구교수에 임용됐다. 운 좋게도 미국 국립보건원(NIH)에서 연구과제 연구비를 받아 독자적으로 전사체 기반 유전변이 연구를 진행했다. 나아가 의료정보와 통합하는 방법을 개발하는 연구도 수행해왔다.

이후 2015년부터 유타대학교 생명의료정보학과에서 조교수로 재직하다 올해 3월 서울대 수의대에 합류했다.

 

Q.  미국에서 계속 활동할 수 있었을텐데 한국에, 그것도 의대가 아닌 수의대에 온 이유가 있나

그 동안에도 생물정보학을 기초로 의료 분야에서의 응용을 고민해왔다. 중개의학 쪽으로 암과 알츠하이머 환자에서 유래된 오믹스 데이터 분석을 기반한 임상학적 연구를 확장하다가 서울대 수의대에서 동물정보관리학 공고를 접했다. 제가 기여할 부분이 있다고 생각했다.

의과대학에서는 의과대학생을 위한 데이터 사이언스 분야 교육이 제공되고 지속적으로 개발되고 있다. 빅데이터 기반 연구도 활발히 진행되고 있다. 특히, 현직 임상의사들뿐만 아니라 의과대학생들도 의료빅데이터 분석에 관심이 많다.

무엇보다도, 의사 출신의 성공한 벤처기업가도 많고, 큰 병원에는 데이터 중심 센터들이 속속 설립되고 있다. 데이터를 활용해 연구도 하고 기업활동도 한다.

당연히 수의과대학도 이러한 방향으로 갈 것이다. 최근 수의과학 분야에서도 데이터 기반 인력 양성의 필요성을 인식하고 관련 연구 인프라 구축이 요구되어져 왔다.

생물정보학과 의료정보학을 연구했던 경험을 살려 연구와 인력양성에 힘을 보태려 한다.

 

Q. 사실 국내 수의과대학에서는 없던 과목이다. 기존 수의사들은 동물의료의 데이터 관련 학문에 생소할 수밖에 없는데

공식명칭은 동물정보관리학이다. 생물정보학에서부터 의료정보학을 아우르는 분야라고 생각한다.

생물정보학(bioinformatics)은 유전자부터 단백질까지 세포로부터 유래된 여러 데이터를 분석해 생명 현상을 이해하는 학문이다.

컴퓨터 공학이나 수학, 통계학을 활용해 유전체, 전사체, 단백질 펩타이드 서열을 분석하는 알고리즘을 개발하거나, 이러한 대량의 데이터를 분석하여 사람 질병의 원인을 규명하고 치료제를 개발하는 주요 학문으로 자리잡았다.

반면 의료정보학(medical informatics)이라고 하면 병원이 떠올릴 수 있다. 병원의 전자의무기록에서부터, 환자의 검사기록이나 영상의학자료, 더 나아가 치료, 처방, 보험정보 등의 데이터를 포괄적으로 다루는 학문분야이다.

사실 요즘은 이 둘의 경계가 확실히 구분되지 않는다. 의료정보학에서 여러 환자의 데이터를 다루다 보면, 차트에 기록한 히스토리뿐만 아니라 환자의 유전자 정보까지 포함하게 된다.

미국에서도 오바마 전 대통령이 정밀의학 이니셔티브(PMI, Precision Medicine Initiative)을 도입하면서 융합이 본격화됐다. 개별 환자의 유전체 정보와 의료정보를 함께 분석해 개인 맞춤형 치료를 제공하는 생명의료 빅데이터기반 미래 의료를 주창한 것이다.

이러한 빅데이터 기반의 질병 예측 방법 고도화 및 개인 맞춤형 치료제 개발이 본격적으로 진행되면서, 저도 생물정보학자로서 유전체 데이터를 임상현장에서 만들어진 의료데이터와 함께 통합 분석하는 연구로 확장하고 있다.

가령 같은 장기의 암환자라고 해도 세부유형이 다 다르다. 같은 약이라도 어떤 환자에서는 잘 듣고, 어떤 환자에서는 효과가 없다. 그 차이를 알아내기 위해 의료데이터 뿐만 아니라 개인의 유전적인 배경까지 함께 봐야 한다는 것이다.

그 차이를 특정한 유전자 A의 돌연변이 여부가 만들어낸다면, 치료제를 선택하기 전에 해당 유전자를 검사하는 방식으로 활용할 수 있다.

물론 이런 접근법을 실현하기 위해서는 많은 데이터가 축적되고, 이를 정보관리 관점에서 통합적으로 분석해야 한다.

 

Q. 정밀의료에는 빅데이터가 필요하다는 것인가

그렇다. 데이터 사이즈가 중요하다. 데이터가 많을수록 분석 정확도도 높아진다.

많은 수의 환자데이터를 확보하기 위하여 하나의 병원보다는 여러 병원으로부터 데이터를 수집하는 것이 중요하다.

그러나 각 병원이 의료데이터를 만들어내는 전자의무기록 시스템이 동일하지 않다. 차트도 다르고, 차트 프로그램 내부에 데이터를 축적하는 방식도 다르다. 심지어 각 의사가 사용하는 의료 용어나 약어도 다르다.

이를 통합하여 표준화된 의료 빅데이터를 구축하는 것이 의료계의 화두 중 하나다.

 

Q. 그런 문제는 수의 분야에도 있다. 아예 빅데이터라고 할 만한 것이 없는 상황이다. 동물의 진료 정보는 각 동물병원에 파편화되어 있다. 행위별 코드를 표준화하는 일조차 아직 걸음마단계다.

앞서 언급했던 오바마 대통령의 PMI 프로그램에서도 각 병원에 있는 의료 데이터의 통합을 목표로 제시했다.  

사실 병원마다 이미 구축된 다양한 전자의무기록 시스템이나 데이터 생산 시스템을 하나로 통일하기란 현실적으로 불가능하다.

그래서 만들어낸 접근방식이 ‘공통데이터모델(Common Data Model)’과 임상데이터웨어하우스(Clinical Data Warehouse)’다.

간략히 설명하자면 병원은 원래 하던 대로 진료하고 기록하되, 그 정보를 공통데이터모델의 체계에 따라 재배치하여 수집하는 방식이라고 보면 된다. 이런 방법으로 여러 병원에서 생성된 데이터를 한 곳에 모아 빅데이터로 만들 수 있다.

이렇게 만들어진 빅데이터는 연구자들이 활용할 수 있도록 공개된다. 이것이 나아가야 할 방향이다.

저는 수의사가 아니라 말씀드리기 조심스럽지만, 수의 분야에서도 이 같은 방향성에서 수의료 데이터를 모아야 한다고 생각한다.

그러자면 우선 용어 정리부터 되어야 한다. 표준화된 코드를 확립하는 것이 급선무다.

이를 바탕으로 클라우드 EMR, 누구나 활용할 수 있는 공용 플랫폼을 구축하면 전국 동물병원에서 생성되는 데이터를 연결할 수 있게 된다.

국가 차원에서 추진하지 않고는 힘든 일이다.

 

Q. 학교 이야기로 돌아와서, 학생들이 어떤 강의를 듣게 되는지 궁금하다

예과 1학년과 본과 2학년을 대상으로 각각 통계학과 정보학을 강의한다. 다음 학기부터 시작할 예정이다.

통계학도 원론적인 내용보다는 R을 활용해 실질적으로 데이터를 분석하는 실습 기반의 강의가 될 것이다.

본과생 대상으로는 생물정보학과 의료정보학을 소개하고 수의학에서 적용할 수 있는 특이적인 내용과 응용을 다룰 생각이다. ‘Translational informatics(중개정보학)’ 과목이라고 볼 수 있다.

이를 통해 데이터의 중요성과 가치를 교육하고자 한다. 학생들이 향후 일선의 수의사로서 데이터를 어떻게 올바르게 생산해낼 수 있는지, 어떻게 해석해야 하는지를 알려주고 싶다.

더 나아가 수의사 출신의 데이터 과학자, 데이터 기반의 기업가를 양성하는 것이 목표다.

 

Q. 몇 년 전 서울대 수의대 인증을 위해 방문했던 미국수의과대학협회(AAVMC) 앤드류 멕카베 사무총장은 4차산업혁명 시대에 걸맞은 데이터 리터러시(data literacy)를 강조했다.

4차산업 시대에는 모든 분야에서 어마어마한 데이터가 축적된다. 의학은 물론 수의학 분야에서도 마찬가지다.

예전에는 눈으로 보고 이해되는 자료들만 봤다면 이제는 코딩과 같은 전문적인 데이터 분석을 읽어내는 능력을 길러야 한다.

수의과대학 학생들도 동물정보관리학 수업을 통해 데이터를 다루는 연구와 응용분야를 접하고 역량을 기를 수 있을 것으로 기대한다.

임상현장에서 논문을 볼 때도, 공직에서 정책을 만들 때도 다뤄야 하는 재료는 데이터다. 데이터를 통계학적으로 다루고, 주어진 데이터도 비판적으로 사고할 수 있어야 한다.

데이터의 중요성을 인식하고, 학생들이 역량을 개발할 수 있게끔 도와주는 것이 제 역할이라는 생각이 든다.

수의사분들께도 의료 데이터의 표준화에 대한 인식이 개선되는데 도움을 드리고 싶다.

Loading...