[이코노믹리뷰=최진홍 기자] 코로나19가 전 세계를 강타한 가운데 이를 극복하기 위한 IT 기업들의 분투도 이어지고 있다. 이런 가운데 AWS가 주도적으로 마법의 코로나 백과사전, CORD-19 서치 서비스를 시작해 눈길을 끈다. 인공지능과 빅데이터, 그리고 클라우드의 만남으로 결합된 코로나19 지식 플랫폼에 전 세계적인 관심이 집중되고 있다.

4일 AWS 한국 사무실에서 바시 필로민(Vasi Philomin) AWS 머신러닝 및 AI 담당 총괄과 단독으로 화상 인터뷰를 진행했다. 그는 클라우드와 의료의 만남이 더욱 적극적으로 이뤄져야 하며, 다양한 가능성에 주목해야 한다고 말했다.

▲ 화상 인터뷰가 진행되고 있다. 사진=최진홍 기자

CORD-19 서치, 정체는?
CORD-19 서치는 자연어 질문으로 수만 개의 의학 연구논문과 문서를 빠르고 쉽게 검색할 수 있는 머신러닝(ML) 기반의 웹사이트다. 연구 논문과 문서에서 생성된 데이터세트를 통해 연구자들이 빠르게 증가하고 있는 코로나 바이러스 관련 문헌을 탐색해 관련성 높은 최신 정보를 효율적으로 찾을 수 있도록 도와주며, AWS 머신러닝 서비스에 의해 구동된다.

쉽게 말해 연구원들이 “코로나19의 타액 바이러스 부하는 언제 가장 높을까?”, “회복기 혈장 치료가 백신의 전조가 될 수 있을까?”와 같은 자연어를 사용한 질문을 할 경우 간단한 검색 인터페이스를 제공한다는 뜻이다. 나아가 출처 문서뿐 아니라 정밀한 답변까지 제공한다.

필로민 총괄은 CORD-19 출범에 대한 설명을 부탁하자 코로나19 사태 이전, 특히 AWS의 행보에 주목해야 한다고 말했다. 그는 "AWS는 코로나19 이전에도 헬스케어, 생명공학, 게놈 연구, 바이오 테크 등 여러 분야에 걸친 고객들에게 서비스를 제공하고, 이들과 협업해왔다"면서 "이러한 조직들에게 중요한 것이 환자 데이터다. 데이터를 위한 보안과 상호운영성을 확보하고 규제준수 요구사항을 충족시키는 것이 중요하며 AWS는 기업 및 조직들이 정보를 저장하고 전송하는데 있어 보안은 물론, 미국 의료정보보호법(HIPPA)이나 미 연방정부의 FedRAMP(Federal Risk and Authorization Management Program)와 같은 규제를 준수하는데 도움을 줬다"고 말했다.

실질적인 사례도 나왔다. 필로민 총괄은 한국 서울대병원과의 협업을 거론했다. 그는 "서울대병원 의료진은 암 정밀의료 플랫폼 사이앱스(Syapse)를 통해 환자의 임상 및 게놈 프로파일에 기반한 정밀 암치료를 제공한다"면서 "현장에서 활용되는 여러가지 애플리케이션이 AWS 클라우드 상에서 운영되며 서울대병원 의료진은 이를 통해 보다 효과적인 맞춤형 암치료를 제공하고 있다"고 말했다.

싱가포르의 게놈 연구소도 AWS와의 주된 파트너다. 그는 "감염 질환을 위한 유전자 염기서열을 분석을 수행하는 싱가포르 게놈 연구소는 AWS를 통해 기존에 6시간 소요됐던 개개인 유전자 분석 시간을 15분 이하로 단축할 수 있었으며, 비용도 이전의 5%가 안 되는 수준으로 감소시켰다"고 설명했다.

AWS 기반의 의료 플랫폼 강화에 매진하던 상황에서 코로나19가 터졌고, 이를 바탕으로 CORD-19 서치가 가동됐다는 설명이다. 필로민 총괄은 "코로나19 사태가 커지던 3월 말, 미 백악관에서 원격 라운드테이블을 주최했고 많은 IT 기업들이 모였다"면서 "당시 알렌 AI 연구소(Allen Institute for AI)를 만났으며 이를 바탕으로 연구 과학계가 코로나19에 대한 연구를 진행하면서 많은 관련 문헌들을 보유하고 있음을 알게 됐다"고 말했다.

코로나19 극복을 위해서는 방대한 자료를 통해 연구를 진행해야 하며, 기존 연구 과학계가 많은 문헌들을 보유하고 있었으나 문제는 활용도였다. 필로민 총괄은 "알렌 AI 연구소와 만날 당시 문헌이 2만건 정도였다면 지금은 4만7000건 정도로 증가했다"면서 "데이터가 폭발적으로 늘어나면서 연구 결과나 문서에서 원하는 것을 추려내는 것이 어려웠다. 심지어 연구자들이 연구를 수행할 때 과거에 어떤 연구 결과가 있었는지 문헌을 찾는 일이 어려워지고, 특히 연구하고 있는 연구 제목과 관련된 과거 데이터, 혹은 그것에 대한 근거 정보를 찾는 것이 훨씬 복잡해졌다"고 말했다.

코로나19 극복을 위해 의료 과학계가 힘있는 연구를 진행해야 했으나, 방대한 문헌에 묻혀 제대로 된 연구를 할 수 없었다는 뜻이다. 심지어 모 기업의 경우 특정 연구를 진행한 후 나중에야 그 연구를 과거에 했던 것을 발견해 논란이 커지기도 했다.

AWS는 여기에 착안했다. 필로민 총괄은 "2019년 12월 AWS 리인벤트에서 아마존 켄드라(Amazon Kendra)가 발표됐다"면서 "아마존 켄드라는 머신러닝을 기반으로 하는 정확하고 사용하기 쉬운 기업 검색 서비스다. 이를 통해 CORD-19 서치에 대한 청사진을 그렸다"고 설명했다. 아마존 켄드라는 맥락을 이해하는 기술을 가지고 있기 때문에 자연어로 질문을 하면 다양한 숫자, 통계, 정보들을 즉각 제공할 수 있다.

또 다른 기술은 아마존 컴프리헨드 메디컬(Amazon Comprehend Medical)이다. 머신러닝을 사용해 비정형 의료 텍스트에서 정확하고 신속하게 관련 정보를 추출해낸다. 이 메타 데이터를 바탕으로 아마존 켄드라가 정확하고 연관성 높은 답을 찾아주는 것이 CORD-19 서치다.

CORD-19 서치는 공공 데이터를 가진 기관과도 적극 협력한다. 필로민 총괄은 "코로나19 관련 데이터세트, 헬스케어 관련 단체에서 나오는 가용한 병상 수 데이터, 알렌 AI 연구소에서 확보하고 있었던 4만7000건에 달하는 다양한 논문이나 문헌, 존스홉킨스대학병원에서 제공했던 치료 관련 트래킹 및 정보를 활용하고 있다"면서 "데이터들을 AWS 클라우드 상에 올려 AWS 코로나19 데이터 레이크(공공 데이터)로 제공해 모두가 이 데이터들을 활용하도록 하고 있다. 이 데이터들은 계속 업데이트 되고 있으며, 모든 사람이 접근할 수 있는 아마존 S3(Amazon S3) 버킷(bucket)에 들어가 있어서 무료로 사용 가능하다"고 설명했다.

필로민 총괄은 CORD-19 서치를 통해 데이터에 기반한 의사결정의 중요성도 강조했다. 그는 "앞으로 훨씬 더 다양한 데이터 소스를 통합시켜(임상실험 등) 전세계 연구자들이 여러 환자에 걸쳐 질병이 어떻게 진행되는지 식별하고 데이터에 기반한 의사결정을 내릴 수 있도록 도울 계획"이라면서 "이를 통해 궁극적으로 환자 결과를 긍정적으로 개선하는 데 기여하고 싶다"고 말했다.

예민한 질문, 의료와 클라우드
CORD-19를 포함한 AWS의 클라우드 전략은 이미 그 위력을 발휘하고 있다. 당장 UC 버클리대학교(UC Berkeley), UC샌프란시스코(UCSF), 스탠퍼드대학교(Stanford University)가 함께 참여하고 있는 의료과학 연구 이니셔티브인 챈 저커버그 바이오허브(Chan Zuckerberg Biohub)와 AWS가 협력하고 있다. 서울대병원도 마찬가지다. 필로민 총괄은 "한국에서 처음 코로나19 환자가 폭발적으로 증가했을 때 서울대병원이 AWS를 사용해서 환자의 진단영상을 중앙에 저장했었다"면서 "의료진들이 함께 환자의 상태를 모니터링하여 지역의 가까운 병원으로 전원을 시켜도 되는지, 아니면 경북 문경시에 있는 격리소에 다시 격리를 해야하는지 판단할 수 있었다"고 말했다.

챗봇 플랫폼인 아마존 렉스(Amazon Lex)가 활용된 적도 있다. 필로민 총괄은 "일렉트로닉 케어기버(Electronic Caregiver)라는 건강 및 안전 관련 모니터링 장비 업체는 웨어러블 장치로 원격으로 체온이나 증상을 모니터링하고 트랙킹한다"면서 "만일 체온 상승이 이뤄졌을 때는 아마존 렉스가 트리거가 되어 의료진과 환자 사이의 대화를 챗봇으로 진행하게 하고, 증상을 확인해서 코로나19 위험을 평가할 수 있는 단계로 이어지게 한다"고 설명했다.

UC 샌디에이고 헬스의 영상 방사선과도 인공지능을 사용해 폐 영상 이미지를 분석하며 AWS와 협력하고 있다.

의료와 클라우드의 간격이 점점 좁혀지고 있으나, 아직은 이견도 많다. 특히 국내의 경우 원격의료와 관련된 논쟁과 더불어 최소한 사람의 목숨을 다루는 일에 클라우드를 활용하는 것은 보수적이어야 한다는 주장도 나온다. 나아가 클라우드의 보안성이 검증되지 않아 개인정보 유출을 우려하는 목소리도 있다.

필로민 총괄은 오히려 "클라우드가 가진 기본적인 장점 때문에 의료산업에서 클라우드를 적극 수용해야 한다고 생각한다"고 말했다.

그는 "샌프란시스코주립대학교에서는 스탠포드대 헬릭스 그룹(The Helix Group at Stanford University)과 미국립보건원(National Institutes of Health, NIH)의 후원을 받아 분자생물학인 피처(FEATRUE)라는 연구를 진행하고 있다"면서 "방대한 자료와 오랜 시간이 소요되는 연구지만 AWS를 사용한 후 컴퓨팅 비용을 약 20분의 1로 절감하고, 필요한 연산능력을 적시에 활용할 수 있었다"고 설명했다.

AWS의 경우 인공지능 및 머신러닝 역량을 바탕으로 더욱 강력한 성과를 낼 수 있다는 말도 나왔다. 필로민 총괄은 "하드웨어 유지와 관련된 고정비용이 없고, 필요에 따라 탄력적으로 용량을 확보할 수 있는 것과 같은 클라우드의 기본적인 이점이 의료계에서 클라우드를 도입해야 하는 이유"라고 말했다.