“인공지능(AI) 쇼크!” “AI가 바꾸는 미래!” “AI에 놀란 인류”
지금 들어도 익숙한 표현인데요, 2016년에도 여러 언론은 물론 다양한 산업에서 AI를 활용하려는 시도가 이어졌던 적이 있습니다. 바로 이세돌 9단과 ‘알파고’와의 바둑 대결이었어요. 서울에서 진행된 대결에서 알파고는 이세돌 9단을 4대 1로 꺾으며 ‘AI 쇼크’라는 유행어를 만들어 냅니다.
이후 약 1년여간 AI는 모든 이슈를 집어삼키는 존재로 급부상합니다. 하지만 2017년 이후 잠잠해졌는데요, 당시만 해도 지금처럼 AI 기술이 범용화 되지 않았던 때여서 일반인들이 피부로 느끼는 게 적었습니다. 2022년 11월 오픈 AI의 챗GPT가 출시된 이후 2년 가까이 AI 열풍이 지속되고 있는 지금 과는 달랐어요. 하지만 당시 세상을 뒤흔들었던 알파고는 이후 세대를 거듭하며 조용히, 그리고 꾸준히 발전을 거듭해 왔습니다.
단백질 구조를 예측하는 AI인 ‘알파폴드’로 진화해 과학기술계를 흔들고 있어요. 알파폴드가 주목받는 이유, 바로 단백질 구조 예측이 ‘신약 개발’과 연결되기 때문입니다. 알파폴드를 앞세운 AI들이 최근 신약 개발 부문에서 성과들을 쏟아내고 있어요. 긍정 회로를 돌려보자면 AI가 발전하면서 신약 개발 기간 또한 과거와 비교했을 때 빠르게 단축되는 듯 보입니다. 비용도 줄 것으로 기대되고요. 이번에는 신약 개발과 AI를 주제로 짧게 정리해 보겠습니다.
1. 신약개발 과정과 AI
짧게 신약 개발 과정을 살펴볼게요. 많은 과학자가 여러 실험을 통해 신약 후보 물질을 발굴합니다. 간단하게는 암세포에 후보 물질을 떨어트려 효과가 있는지 살펴본 뒤 이어 쥐 실험을 통해 동물 내에서도 작동하는지 살펴봐요. 일반적으로 제약사들은 수천, 수만 개의 신약후보 물질을 보유하고 있습니다.
수많은 후보 물질 중 효과가 좋을 것으로 예상되는 물질을 기반으로 임상 시험을 시작합니다. 먼저 부작용이 있는지, 없는지를 따지는 ‘전 임상’을 진행하고 일반적으로 동물 실험을 통해서, 이를 마치면 ‘임상 1상’ ‘임상 2상’ ‘임상 3상’ 등의 단계를 거쳐요.
임상 과정에서 발견되는 부작용이나 효과에 따라서, 그리고 어떤 질병을 대상으로 한 임상인지에 따라 임상 시험 과정은 상당히 다릅니다. 임상 1상과 2상을 동시에 진행하기도 하고, 특정 질병의 경우에는 2상을 마치고 바로 허가가 나오는 경우도 있어요.
‘일반적으로’ 설명해 드리면 임상 1상은 주로 건강한 사람이나 소수의 환자를 통해 약물의 독성을 확인합니다. 임상 2상은 2a와 2b로 나뉘기도 하는데 2a는 수십 명 규모의 임상 군을 기반으로 약효를 확인하고 투여량을 분석합니다. 2b는 2a에서 얻은 데이터를 기반으로 더 많은 환자에게 투여해 효과를 확인해요.
임상 3상은 수천 명의 환자를 대상으로 신약 후보 물질에 대한 효과 검증을 하는 단계입니다. 임상마다 서로 다르지만 일반적으로 3~5년 정도, 임상 시험 비용은 수백~수천억 원이 필요합니다. ‘일반적으로’라는 말을 많이 쓰는 이유는 신약 개발 과정을 하나로 표현하기 어렵기 때문입니다.
신약으로 출시되는 확률은 다음과 같아요. 약물을 만들고, 전 임상, 임상 시험을 거쳐 규제 검토 후 마케팅 승인을 받는 데 성공하는 후보물질은 2~3만 개 중 1개꼴로 조사됐습니다. 임상 시험부터 시작해 허가받아 판매까지 돌입할 확률은 10~20% 대예요.
2000~2018년까지 미국에서 진행된 임상 시험과 약물 개발 비용 평균은 1억 7270만 달러였어요. 실패 비용까지 포함하면 5억 1580만 달러로 증가하고요. R&D에 쓰는 비용은 3억 달러~44억 달러 수준이었습니다.
신약 개발에 필요한 기간은 평균 7년 정도로 나타납니다. 코로나19 백신처럼 빠른 절차로 허가가 난 경우도 있지만 어떤 신약 개발에는 10년, 20년이 걸리기도 합니다. 아스트라제네카가 개발한 ‘임주도’는 임상 시작부터 허가까지 19년이 걸렸어요. 파킨슨병 치료제인 ‘누리안즈’는 1996년 임상을 시작해 2019년에 FDA 승인을 받습니다.
효과가 좋은 신약을 개발하면 많은 돈을 벌 수 있습니다. 하지만 그 과정은 이처럼 혹독합니다. 투자 없이 얻을 수 있는 것은 없습니다. 이렇다 보니 현재 많은 과학자는 물론 기업들은 AI를 적용, 신약 개발에 투입되는 비용과 시간을 줄이려는 방안을 찾고 있습니다. 그리고 조금씩 그 결과가 나올 조짐이 보이고 있습니다.
2. 알파폴드가 바꾸고 있는 세상
“평균 10년이 걸리던 신약 개발 기간을 몇 달로 단축할 수 있는 날이 오게 될 것입니다.”
구글 딥마인드의 수장인 데미스 허사비스 CEO가 올해 초 남긴 말입니다. 신약 개발 분야도 예외는 아닙니다. AI는 이미 신약 개발 과정 깊숙이 침투했는데요, 이세돌 9단을 꺾은 알파고, 그 알파고의 후예인 ‘알파폴드’의 활동이 대표적입니다.
알파폴드는 단백질 구조를 예측하는 AI입니다. 단백질 구조 예측이 중요한 이유, 역시 짧게 설명해 볼게요. 생명의 기본 단위 DNA는 RNA를 거쳐 우리 몸에 필요한 단백질을 만들어 냅니다. 단백질은 세포의 구성성분이기도 하고, 효소나 호르몬, 항체의 주성분으로 우리가 ‘생명’을 유지하는 데 많은 기능을 수행하고 있습니다.
특히 이 단백질은 신약 개발을 할 때 상당히 중요합니다. 질병의 원인이 되는 단백질에 결합하는 약물을 설계함으로써 질병을 예방하거나 나아지게 할 수 있거든요. 이를 위해서는 약물이 타깃으로 하는 단백질의 구조를 정확히 파악해야만 합니다.
특히 세포를 감싸고 있는 ‘세포막 단백질’이 있는데, 우리가 알고 있는 질병의 50~60%가 이 세포막 단백질 이상으로 발생한다고 알려져 있어요. 따라서 단백질 구조를 잘 알면, 신약 개발을 할 때 유리한 위치에 오를 수 있게 됩니다. 물론 모든 신약이 단백질을 타깃으로 하는 것은 아닙니다.
3. 파악하기 어려운 단백질 구조
단백질은 수십~수천 개의 ‘아미노산’으로 이루어져 있습니다. 이 아미노산은 DNA를 구성하는 ‘염기’와 관련이 있어요. 염기, 기억하시죠? 모든 생명체는 아데닌(A), 구아닌(G), 시토신(C), 티민(T). 4개의 염기를 가지고 있습니다. 4개 염기 중 3개 염기가 얽히고설키면서 1개의 아미노산이 만들어져요. 이 아미노산이 또 얽히고설키면서 단백질이 만들어집니다.
지금까지 과학자들이 찾아낸 단백질의 종류는 약 2억 개에 달합니다. 이중 인간에서 발견된 단백질은 2만여 개에 달하고요. 이중 알파폴드가 나타나기 전까지 구조를 파악한 단백질은 17~18만 개 정도에 불과했다고 해요.
“단백질 구조 그까짓 거 성능 좋은 현미경 사다가 때려 넣고 살펴보면 다 알 수 있는 것 아니냐”라고 생각하실 수 있지만 이게 생각처럼 쉽지 않습니다. 먼저 단백질 결정을 만드는 것부터 난해하고, 너무 작기 때문에 X-선 결정법 같은 기법을 써야 하는데 단순히 돈과 시간을 투자한다고 무조건 성공하는 분야가 아닙니다.
한 종류의 단백질 구조 분석에는 짧게는 수개월 많게는 수년이 걸립니다. 끝까지 찾아내지 못할 때도 있고요. 단백질 구조 예측은 과학자들 사이에서도 악명 높은 연구 분야로 손꼽힌다고 합니다. 한 개의 단백질 구조를 파악하는 과정이 박사 논문이 될 수도 있고요. 우리 몸에서 상당히 중요한 역할을 하는 단백질 구조 예측에 성공한 과학자는 ‘노벨상’을 받기도 합니다. 이 단백질은 현재 신약 개발 분야에서 활발히 활용되고 있고요.
4. 알파폴드가 예측한 지구상의 모든 단백질
알파폴드는 단백질 구조 예측 분야에서 획기적인 성과를 이어가고 있어요. 인간이 지금까지 밝힌 단백질 구조를 학습한 알파폴드는 지난 2021년 인간의 단백질 2만여 개 중 98.5%의 구조를 예측하고 2022년에는 지구상에 존재하는 2억 개의 단백질 중 99%의 구조를 예측합니다.
물론 예측을 한 것이지 이게 맞는지는 실제 실험을 통해 확인을 다시 해야만 합니다. 하지만 ‘구조가 이럴 것이다’라고 예측한 뒤 관찰하는 것과 아무것도 모른 상태에서 관찰하는 것은 큰 차이가 있어요. 단백질 결정을 만들고, 관찰하는 과정을 보다 효율적으로 진행할 수 있는 만큼 시간과 비용을 아낄 수 있게 됩니다.
단백질 구조 하나를 파악하는 게 박사논문이 되는 시대일 정도이다 보니 알파폴드가 이룬 성과는 수십억 년의 연구와 수조 달러에 해당하는 비용을 절감했다는 말이 나옵니다.
5. 실제 신약 개발에 활용되고 있는 AI
알파폴드는 이미 신약 개발 분야에서 다양하게 활용되고 있습니다. 마다가스카르에 사는 박쥐에서 발견한 바이러스에 대항할 수 있는 말라리아 백신 개발에 활용되었고 항생제 내성을 연구하고 암을 치료할 수 있는 새로운 약물 합성법을 제안하는 등 종횡무진 뛰어다니고 있어요. 이 분야를 연구하는 과학자들이 알파폴드 없이는 이제 연구할 수 없을 정도라는 말이 나올 정도라고 합니다.
딥마인드는 2021년, 알파폴드 기반의 약물 연구를 위해 ‘아이소모픽 랩(Isomorphic Labs)’을 만듭니다. 아이소모픽랩스는 알파폴드 3을 개발했는데 단백질 구조 예측은 물론, DNA, RNA를 포함해 생명체를 구성하는 거의 모든 분자의 구조와 상호작용을 예측할 수 있다고 합니다.
AI 기반으로 신약을 개발하는 기업의 파이프라인에 대한 분석 논문을 보면 AI를 기반으로 설계한 신약후보 물질의 임상 1상 성공률은 80~90%로 기존 업계 평균보다 높은 것으로 조사됩니다. AI가 신약후보 물질 선별에 있어서 확실히 효과가 있다는 연구가 쌓이는 중입니다.
거대 제약사들이 가만히 있을 리 없습니다. 구글의 아이소모픽랩스는 일라이릴리, 노바티스 등과 최근 화합물 신약 연구 개발 협업 계약을 체결해요. 일라일 리와는 17억 달러 규모, 노바티스와는 12억 달러 규모의 계약입니다. 아스트로제네카, GSK, 화이자, MSD 등 많은 기업이 AI 기술에 대한 투자를 아끼지 않고 있습니다.
홍콩에 기반을 둔 생명공학 스타트업 ‘인실리코 메디신’은 AI로 이용해 만든 폐 질환 신약후보 물질 ‘INS018_055’의 임상에 돌입하기도 합니다. 현재 임상 2상이 진행 중인데요, 불과 30개월 만에 신약후보 물질을 설계합니다. 기존에는 약 60개월이 걸리던 과정이었다고 해요.
가비디아, 엔비디아도 빠질 수 없습니다. 엔비디아는 렌커젼이라는 생명공학 기업과의 협업으로 AI를 이용해 신약후보 물질 2.8조 개를 빠르게 스크리닝 했는데 이는 기존 방식으로는 10만 년이 걸리는 일이라 합니다.
이달 초 흥미로운 연구가 발표됩니다. 메타와 구글에 있던 개발자들이 나와 만든 스타트업 ‘EvolutionaryScale’의 연구예요. 이들이 만든 AI의 이름은 ‘ESM3’ 인데요, 수억 개의 단백질 서열과 구조, 정보 등을 학습했다고 합니다. 이를 기반으로 새로운 단백질을 설계할 수 있어요. 신약개발을 포함해 생명공학 분야에서 다양하게 활용될 수 있는 AI입니다.
연구진은 ESM3의 성능을 확인하기 위해 ‘형광단백질’ 설계를 요구합니다. 형광단백질은 말 그대로 ‘반짝반짝’ 빛나는 단백질인데, 이를 통해 뇌의 어떤 부위가 어떤 기능을 가지고 있는지, 특정 행동을 했을 때 어떤 유전자가 활성화되는지 등을 알 수 있게 됐습니다. 1960년대 해파리에서 이를 발견한 과학자들은 노벨상을 받았고요.
연구진은 AI를 이용해 빛나는 분자를 만들고 ‘esmGFP’라는 이름을 붙입니다. 이 단백질은 기존 형광단백질과 유전자 서열 차이가 컸는데요. ‘5억 년 이상의 진화’를 거쳐야 볼 수 있는 존재라고 이야기합니다. 즉 자연에서는 지금으로부터 5억 년의 시간이 지나야 나타났을 법한 진화된 형광단백질을 AI가 단 며칠 만에 만들어 냈다는 겁니다. 대단하다는 생각과 함께 문득 두려운 느낌도 살짝 들었어요.
AI에 대한 장밋빛 이야기를 잔뜩 했지만 우려도 존재합니다. ‘악용’ 때문이에요. 방금 소개한 ESM3의 경우 최신 버전을 사용하려면 미국 정부에 보고 해야 합니다. 과학자들이 마음껏 사용할 수 있는 오픈 소스에도 제한이 있는데요, ‘치명적인 무언가’를 설계할 가능성이 있기 때문이라고 해요. 미션 임파서블과 같은 영화에 자주 등장하는 ‘한 방울로 도시 하나를 파괴할 수 있는 생화학 무기’ 개발에 AI가 활용될 수 있습니다.
생성형 AI의 발전을 두고 기대와 우려가 함께 나오듯, 신약 개발 분야도 마찬가지입니다. 부작용은 최소화하면서 장점을 극대화하는 것, 역시나 이를 활용하는 인간의 선택에 달린 것 같습니다. 인간은 어떤 선택을 내리게 될까요.
'기술' 카테고리의 다른 글
AI 시대, 미디어의 미래 (feat. 익숙했는 모든 것이 빠르게 파괴될 가능성) (85) | 2024.07.29 |
---|---|
대격변 AI 시대, 데이터로 사고하고 데이터로 리드하라 (89) | 2024.07.21 |
영화계에 몰려오는 거대한 폭풍 (feat. AI로 만드는 영화) (86) | 2024.07.16 |
피그마, 2조원을 날려버린 남자 (feat. 컨피그 2024) (91) | 2024.07.12 |
GPT-4o의 벤치마크를 뛰어넘은 Claude 3.5 Sonnet (feat. 인공지능 버블) (81) | 2024.07.11 |
댓글