醫(yī)藥網(wǎng)6月22日訊 雖然基因組學、蛋白質組學、生物信息學等現(xiàn)代分子生物學科的發(fā)展為藥物研發(fā)理論帶來了長足進步,但由于藥物分子在人體發(fā)生生化反應的復雜性,新藥研發(fā)并沒有擺脫經(jīng)驗主義色彩。
傳統(tǒng)的藥物研發(fā)以藥化專家為主導,通常情況下,藥化專家根據(jù)經(jīng)驗每提出5000~10000種化合物做藥物篩選,最終只有1種化合物能通過臨床測試并最終上市。據(jù)《Nature》(英國自然出版集團旗下周刊)統(tǒng)計,一款新藥從研發(fā)到獲批上市,平均需要10~15年時間,耗費約26億美元,但臨床成功率不到10%。研發(fā)周期長、成本高、成功率低已經(jīng)成為新藥研發(fā)的“三座大山”。AI技術在自然語言處理、圖像識別、深度學習和認知計算等方面的優(yōu)勢可應用到新藥研發(fā)的各個環(huán)節(jié)。據(jù)估算,從靶點確定到臨床候選藥物環(huán)節(jié),通過AI輔助計算的方法,可以把傳統(tǒng)研發(fā)方法需要的時間從3~6年壓縮到1~2年,從而大幅提升效率并節(jié)省成本。
因此,AI+新藥研發(fā)成為當前藥學研究和前沿醫(yī)學
創(chuàng)業(yè)的熱點。據(jù)統(tǒng)計,2020年全球AI+新藥研發(fā)領域的投資已經(jīng)超過18.3億美元,是2015年投資額的5.4倍。
AI在臨床試驗環(huán)節(jié)應用不足
藥物研發(fā)有十余個環(huán)節(jié),但受限于數(shù)據(jù)可獲得性等方面的因素,AI目前只能應用于少數(shù)環(huán)節(jié)。據(jù)統(tǒng)計,近10年來,AI在新藥研發(fā)領域的應用主要集中在藥物發(fā)現(xiàn)階段,占比超過2/3,為66例(見圖),例如靶點及生物標記物的選擇與確定、先導化合物的確定、構效關系的研究與活性化合物的篩選、先導化合物的優(yōu)化、候選藥物的選定等環(huán)節(jié)。而在臨床試驗階段,例如藥物依從性、預測治療結果、數(shù)據(jù)分析、病理研究、疾病診斷等場景的AI應用不足1/4。
實際上,臨床試驗階段的效率提升或成本降低對新藥研發(fā)投入的影響要遠超過藥物發(fā)現(xiàn)階段。據(jù)英國劍橋大學化學系分子信息研究中心Andreas Bender博士測算,在臨床試驗階段,降低試驗失敗率帶來的收益是提升藥物發(fā)現(xiàn)速度或降低成本的2~5倍。但如前所述,AI應用主要集中在藥物發(fā)現(xiàn)環(huán)節(jié),在該環(huán)節(jié)的應用節(jié)省的新藥研發(fā)成本非常有限。在臨床試驗環(huán)節(jié)的應用,特別是通過AI降低臨床試驗失敗率才是其最大用武之地。
Andreas Bender模擬了通過AI技術手段加速藥物發(fā)現(xiàn)速度、降低成本和提升全流程各環(huán)節(jié)成功率(提升質量)的三種情況(假設AI對速度、成本和階段成功率的改進皆為20%)對一個成功推向市場的新藥在成本方面的影響,得出以下結論:提高成功率(特別是在所有臨床階段)對整個研發(fā)項目價值的影響最大,遠遠超出了提高各自階段的研發(fā)速度和降低成本帶來的收益。
生物學復雜性限制AI應用
AI應用集中于藥物發(fā)現(xiàn)環(huán)節(jié),是因為該環(huán)節(jié)以化學過程為主,研究人員對候選化合物數(shù)據(jù)的完整性及可重復性、化學穩(wěn)定性、理論認知度等都有較好的把握,有利于AI建模。
但臨床試驗階段是以生物學過程為主,其復雜性在數(shù)據(jù)和AI建模兩方面都帶來巨大挑戰(zhàn)。在數(shù)據(jù)方面,需要將臨床數(shù)據(jù)加以結構化處理,而諸如病歷、隨訪記錄目前還很難
標準化、數(shù)字化;由于涉及患者隱私,目前尚無能充分保障數(shù)據(jù)安全的有效措施,這也限制了臨床數(shù)據(jù)的靈活運用。因此,目前行業(yè)內還嚴重缺乏真實可信、覆蓋臨床各環(huán)節(jié)的完整臨床數(shù)據(jù)庫。在AI建模方面,化合物與人體靶點的反應過程非常復雜,目前理論認知不足,受環(huán)境因素影響很大,數(shù)據(jù)穩(wěn)定性和可重復性差,不利于AI建模,對療效和安全性的影響也難以把控。當前AI藥物研發(fā)模型通常是從簡出發(fā),很少一開始就考慮生物學的復雜性,因而常常在臨床測試時遭遇失敗。這種簡化的AI模型僅在單因果
疾病的情況下才是有效的,例如某病毒感染人體,需要復制某種蛋白酶或者受體才能進入細胞,基于這類單一靶點有效并已經(jīng)產(chǎn)生了很多獲批上市藥物。但是,大多數(shù)疾病難以靠單一靶點調控進行有效修復,導致許多基于單一靶點的藥物在臨床試驗中失敗。此外,AI系統(tǒng)中往往會簡化模型而忽視其他問題,例如化合物是否到達其預期的靶點,是否能夠治療疾病的某種表型,以及它的副作用是否在可接受范圍內等。
AI系統(tǒng)要取得成功,需要建立明確的“化合物-靶點-表型”聯(lián)系。雖然近年來出現(xiàn)了一些更具臨床相關性的模型(其中部分模型是針對特定患者群體的),對未來藥物的發(fā)現(xiàn)具有積極意義,但現(xiàn)階段可用AI進行挖掘的數(shù)據(jù)相對較少。此外,一個模型越針對特定患者人群,其通用性越差,這就需要生成足夠多的數(shù)據(jù)才能具有實用價值,這也是AI應用于新藥研發(fā)所面臨的巨大挑戰(zhàn)。
總之,受限于生物學的復雜性和臨床數(shù)據(jù)庫的缺乏,AI在藥物研發(fā)領域的應用主要集中在前端藥物發(fā)現(xiàn)環(huán)節(jié),但這為藥物研發(fā)帶來的收益相對有限。未來,只有臨床數(shù)據(jù)極大豐富完善,在“化合物-靶點-表型”三者之間建立更明確的藥理關系,AI更多應用到臨床試驗環(huán)節(jié),才能對新藥研發(fā)產(chǎn)生真正的推動作用。