長久以后,新藥研發(fā)的高回報和高風險讓人又愛又恨。新藥研發(fā)的高風險主要源于研發(fā)的周期復(fù)雜、耗時長,從活性到成藥性,從制劑到生產(chǎn)工藝,任何一個環(huán)節(jié)的失敗都會讓一款被寄予厚望的新藥研發(fā)前功盡棄。
根據(jù)美國Tufts大學2014年的一項研究統(tǒng)計,一款新藥從首次合成到進入臨床平均耗時31.2個月,而從臨床I期到成功上市平均再需96.8個月。也正因為投入資金巨大、耗時長、風險高,新藥研發(fā)幾乎一直是財力雄厚的巨頭藥企才玩得起的游戲。
另一方面,環(huán)境惡化、全球化、老齡化等現(xiàn)代社會問題所帶來的新的醫(yī)藥市場需求愈發(fā)凸顯,尤其集中在癌癥、傳染性疾病、心血管疾病、神經(jīng)退行性疾病等方面。有預(yù)計到2024年,全球醫(yī)藥市場總規(guī)模將超過11萬億。
面對如此巨大的用藥缺口,制藥行業(yè)亟需能在各個環(huán)節(jié)上降本增效的突破性解決方案,包括高速篩選和設(shè)計有潛力的候選藥、提高藥劑開發(fā)和快速優(yōu)化工藝流程、以及加速臨床試驗的樣本篩選和不良反應(yīng)監(jiān)測等多管齊下,從而實現(xiàn)新藥和新療法的加速研發(fā)和市場化。
在計算方法輔助藥物設(shè)計之前的時代,新藥的篩選幾乎完全依靠化學合成和生物試驗,成本高耗時長。隨著計算化學和計算生物學等學科的發(fā)展,藥物篩選實現(xiàn)了高通量初篩,既縮小了先導(dǎo)化合物的范圍又以非常低成本的方式覆蓋了更大范圍的化合物結(jié)構(gòu)。
只是早期的計算輔助藥物篩選和設(shè)計的方法效果不穩(wěn)定,這一方面受限于這些模型和算法依賴于科學家對化合物理化和藥學性質(zhì)的認知,另一方面計算力的限制導(dǎo)致虛擬篩選其實遠不能覆蓋這種技術(shù)應(yīng)該搜索的全部結(jié)構(gòu)和能量空間(數(shù)量級可能達到10的60次方)。
而伴隨著機器學習、人工智能等核心技術(shù)的快速發(fā)展,計算能力的大幅提升,這兩方面的問題都可以迎刃而解。機器學習等人工智能算法就是為了處理海量數(shù)據(jù)而生的。而隨著有效數(shù)據(jù)累計的越多計算結(jié)果則越好,并且可以最小程度的依賴于人的先驗知識。
AI或人工智能,是用以指代一個能夠獨立學習和決策的系統(tǒng),它能夠從被給予的輸入(數(shù)據(jù))中學習“知識”,找出規(guī)律,并據(jù)此進行推演和預(yù)測。目前已應(yīng)用于醫(yī)藥行業(yè)的很多方法,比如機器學習(包括深度學習)、自然語言處理、計算機視覺等都屬于人工智能的范疇。
機器學習在靶點識別、藥物篩選、藥物設(shè)計、疾病診斷、傳染病預(yù)測等多方面都有廣泛的應(yīng)用;自然語言處理是一種機器從文本中提取信息的方法,可以被用于分析電子檔案等文本數(shù)據(jù),甚至于在臨床試驗中招募合適的患者和優(yōu)化實驗設(shè)計;而計算機視覺則在基于醫(yī)學圖像的疾病診斷、疾控視頻監(jiān)測等應(yīng)用場景中已經(jīng)取得了實質(zhì)性的進展。
人工智能正在逐個擊破醫(yī)療行業(yè)的高成本低效率之痛。
新藥研發(fā)的全過程大致可分為藥物發(fā)現(xiàn)、臨床前研究、臨床研究以及上市四個階段。計算機在傳統(tǒng)的驅(qū)動模式下,主要集中于藥物發(fā)現(xiàn)階段的藥物篩選、結(jié)構(gòu)優(yōu)化等環(huán)節(jié),伴隨機器學習算法的深入,計算驅(qū)動的場景已經(jīng)擴展到了新藥研發(fā)的全過程,其中靶點發(fā)現(xiàn)、藥物篩選、藥物設(shè)計和優(yōu)化、臨床試驗患者招募、優(yōu)化臨床試驗設(shè)計等方面有較為深入的應(yīng)用。
靶點發(fā)現(xiàn)。已經(jīng)上市包括在管線上的藥物靶點數(shù)量非常有限,藥企除了針對已有靶點研發(fā)更有效的新藥,更需要尋找新的靶點以解決抗藥性問題或獲得更好的治療效果。新靶點的發(fā)現(xiàn)依賴于從海量的生物信息學數(shù)據(jù)找出與疾病的臨床指征的關(guān)聯(lián),再從中發(fā)現(xiàn)有可藥性的靶點。各種機器學習、數(shù)據(jù)挖掘的算法被應(yīng)用于轉(zhuǎn)錄組、蛋白質(zhì)組、代謝組等高通量生物組學數(shù)據(jù)中,通過大量數(shù)據(jù)不斷的對算法的進行訓練,從而挖掘出有潛力的新靶點。
臨床試驗患者招募。在臨床試驗中,機器學習和自然語言處理可以應(yīng)用于優(yōu)化和加速患者的招募選擇。通?;颊呷虢M的時間大概占用了全部試驗期的三分之一,而如果臨床試驗招募的患者不合適,會導(dǎo)致約80%的失敗病例。機器學習方法可以在臨床試驗的II期和III期中,通過分析患者特異性基因表達譜來選擇特定的患病人群進行招募,從而加速試驗過程,提升成功率。
此外,AI在上市過程中的市場分析定價,后期的不良反應(yīng)監(jiān)測的方面都有可發(fā)揮作用的空間。
人工智能技術(shù)和應(yīng)用場景的日趨成熟,帶來了市場的飛速發(fā)展,從2015年2億美元的市值到2018年的7億,預(yù)計2024年將達到50億美元。作為AI重要應(yīng)用場景之一的制藥行業(yè),全球領(lǐng)先的制藥公司開始率先擁抱人工智能,或從內(nèi)部孵化或直接與AI科技公司合作。
輝瑞和IBM Watson合作利用后者的計算平臺和ML、NLP等技術(shù)搜索癌癥免疫療法的新靶點,賽諾菲與首個AI制藥臨床試驗公司Exscientia合作,利用Exscientia開發(fā)的AI藥物發(fā)現(xiàn)平臺來優(yōu)化用于心臟病和癌癥治療的先導(dǎo)化合物結(jié)構(gòu);此外,諾華、拜耳、Lilly等都與微軟、IBM、XtalPi等AI技術(shù)或AI制藥公司在藥物研發(fā)等領(lǐng)域有合作。
除了只就計算可驅(qū)動新藥研發(fā)階段與大型藥企進行合作,像英矽智能這種“端到端”的新藥研發(fā)模式也是未來AI制藥公司可以發(fā)展的商業(yè)模式。AI制藥公司在計算驅(qū)動新藥研發(fā)方面,比之老牌藥企已經(jīng)先行,技術(shù)領(lǐng)先優(yōu)勢如果再配以完備的全鏈條研發(fā)能力,將有望在新藥研發(fā)的速度和成本之戰(zhàn)中勝出。
英矽智能目前不僅和全球三十多家領(lǐng)先的藥企達成合作,還擁有自有管線30多條,用于覆蓋各類疾病的藥物研發(fā)。這種級別的管線數(shù)量,越到后期,資金和資源的壓力越大。英矽的信心一方面來源于AI技術(shù)極大降低了初期研發(fā)的成本和時間,另外其自建的三款A(yù)I藥物研發(fā)平臺可以覆蓋新藥研發(fā)和臨床試驗的三大階段,包括靶點發(fā)現(xiàn)(PandaOmics)、藥物設(shè)計和生成(Chemistry42)、和臨床試驗的結(jié)果預(yù)測平臺InClinico。即便有AI加持,英矽目前的策略仍然是把管線推進到臨床I期,而在II和III時尋求強有力的合作伙伴。
文章來源:佰傲谷BioValley ,作者蔣萍