楊蓉
2018年10月底,在哈弗醫(yī)學院由Corey Lane Partners,LLC創(chuàng)辦的BioPharma AI應用峰會圓滿落幕。這次峰會堪稱是人工智能和生命科學相交的一個顯型快照,以下總結了這次峰會的十項觀察結果。
1.藥物開發(fā)企業(yè)問題逐漸暴露,AI應用潛力很大
傳統(tǒng)的制藥公司在藥物開發(fā)方面都會存在時間長、花費多的問題,這也是人工智能介入的重要原因之一。塔夫茨(Tufts)藥物研究中心最新數(shù)據(jù)顯示,開發(fā)一種新藥,平均費用為26億美元,新藥的平均上市時間為12年。目前,大約有10%的候選藥物開始從測試階段進入市場。很顯然,這些數(shù)字被改進的空間還很大,人工智能有很大的輔助潛力。
2.藥物開發(fā)中的AI應用預見火熱
目前,很多公司都開始將人工智能應用到藥物研發(fā)過程中,例如創(chuàng)業(yè)公司Berg Health,該公司正在收集前列腺癌癥患者的相關數(shù)據(jù),作為新藥物研發(fā)的測試數(shù)據(jù)。Insilico Medicine被評為全球人工智能百強公司,該公司的首席執(zhí)行官Alex Zhavoronkov在大會上表示,我們都沒有能力去評估Insilico背后的科學,該公司擁有人工智能所有的外在跡象,發(fā)表過多項論文,以及GANS等先進技術生成對抗網(wǎng)絡,深度學習方法,并且還擁有杰出的合作伙伴,以及“先進的端到端藥物AI”目標。
3. AI藥物領域,小公司勝過大公司
在AI藥物領域,很多初創(chuàng)公司的發(fā)展速度都遠遠超過大型制藥公司,例如Berg和Insilico。這些初創(chuàng)的制藥公司正在不斷地將新藥物推向市場,發(fā)展前景不可估量。大會上多位發(fā)言人表示,大型制藥公司對創(chuàng)業(yè)生態(tài)系統(tǒng)的推動并不明顯,甚至還會出現(xiàn)被投訴的現(xiàn)象,眾人多抱怨大型制藥公司費時又費錢。在人工智能領域,大型制藥公司憑借豐富的內、外資源,其發(fā)展速度和規(guī)模勝過小型公司,但AI藥物研發(fā)應用的幅度卻不是很大。據(jù)了解,輝瑞(Pfizer))目前正在進行著150多個人工智能項目的研發(fā)工作,但是涉及藥物發(fā)開的項目卻很少。
4.高投注,低信度
如今,很多藥物企業(yè)傾向于投注高期望的AI項目,即便他們對自己的需求并不明確。大會上,大型制藥企業(yè)和一些初創(chuàng)公司的高管一致認為,在建立未來人工智能項目時,必須優(yōu)先考慮好模型性能監(jiān)控和項目規(guī)劃的問題,包括假設定義和測試標準。一個好的人工智能項目不僅要關注狹義的研究問題,更需要觀測長期效果,以確保項目的可持續(xù)性和擴展性。
5.數(shù)據(jù)是制藥和生命科學中人工智能的關鍵
制藥和生命科學中的人工智能應用,數(shù)據(jù)是最核心的所在。其中大部分涉及“組學”數(shù)據(jù)———基因組學、蛋白質組學、生物組學和代謝組學等,越來越多的數(shù)據(jù)被應用到制藥領域,作為各種測試中的“假設”。很難想象在沒有人工智能的情況下,怎樣分析這些數(shù)據(jù),當然也可以想象,在這樣的大數(shù)據(jù)時代,擁有極強數(shù)據(jù)分析能力的公司占據(jù)了多大的優(yōu)勢。
6.在這段旅程中,沒有人會單獨行動
在藥物領域,一個組織想要獨自進行人工智能的研發(fā)是很難的,因為會涉及到很多伙伴關系和生態(tài)系統(tǒng)之間的關系。很多小公司都開始跟大公司聯(lián)手組建醫(yī)療保險人工智能聯(lián)盟,圍繞該項技術進行合作和倡導,即便是一家大型的制藥公司,在早期發(fā)展中也需要得到外界的幫助。
7. Watson AI已失寵
會上沒有多少人提到過IBM的Watson,因為大家認為它在癌癥治療方面效果并不是很好。Watson AI似乎不再被視為改善藥物開發(fā)的一個因素。據(jù)了解,輝瑞利用沃森進行藥物開發(fā)的試點工作仍在進行中,但該公司正在“冷卻”這項技術。
8.藥物領域的AI預測≠自動化預測
與人工智能許多預測不同的是,在人工智能藥物開發(fā)領域中,似乎沒有人會說人類科學家和護理提供者在未來將不被需要。相反,在醫(yī)藥領域,他們都是同等類型的人,除此之外,該領域還會增加大量的數(shù)據(jù)科學家和AI工程師。Flatiron Health就將這一問題解釋得很好,在這家數(shù)據(jù)驅動的癌癥治療公司,AI“增強”不等同于自動化“增強”。2018年年初,F(xiàn)latiron Health被瑞士制藥巨頭羅氏收購,目前,主要負責的任務是從醫(yī)生的筆記和電子健康記錄中的其他非結構化數(shù)據(jù)中提取關鍵信息。Flatiron使用自然語言處理AI工具不是為了減輕工作任務,而是為了提高生產(chǎn)力。
9.數(shù)據(jù)質量問題仍在,仍需著重關注
雖然藥物開發(fā)中的人工智能應用正在有條不紊地進行著,但是數(shù)據(jù)質量的問題仍需著重關注。會議上經(jīng)常會有發(fā)表“數(shù)據(jù)不良”聲明的說法。雖然很多企業(yè)正在努力改進算法和人工智能基礎設施,但數(shù)據(jù)質量問題始終存在。眾所周知,金融風險很高,有偏差的數(shù)據(jù)標準和粒度會導致算法偏見,從而即便是再多的努力也是浪費時間和資源。同樣因為這個問題,很多的數(shù)據(jù)采集者在數(shù)據(jù)收集階段就致力于提高數(shù)據(jù)質量。
10.知識共享及數(shù)據(jù)質量比數(shù)據(jù)收集更重要
會議上的幾位發(fā)言者提到,制藥公司傾向于根據(jù)數(shù)據(jù)庫的數(shù)量來囤積數(shù)據(jù)并評估其未來是否成功。Sanofi首席數(shù)據(jù)官Milind Kamkolkar在大會上表示,知識共享和提升數(shù)據(jù)質量的合作比收集數(shù)據(jù)更重要,但藥物領域的競爭非常激烈,任何公司都不愿意向競爭對手分享他們爭取到的數(shù)據(jù)。預計不久的將來,醫(yī)療保健和制藥利益相關者將不得不與數(shù)據(jù)所有者(即醫(yī)療保健提供者、患者和其他醫(yī)療保健消費者)協(xié)商數(shù)據(jù)的使用權。
人工智能在制藥行業(yè)的應用還處于早期階段,目前已經(jīng)有大量的企業(yè)投注于這個領域,但是未來如何還需持續(xù)關注。