以大模型加速新藥研發,成本降低70%:一家大廠的「云端」實戰(2)
不只有面向藥物分子設計的行業大模型,一直以來,華為云還在做一件更長期主義的事:打造新藥研發領域的「EDA 軟件」。
業內有一個判斷:「未來的 AI 制藥,正從以算法為中心(Model-centric)朝著以數據為中心(Data-centric)的競爭趨勢演進,而高質量大數據是醫藥研發的競爭關鍵。」
新藥研發的核心高質量數據通常掌握在藥企手中,然而大部分藥企特別是中小企業仍處于傳統醫藥研發階段,缺乏人工智能及大數據分析手段的支撐。海量的原始數據未經過系統化的清洗整理,大多不能產生良好的預測效果。
數據的價值需要使用算法去發現,同時結合 AI 新藥研發公司成熟的算法,而算法需要運行在算力平臺上。在這種情況下,就需要一個高效的企業級 AI 輔助藥物研發平臺將三大要素有機結合起來。
如此一來,不僅能夠提高藥物研發的效率、節約成本,還能大大降低藥物研發的門檻,讓每一家藥企都能高效轉型。
為此,華為云在醫藥領域自下而上構建了 IaaS、PaaS、SaaS 三層服務:基于分布式云基礎設施,在藥物研發環節為藥企提供融合大數據、AI 能力的一站式 AI 輔助藥物研發平臺,并且根據多樣性的數據治理和 AI 開發需求,提供全鏈路藥物研發數據治理能力和全流程藥物研發 AI 開發能力,幫助眾多藥企降低 AI 開發門檻和提升研發效率 。
具體來說,在 SaaS 層,華為云的一站式 AI 輔助藥物研發平臺涵蓋了「靶點發現」、「藥物篩選」、「分子優化」三大核心服務,覆蓋新藥研發全流程,支持從靶點發現、虛擬篩選、先導化合物優化到獲取可合成先導化合物的全業務流程,真正做到了「無功能斷點」。
例如,傳統的靶點發現需要做大量的科研工作,對靶點做大量的生物學假設,并設計一系列的實驗進行驗證,需要漫長的周期。在這一環節,華為云發布了 AutoGenome 單組學自動 AI 建模、AutoOmics 多組學自動 AI 建模、AutoGGN 調控網絡自動 AI 建模三個框架,即使是沒有機器學習背景的研究人員,也可以借助這些自動化調優的方法和策略對自己研究的問題和數據進行建模。
再談到藥物篩選,傳統方法通常是借助實驗手段或采用高通量實驗篩選平臺進行篩選,不僅耗時、耗錢,而且多樣性差。華為云的一站式 AI 輔助藥物研發平臺則大大加速了這一早期篩選過程:平臺預置了藥物虛擬篩選流程和分子庫,依托于華為云彈性擴容算力,支持并行化地完成海量的藥物虛擬篩選,同時支持小分子和多肽分子對接,提供了打分矩陣、集成可視化。
藥物虛擬篩選結果案例展示。
一個具備代表性的案例是,新冠疫情爆發之后,由于沒有實驗提出新冠病毒相關靶點,研究人員很難進行相關業務設計。當時,華為云和國內幾所高校積極開展新冠肺炎藥物篩選工作,基于華為云 15000 核超大算力,完成了新冠 21 個蛋白質靶點與 8500 個已上市藥物的篩選工作。原本耗時一個月的藥物虛擬篩選,最終縮短到一天完成。
對于分子優化環節,傳統方法更加依賴資深的藥化專家在漫長職業生涯中積累的經驗,對化合物進行改造,并需要進行實驗驗證,項目的成功極其依賴藥化專家的經驗和運氣,而華為云提供的盤古藥物分子大模型將這一階段的工作進行了拆解,提供了多種自動化工具。
模型以參考化合物為起點,使得從參考化合物到改造化合物的類藥性質一覽無余,更方便地迭代優化,得到性質更優、結構新穎的化合物。這些豐富的功能意味著,如果一位藥企的研究人員積累了大量關于某種毒性的試驗數據,就可將試驗數據上傳并通過盤古藥物分子大模型基于它的試驗數據進行 Fine-tune 調優,直接可以在八十多種分子屬性里面再加上新的自定義分子屬性。
「算法只是一種技術的架構,一方面算法需要數據的訓練來實現真正的業務需要,另一方面,就像 ChatGPT 一樣,只有足夠多的數據輸入才能實現算法的最好性能,最后,算法的領先性需要持續的數據輸入和迭代。所以未來 AI 制藥的競爭是 AI 算法和藥企數據的深度結合,實現干(計算,Dry Lab)濕(實驗,Wet Lab)結合,循環迭代的大模型。」
SaaS 化服務的好處在于,藥企只需訂閱這一平臺,就可以立即將其應用到自身的業務中,不用考慮他要雇多少人去開發、維護平臺,也不需要考慮怎么引入新的技術方法。這種模式對于藥企來是最直接、最快速的提升,意味著可以將重心、核心、精力聚焦于自身的業務層。
在將最新的技術和方法引入到平臺的同時,華為云團隊也特別注重將客戶需求和建議融入平臺。為了應對不斷變化的需求,「AI 輔助藥物研發平臺」每年平均迭代、更新幾十次,華為云派出專業的研發團隊讓藥企的算法模型服務持續從業務中獲得反饋以進行更新,確保藥企可以方便快捷地將最新的技術應用起來,最終加速創新藥的研發。
數據、算法、算力,構成了 AI 技術發展的三大要素,三者之間密不可分。例如,還有一些挑戰依舊是藥企最擔心的:比如藥物設計階段產生的大量數據如何存、怎么用?算力資源的局限如何突破?
面向客戶在「數據」和「算力」兩塊的升級需求,華為云也給到了專門的解決方案:通過全鏈路藥研數據治理服務,在集成、存儲、轉換、分析、治理等全生命周期幫助醫藥企業進行自動化、智能化的數據治理,實現外采數據統一管控、干實驗數據跨團隊共享、干 / 濕實驗數據整合閉環,并以中心化數據安全策略覆蓋全鏈路,為藥物研發提供高質量、高可信數據;此外,在算力方面,華為云提供醫藥行業分布式云基礎設施,為藥物研發提供最強算力底座和極致算力性能,通過高安全、高可用、高性能、國產化、大算力的云計算資源,保障生物醫藥企業數字化建設的數據安全性、系統合規性、研發穩定性、資源彈性。
讓「AI for Industries」走到千行百業的深處
從目前的階段來看,AI 制藥對于制藥行業仍是一門顛覆式的創新技術。長遠來看,AI 技術廣泛應用于制藥行業的是必然趨勢,以傳統實驗為唯一的藥物發現過程必將逐漸過渡為以數據驅動的范式。
中國的制藥行業是一個飽和的市場,對于每一家藥企來說,創新藥的研發將成為下一階段取勝的關鍵。接下來的路怎么走,仍然值得探討。
在取得一系列成果之后,華為云已成為 AI 新藥研發賽道的「實力玩家」,越來越受到行業伙伴的關注。基于此,多方機構聯合起來探索一種科研機構、醫藥產業鏈、華為云等「產學研用」緊密結合的模式,成為了眾望所歸。
在近日舉辦的華為云 AI 新藥研發論壇中,由昌平區管委會、昌發展、華為云共同建設的「生命谷健康云創新中心」正式揭牌。
該中心投入運營后,華為云也將基于人工智能等云計算能力持續匯聚各方力量,更有效地服務藥企,幫助京津冀 TOP 藥企實現突破性創新,提升京津冀生物醫藥產業在全國的知名度,并將合作模式輻射至全國各生物醫藥產業園區。
華為云 EI 服務產品部部長尤鵬表示,AI制藥技術使得漫長的「馬拉松」轉向「加速跑」,華為希望以自身數據、算法、算力三方面的積累,以生命谷健康云創新中心為起點,未來服務于全國100+生物醫藥產業基地,推動中國新藥研發高質量高速發展。
在新藥研發領域的歷史性變革中,像華為云這樣的頭部企業,正在對中國 AI 新藥研發事業起到重要的推動作用。在我國生物醫藥產業鏈和產業集聚的形成過程中,「生命谷健康云創新中心」模式也將成為一種值得關注的創新路徑。
最后,當大模型成為全新的風口,我們更需要思考的是,動輒十億、百億參數的大模型能在何種程度上改變社會,實現路徑又是怎樣的。
作為國內率先投入大模型研發及落地的機構,華為云認為,未來的三年將會是大模型是風起云涌的三年,AI 將會和各行各業深度結合,「AI for Industries」將是主要方向。
基于盤古基礎大模型,華為云正在向各行各業提供盤古行業大模型服務,陸續推出了礦山、藥物分子、電力、氣象、海浪等盤古行業大模型,為業界貢獻先進的算法和解決方案。
未來,參照已經實踐的大模型服務模式,華為云希望繼續將最前沿的一批 AI 技術復制到千行百業之中去,推動人工智能開發實現從「作坊式」到「工業化」升級。
*博客內容為網友個人發布,僅代表博主個人觀點,如有侵權請聯系工作人員刪除。







