開發與維運

1.3W分子中找出38個潛在藥物,阿里雲超算把時間縮短了75%

新型冠狀病毒的爆發,猛然將全國醫療機構拽進了一場與病毒賽跑的戰役當中。

病毒傳播速度駭人,用藥需求迫切。各醫藥研究機構都想方設法利用最先進的技術,最大化縮短研發週期,加速有效藥物投入使用。

以計算驅動創新的藥物研發科技企業晶泰科技也於1月20日迅速成立研究小組,調集雲端算力,對病毒感染宿主機理提供分子層面的研究,建立病毒關鍵蛋白與人體配體結合區域的三維模型,預測病毒可能出現的強傳染力突變,還從已上市藥物中篩選可能具有抗新冠病毒活性的藥物,並將大量計算數據、模型與成果公開與同行分享,為疾病防治及藥物研發提供支持。

最新的好消息是,抗瘧疾藥磷酸氯喹可能成為新冠肺炎的破局之藥。

該藥物在臨床試驗中被證實對新型冠狀病毒肺炎(COVID-19)具有良好的治療效果,但其治療機理和分子機制尚不清晰。

晶泰科技對氯喹可能的作用機制進行分子動力學模擬,驗證了該藥物對病毒的一種作用機制,並發現其新的潛在治療機理,為抗疫藥品開發與優化提供研究基礎與科學參考。目前,晶泰科技正與眾生藥業合作,推進體外實驗驗證。

在本次抗冠藥物研發中,阿里雲在晶泰科技背後提供了大量的免費算力支持。每一次的分子動力學模擬背後,都離不開高性能計算。

阿里雲免費開放算力,加速新冠藥物研發

高性能計算(High Performance Computing,簡稱HPC),常被稱為“超算”,是當代虛擬藥物研發的重要支撐。

以老藥新用為例。從已有的藥物裡面,找到能治療新冠的藥是最快的方式。若研製新藥,則會涉及到後續的大量臨床實驗和藥監局審批,遠水救不了近火。

image.png

要找到阻礙病毒的正常活動的化合物,以往的方法是通過大量實驗做篩選,費時又費力。如今,科學家嘗試通過機器模擬分子化合物與靶點的相互作用,從而篩選出可能有效的化合物做實驗,從而擴大搜索範圍,提高篩選針對性,節約研發時間,將有限的實驗資源應用到最有可能成功的候選藥物上。

首先要了解靶點與化合物作用的意義,如能找到干擾病毒複製的化合物(藥物),就能抑制病毒對機體的傷害。

比如,病毒蛋白在合成過程中,需要蛋白酶的介入,如3CLpro蛋白酶和PLpro蛋白酶,抑制蛋白酶的功能就是抑制病毒的方法之一。

病毒體內能夠被其它物質識別或結合的結構,被稱為靶點(Biological Target)。如果找到能夠與這個靶點結合的小分子藥物,就能阻礙蛋白酶水解酶前體多聚蛋白,無法釋放病毒RNA複製所需的聚合酶與解螺旋酶,進而改變其功能,阻礙病毒蛋白合成,導致病毒無法複製,實現抑制病毒複製的效果。

晶泰科技通過藥物模擬算法,從2900個已批准上市藥物與10000箇中藥分子中找到183個有潛在抑制新冠病毒3CLpro和PLpro靶點的藥物,又經過高精度篩選,用分子動力學方法精確模擬計算藥物化合物與病毒靶點間的親和力,將這一列表縮小到38個藥物,這一系列預測需要完成大量高精度的計算。

image.png

如此級別的高精度計算,所需要耗費的計算資源超乎想象。若用一臺電腦(1張GPU卡),一天只能完成8-10個分子的計算模擬,至少幾十天才能完成一次篩選。

晶泰科技在雲計算的幫助下,將這一過程從一個多月縮短到了一週,從而節約了寶貴的研發時間,將藥物體外實驗的進程大大提前。於此可見大算力的重要性,雲端高性能計算為能相關場景提供大規模算力。

疫情的肆虐使得算力供不應求,為了抗擊疫情,1月29日,阿里雲宣佈向全球公共科研機構免費開放高性能計算平臺、CPU/GPU集群及AI算力。

阿里雲陸續支持了超過10家一線抗疫科研機構,涵蓋了藥物研發、CT醫學圖像AI診斷等抗疫一線急需解決的問題,晶泰科技亦是其中一家獲支持機構。

研究氯喹的作用前,晶泰科技就利用雲計算完成了部分研究:從分子層面理解病毒感染機理,判定出未來同類病毒的人際傳播風險;通過高精度計算,預測病毒及其突變對傳染性和致病性的影響;獲得阿里雲高性能計算平臺提供的公益算力後,晶泰科技北京人工智能藥物研發中心很快完成針對全球已上市藥物小分子及中藥分子的老藥新用篩選,目前正在進行實驗驗證,並繼續支持廣譜抗冠狀病毒新藥的研究。

利用自動伸縮,節省成本與運維工作量

晶泰科技在本次疫情中與阿里雲合作流暢,推進迅速,得益於此前持續合作建立的基礎。

晶泰科技從成立伊始就對雲情有獨鍾,源於其在藥物發現、開發中用量子物理、人工智能對藥物關鍵性質進行模擬的商業場景,對高性能計算算力的需求有時間不定期、規模不定量的特點。

若購買了固定的算力,波谷時期意味著企業成本浪費;而在疫情這般非常時期,藥物研究是一場與時間的賽跑,固定算力的天花板也會限制科學家的研究效率。

雲超算的彈性與此不謀而合。去年春天,晶泰科技已開始對阿里雲超算平臺進行測試使用,它可以根據自身需求隨用隨買,不過晶泰科技時大時小的算力需求,若人肉運維依然繁瑣。

為此,阿里雲超算的技術人員開發了基於HPC作業負載的自動伸縮服務,可根據集群調度器中作業負載情況,自行幫助晶泰科技進行計算節點的申請和釋放,調整硬件計算資源,幫助用戶優化資源成本。

比如,當集群中沒有排隊作業,但仍有空閒節點時,自動伸縮將會放空閒節點,從而降低節點空置率。反之則根據調度器中排隊作業的資源需求,按預先設定的策略自動擴容。

為了加快擴容時的軟件部署,阿里雲超算還上線自定義鏡像功能,將擴容時間壓縮到1分鐘左右。

跨機房調度算力,縮短藥物研發時間

高度波動的算力需求,也給庫存與機型的調度帶來挑戰。

一般情況下,高性能計算集群節點都位於同一數據中心內,而晶泰科技的研究,經常需要建立大規模的GPU集群,其GPU需求量一旦觸及波峰,時而面臨單個數據中心無法滿足的情況,這限制了其藥物研發時間。

於是,阿里雲超算團隊的工程師實現了基礎設施的互通,為晶泰科技設計了跨數據中心的資源調度方案,實現快速響應晶泰科技的機型供給需求,即使在算力緊張時也能幫助科學家大大縮短計算時間,加快藥物研究。

優化軟件環境,提高運算性能

在生物製藥行業,Gromacs是分子動力學模擬(Molecular Dynamic Simulation)常用到的開源軟件,在本次新冠病毒研究中,自然是必不可少的利器。

阿里雲超算平臺早先便對Gromacs做了集成,提供多節點並行和GPU加速等多個軟件版本,用戶只需通過簡單的勾選操作,就可以輕鬆完成Gromacs在雲超算集群上的快速部署。

阿里雲還可以根據客戶Gromacs軟件的使用情況,通過針對性的軟件調優,來進一步加速分子動力學模擬計算過程。

從軟件底層數學庫、多節點並行通訊庫,進程/線程配比及計算任務分配等多個角度進行調優,阿里雲超算團隊可以通過有效加速Gromacs軟件計算過程,實現20%的性能提升。目前,阿里雲正與晶泰科技進行溝通,確定在指定算例上分別加速Gromacs CPU版本和GPU版本的性能調優目標,在下一階段的藥物研究中進一步為其加速。

此外,晶泰科技還應用了容器Docker技術,將晶泰科技內部的軟件和算法包裝到docker裡面,一般的高性能計算很少使用。

阿里雲超算則配備了高性能容器應用服務,晶泰科技只需要打包好需要容器應用,上傳到阿里雲容器鏡像庫裡,即可就輕鬆直接部署在集群中,節省了相關環境改造工作。

新冠疫情仍未過去,跟病毒的戰爭仍在繼續。如今,晶泰科技正加速推進體外實驗驗證,阿里雲的工程師們正連軸轉支持著各醫療機構的藥物研發,可喜的是,階段性進展次第公佈,相信未來能聽到更多的好消息。

智能防控總決戰,大AI無疆快診斷,阿里雲在線分享“人工智能助力疫情防控——新冠肺炎AI輔診平臺全面開放”,“阿里雲暖春行動”在線課堂請點擊查看

如需瞭解更多,也可以發郵件到[email protected]

本文來源:醫谷微信公眾號

Leave a Reply

Your email address will not be published. Required fields are marked *