今年5月發(fā)布業(yè)界首個2000億參數(shù)中文預訓練語言模型——鵬程.盤古之后,鵬城實驗室在Huawei Connect 2021又發(fā)布新成果——鵬程.神農(nóng)平臺,一個面向生物醫(yī)學領域的人工智能平臺。
AI正在加速向各行各業(yè)滲透,用全新的模式破解傳統(tǒng)產(chǎn)業(yè)的痛點。醫(yī)藥領域多年來一直存在著“雙十魔咒”,即十年的研發(fā)周期,十億美元的投入,但最終未必是一定能有完美的研發(fā)結(jié)果。鵬程.神農(nóng)平臺的落地,有望助力醫(yī)藥行業(yè)告別“十年磨一劍”的制藥模式,開啟“AI+制藥”時代。
“雙十魔咒”有解了
抗生素是人類歷史上的重大發(fā)現(xiàn),不僅大大提升了人們的抗病能力,也讓人類的壽命延長了數(shù)十年。
但是,隨著抗生素的廣泛使用甚至濫用,目前細菌對抗生素的耐藥性問題已十分嚴重,抗生素耐藥性正在對全球健康構(gòu)成威脅。因此,發(fā)展新型抗生素勢在必行。基于不同機制的新型抗生素正處于研發(fā)的不同階段。另外,由于生物技術(shù)的迅猛發(fā)展,促進了抗體藥物的發(fā)展,抗菌多肽類藥物成為抗生素領域的新生力量。
根據(jù)世界衛(wèi)生組織近日發(fā)布的一份報告,盡管人們越來越意識到抗生素耐藥性的迫切威脅,但世界仍未能開發(fā)出急需的新型抗菌治療方法。世衛(wèi)組織助理總干事哈南·巴爾基(Hanan Balkhy)表示:“開發(fā)、生產(chǎn)和分配有效的新抗生素的持續(xù)失敗進一步加劇了抗生素耐藥性的影響,并威脅我們成功治療細菌感染的能力。”
抗菌肽具有廣譜抗菌活性,對細菌有很強的殺傷作用,并且某些抗菌肽對部分病毒、真菌、原蟲和癌細胞等有殺滅作用,甚至能提高免疫力、加速傷口愈合過程,在醫(yī)學上有非常好的應用前景。
但是抗菌肽的研究進展并不快。世界上第一個抗菌肽是1980年被發(fā)現(xiàn)的,此后人們相繼從細菌、真菌、兩棲類、昆蟲、高等植物、哺乳動物乃至人類中發(fā)現(xiàn)并分離獲得具有抗菌活性的多肽。但是這樣的研究過程很慢,效率低下。人類利用自然合成的方法在40年間僅僅發(fā)現(xiàn)了4000多種候選抗菌肽。
廣闊的應用前景與傳統(tǒng)的研究方法之間的矛盾,因技術(shù)的進步看到了新機遇。
抗菌肽分子量在2000~7000左右,由20~60個氨基酸殘基組成。今天,借助鵬程.神農(nóng)平臺強大的序列生成能力,結(jié)合現(xiàn)有的抗菌肽數(shù)據(jù)集,可以在很短的時間內(nèi)生產(chǎn)數(shù)萬種候選肽的氨基酸序列,而且經(jīng)過篩選的高價值的潛在序列,提高生成準確率,再經(jīng)過生物實驗室和臨床驗證,極大加速了新型抗菌肽的發(fā)現(xiàn)過程。
行業(yè)迭代,AI+成制藥行業(yè)新動能
中國古代神話傳說中的神農(nóng)是通過嘗遍百草了解每一種植物的藥性,“嘗”百草是古代探索藥性的基本方法,無論是中國歷史上的神醫(yī)藥圣李時珍用畢生精力撰寫的《本草綱目》,還是藥王孫思邈《千金要方》中記錄的藥草、藥方,都是通過傳統(tǒng)的方式一點點試出來的。也正是因為方法受限,醫(yī)藥的進步也很緩慢。
發(fā)展到現(xiàn)代制藥產(chǎn)業(yè),包括資金、技術(shù)、經(jīng)驗等各方面的條件都在不斷提升,但制藥依然是一個成本高、投資大、風險高的行業(yè)。行業(yè)內(nèi)有一個共識,新藥研發(fā)是一場九死一生的冒險,新藥研發(fā)成本都在10億上,研發(fā)周期一般是10-12年,臨床失敗率高達95%。比如人類對艾滋病、阿爾茨海默、癌癥等病一直無解,無數(shù)藥企、研究機構(gòu)投入重金研發(fā),但至今這些病還都沒有研發(fā)出特效藥。2020年初,突然爆發(fā)的新冠疫情給席卷全球,多項研究遭到擱置,這對許多研制新藥的企業(yè)而言無異于雪上加霜。
全球生物醫(yī)藥規(guī)模持續(xù)增長,但是醫(yī)藥研發(fā)的效率不斷下降,研發(fā)一款新藥投入的成本和時間越來越呈指數(shù)級的增長。以德勤公司發(fā)布的研究報告顯示,藥物開發(fā)的投資回報率從2010年的10%穩(wěn)步下降至2018年的2%左右。
這一點在抗生素藥物的研發(fā)上更為明顯。世衛(wèi)組織的報告指出,雖然有一些前景不錯處于不同開發(fā)階段的產(chǎn)品,但是由于藥物開發(fā)過程中巨大的經(jīng)濟成本和內(nèi)在的科學挑戰(zhàn),這些產(chǎn)品中只有一小部分會最終進入市場。再加上成功的抗生素產(chǎn)品能帶來的投資回報少,導致主要私營投資者和大多數(shù)大型制藥公司的積極性不高。
報告證實,新抗生素的臨床前和臨床開發(fā)繼續(xù)由中小型公司推動。這些企業(yè)通常在臨床開發(fā)的后期或直到獲得監(jiān)管機構(gòu)批準之前,都難以為其產(chǎn)品融資。
從上個世紀80年代開始,制藥行業(yè)就開始利用計算機來輔助藥物的研發(fā)。但是依然不能滿足人類發(fā)展對于新藥的迫切需求。就以去年爆發(fā)的新冠疫情來看,無論是治療藥物還是疫苗,都非常急切。在此背景下,“AI制藥”也逐漸成為了當前藥學研究和前沿醫(yī)學創(chuàng)業(yè)的新發(fā)展熱點。
鵬程.神農(nóng)平臺是面向醫(yī)藥領域的一個新成果,包含蛋白質(zhì)結(jié)構(gòu)預測、小分子生成、靶點與小分子相互作用預測以及新抗菌多肽設計與效果評價等模塊。基于神農(nóng)平臺,各藥廠、機構(gòu)可以做一系列的開發(fā)研究,通過蛋白質(zhì)生成模型加速推理和生成氨基酸序列,并可開展更多生物研究科研任務。
以新型抗菌肽項目來看,基于已知抗菌肽結(jié)構(gòu),解密與掌握多肽類氨基酸序列規(guī)律,采用AI方式設計目標新型肽鏈,提高搜索空間和生成效率。神農(nóng)平臺可加速新型抗菌肽發(fā)現(xiàn),這使得抗菌肽有望成為新一代“抗生素”。
傳統(tǒng)制藥行業(yè)之所以存在“雙十魔咒”,主要還是過于依賴專家的經(jīng)驗。AI+制藥,則是將人類的經(jīng)驗與計算機強大的算力結(jié)合。
鵬城可期,加速AI在行業(yè)應用中落地
人工智能正從單點技術(shù)走向真正的通用技術(shù),AI的通用性、泛化能力以及性能,決定AI在各行各業(yè)的就應用價值以及發(fā)展速度。以前,行業(yè)AI多局限于單點技術(shù),應用落地依賴工程師的開發(fā)能力以及專業(yè)人員的經(jīng)驗,AI應用呈現(xiàn)出碎片化,成本高、落地慢等痛點。而鵬程.盤古大模型、鵬程.神農(nóng)平臺具備很強的泛化能力,通過與行業(yè)知識結(jié)合,少量樣本也能達到高精度,基于預訓練+下游微調(diào)的工業(yè)化AI開發(fā)模式,這無疑將大大加速AI在行業(yè)應用中的落地。
以鵬程.盤古大模型為例,作為業(yè)界首個 2000 億參數(shù)中文預訓練語言模型,預訓練階段學習了40TB中文文本數(shù)據(jù),是最接近人類中文理解能力的AI大模型。盤古NLP大模型具備廣泛的運用場景,在知識問答、知識檢索、知識推理、閱讀理解等文本生成領域表現(xiàn)突出。未來金融領域,可以輔助識別企業(yè)風險,助力企業(yè)盡調(diào)和項目審核;在醫(yī)療方面,其強大的信息抽取能力,可以幫助科研人員和醫(yī)生從海量文獻中快速提取關鍵知識。
無論是鵬程.盤古大模型還是鵬程.神農(nóng)平臺,背后離不開AI平臺的支撐。
昇騰AI基礎軟硬件平臺,包括昇騰處理器、Atlas系列硬件、異構(gòu)計算架構(gòu)CANN和AI框架昇思MindSpore等。其中,CANN是針對AI場景推出的異構(gòu)計算架構(gòu),通過軟硬件的協(xié)同優(yōu)化,親和昇騰AI的圖編譯技術(shù),持續(xù)擴充高性能算子庫,來釋放昇騰AI硬件的強大性能,極大提升應用可獲得算力。昇思MindSpore是面向萬物智能時代覆蓋端、邊、云的全場景AI框架,為開發(fā)者提供了友好設計、高效運行、簡捷部署的開發(fā)體驗。昇騰AI基礎軟硬件平臺,除了底層硬件本身自帶的強大AI計算性能,全棧化的整合更能在開發(fā)層面最大程度發(fā)揮出硬件最佳性能,從而降低AI應用開發(fā)門檻,最終加速AI向場景滲透的產(chǎn)業(yè)進程。
而基于昇騰AI基礎軟硬件搭建而成的“鵬城云腦Ⅱ”主要提供人工智能研究必須的計算力資源、存儲資源、網(wǎng)絡資源、數(shù)據(jù)資源和研究環(huán)境,覆蓋人工智能基礎研究、重大應用、操作系統(tǒng)、數(shù)據(jù)資源共享、產(chǎn)業(yè)服務等專門研究實驗領域。國際超算大會(ISC21)最新一期IO500排行榜上, “鵬城云腦II”蟬聯(lián)全系統(tǒng)輸入輸出和10節(jié)點規(guī)模系統(tǒng)兩項世界冠軍,再次刷新世界紀錄。特別值得一提的是,“鵬城云腦II”在全系統(tǒng)輸入輸出性能角度的得分是第二名的近20倍,呈現(xiàn)碾壓優(yōu)勢。如此強大的“鵬城云腦II”成為大模型研發(fā)的肥沃土地,土地越肥沃,生長出來的花花草草也就越茂盛。
當然,花草長得是否種類繁多,更重要的就是要依靠生態(tài)。此前,鵬程.盤古的模型、代碼、數(shù)據(jù)集在 OpenI 啟智社區(qū)全面開源、開放,吸引更多行業(yè)的開發(fā)者共同參與,針對不同場景創(chuàng)新應用,已經(jīng)在一些行業(yè)開花結(jié)果。
【結(jié)束語】
從0到1難,給1后面再加0就相對快得多。鵬程.盤古大模型和鵬程·神農(nóng)平臺干的都是從0到1的事,當相于給AI造好了輪子。輪子造好了,行業(yè)應用也就會越跑越快。
請登錄以參與評論
現(xiàn)在登錄