《自然》重磅!AI顛覆蛋白設(shè)計(jì),開(kāi)發(fā)藥物的新時(shí)代要來(lái)了?
自AlphaFold橫空出世以來(lái),人工智能(AI)已經(jīng)徹底革新了結(jié)構(gòu)生物學(xué)的研究現(xiàn)狀。除了預(yù)測(cè)蛋白質(zhì)結(jié)構(gòu),使用AI進(jìn)行從頭設(shè)計(jì)功能性蛋白質(zhì)分子亦已成為現(xiàn)實(shí)。今日,人工設(shè)計(jì)蛋白領(lǐng)域先驅(qū)David Baker教授在《自然》發(fā)布最新論文,其團(tuán)隊(duì)所開(kāi)發(fā)出的AI軟件RFdiffusion能夠突破既往諸多蛋白質(zhì)設(shè)計(jì)限制,可根據(jù)需要“定制化”設(shè)計(jì)出包含高階對(duì)稱(chēng)結(jié)構(gòu)等以往無(wú)法通過(guò)AI設(shè)計(jì)的蛋白質(zhì)。《自然》新聞稿指出,此AI模型可按需設(shè)計(jì)生物分子,將可能帶來(lái)變革性疫苗和藥物開(kāi)發(fā)的下一個(gè)時(shí)代。
(資料圖片)
過(guò)往蛋白質(zhì)設(shè)計(jì)的限制
在AI時(shí)代來(lái)臨前,蛋白質(zhì)的設(shè)計(jì)主要是通過(guò)組合許多已知蛋白質(zhì)的功能性結(jié)構(gòu),例如酶蛋白的口袋所進(jìn)行。這種方式需要對(duì)蛋白如何折疊及其工作方式有清楚的了解,并需經(jīng)過(guò)多次反復(fù)的試驗(yàn)確認(rèn),科學(xué)家有時(shí)甚至需在篩選數(shù)千種設(shè)計(jì)后才能識(shí)別可能符合條件的蛋白分子。
然而類(lèi)似于AlphaFold這類(lèi)基于AI蛋白結(jié)構(gòu)預(yù)測(cè)模型的開(kāi)發(fā)打破了此一限制,科學(xué)家可以?xún)H通過(guò)氨基酸序列來(lái)預(yù)測(cè)蛋白結(jié)構(gòu),并據(jù)此從頭設(shè)計(jì)新的蛋白分子。其中一種方法是基于“幻想”(hallucination),即通過(guò)隨機(jī)建立氨基酸序列,然后經(jīng)由AlphaFold或RoseTTAFold等AI模型優(yōu)化,直至模型中的神經(jīng)網(wǎng)絡(luò)顯示其可能折疊成一特定的結(jié)構(gòu)。
而另一個(gè)方法為“修復(fù)”(inpainting),即通過(guò)獲取一個(gè)蛋白質(zhì)序列或結(jié)構(gòu)的指定片段,并使用AI模型構(gòu)建分子周?chē)钠溆嗖糠帧H欢鵁o(wú)論是基于“幻想”或“修復(fù)”模型設(shè)計(jì)出的蛋白質(zhì),能夠在實(shí)驗(yàn)室中被制造、純化出具功能性蛋白質(zhì)的概率皆不高。此外,基于“幻想”的模型多僅可用于設(shè)計(jì)小型蛋白質(zhì),而在使用“修復(fù)”模型時(shí)則需要輸入一長(zhǎng)串指定片段才能形成可能的蛋白質(zhì)。
基于能產(chǎn)生真實(shí)圖片的生成式神經(jīng)網(wǎng)絡(luò)模型來(lái)設(shè)計(jì)蛋白
為突破這些限制,科學(xué)家將像是Stable Diffusion、DALL-E和Midjourney等能產(chǎn)生真實(shí)圖片的神經(jīng)網(wǎng)絡(luò)AI模型融入蛋白設(shè)計(jì)當(dāng)中。這類(lèi)模型被稱(chēng)之為去噪擴(kuò)散概率模型(DDPMs)。Baker教授團(tuán)隊(duì)將之與RoseTTAFold結(jié)合而產(chǎn)生新的RFdiffusion模型,并以?xún)?chǔ)存于蛋白數(shù)據(jù)庫(kù)(PDB)中大量的真實(shí)蛋白質(zhì)圖像加以訓(xùn)練。在生成全新蛋白質(zhì)時(shí),RFdiffusion一開(kāi)始會(huì)產(chǎn)生許多“噪音”,即許多隨機(jī)氨基酸分類(lèi),所生成的蛋白與原起始的蛋白結(jié)構(gòu)相異,然后再通過(guò)漸進(jìn)式的“去噪”過(guò)程,便產(chǎn)生類(lèi)似于真實(shí)但全新的蛋白質(zhì)。
當(dāng)Baker團(tuán)隊(duì)在除了蛋白質(zhì)長(zhǎng)度之外沒(méi)有提供任何指示的情況下測(cè)試RFdiffusion時(shí),該網(wǎng)絡(luò)產(chǎn)生了多樣化的、外觀逼真的蛋白質(zhì),與PDB中訓(xùn)練的蛋白質(zhì)都不相同。但研究人員亦可在“去噪”過(guò)程給予模型蛋白的生成條件以使之產(chǎn)生包括特定折疊,或能與另一分子表面結(jié)合的蛋白質(zhì)。通過(guò)RFdiffusion所設(shè)計(jì)出蛋白質(zhì)結(jié)構(gòu)的準(zhǔn)確性也經(jīng)過(guò)實(shí)驗(yàn)驗(yàn)證。在論文當(dāng)中,一個(gè)通過(guò)RFdiffusion設(shè)計(jì)可與流感血凝素復(fù)合物結(jié)合的粘合劑,其冷凍電鏡結(jié)構(gòu)(cryo-EM)與設(shè)計(jì)模型幾乎完全相同。
根據(jù)華盛頓大學(xué)官網(wǎng),RFdiffusion模型勝過(guò)現(xiàn)有許多蛋白質(zhì)設(shè)計(jì)方法,包含蛋白質(zhì)結(jié)合劑設(shè)計(jì)、對(duì)稱(chēng)寡聚物設(shè)計(jì)、酶活性位點(diǎn)支架,以及用于治療和金屬結(jié)合蛋白質(zhì)設(shè)計(jì)的對(duì)稱(chēng)基序支架設(shè)計(jì)等。
目前為止,Baker團(tuán)隊(duì)已利用RFdiffusion制造出了與癌癥、自身免疫疾病和其他病癥有關(guān)的蛋白質(zhì)強(qiáng)烈結(jié)合的蛋白質(zhì)。其中所設(shè)計(jì)出一強(qiáng)有力的結(jié)合劑能夠與難以靶向的免疫信號(hào)分子——腫瘤壞死因子受體相結(jié)合(數(shù)據(jù)尚未發(fā)表)。此外,該團(tuán)隊(duì)也通過(guò)RFdiffusion設(shè)計(jì)出包含p53蛋白關(guān)鍵序列的蛋白,當(dāng)將95種所設(shè)計(jì)的蛋白在實(shí)驗(yàn)室純化出來(lái)時(shí),有超過(guò)半數(shù)所設(shè)計(jì)的蛋白能與MDM2蛋白(p53蛋白的天然靶標(biāo))相結(jié)合,其中一個(gè)所設(shè)計(jì)出的蛋白質(zhì)與MDM2的結(jié)合強(qiáng)度甚至超過(guò)天然p53蛋白質(zhì)約1000倍。當(dāng)研究人員試著用基于“幻想”的AI模型進(jìn)行類(lèi)似實(shí)驗(yàn)時(shí)發(fā)現(xiàn),其所設(shè)計(jì)出的蛋白質(zhì)與MDM2結(jié)合的能力無(wú)法在實(shí)驗(yàn)中被驗(yàn)證。Baker教授稱(chēng)有10-20%由RFdiffusion設(shè)計(jì)的蛋白與他們預(yù)期靶標(biāo)結(jié)合的強(qiáng)度足以有用,而此數(shù)值在早期、AI前的方法只有不到1%。
華盛頓大學(xué)的計(jì)算機(jī)生化學(xué)家,也是RFdiffusion的共同開(kāi)發(fā)者Joe Watson博士說(shuō):“RFdiffusion正在拓寬我們可以制造結(jié)合劑蛋白質(zhì)的能力,并可開(kāi)發(fā)出有意義的療法?!?/p>
未來(lái)的挑戰(zhàn)
雖然RFdiffusion模型的開(kāi)發(fā)將從頭設(shè)計(jì)蛋白質(zhì)領(lǐng)域又往前推進(jìn)了一步,但在距離開(kāi)發(fā)有效療法的道路上仍有許多關(guān)卡需要克服。其中一項(xiàng)便是利用該模型設(shè)計(jì)更復(fù)雜的結(jié)合蛋白,如抗體或T細(xì)胞使用的蛋白受體,這些蛋白質(zhì)具有與其靶標(biāo)互鎖的柔性環(huán)結(jié)構(gòu)。目前RFdiffusion所設(shè)計(jì)出的蛋白結(jié)合劑皆為扁平界面。然而B(niǎo)aker教授表示他們已取得抗體蛋白設(shè)計(jì)的部分進(jìn)展。此外,除了與靶標(biāo)蛋白結(jié)合,治療用的蛋白質(zhì)還需具備不與其他蛋白結(jié)合的專(zhuān)一性,以及具可大量生產(chǎn)的特性,這些不同的標(biāo)準(zhǔn)是未來(lái)開(kāi)發(fā)蛋白設(shè)計(jì)工具時(shí)所需納入考量的。
而這類(lèi)基于擴(kuò)散模型的AI蛋白設(shè)計(jì)的另一個(gè)局限是它們無(wú)法制造出與天然蛋白質(zhì)有巨大差異的蛋白質(zhì)。這是由于AI系統(tǒng)只接受現(xiàn)有蛋白質(zhì)圖像的訓(xùn)練,因此傾向于制造類(lèi)似結(jié)構(gòu)的蛋白質(zhì)。此外,研究人員亦正在探索是否可使用通俗易懂的語(yǔ)言文本描述來(lái)設(shè)計(jì)蛋白質(zhì),類(lèi)似于喂給Midjourney等圖像生成工具的提示。Watson博士說(shuō):“你可以想象,我們將能夠?qū)懗鲆环N蛋白質(zhì)的描述,讓它們合成并進(jìn)行測(cè)試?!?/p>
華盛頓大學(xué)蛋白設(shè)計(jì)研究所首席戰(zhàn)略及運(yùn)營(yíng)官Lance Stewart博士在今年的藥明康德全球論壇中指出,自從10年前與蛋白設(shè)計(jì)領(lǐng)域先驅(qū)David Baker教授相識(shí)后,人工智能在預(yù)測(cè)蛋白結(jié)構(gòu)、設(shè)計(jì)蛋白藥物等方面取得了很大進(jìn)步。雖然仍有許多挑戰(zhàn)需克服,今日的論文無(wú)疑進(jìn)一步擴(kuò)展了人工智能設(shè)計(jì)蛋白質(zhì)的策略,讓靶向更多靶點(diǎn)成為可能。讓我們期待這些蛋白設(shè)計(jì)上的進(jìn)步能早日轉(zhuǎn)化成為治療疾病的新藥好藥,為更多患者造福。
本文來(lái)源:藥明康德,原文標(biāo)題:《《自然》重磅!顛覆蛋白設(shè)計(jì),開(kāi)發(fā)藥物的新時(shí)代要來(lái)了?》
風(fēng)險(xiǎn)提示及免責(zé)條款 市場(chǎng)有風(fēng)險(xiǎn),投資需謹(jǐn)慎。本文不構(gòu)成個(gè)人投資建議,也未考慮到個(gè)別用戶(hù)特殊的投資目標(biāo)、財(cái)務(wù)狀況或需要。用戶(hù)應(yīng)考慮本文中的任何意見(jiàn)、觀點(diǎn)或結(jié)論是否符合其特定狀況。據(jù)此投資,責(zé)任自負(fù)。關(guān)鍵詞: