基于人工智能(AI)的蛋白質(zhì)結(jié)構(gòu)預(yù)測(cè)工具集
王建民
蛋白質(zhì)折疊包括在空間中重新排列線性氨基酸序列,使它們處于低能狀態(tài)。僅根據(jù)氨基酸序列預(yù)測(cè)正確的三維結(jié)構(gòu)是非常困難的,因?yàn)殡逆I的自由組合會(huì)產(chǎn)生大量的可能性:即使一個(gè)小的蛋白質(zhì)被順序采樣,也需要比宇宙年齡更長(zhǎng)的時(shí)間,所以預(yù)測(cè)是經(jīng)過(guò)計(jì)算的,以避免順序采樣的問(wèn)題。在過(guò)去的40年中,計(jì)算和預(yù)測(cè)不斷改進(jìn),通過(guò)X射線晶體學(xué)、核磁共振波譜和冷凍電鏡實(shí)驗(yàn)確定了蛋白質(zhì)結(jié)構(gòu)序列的同源性。自1994年以來(lái),通過(guò)將計(jì)算和預(yù)測(cè)方法應(yīng)用于新分析的蛋白質(zhì)結(jié)構(gòu),每?jī)赡陮?duì)其性能進(jìn)行一次評(píng)估。三年前,AlphaFold的首次實(shí)現(xiàn)是應(yīng)用人工智能分析蛋白質(zhì)結(jié)構(gòu)的革命性進(jìn)展。2020年,重新設(shè)計(jì)的AlphaFold幾乎完美準(zhǔn)確地預(yù)測(cè)了蛋白質(zhì)的三維結(jié)構(gòu),其預(yù)測(cè)水平與實(shí)驗(yàn)室?guī)缀醭制?,解決了困擾學(xué)術(shù)界50年的“蛋白質(zhì)折疊”難題。DeepMind團(tuán)隊(duì)提出了一種名為AlphaFold 2的計(jì)算方法,即使不知道相似的結(jié)構(gòu),也能以原子精度有規(guī)律地預(yù)測(cè)蛋白質(zhì)結(jié)構(gòu)。2021年7月15日,DeepMind團(tuán)隊(duì)在《自然》雜志上發(fā)表了一篇文章& # 34;使用AlphaFold進(jìn)行高度精確的蛋白質(zhì)結(jié)構(gòu)預(yù)測(cè)& # 34;,描述了AlphaFold2是基于神經(jīng)網(wǎng)絡(luò)新設(shè)計(jì)的AlphaFold版本,其預(yù)測(cè)的蛋白質(zhì)結(jié)構(gòu)可以達(dá)到原子級(jí)精度。2021年7月15日,華盛頓大學(xué)蛋白質(zhì)設(shè)計(jì)研究所David Baker教授的研究小組和其他合作機(jī)構(gòu)在Science上發(fā)表了一篇論文& # 34;使用三軌道神經(jīng)網(wǎng)絡(luò)精確預(yù)測(cè)蛋白質(zhì)結(jié)構(gòu)和相互作用& # 34;,并發(fā)表了其開(kāi)源蛋白質(zhì)預(yù)測(cè)工具RoseTTAFold的研究成果。
AlphaFold2和RoseTTAFold等數(shù)據(jù)以及人工智能驅(qū)動(dòng)的蛋白質(zhì)折疊預(yù)測(cè)工具,為大分子結(jié)構(gòu)預(yù)測(cè)和設(shè)計(jì)提供了強(qiáng)大的驅(qū)動(dòng)力。本文旨在總結(jié)相關(guān)工具。
https://github.com/sacdallago/folding_tools