PRODUCT CLASSIFICATION
產品分類了解蛋白質挑戰的AI解決(jue) 方案
根據一項嚴(yan) 格的獨立研究,在一項重大的科學進步中,DeepMind的AI係統AlphaFold的-新版本已被認為(wei) 是解決(jue) 已有50年曆史的蛋白質結構預測挑戰(通常稱為(wei) “蛋白質折疊問題”)的解決(jue) 方案。評定。從(cong) 長遠來看,這一突破可以大大促進生物學研究,從(cong) 而在疾病理解和藥物發現等領域開辟新的可能性。
CASP14的結果表明,DeepMind的-新AlphaFold係統在結構預測中達到了無與(yu) -倫(lun) 比的準確性。該係統能夠在幾天之內(nei) 確定高精度結構。CASP是蛋白質結構預測的關(guan) 鍵評估,是始於(yu) 1994年的兩(liang) 年一次的社區運行評估,是評估預測技術的金標準。參加者必須盲目地預測剛剛通過實驗確定的蛋白質(或者在某些情況下尚未確定)的蛋白質結構,並等待將其預測與(yu) 實驗數據進行比較。
CASP使用“全-球距離測試(GDT)”度量標準來評估精度,範圍為(wei) 0-100。新的AlphaFold係統在所有目標上的GDT總體(ti) 平均得分為(wei) 92.4。係統的平均誤差約為(wei) 1.6埃,大約是原子的寬度。根據CASP聯合創始人兼主席John Moult教授的說法,大約90 GDT的分數被非正式地認為(wei) 與(yu) 通過實驗方法獲得的結果具有競爭(zheng) 力。
馬裏蘭(lan) 大學CASP聯合創始人兼主席John Moult教授說:“近50年來,我們(men) 一直在解決(jue) 這個(ge) 問題(蛋白質如何折疊)這一問題。親(qin) 身經曆了DeepMind對此的解決(jue) 方案在這個(ge) 問題上停留了這麽(me) 長時間,經過了無數停頓,開始思考我們(men) 是否會(hui) 到達那裏,這是一個(ge) 非常特殊的時刻。”
對現實世界的影響
DeepMind很高興(xing) 能與(yu) 其他人合作,以了解有關(guan) AlphaFold潛力的更多信息,AlphaFold團隊正在研究蛋白質結構預測如何與(yu) 少數專(zhuan) 家小組一起幫助理解某些疾病。
還有跡象表明,作為(wei) 科學界開發的許多工具之一,蛋白質結構預測可能在未來的大流行應對工作中有用。今年早些時候,DeepMind預測了SARS-CoV-2病毒的幾種蛋白質結構,實驗人員令人印象深刻的快速工作現已證實AlphaFold在其預測中達到了很高的準確性。
AlphaFold是DeepMind迄今為(wei) 止重要的改進之一。但是,與(yu) 所有科學研究一樣,還有許多工作要做,包括弄清楚多種蛋白質如何形成複合物,它們(men) 如何與(yu) DNA,RNA或小分子相互作用以及如何確定所有氨基酸側(ce) 鏈的精-確位置。
與(yu) 早期的CASP13 AlphaFold係統一樣,DeepMind計劃在適當的時候向同行評審的期刊提交詳細介紹該係統工作原理的論文,並同時探索如何-好地以可擴展的方式為(wei) 係統提供更廣泛的訪問。
AlphaFold在展示AI作為(wei) 輔助基礎科學發現的工具的驚人潛力方麵開辟了新天地。DeepMind期待與(yu) 他人合作以釋放這種潛力。
諾貝爾獎得主,皇-家學會(hui) 主席Venki Ramakrishnan教授說:“這項計算工作代表了蛋白質折疊問題的驚人進展,蛋白質折疊問題是生物學界50年來的巨大挑戰。它已經發生了數十年,而該領域的許多人將我們(men) 已經預見到了。很高興(xing) 看到它將從(cong) 根本上改變生物學研究的許多方式。”
為(wei) 什麽(me) 蛋白質結構預測很重要
蛋白質對生命至關(guan) 重要,其形狀與(yu) 功能密切相關(guan) 。準確預測蛋白質結構的能力使人們(men) 能夠更好地了解它們(men) 的作用及其運作方式。目前,主數據庫中有超過2億(yi) 種蛋白質,而它們(men) 的3-D結構中隻有一小部分已經被繪製出來。
一個(ge) 主要的挑戰是蛋白質在理論上可以折疊成終的3-D結構之前可以折疊的天文方法。從(cong) 根本上說,社會(hui) 麵臨(lin) 的許多大挑戰,例如開發疾病的治療方法或尋找可分解工業(ye) 廢物的酶,都與(yu) 蛋白質及其作用密切相關(guan) 。確定蛋白質的形狀和功能是科學研究的一個(ge) 主要領域,主要是使用實驗技術,每個(ge) 結構可能要花費數年的艱辛和艱巨的工作,並且需要使用數百萬(wan) 美元的設備。
DeepMind解決(jue) 蛋白質折疊問題的方法
突破性突破是DeepMind在2018年*參加CASP13的基礎上,初的AlphaFold版本在所有參與(yu) 者中都達到了-高的準確性。現在,DeepMind為(wei) CASP14開發了新的深度學習(xi) 體(ti) 係結構,從(cong) 生物學,物理學和機器學習(xi) 領域以及過去半個(ge) 世紀蛋白質折疊領域的許多科學家的工作中汲取了靈感。
折疊的蛋白質可以被認為(wei) 是“空間圖”,其中殘基是結點,邊緣將殘基緊密相連。該圖對於(yu) 理解蛋白質內(nei) 的物理相互作用及其進化曆史非常重要。對於(yu) 在CASP14上使用的-新版本的AlphaFold,DeepMind創建了一個(ge) 基於(yu) 注意力的神經網絡係統,端到端進行了培訓,該係統試圖解釋該圖的結構,同時對所構建的隱式圖進行推理。它使用進化相關(guan) 序列,多序列比對(MSA)和氨基酸殘基對表示來完善此圖。
通過重複此過程,係統可以對蛋白質的潛在物理結構進行強有力的預測。此外,AlphaFold可以使用內(nei) 部置信度量度來預測每個(ge) 預測的蛋白質結構的哪些部分是可靠的。
該係統接受了來自蛋白質數據庫中約170,000種蛋白質結構組成的公開數據的培訓,使用的是現代機器學習(xi) 標準,使用的計算量相對較小-大約運行了128個(ge) TPUv3核(大約相當於(yu) 100-200個(ge) GPU)幾個(ge) 星期。