機器之心報道
編輯:陳萍、小舟、澤南
科學界已知的幾乎所有蛋白質結構,都在這里了。
蛋白質是生命的基礎構件,它們由氨基酸鏈組成,折疊成不同的復雜形狀。蛋白質的功能通常由其 3D 結構決定。如果我們了解蛋白質的折疊方式,就可以開始探索它們是如何工作的,并嘗試改變它們的功能。盡管 DNA 提供了制造氨基酸鏈的指令,但預測它們如何相互作用以形成蛋白質的 3D 結構是一個巨大的挑戰。
一年前,DeepMind 發布了 AlphaFold2,以原子水平的準確度預測了 2/3 的蛋白質結構,并與 EMBL-EBI 共同發布了開放可搜索的蛋白質結構數據庫 AlphaFold DB,與世界共同分享這一技術。
7 月 28 日,DeepMind 宣布 AlphaFold DB 已從 100 萬個結構擴展到超過 2 億個結構,擴大超過 200 倍,這一進展將極大地提升人們對于生物學的理解。
幾乎涵蓋所有已知蛋白質
「你可以認為它基本涵蓋了所有蛋白質結構。包括植物、細菌、動物和許多其他生物的預測結構,這為 AlphaFold 開辟了巨大的新機會,可以對環保、糧食安全和被忽視疾病等重要問題產生影響,」DeepMind 創始人、首席執行官杰米斯 · 哈薩比斯在介紹 AlphaFold DB 這次擴展時說道。

這一更新包括植物、細菌、動物和其他生物的蛋白質預測結構。

這一更新意味著蛋白質數據庫 UniProt 都將帶有蛋白質預測結構(UniProt 是一個全面的,高質量的,免費使用的蛋白質序列與功能信息數據庫,它還包含了大量來自研究文獻的關于蛋白的生物學功能信息)。研究者可以通過 Google Cloud Public Datasets 批量下載,讓世界各地的科學家更容易訪問 AlphaFold。
斯克里普斯轉化研究所創始人 Eric Topol 表示:「AlphaFold 是生命科學領域獨一無二的重大進步,展示了 AI 的力量。過去確定蛋白質的 3D 結構需要數月或數年,現在只需幾秒鐘。AlphaFold 已經加速并實現了大規模發現,包括破解核孔復合體的結構。新的蛋白質結構不斷增加,幾乎照亮了整個蛋白質宇宙,我們可以期待每天都有更多的生物謎團被解開。」
AlphaFold 的影響
自發布至今,AlphaFold 已產生令人難以置信的影響。它是 DeepMind 構建的最復雜的人工智能系統,需要多項關鍵創新,并已應用到多種下游任務中。
AlphaFold2 可以在原子精度上準確地預測蛋白質的結構,它不僅為生物學中 50 年來的重大挑戰提供了解決方案,也證明了:人工智能可以極大地加速科學發現,進而推動人類進步,這一點意義重大。
DeepMind 已經開源了 AlphaFold 的代碼,并在《自然》雜志上發表了兩篇深度論文,引用量已超過 4000。此外,DeepMind 還與 EMBL-EBI 合作設計了一種幫助生物學家使用 AlphaFold 的工具,并共同發布了 AlphaFold DB。
在發布 AlphaFold 之前,DeepMind 征求了 30 多名生物學研究專家的意見,使得他們以最大化潛在利益和最小化潛在風險的方式與世界分享 AlphaFold 。

迄今為止,來自 190 個國家 / 地區的超過 500000 名研究人員訪問了 AlphaFold DB,查看了超過 200 萬個結構。一些免費提供的蛋白質結構也已集成到其他公共數據集中,例如 Ensembl、UniProt 和 OpenTargets,被數百萬用戶訪問。
在與其他機構合作時,DeepMind 優先考慮那些最具積極社會效益的應用,重點關注那些資金不足或被忽視的計劃。
拼湊核孔復合體
在最新一期《科學》雜志特刊上,幾個研究團隊描述了 AlphaFold 幫助拼湊核孔復合體——生物學中最具挑戰性的難題之一。這個巨大的結構由數百個蛋白質部分組成,控制著進出細胞核的一切。

人們通過使用現有的實驗方法揭示它的輪廓,結合 AlphaFold 預測完成和解釋其中不清楚的區域,最終揭示了它的微妙結構。《科學》將其稱為實驗結構生物學的勝利,這種新研究方式現在正成為實驗室的常規做法,開啟了新的科學研究道路。
結構搜索工具
Foldseek、Dali 等結構搜索工具允許用戶非常快速地搜索與給定蛋白質相似的結構。這將是為實際有用的蛋白質(例如分解塑料的蛋白質)挖掘大型序列數據集的第一步,它可以提供有關蛋白質功能的線索。
對人類健康的影響
AlphaFold 已經對人類健康產生了重大而直接的影響。與歐洲人類遺傳學會的合作證明 AlphaFold 對于解開罕見遺傳疾病的原因至關重要。此外,AlphaFold 還通過更好地了解新發現的可能成為藥物靶點的蛋白質,幫助科學家更快地找到與其結合的潛在藥物來加速藥物發現。
原文地址:http://www.myzaker.com/article/62e354148e9f0972ce53574a