国产精品电影_久久视频免费_欧美日韩国产激情_成年人视频免费在线播放_日本久久亚洲电影_久久都是精品_66av99_九色精品美女在线_蜜臀a∨国产成人精品_冲田杏梨av在线_欧美精品在线一区二区三区_麻豆mv在线看

Meta AI開放6億+宏基因組蛋白質結構圖譜,150億語言模型用兩周完成

人工智能 新聞
如今,在蛋白質結構預測領域,各大廠也出現了「百家爭鳴,百家齊放」。

今年,DeepMind 公布了大約 2.2 億種蛋白質的預測結構,它幾乎涵蓋了 DNA 數據庫中已知生物體的所有蛋白質。現在,另一家科技巨頭 Meta 正在填補另一空白,微生物領域。

簡單來說,Meta 使用 AI 技術預測了約 6 億種蛋白質結構,這些蛋白質來自細菌和其他尚未被表征的微生物。團隊負責人 Alexander Rives 表示:「這些蛋白質是我們所知最少的結構,它們是非常神秘的蛋白質。我認為這些發現為深入了解生物學提供了潛力。」

通常,語言模型是在大量文本上進行訓練的。Meta 為了將語言模型應用于蛋白質,Rives 及其同事將已知的蛋白質序列作為輸入,這些蛋白質由 20 種氨基酸組成,并用不同的字母表示。然后,該網絡在遮蔽一定比例氨基酸的情況下學會了自動補全蛋白質。

Meta 將這個網絡命名為 ESMFold。雖然 ESMFold 預測準確性不如 AlphaFold,但在預測結構方面,它比 AlphaFold 快約 60 倍。這一速度意味著可以將蛋白質結構預測擴展到更大的數據庫。

圖片

  • 論文地址:https://www.biorxiv.org/content/10.1101/2022.07.20.500902v2
  • 項目地址:https://github.com/facebookresearch/esm

如今,作為測試,Meta 決定將他們的模型應用于宏基因組 DNA 數據庫,這些 DNA 全部來自環境,包括土壤、海水、人類腸道、皮膚和其他微生物棲息地。Meta AI 宣布推出包含 6 億多個蛋白質的 ESM 宏基因組圖譜(ESM Metagenomic Atlas),它是首個蛋白質宇宙「暗物質」的綜合視圖。這還是最大的高分辨率預測結構數據庫,比任何現有的蛋白質結構數據庫都要大 3 倍,并且是第一個全面、大規模地涵蓋宏基因組蛋白質的數據庫。

圖片

Meta 團隊總共預測了超過 6.17 億個蛋白質結構,只花了兩周的時間。Rives 說,預測是免費的,任何人都可以使用,就像模型的底層代碼一樣。

圖片

交互版本地址:https://esmatlas.com/explore?at=1%2C1%2C21.999999344348925

舉例而言,下圖為 ESMFold 對 PET 酶的預測。

圖片

引言

眾所周知,蛋白質作為復雜且動態的分子,其由基因編碼,主要負責生命基本過程。蛋白質在生物學中有著驚人作用。比如,人類眼睛中的視桿和視錐細胞可以感知光線,因而我們能看到外面的世界;構成聽覺和觸覺基礎的分子傳感器;植物中把光能轉化為化學能的復雜分子;驅動微生物和人類肌肉運動的「馬達」;分解塑料的酶;保護我們免受疾病的抗體,等等這些都是蛋白質。

1998 年,來自威斯康辛大學植物病理學部門的 Jo Handelsman 首次提出宏基因組學(Metagenomics)這一概念,它是源于將來自環境中基因集可以在某種程度上當成單個基因組研究分析的想法,而宏的英文正是 meta-,也翻譯為元。

宏基因組學揭示了數十億個對科學來說是新的蛋白質序列,并首次編入由 NCBI、歐洲生物信息學研究所 (European Bioinformatics Institute) 和聯合基因組研究所 (Joint Genome Institute) 等公共項目編制的大型數據庫中。

Meta AI 開發的新的蛋白質折疊方法,該方法利用大型語言模型,在宏基因組數據庫中(具有數億蛋白質)創建了首個全面的蛋白質結構視圖。Meta 發現,相對于現有的 SOTA 蛋白質結構預測方法,語言模型可以將預測蛋白質原子級三維結構的速度提高 60 倍。這一進展將有助于加速蛋白質結構理解的新時代,這是首次人類有可能了解基因測序技術正在編目的數十億蛋白質的結構。

解鎖隱藏的自然世界:宏基因組結構空間的首個綜合視圖

我們知道,基因測序的進步使得對數十億個宏基因組蛋白序列進行編目成為可能。但是,通過實驗確定數以億計蛋白質的 3D 結構遠遠超出了時間密集型實驗室技術的范圍,例如 X 射線晶體學,它可能需要數周乃至數年的時間來檢測單個蛋白質。計算方式可以讓我們深入了解使用實驗技術無法實現的宏基因組學蛋白質。

ESM 宏基因組圖譜將使科學家能夠在數億蛋白質的尺度上搜索和分析宏基因組蛋白質的結構。這可以幫助識別以前未被表征的結構,尋找遙遠的進化關系,并發現可用于醫學和其他應用的新蛋白質。

如下為一張包含數以萬計高置信度預測的圖譜,展示了與目前已知結構的蛋白質的相似性。并且,該圖像首次顯示了完全未知的蛋白質結構空間的更大區域。

圖片

學習閱讀生物學語言

如下圖所示,ESM-2 語言模型經過訓練,可以預測進化過程中被序列掩蓋的氨基酸。Meta AI 發現,作為訓練的結果,蛋白質結構的信息出現在該模型的內部狀態中。這實在令人驚訝,因為該模型僅在序列上進行了訓練。

圖片?

就像論文或信件的文本一樣,蛋白質可以寫成字符序列。其中,每個字符對應 20 種標準化學元素(氨基酸)中的一種,每種又具有不同的特性,它們是蛋白質的構建塊。這些構建塊能夠以天文數字的不同方式組合在一起,例如對于由 200 個氨基酸組成的蛋白質,存在 20^200 個可能的序列,這要比可見宇宙中的原子數量還要多。每個序列都折疊成 3D 形狀(但并非所有序列都會折疊成連貫的結構,許多序列折疊成無序形式),正是這種形狀在很大程度上決定了蛋白質的生物學功能。

學習閱讀這種生物學語言帶來了很大挑戰。雖然蛋白質序列和文本段落都可以寫成字符,但它們之間存在著深刻而根本性的差異。蛋白質序列描述了一個分子的化學結構,該分子根據物理定律折疊成復雜的 3D 形狀。

蛋白質序列包含了傳遞蛋白質折疊結構信息的統計模式。舉例而言,如果一個蛋白質中的兩個位置共同進化,或者換言之,如果其中一個位置出現某種氨基酸,通常與另一個位置的某種氨基酸配對,這可能意味著這兩個位置在折疊結構中相互作用。這類似于拼圖游戲中的兩塊拼圖,進化必須選擇在折疊結構中拼合在一起的氨基酸。這又意味著我們通常可以通過觀察蛋白質序列中的模式來推斷蛋白質的結構。

ESM 使用 AI 來學習閱讀這些模式。2019 年,Meta AI 提供證據證明語言模型學習了蛋白質的特性,例如它們的結構和功能。通過一種被稱為掩碼語言建模的自我監督學習形式,Meta AI 在數百萬個天然蛋白質的序列上訓練了一個語言模型。使用這種方法,模型必須正確填寫文本段落中的空白,例如「To _ or not to , that is the _____」。

之后,Meta AI 訓練了一個語言模型來填補蛋白質序列中的空白。他們發現,蛋白質結構和功能的信息在這一訓練中浮現了出來。2020 年,Meta 發布了一個 SOTA 蛋白質語言模型 ESM1b,用于各種應用,包括幫助科學家預測 COVID-19 的演變以及發現疾病的遺傳原因。

現在,Meta AI 擴展了這種方法,用來創建下一代蛋白質語言模型 ESM-2,它的參數為 150 億,是迄今為止最大的蛋白質語言模型。他們發現,當模型參數從 800 萬放大到 150 億時,內部表示中會出現信息,從而能夠以原子分辨率進行 3D 結構預測。

將蛋白質折疊實現數量級加速

在下圖中,隨著模型的擴大,高分辨率的蛋白質結構出現。同時隨著模型的縮放,蛋白質結構的原子分辨率圖像中會出現新的細節。

圖片

使用當前 SOTA 計算工具,在實際時間范圍內預測數億蛋白質序列結構可能花費數年時間,即便用上主要研究機構的資源也是如此。因此,想要在宏基因組尺度上進行預測,預測速度的突破至關重要。

Meta AI 發現使用蛋白質序列的語言模型大大加快了結構預測的速度,最高提升 60 倍。這足以在短短幾周內對整個宏基因組數據庫做出預測,并且可以擴展到比我們當前發布的數據庫大得多的數據庫。事實上,這種新的結構預測能力能夠在短短兩周內,在大約 2000 個 GPU 組成的集群上預測超過 6 億多個宏基因組蛋白的序列。

此外,當前 SOTA 結構預測方法需要搜索大型蛋白質數據庫以識別相關序列。這些方法實際上需要一整組進化相關的序列作為輸入,以便它們可以提取與結構相關的模式。Meta AI 的 ESM-2 語言模型在其對蛋白質序列的訓練過程中學習這些進化模式,進而能夠直接從蛋白質序列中對 3D 結構進行高分辨率預測。

下圖展示了使用 ESM-2 語言模型進行蛋白質折疊。箭頭從左到右顯示了網絡中從語言模型到折疊 trunk 再到結構模塊的信息流,最后輸出 3D 坐標和置信度。

圖片

更多詳細內容請參閱原文。

博客鏈接:https://ai.facebook.com/blog/protein-folding-esmfold-metagenomics/

責任編輯:張燕妮 來源: 機器之心
相關推薦

2022-11-02 13:41:46

2022-12-23 15:04:33

Meta模型

2022-07-22 14:49:37

語言模型DeepMindAlphaFold2

2025-02-04 11:11:07

2023-03-03 14:00:00

模型深度學習

2021-07-24 10:21:46

模型人工智能深度學習

2025-07-14 16:59:06

AI蛋白質模型

2023-08-08 10:17:16

人工智能

2022-10-08 12:38:23

模型開源

2024-06-26 13:21:50

2021-12-20 10:07:35

AI 數據人工智能

2023-07-06 16:59:56

英特爾

2023-07-06 13:23:49

2023-01-13 21:13:31

AI人工智能醫療

2024-04-22 07:20:00

訓練開源

2024-11-15 13:42:25

2023-09-20 12:44:00

AI訓練

2022-12-25 13:36:47

論文

2022-02-14 00:04:24

AI蛋白質結構

2023-10-04 09:23:21

微軟開發
點贊
收藏

51CTO技術棧公眾號

极品束缚调教一区二区网站| 欧美日韩精品一区二区| 精品视频在线播放免| 激情婷婷综合网| 亚洲精品女人| 91成人性视频| 电影中文字幕一区二区| 欧美一区日韩一区| 好紧好硬好湿我太爽了| 国产成人亚洲精品狼色在线| 久久99国产精品| 欧美丰满老妇| 欧美性资源免费| 精品亚洲a∨| 亚洲毛茸茸少妇高潮呻吟| 欧美jizz18性欧美| 一区二区三区在线免费视频| 欧美日韩中文在线视频| 男人的j进女人的j一区| 日本一区二区精品视频| 最新成人av网站| 亚洲va电影大全| 日韩国产一区二区| 成人动漫网站在线观看| 精品福利网址导航| 国内精品美女av在线播放| 外国成人毛片| 欧美成人久久久| 91色琪琪电影亚洲精品久久| 欧美日韩国产在线观看网站 | 好男人看片在线观看免费观看国语 | 亚洲青青一区| 久久久999精品| 亚洲精品黑牛一区二区三区| 久久青草精品视频免费观看| 久久久久97| 成人亚洲欧美一区二区三区| 免费看亚洲片| 国产在线视频在线| 久久网站最新地址| 中日韩免费毛片| 91精品国产91综合久久蜜臀| 老司机精品视频在线观看6| 亚洲女人天堂网| 亚洲欧洲av| 欧美精品七区| 国产农村妇女毛片精品久久麻豆| 黄网站app在线观看下载视频大全官网| 欧美私模裸体表演在线观看| 欧美精品一区在线观看| 国产精品毛片av| 99九九视频| youjizz国产精品| 亚洲精选av在线| 国产视频久久久| 色喇叭免费久久综合| 日本道在线视频| 欧美性猛交xxxx免费看漫画 | 国产亚洲激情视频在线| 国产va免费精品观看精品视频| 亚洲毛片aa| 日韩欧美999| 色天下一区二区三区| 中国一区二区三区| 色婷婷综合久色| 国产精品一区二区美女视频免费看 | 欧美日韩一区自拍| 理论片鲁丝二区爱情网| 亚洲天堂成人在线| 国产日韩欧美一区在线| 九色在线观看视频| 国产精品美女诱惑| 一区二区三区资源| 欧美成人精品一级| 国产一级大片免费看| 欧美日韩激情一区二区三区| 久久性感美女视频| 亚洲第一成年免费网站| 国产日韩av高清| 亚洲18女电影在线观看| 色老板在线视频一区二区| 国产 日韩 亚洲 欧美| 久久精品欧美视频| 国产亚洲欧美日韩俺去了| 久久97精品| 黑人巨大精品欧美一区二区奶水| 久久久久久久91| 欧美性高潮在线| 久久久精品性| 中国色在线日|韩| 欧美狂野激情性xxxx在线观| 国产亚洲精品美女久久久| 不卡一区二区三区四区| 欧美国产视频| 美女黄色片视频| 91免费欧美精品| 日韩电影视频免费| 国产精品女同一区二区三区| 精品欧美久久| 免费网站成人| 欧美日韩在线不卡视频| 久久久精品国产亚洲| 五月天久久比比资源色| 亚洲精品综合| 欧美日韩大片| 中文字幕亚洲精品视频| 中文字幕av日韩精品| 91国自产精品中文字幕亚洲| 亚洲午夜久久久久中文字幕久| 日韩精品电影一区亚洲| 国产精品18| 黄色在线免费| а√最新版在线天堂| 日本不卡二区| 欧美激情乱人伦一区| 欧美一二三四区在线| 中文字幕一区在线观看视频| 高清日韩av| 成人黄色av播放免费| 久久综合久久88| 91麻豆精品国产自产在线观看一区 | 国产精品mm| 日韩中文字幕| 岛国中文字幕在线| 成视频在线观看免费观看| 自拍亚洲欧美老师丝袜| 国产视频福利一区| 日韩中文字幕在线看| 日韩欧美综合在线| 一区二区三区欧美亚洲| 成人免费的视频| 美国毛片一区二区| 尤物网精品视频| 亚洲女同另类| wwwav91| 午夜影院观看视频免费| 男人天堂av网站| 成人免费淫片95视频观看网站| 日本成人在线不卡| www.激情网| 亚洲国产一二三精品无码| 日本一二三区视频在线| 黄色三级中文字幕| 日本精品福利视频| 日本男女交配视频| 国产一区二区网| 精品免费国产一区二区| 无码精品a∨在线观看中文| 国产又黄又大又粗视频| 国产伦精品一区二区三区四区视频_| 日本免费在线视频观看| www插插插无码免费视频网站| 少妇久久久久久被弄到高潮| 日本a在线天堂| 亚洲国产精品久久久久爰色欲| av网址在线观看免费| 成人网18入口| 成人高清免费在线| 三级欧美日韩| videoxxxx另类日本极品| 黄色在线播放网站| 97se综合| 欧美色婷婷久久99精品红桃| 亚洲电影av| av午夜精品一区二区三区| 伊人一区二区三区| 欧洲一区在线电影| 永久555www成人免费| 国产日韩欧美在线| 在线观看18视频网站| 国产成免费视频| 黑人另类精品××××性爽| 久久wwww| 日本欧美在线观看| 亚洲久本草在线中文字幕| 欧美人体做爰大胆视频| 欧美亚洲国产日韩2020| 日韩在线电影一区| 有色激情视频免费在线| 国产色99精品9i| 青青国产91久久久久久| 亚洲成人第一页| 美日韩精品免费观看视频| 97影院在线午夜| 午夜宅男在线视频| 日韩网站中文字幕| 国产情侣久久| 在线影院国内精品| 国产精品日韩在线播放| 玩弄japan白嫩少妇hd| 俺来也官网欧美久久精品| 欧美日韩91| 色av一区二区| 91在线精品视频| 成人天堂入口网站| 精品国产亚洲日本| aaa亚洲精品| 久久久精品日本| 性刺激的欧美三级视频| 少妇精品在线|