← 返回首頁

DISCO 透過聯合擴散技術實現蛋白質序列與結構的同步設計,突破自然界化學限制

Jarrid Rector-Brooks
Jarrid Rector-Brooks
@jarridrb
793🔁 183
𝕏 (Twitter)🔥🔥🔥
AI 中文摘要Claude 生成

DISCO 透過聯合擴散技術實現蛋白質序列與結構的同步設計,突破自然界化學限制。

DISCO (Diffusion for Sequence-structure CO-design) 是一種多模態生成模型,能同時設計蛋白質序列與 3D 結構,無需預先指定催化殘基,即可創造出自然界未曾出現過的全新酵素。該模型不僅在設計效能上超越現有方法,更成功透過濕實驗驗證,設計出能執行自然界不存在的化學反應之酵素。

技術瓶頸與挑戰
傳統酵素工程(如定向演化)雖然強大,但過程極度耗時且受限於自然界已存在的化學反應。例如,一項針對 C(sp³)–H 插入反應的工程,過去需耗費 14 輪實驗與超過一年時間。現有的 AI 設計方法則面臨兩大核心瓶頸:

  • 依賴「theozyme」(預先指定的催化殘基排列):這要求研究者對反應機制有極深理解,但在處理新穎化學反應時,此類資訊往往不可得。
  • 序列與結構生成脫鉤:現有方法通常先生成骨架,再填充氨基酸序列,這種分離的流程導致關鍵資訊在轉換過程中流失。

核心技術架構
DISCO 透過「聯合擴散」(Joint Diffusion)技術,將蛋白質序列與 3D 結構視為一個整體進行生成,徹底消除了傳統兩階段流程的缺陷。其關鍵技術創新包括:

  • 跨模態循環(Cross-modal recycling):結構與序列資訊在生成過程中進行雙向對齊,確保氨基酸選擇與幾何結構相互適應。
  • 自我修正序列(Self-correcting sequence):允許模型在生成過程中 revisits 並修正早期的氨基酸選擇,避免過早鎖定錯誤。
  • 雜訊引導(Noisy guidance):透過對另一模態的雜訊版本進行條件化,強化模型對結構與序列的對齊能力。
  • Feynman-Kac Correctors:在推理階段進行多模態引導,例如強制增加二硫鍵密度,或在結合目標的同時主動避開誘餌分子。

實際效能與驗證
DISCO 在「Studio-179」基準測試中展現了卓越的通用性,該測試包含 179 種自然與非自然配體。DISCO 在 179 個目標中,有 178 個表現優於現有基準模型。在濕實驗(Wet lab)驗證中,其成果更具突破性:

  • 針對碳烯轉移反應(Carbene-transfer):單次計算設計即達到 2,360 TTN(總轉換數),遠超 14 輪定向演化的成果。
  • 針對 B–H 插入反應:單次設計達到 5,170 TTN,效能是實驗室定向演化的兩倍以上。

創新性與演化潛力
DISCO 設計出的酵素活性位點在自然界中並不存在,其創新性極高:

  • 結構新穎:超過 90% 的設計基序(Motif)在「AlphaFold Database」中找不到相近的同源物,證明模型並非單純重組已知片段,而是發現了全新的解決方案。
  • 具備演化起點:這些設計不僅具備功能,更具備「可演化性」。以 dCT-H11 為例,僅經過一輪誘變,活性即提升 4 倍,並能改變立體選擇性,證明 DISCO 為蛋白質工程提供了一個極佳的演化起點。