OpenAI 的新 AI 模型 Rosalind 可能會縮短藥物發現的時間。你可能無法使用它

###簡要概述

  • OpenAI 公布了 GPT-Rosalind 以加速藥物發現流程。
  • 基準測試顯示出強勁的提升,但在實際應用中的影響仍受限。
  • 在生物安全憂慮升高的情況下,存取權受到嚴格限制。

OpenAI 剛剛以 Rosalind Franklin 的名字命名了其首個專門領域的 AI 模型——這位英國化學家,其X光晶體學工作幫助揭示了 DNA 的雙螺旋結構,並在生前未獲得應有的認可。 GPT-Rosalind 在星期四亮相,是一個專為生物學、藥物發現和轉化醫學設計的推理模型。這是 OpenAI 所謂的生命科學模型系列的第一款——直接針對一個市場,該市場中從大學到 Google DeepMind 等多個專業實驗室都在激烈角逐。 專家指出,將一個藥物從目標發現到在美國獲得監管批准平均需要 10 到 15 年。大部分時間並非在靈光一現的瞬間,而是在繁瑣的工作中:解析數千篇論文、查詢資料庫、設計試劑、解讀模糊的結果。這正是 GPT-Rosalind 試圖解決的問題。 OpenAI 認為該模型可以壓縮早期階段的工作。公司表示,GPT-Rosalind 設計來幫助科學家「探索更多可能性,發現可能被忽略的聯繫,並更早得出更好的假設」。

 基準測試至少部分支持這些雄心。在以真實生物資訊任務為基礎的基準測試 BixBench 上,GPT-Rosalind 的通過率為 0.751,為已公布結果模型中的最高分。在 LABBench2 上,它在十一個任務中有六個超越了前身 GPT-5.4。 GPT-Rosalind 在所有涉及生命科學的案例中都超越了 GPT 5.4,但它是一個高度專門的模型,在其他領域的表現可能會較差。

OpenAI 也宣布 Dyno Therapeutics 將協助測試和評估其模型,基於未公開的 RNA 序列,以排除記憶化的可能性。GPT-Rosalind 在十次提交中,序列預測任務的排名高於人類專家第 95 百分位,生成任務約在第 84 百分位。 不過,OpenAI 自身的生命科學研究負責人 Joy Jiao 對模型的實際能力持謹慎態度。她解釋公司並不認為 Rosalind 能自主創造新療法,但告訴記者它可以大大加快研究進度。「我們確實看到幫助研究人員更快完成科學過程中一些最複雜、耗時部分的真正機會,」Jiao 在一場新聞發布會上說,根據 LA Times 的報導。 圍繞該模型的生態系統可能與模型本身一樣重要。OpenAI 也推出了一個免費的生命科學研究插件,連接超過 50 個科學資料庫和工具——蛋白質結構查詢、序列搜索、文獻回顧、基因組流程。擁有 GPT-Rosalind 存取權的企業用戶可以在此基礎上獲得推理層,而其他用戶則使用標準模型的插件。 OpenAI 已經與多家製藥和生物技術公司簽約,包括 Amgen、Moderna 和 Thermo Fisher Scientific。另方面,它還與洛斯阿拉莫斯國家實驗室合作進行 AI 指導的蛋白質和催化劑設計研究。 「生命科學領域在每一步都要求精確。問題高度複雜,數據高度獨特,風險也極高,」Amgen 的 AI 與數據高級副總裁 Sean Bruich 在官方公告中表示。 對 Rosalind 的存取是有意限制的。該模型僅限於美國企業,需通過資格和安全審查。這並非抽象的擔憂:一個由超過 100 位科學家組成的國際聯盟已呼籲加強對用於訓練 AI 的生物數據的管控,理由是涉及病原體設計的風險。OpenAI 的限制性推廣是直接回應。在研究預覽期間,使用不會消耗現有的 API 配額。 這也不是 OpenAI 首次涉足科學工作流程。一月推出的 Prism 科學寫作工作空間是第一步。GPT-Rosalind 更為尖銳、專門的後續產品,並彰顯領域專用模型正成為一個嚴肅的競爭前沿。 目前尚未有完全由 AI 發現的藥物通過三期臨床試驗,這個數字仍是零。但如果 GPT-Rosalind 能幫助研究人員在數千個實驗室中更快設計出更好的實驗,則對於發現的內容和時間的積累效應,可能會改變整個局面。這才是核心論點,也是值得密切關注的地方。

查看原文
此頁面可能包含第三方內容,僅供參考(非陳述或保證),不應被視為 Gate 認可其觀點表述,也不得被視為財務或專業建議。詳見聲明
  • 打賞
  • 留言
  • 轉發
  • 分享
留言
請輸入留言內容
請輸入留言內容
暫無留言