#### 要約* OpenAIは、薬剤発見のワークフローを加速させるためにGPT-Rosalindを発表した。* ベンチマークは高い成果を示しているが、実世界への影響はまだ限定的である。* 生物安全保障の懸念が高まる中、アクセスは厳しく制限されている。OpenAIは、英国の化学者ロザリンド・フランクリンの名前を冠した最初のドメイン特化型AIモデルを発表した。彼女はDNAの二重らせん構造を解明するためのX線結晶学の研究で知られ、彼女の生前にその功績が認められなかったことで有名だ。GPT-Rosalindは木曜日に公開され、生物学、薬剤発見、翻訳医療のために特別に設計された推論モデルである。これはOpenAIが「ライフサイエンスモデルシリーズ」と呼ぶ最初のモデルであり、多くの大学やGoogle DeepMindなどの専門的な研究所が競い合う市場を狙った直接的な戦略だ。専門家によると、ターゲット発見から米国での規制承認までに平均10〜15年かかるという。この時間の大部分は、ひらめきの瞬間ではなく、何千もの論文を解析し、データベースに問い合わせ、試薬を設計し、曖昧な結果を解釈する作業に費やされている。GPT-Rosalindはこの作業を短縮しようとしている。OpenAIは、このモデルが初期段階の作業を圧縮できると主張している。同社は、「GPT-Rosalindは、科学者がより多くの可能性を探り、見落としがちなつながりを浮き彫りにし、より良い仮説に早く到達できるよう設計されている」と述べている。<span style="width:0px;overflow:hidden;line-height:0" data-mce-type="bookmark" class="mce_SELRES_start"></span>ベンチマークは、その野心の一部を裏付けている。実世界のバイオインフォマティクス課題を中心に構築されたベンチマークBixBenchでは、GPT-Rosalindは0.751の合格率を記録し、公開結果のあるモデルの中で最高得点を獲得した。LABBench2では、前モデルGPT-5.4を11のうち6つの課題で上回った。GPT-Rosalindは生命科学に関わるすべてのケースでGPT-5.4を上回るが、これは非常に特定のモデルであり、それ以外の分野では性能が劣る可能性が高い。OpenAIはまた、Dyno Therapeuticsが未公開のRNA配列に基づいてモデルのテストと評価を行い、記憶を排除する手助けをすると発表した。GPT-Rosalindのベストオブテンの提出は、シーケンス予測課題で人間の専門家の95パーセンタイル以上、生成では84パーセンタイル付近にランク付けされた。ただし、OpenAIの生命科学研究責任者ジョイ・ジオは、モデルが実際に何ができるかについて慎重に語った。彼女は、同社はロザリンドを自律的に新しい治療法を創出できるモデルとは見なしておらず、研究を加速させる大きな助けになると述べた。「私たちは、科学的プロセスの中で最も複雑で時間のかかる部分を研究者がより早く進められるよう支援する本当の機会があると考えている」と、_LA Times_の記者会見でジオは語った。モデル周辺のエコシステムも重要かもしれない。OpenAIはまた、Codex用の無料のライフサイエンス研究プラグインをリリースし、50以上の科学データベースやツール(タンパク質構造の検索、配列検索、文献レビュー、ゲノム解析パイプライン)に接続できるようにした。GPT-Rosalindにアクセスできる企業ユーザーには推論層が追加され、その他のユーザーは標準モデルのプラグインを利用できる。OpenAIは、Amgen、Moderna、Thermo Fisher Scientificなどの製薬・バイオテクノロジー企業を含む顧客リストを用意している。別途、ロスアラモス国立研究所とAIを用いたタンパク質や触媒の設計に関する研究協力も進めている。「ライフサイエンスの分野では、あらゆる段階で正確さが求められる。質問は非常に複雑で、データは非常にユニークであり、リスクも非常に高い」と、アムジェンのAI・データ担当シニアVPのショーン・ブルイヒは公式発表で述べた。ロザリンドへのアクセスは意図的に制限されている。モデルは米国内の企業のみ対象で、資格と安全性の審査を経る必要がある。懸念は抽象的なものではなく、100人以上の科学者からなる国際連合が、AIの訓練に使用される生物学的データの規制強化を求めており、病原体設計のリスクを指摘している。OpenAIの制限付き展開はこれに直接対応したものである。研究プレビュー期間中は、既存のAPIクレジットを消費しない。これはOpenAIが科学的ワークフローに初めて進出した例ではない。1月に開始されたPrismの科学的執筆ワークスペースはその第一歩だった。GPT-Rosalindは、そのより洗練され、専門化された次のステップであり、ドメイン特化型モデルが本格的な競争の最前線になりつつあることを示すシグナルだ。完全にAIが発見した薬剤がフェーズ3試験を通過した例はまだ一つもない。その数はゼロだ。しかし、GPT-Rosalindが研究者の実験設計を6ヶ月早め、何千もの研究所で役立つなら、その発見やタイミングに与える累積的な影響は非常に大きい。これが本当の狙いであり、注視に値するポイントだ。
OpenAIの新しいAIモデルロザリンドは、医薬品発見に数年の時間を短縮できる可能性があります。あなたはおそらくそれを使えないでしょう
要約
OpenAIは、英国の化学者ロザリンド・フランクリンの名前を冠した最初のドメイン特化型AIモデルを発表した。彼女はDNAの二重らせん構造を解明するためのX線結晶学の研究で知られ、彼女の生前にその功績が認められなかったことで有名だ。 GPT-Rosalindは木曜日に公開され、生物学、薬剤発見、翻訳医療のために特別に設計された推論モデルである。これはOpenAIが「ライフサイエンスモデルシリーズ」と呼ぶ最初のモデルであり、多くの大学やGoogle DeepMindなどの専門的な研究所が競い合う市場を狙った直接的な戦略だ。 専門家によると、ターゲット発見から米国での規制承認までに平均10〜15年かかるという。この時間の大部分は、ひらめきの瞬間ではなく、何千もの論文を解析し、データベースに問い合わせ、試薬を設計し、曖昧な結果を解釈する作業に費やされている。GPT-Rosalindはこの作業を短縮しようとしている。 OpenAIは、このモデルが初期段階の作業を圧縮できると主張している。同社は、「GPT-Rosalindは、科学者がより多くの可能性を探り、見落としがちなつながりを浮き彫りにし、より良い仮説に早く到達できるよう設計されている」と述べている。
ベンチマークは、その野心の一部を裏付けている。実世界のバイオインフォマティクス課題を中心に構築されたベンチマークBixBenchでは、GPT-Rosalindは0.751の合格率を記録し、公開結果のあるモデルの中で最高得点を獲得した。LABBench2では、前モデルGPT-5.4を11のうち6つの課題で上回った。 GPT-Rosalindは生命科学に関わるすべてのケースでGPT-5.4を上回るが、これは非常に特定のモデルであり、それ以外の分野では性能が劣る可能性が高い。
OpenAIはまた、Dyno Therapeuticsが未公開のRNA配列に基づいてモデルのテストと評価を行い、記憶を排除する手助けをすると発表した。GPT-Rosalindのベストオブテンの提出は、シーケンス予測課題で人間の専門家の95パーセンタイル以上、生成では84パーセンタイル付近にランク付けされた。 ただし、OpenAIの生命科学研究責任者ジョイ・ジオは、モデルが実際に何ができるかについて慎重に語った。彼女は、同社はロザリンドを自律的に新しい治療法を創出できるモデルとは見なしておらず、研究を加速させる大きな助けになると述べた。「私たちは、科学的プロセスの中で最も複雑で時間のかかる部分を研究者がより早く進められるよう支援する本当の機会があると考えている」と、_LA Times_の記者会見でジオは語った。 モデル周辺のエコシステムも重要かもしれない。OpenAIはまた、Codex用の無料のライフサイエンス研究プラグインをリリースし、50以上の科学データベースやツール(タンパク質構造の検索、配列検索、文献レビュー、ゲノム解析パイプライン)に接続できるようにした。GPT-Rosalindにアクセスできる企業ユーザーには推論層が追加され、その他のユーザーは標準モデルのプラグインを利用できる。 OpenAIは、Amgen、Moderna、Thermo Fisher Scientificなどの製薬・バイオテクノロジー企業を含む顧客リストを用意している。別途、ロスアラモス国立研究所とAIを用いたタンパク質や触媒の設計に関する研究協力も進めている。 「ライフサイエンスの分野では、あらゆる段階で正確さが求められる。質問は非常に複雑で、データは非常にユニークであり、リスクも非常に高い」と、アムジェンのAI・データ担当シニアVPのショーン・ブルイヒは公式発表で述べた。 ロザリンドへのアクセスは意図的に制限されている。モデルは米国内の企業のみ対象で、資格と安全性の審査を経る必要がある。懸念は抽象的なものではなく、100人以上の科学者からなる国際連合が、AIの訓練に使用される生物学的データの規制強化を求めており、病原体設計のリスクを指摘している。OpenAIの制限付き展開はこれに直接対応したものである。研究プレビュー期間中は、既存のAPIクレジットを消費しない。 これはOpenAIが科学的ワークフローに初めて進出した例ではない。1月に開始されたPrismの科学的執筆ワークスペースはその第一歩だった。GPT-Rosalindは、そのより洗練され、専門化された次のステップであり、ドメイン特化型モデルが本格的な競争の最前線になりつつあることを示すシグナルだ。 完全にAIが発見した薬剤がフェーズ3試験を通過した例はまだ一つもない。その数はゼロだ。しかし、GPT-Rosalindが研究者の実験設計を6ヶ月早め、何千もの研究所で役立つなら、その発見やタイミングに与える累積的な影響は非常に大きい。これが本当の狙いであり、注視に値するポイントだ。