2026-04-08 10:41:05

最近、多モデルの相互対戦を行ったところ、面白い発見がありました。

同じアーキテクチャの課題について、私はClaudeとCodexにそれぞれ独立して解決策を書かせました。
Codexは一つ見落としがありました：私の戦略は20以上の独立したプロセスに分散しているのに、彼の書いた解決策は「すべてのコンポーネントが同じ場所で動作する」と仮定していて、そのままでは無効でした。Claudeは一目でその問題を見抜きました。
逆にClaudeは別の見落としをしていました：彼は新しい独立モジュールを作ることに固執していましたが、実は私の手元には既存のフレームワークがあり、ちょっとしたフィールド追加だけで対応できるものでした。Codexはその点を拾い上げました。
最も面白かったのは、その後のステップです：私は二つのモデルにお互いの最終案をレビューさせましたが、双方とも「相手が既に書いたフレームワーク」を前提にしてしまい、結果的に一つの境界条件を見落としました。最終的には私が手動で本番データを動かして気づきました。
今の習慣は、各ラウンドの相互対戦ごとに成功基準を設定し、一方のモデルにもう一方の下書きを見せないことです。手に入るのは、重複しない盲点を持つ二つの独立した下書きで、それらを組み合わせて初めてほぼ完全な解決策となるのです。

原文表示