All In Podcastの最新エピソードで、重鎮たちがMicron、ストレージのボトルネック、中国のオープンソースモデル、分散推論についてどう見ているか


このAll In Podcastは情報量が多く、特に共有する価値があると思うテーマをいくつか選んで整理しました。
まず中国のオープンソースモデルの流れから。進展は想像以上に速いです。
智譜AIは、次世代Frontier級オープンソースモデルGLM 5.2をリリースしました。7440億パラメータ、100万トークンのコンテキスト、完全にMITオープンソースライセンスを採用。評価データは驚くべきものです:ソフトウェアエンジニアリングプログラミングベンチマークでGPT-5.5を上回り、Anthropicの最上位Claude Opus 4.8との差も1%未満ですが、API価格は同等性能のアメリカのモデルより85%も安いです。
番組内で面白い詳細がありました。中国チームが加速的に追い上げる方法についてです。何千台ものスマートフォンやiPadでデバイスファームを構成し、暗号化アカウントを使ってアメリカのトップFrontierモデルのAPIに高密度で質問し、相手の推論チェーンを収穫して、自らのオープンソースモデルの強化学習に投入する。これは、アメリカの研究所が巨費を投じて得た正解をカンニングペーパーとして利用し、非常に低コストで近い性能を実現するようなものです。
Sacksはこれに対してかなり鋭い態度を示しました。彼はAnthropicのDarioが以前、アメリカ政府に煩雑な安全承認プロセスを導入するよう推進したことを批判し、このような自己制限がかえってアメリカ自身のペースを遅らせていると述べました。Fableモデルは脱獄(ジェイルブレイク)の告発で強制的に削除され、OpenAIの新モデルの承認も難航しています。彼の判断では、中国のモデルは現在技術面で約9ヶ月、チップ面で約24ヶ月遅れていますが、すでにHuawei昇騰のような国産チップを使ってGLM5ファミリーのトレーニングを完了しています。将来的には、国産チップに最適化され、安価で使いやすい「AIボックス」が低価格で世界市場に投げ売りされる可能性が高く、一方アメリカは様々な制限を設けており、結果的にこの数兆ドル規模の輸出市場を手放している、と。
Micronの今回の決算について、番組は的確な位置づけを示しました:DRAMこそがAIブーム全体の真のボトルネックである、と。
Micronの今四半期の売上高は前年同期比で4倍に急増し、90億から420億に跳ね上がり、ガイダンスは予想を大幅に上回り、2026年のHBMの生産能力はすでに完売しています。
番組内でかなり率直な意見がありました:以前はみんなTwitterで様々な日本の補助部品会社を「ボトルネック株」として探していましたが、真の要はDRAM、特にHBMだけだ、と。理由は簡単で、メモリの帯域幅と容量がすべての大規模モデル推論性能の物理的上限を決定し、これはハードな制約であり、回避できません。さらに、マスク氏が建設中のスーパーファクトリーの技術的核心もDRAMに焦点を当てており、光ファイバーや電源、NANDフラッシュではない、とさえ言及されています。
Micronは今回のビジネスモデルでも興味深い変化を遂げました:コアクラウドベンダーと「価格の下限と上限」保護付きの長期供給契約を結び、将来の収益の50%を固定化しました。これは、たとえ将来業界サイクルが下降しても、最低契約価格が過去のどのサイクルの粗利益ピークよりも高いことを意味します。
参入障壁に関しては、中国の長鑫存儲(CXMT)が上場準備中で、将来的に低価格のミドルロークラス消費者向けメモリでAppleのような大手のコスト圧力を緩和する可能性がありますが、AIサーバーに必要なトップクラスのHBM分野では、現在世界的にMicron、SK hynix、Samsungの3社しか生産できず、プロセス難易度が極めて高く、短期間で追いつくことはできません。
番組ではかなり大げさな予測が示されました:来年の世界の超大規模資本支出のうち、30%から40%が直接DRAMチップメーカーに流れるだろう、と。このコスト高騰により、AppleはMacBookとMac Studioの小売価格を全ラインで値上げしました。
エッジコンピューティングと分散推論の部分は、今回のエピソードで最も想像力に富んだ内容です。いくつか面白いと考えた構想を共有します。
Teslaは6月18日、「Megapod」というハードウェア商標を申請しました。背後にある物理的ロジックは次の通りです:地上に1ギガワットのデータセンターを建設する場合、土地、エネルギー消費、液冷の承認プロセスが極めて長くなります。Megapodの構想は、GPU、バッテリーネットワーク、冷却システムをコンテナ型のモジュラーデータセンターに統合し、すでに承認済みで既存の電力網と遊休地があるTeslaスーパーチャージャーステーションネットワークに直接投入し、従来のデータセンター建設の最大のボトルネックである承認と電力接続を回避するものです。
分散推論の流れのロジックも興味深いです:モデルが質問に回答するプロセスは2つのフェーズに分割できます。質問を理解するPrefillフェーズと、高帯域幅・高メモリ消費のDecodeフェーズです。大口資金で減価償却された旧型GPUを購入し、フロントエンドにデコード最適化専用のチップを外付けして、コストの低い分散推論ネットワークを構成できます。
さらにクレイジーな構想は、将来、家庭用蓄電池Powerwallを購入するユーザーに割引を提供し、各バッテリーに強制的にAIチップを内蔵させ、さらにStarlink衛星接続と組み合わせて、バッテリーがアイドル状態のときに自動的に巨大な分散P2P推論プールを形成し、無尽蔵でほぼ無料のオフショア計算能力を得る、というものです。この構想が実際に実現すれば、従来のクラウド大手にとっては次元の異なる打撃となるでしょう。
最もクレイジーな部分は宇宙計算能力です。地上に1ギガワットのデータセンターを建設するには350億ドルのチップコストと250億ドルの冷却・人件費が必要で、さらに様々な用地論争に直面します。しかし、SpaceXのスターシップが完全再使用を実現すれば、1ギガワットの計算能力をレーザーインターコネクトで宇宙軌道に打ち上げるコストは、わずか50億ドルにまで暴落する可能性があります。宇宙の自然な極寒環境とほぼ無限の太陽エネルギーにより、宇宙データセンターの運用経済性が3〜4年以内に地上のデータセンターを逆転させるかもしれません。
DRAM-4.91%
SKHYNIX-8.97%
原文表示
このページには第三者のコンテンツが含まれている場合があり、情報提供のみを目的としております(表明・保証をするものではありません)。Gateによる見解の支持や、金融・専門的な助言とみなされるべきものではありません。詳細については免責事項をご覧ください。
  • 報酬
  • コメント
  • リポスト
  • 共有
コメント
コメントを追加
コメントを追加
コメントなし