Google DeepMindがローカルAI向けにDiffusionGemmaを4倍の速度向上でリリース
Google DeepMindは、並列処理によってテキストを生成する新しいGemma 4のオープンモデルファミリーのメンバーであるDiffusionGemmaをリリースしました。モデルは、Nvidia DGXシステムや一般向けのゲーミングGPUを含むローカル環境で、より高速かつ効率的な性能を実現しています。左から右へ1トークンずつ順番に生成する自己回帰(オートレグレッシブ)モデルとは異なり、DiffusionGemmaは画像生成モデルに似た拡散ベースの手法を採用します。まずプレースホルダートークンから開始し、複数回のパスを通じてそれらを洗練させることで、テキストブロック全体を同時に生成します。このアーキテクチャの変更により、同程度のサイズの自己回帰型Gemmaモデルと比べて出力速度は約4倍になり、高性能な一般向けコンシューマーGPUのメモリ制約の範囲に収まります。 DiffusionGemma は並列テキスト生成のための拡散ベースのアーキテクチャを使用 多くのAIモデルは自己回帰型として設計されており、テキストを左から右へ1トークンずつ生成します。DiffusionGemmaは、静止し
OliverGrant·06-10 19:39