1/ 🧠 為什麼未來的 personal AI computer(像 NVIDIA DGX Spark)真的能跟 data center 一較高下?
不是因為桌面變強到取代雲端,而是因為 AI 的「需求結構」正在分裂 ——
訓練留在雲端,推論回到本地。
2/ 關鍵突破一:FP4 改寫遊戲規則
70B 參數的模型,用 FP16 要 140GB 記憶體;
換成 FP4 → 只要 35GB。
一台配 128GB unified memory 的桌面機,就能跑得動以前要 8 張 H100 才能裝下的模型。
精度損失?用 QAT(量化感知訓練)幾乎可以忽略。
3/ 關鍵突破二:Memory Wall 正在被打破
LPDDR5X 頻寬不夠?
•Apple M4 Ultra 用超寬位元寬度做到 ~800 GB/s
•LPDDR6(2027)頻寬再翻倍
•NVIDIA DGX Spark 用 GB10 + 連貫記憶體架構
桌面端不再是「閹割版 GPU」,而是「為推論優化的新物種」。
4/ 關鍵突破三:你根本不需要 data center
Data center 解決的是:
✅ 訓練 frontier model(兆級參數)
✅ 服務全球數十億用戶並發
個人需要的是:
✅ 一個跑得動 70B–200B 模型的本地大腦
✅ 隱私、低延遲、不用月費
這兩件事根本是不同問題。
5/ 投資啟示 💡
•H