而这场存储革命的绝对主角,正是 HBM(High Bandwidth Memory,高带宽内存)。2026 年 HBM 市场规模预计增长 58% 至 546 亿美元,占 DRAM 市场近四成。HBM 与 DRAM 究竟有什么区别?AI 大模型为何对 HBM 如此依赖?
HBM 与 DRAM:同源不同命
HBM 与 DRAM 共享同一种基础存储介质——动态随机存取存储器。但二者的技术路线、架构设计和应用场景,却走向了完全不同的方向。
传统 DRAM 走的是“平面扩张”路线。 以 DDR4、DDR5 为代表的传统 DRAM 采用平面架构,通过制程升级(如从 20nm 推进至 2nm)和架构优化(如 DDR5 的预取位数提升)来提高性能。其核心逻辑是:在二维平面上不断缩小晶体管尺寸、提升频率。但这条路正逼近物理极限——2nm 以下制程面临量子隧穿效应等难题,单靠制程微缩已无法满足 AI 算力对存储带宽的指数级需求。
HBM 则选择了“垂直堆叠”的破局之路。 HBM 采用 3D 结构,使用硅通孔(TSV)技术将数个 DRAM 裸片垂直堆叠,形成立方体结构——在 DRAM 芯片上开设数千个细微孔,通过垂直贯通的电极连接上下芯片;底层则是 DRAM 逻辑控制单元,负责整体时序与控制。这种“叠罗汉”式的设计,使得 HBM 能够在极小的物理空间内实现极高的带宽密度。
与此同时,一个有趣的现象正在发生:通用型 DRAM 的盈利能力正在结构性反超 HBM。截至 2026 年首季,通用型 DRAM 与 HBM 的营业利润率差距已扩大至逾 15 个百分点。市场测算显示,2026 年将产能分配给通用 DRAM,每片晶圆产生的营收已是 HBM 的两倍以上,毛利接近三倍。这正是 SK 海力士考虑将部分资源重新向通用 DRAM 倾斜的原因——但这恰恰印证了整个存储市场正处于全面性的景气高涨。
HBM vs DRAM:AI 大模型为何离不开它?存储芯片从“平面时代”走向“ 3D 革命”
2026 年 6 月 30 日,比特币在 60,000 美元附近窄幅震荡,以太坊维持在 1,600 美元区间。加密市场在经历 6 月以来的持续回调后,短期空头主导格局未改。但就在加密资产进入“垃圾时间”的同时,另一条赛道正经历前所未有的爆发式增长——半导体存储。
世界半导体贸易统计组织(WSTS)2026 年春季报告大幅上调行业增长预期:2026 年全球半导体市场规模或突破 1.51 万亿美元,同比增长 90%,其中存储芯片同比增幅达 250%,规模突破 8,000 亿美元。存储产值将首次超越晶圆代工,成为半导体第一增长极。
而这场存储革命的绝对主角,正是 HBM(High Bandwidth Memory,高带宽内存)。2026 年 HBM 市场规模预计增长 58% 至 546 亿美元,占 DRAM 市场近四成。HBM 与 DRAM 究竟有什么区别?AI 大模型为何对 HBM 如此依赖?
HBM 与 DRAM:同源不同命
HBM 与 DRAM 共享同一种基础存储介质——动态随机存取存储器。但二者的技术路线、架构设计和应用场景,却走向了完全不同的方向。
传统 DRAM 走的是“平面扩张”路线。 以 DDR4、DDR5 为代表的传统 DRAM 采用平面架构,通过制程升级(如从 20nm 推进至 2nm)和架构优化(如 DDR5 的预取位数提升)来提高性能。其核心逻辑是:在二维平面上不断缩小晶体管尺寸、提升频率。但这条路正逼近物理极限——2nm 以下制程面临量子隧穿效应等难题,单靠制程微缩已无法满足 AI 算力对存储带宽的指数级需求。
HBM 则选择了“垂直堆叠”的破局之路。 HBM 采用 3D 结构,使用硅通孔(TSV)技术将数个 DRAM 裸片垂直堆叠,形成立方体结构——在 DRAM 芯片上开设数千个细微孔,通过垂直贯通的电极连接上下芯片;底层则是 DRAM 逻辑控制单元,负责整体时序与控制。这种“叠罗汉”式的设计,使得 HBM 能够在极小的物理空间内实现极高的带宽密度。
两者在关键性能指标上的差距堪称代际:
带宽方面,传统 DRAM(如 DDR5)带宽约为 50 - 100 GB/s,而 HBM3E 单堆叠带宽可达 1.2 TB/s,下一代 HBM4 预计将提升至 2.0 TB/s 以上。HBM 的带宽是传统 DRAM 的 10 倍以上。
功耗效率方面,HBM 可低至 5 pJ/bit 以下,传统 DRAM 则为 10 - 15 pJ/bit。在动辄数千张 GPU 同时运转的数据中心,这一差距意味着每年数千万美元的电费差异。
延迟方面,传统 DRAM 凭借平面架构优势可维持在 10 ns 级,而 HBM 因堆叠层数增加,延迟在 100 ns 级。但 AI 训练推理场景对“吞吐量”的敏感度远高于“单次延迟”——海量参数的高速吞吐远比单次访问的快慢更重要。
成本方面,HBM 的生产成本远高于传统 DRAM。HBM4 单 Gb 成本虽较 HBM3 下降 30%,但仍是同容量 DDR5 的 3 - 5 倍。HBM 消耗的晶圆用量约为 DDR5 的 4 至 5 倍,TSV 工艺使得 HBM 芯片的比特密度显著低于同规格 DDR——SK 海力士 D1z DDR4 的比特密度为 0.296 Gb/mm²,比其 HBM3(0.16 Gb/mm²)高出 85%。TSV 所需的额外面积和复杂的堆叠封装工艺,是 HBM 成本高企的核心原因。
简言之:传统 DRAM 追求“便宜够用”,HBM 追求“极致带宽”——这是一场“成本优先”与“带宽优先”的技术路线之争。
内存墙危机:为什么 AI 大模型非 HBM 不可?
AI 大模型对 HBM 的依赖,根源在于一个被业界称为“内存墙”(Memory Wall)的根本性瓶颈。
过去 20 年间,GPU 计算能力增长了 6 万倍,而 DRAM 带宽仅提升了 100 倍。算力提升速度远高于数据供给速度——就像一辆马力暴增的赛车,燃油管路却还是 20 年前的规格。GPU 是引擎,HBM 是燃油喷射系统;如果燃油供给速度跟不上,引擎马力再大也只能空转。
大语言模型的运行机制放大了这一矛盾。AI 模型生成回答并非简单检索静态信息,而是持续维护一个包含上下文窗口、键值缓存(KV Cache)、中间激活和路由决策的“工作状态”。这些数据需以超低延迟实时访问且始终可用。在完整 Token 序列处理中,模型需持续访问并更新上下文——即便内存延迟轻微上升,也可能导致吞吐量下降、响应延迟,甚至迫使运营商增配硬件。
训练阶段,万亿参数的大模型需要在海量数据上反复迭代,每一次前向传播和反向传播都涉及巨量参数的读取与更新。HBM 提供的 TB/s 级带宽,是缩短训练时间的决定性因素。
推理阶段,随着多模态大模型和 AI Agent 加速发展,Token 调用量快速上升。推理应用的瓶颈往往不在于“算得有多快”,而在于“数据喂得有多快”。带宽的尽头就是 HBM。
在系统层面,AI 运行于分层内存架构之上:HBM 为加速器提供数据,DRAM 存储实时状态和对话记忆,基于 NAND 的 SSD 则为数据集、嵌入、检索索引、日志和检查点提供持久化存储。HBM 处于最靠近计算核心的位置,承担着最高频、最紧急的数据供给任务——这是任何其他存储介质无法替代的。
正因如此,所有用于生成式 AI 训练和推理的领先 AI 加速器都使用 HBM。HBM 不是 AI 的“可选配件”,而是决定 AI 能走多快的“氧气瓶”。
供需失衡:一场持续数年的结构性短缺
HBM 的需求是刚性的,供给却是“锁死的”。
需求端,2026 年全球 AI 基础设施支出将达到 4,500 亿美元,其中推理算力占比首次超过 70%,由此拉动 GPU、HBM 及高速网络芯片的强劲需求。2026 年 HBM 需求增长主要由 AI ASIC 产能升级驱动,每颗 AI 芯片的 HBM 容量将从 96 GB/192 GB 大幅提升至 216 GB/288 GB。英伟达 Rubin 平台虽单颗 GPU 的 HBM 容量与上代持平,但更高的出货量继续推高整体需求。全球九大云服务商 2026 年合计资本开支预计达约 8,300 亿美元,同比增长 79%。
供给端,尽管三星、SK 海力士、美光三大原厂已将 70% 的新增/可调配产能倾斜至 HBM,但 HBM 产能缺口仍高达 50% 至 60%。截至 2026 年首季,三大原厂的 HBM 产能已全部售罄。据 SemiAnalysis 数据,2026 年 DRAM 供应低于需求约 7%,HBM 缺口 6%、2027 年扩大至 9%。
更关键的是供给刚性。即便三大原厂现在决定扩产,受限于 TSV 工艺、先进封装良率、设备交付周期等物理约束,新增产能释放最快也要到 2028 - 2029 年。国际投行普遍认为 HBM 供不应求的结构性短缺至少将持续到 2028 年。英伟达 CEO 黄仁勋更明确表态:全球 HBM 供应短缺“根本不是短期市场波动,而会是一个持续数年的结构性行业困局”。
价格端,三星电子和 SK 海力士已将 2026 年 HBM3E 供应价格上调近 20%。HBM4 12 层初期合约价预计较 2025 年 HBM3E 12 层溢价 10% 以上。
市场格局:谁在主导这场存储革命?
HBM 市场呈现极高的集中度。法人预测,SK 海力士 2026 年出货市占率约 52%,三星电子约 39%,美光约 8%,中国大陆业者维持极低比重。以销售额计算,SK 海力士 2026 年 HBM 营收有望达 59.5 亿美元,稳居全球第一。
2026 年首季全球 HBM 市场中,SK 海力士市占率约 51.4%。集邦科技预计其 2026 年全年 HBM 市占率可维持约 50%;Counterpoint 更预测其在 HBM4 市场的份额将达 54%。
三大原厂的毛利率已突破 70% 甚至 80%。HBM 的利润分配呈“金字塔”结构——越靠近技术核心与瓶颈环节,分配比例越高。
与此同时,一个有趣的现象正在发生:通用型 DRAM 的盈利能力正在结构性反超 HBM。截至 2026 年首季,通用型 DRAM 与 HBM 的营业利润率差距已扩大至逾 15 个百分点。市场测算显示,2026 年将产能分配给通用 DRAM,每片晶圆产生的营收已是 HBM 的两倍以上,毛利接近三倍。这正是 SK 海力士考虑将部分资源重新向通用 DRAM 倾斜的原因——但这恰恰印证了整个存储市场正处于全面性的景气高涨。
投资视角:HBM 超级周期中的机会
HBM 的结构性短缺与价格上行趋势,为投资者提供了清晰的产业逻辑支撑。
存储原厂是直接受益者。SK 海力士(韩股)、三星电子(韩股)和美光(美股)凭借技术垄断和产能稀缺,赚取了产业链中的绝大部分超额利润。摩根士丹利基于 DRAM 均价至 2026 年上涨 62% 的预测,将存储原厂盈利预测上调 56% 至 63%。
产业链上游同样受益。存储龙头的大规模扩产直接拉动刻蚀、薄膜沉积、测试等半导体设备需求,产业链景气度正从上游向中游传导。HBM 的先进封装需求也推动了 CoWoS 等 2.5D 封装技术的产业化。
AI 芯片厂商是 HBM 的最终需求方。英伟达(美股)、博通(美股)等 AI 芯片龙头对 HBM 的采购需求持续扩大。英伟达 Rubin Ultra 单颗 GPU 的 HBM 容量将提升至 1 TB。
Gate 股票交易:一站式参与全球存储与 AI 投资
对于希望参与这一轮存储超级周期的投资者,Gate 股票提供了便捷的入市通道。
目前,Gate 股票已形成覆盖美股、港股及韩股三大核心市场的 7×24 小时交易服务体系,支持超过 10,000 只美股及 ETF、1,500 余只港股及 1,000 余只韩股,合计覆盖全球超过 12,500 只股票及 ETF 资产。标的涵盖苹果、英伟达、微软、腾讯控股、小米集团、三星电子、SK 海力士等全球代表性上市公司。
用户可通过 Gate 统一账户使用 USDT 一站式参与全球股票投资,支持最低 0.01 股起投的碎股交易,享有股息派发等权益。平台同时支持拆股、合股等公司行动服务,并已实现 App 与 Web 双端全面覆盖。
Gate 股票在原有盘前、盘中及盘后交易基础上,进一步支持隔夜及周末交易,突破传统证券市场交易时间限制。券商间转仓服务也即将上线,将进一步提升用户股票资产管理的灵活性与便利性。
交易方式:用户在 Gate 平台完成统一账户充值后,即可在股票交易模块选择目标股票,以 USDT 计价进行买卖。平台提供实时行情、技术分析工具和订单类型选择(市价单、限价单等),操作流程与加密资产交易体验一致。
结语
HBM 与 DRAM 的区别,本质上是“带宽优先”与“成本优先”两种技术路线的分野。在 AI 算力持续扩张的背景下,HBM 凭借 3D 堆叠和 TSV 技术实现了对“内存墙”的突破,成为大模型训练与推理不可替代的核心组件。
2026 年,全球半导体市场规模突破 1.51 万亿美元,存储芯片增长 250%,HBM 市场增长 58% 至 546 亿美元。产能缺口高达 50% 至 60%,三大原厂产能全部售罄。这不是一轮普通的周期波动,而是由 AI 基础设施长期资本开支驱动的结构性变革。
对于投资者而言,存储原厂、设备材料、AI 芯片三大链条均存在清晰的产业逻辑支撑。而 Gate 股票提供的 7×24 小时美港韩三股交易服务,为全球投资者参与这一轮存储超级周期提供了灵活高效的工具。在市场情绪极度恐惧(恐惧指数 14 - 16)的当下,产业基本面与市场情绪之间的背离,往往孕育着最值得关注的结构性机会。
FAQ
Q1:HBM 和 DRAM 的核心区别是什么?
HBM 与传统 DRAM 的核心区别在于架构。传统 DRAM 采用平面架构,通过制程升级提升性能;HBM 则采用 3D 堆叠技术,利用 TSV 硅通孔将多个 DRAM 裸片垂直堆叠,实现超宽数据路径。HBM3E 带宽可达 1.2 TB/s,是 DDR5 的 10 倍以上,但成本也是同容量 DDR5 的 3 - 5 倍。
Q2:为什么 AI 大模型必须使用 HBM?
大模型训练和推理需要海量参数的高速读写。传统 DRAM 带宽增长远落后于算力提升(20 年算力增 6 万倍,带宽仅增 100 倍),形成“内存墙”瓶颈。HBM 凭借 TB/s 级带宽,能持续为 GPU 供给数据,避免算力空转。所有领先的 AI 加速器都使用 HBM。
Q3:HBM 市场的主要玩家有哪些?
HBM 市场高度集中。SK 海力士 2026 年出货市占率约 52%,三星约 39%,美光约 8%。SK 海力士以销售额计算稳居第一,2026 年 HBM 营收有望达 59.5 亿美元。三大原厂 2026 年全部 HBM 产能已售罄,部分客户已将产能锁定至 2028 年。
Q4:HBM 供不应求的状况会持续多久?
国际投行普遍认为 HBM 供不应求将至少持续到 2028 年。需求端受 AI 基础设施资本开支驱动,供给端受 TSV 工艺、封装良率、设备交付周期等物理约束。即便现在扩产,新增产能释放最快也要到 2028 - 2029 年。黄仁勋称这是“持续数年的结构性行业困局”。
Q5:如何在 Gate 平台投资 HBM 相关股票?
Gate 股票支持美股、港股、韩股 7×24 小时交易,覆盖超 12,500 只股票及 ETF。用户可通过统一账户使用 USDT 一站式投资,最低 0.01 股起投。HBM 相关标的包括存储原厂 SK 海力士(韩股)、三星电子(韩股)、美光(美股),以及 AI 芯片厂商英伟达(美股)等。