广场
最新
热门
资讯
我的主页
发布
torygreen
币龄 2.9 年
最高 VIP 等级 0
关注
用户暂无简介
0
关注
14
粉丝
45
点赞
广场
直播
torygreen
1小时前
AI投资正以46%的速度超出AI收入。2001年电信泡沫期间,这一差距为32%。我们已经超过了电信泡沫的区间,并且仍在加速,预计到2027年年度资本支出将达到$1T 。
代币价格则揭示了另一面。硅数据LLM代币支出指数在5月份达到了每百万代币2.06美元的峰值。现在为1.62美元。六周内下跌20%。自2023年以来下跌超过90%。
代币总支出同比大约翻了一番。更便宜的代币在扩大市场,而非摧毁它。问题在于当价格下跌时,资本支出账单不会缩水。无论你每百万代币收费2美元还是0.50美元,基础设施成本都一样。
训练是一种具有有限时间线的资本支出。推理则是持续性的。当代币价格压缩90%时,服务模型的利润率也随之压缩。客户群在增长,但单位经济效应在变薄。
超大规模计算定价是为一个GPU容量稀缺、买家无处可去世界而构建的。容量仍然稀缺。但为此支付高额溢价的意愿正在减弱。
TOKEN
0.44%
查看原文
赞赏
点赞
评论
转发
分享
torygreen
07-04 07:43
.@nvidia 不再仅仅参与芯片制造。它正将自己定位为AI基础设施经济中的直接参与者。
从最近的公告来看,他们正在为数据中心提供融资,并从中获取其所产生的云收入份额。
最近的两项合作完美地说明了这一转变:
21万块GPU,对应6年内承诺的250-300亿美元采购量
> Sharon AI $SHAZ 在澳大利亚部署4万块GB300
> Firmus 在巴淡岛将加速器规模扩大到17万块,总功率360MW
与此同时,英伟达及其合作伙伴推出了XFRA液冷GPU系统,用于分布式部署,即使是小规模。一个100单元的试验正在进行中,声称成本比超大规模低5倍,构建速度快6倍。
这一转变具有战略意义。英伟达正从销售硬件转向获取这些GPU在生产中所赚取的一部分。它现在覆盖了芯片、系统设计、软件以及越来越多的融资,使得协调变得更加可控。
真正的制约在于别处:将并非你制造的GPU,由你无法控制的运营商运营,聚合到行为如同单一机器的集群中。
这正是这种方法要解决的难题。
查看原文
赞赏
点赞
评论
转发
分享
torygreen
07-03 09:18
70% 的公司表示他们使用人工智能。但只有不到十分之一的企业在生产环境中运行着真正的智能体。
这一差距存在于斯坦福大学的 AI 指数中,这是目前最常被引用、偏见最少的人工智能数据集,并非由某个利益相关实验室发布。
仅谷歌去年就在人工智能基础设施上花费了超过 1500 亿美元。前沿实验室的收入正以历史性的速度增长,而计算支出也同步攀升,并未像通常基础设施规模化后那样在收入中占比下降。
采用从来不是瓶颈。瓶颈在于运行一个永不停止的工作负载,检查工具、采取行动、保持状态,同时成本结构不会在收益复利之前吞噬收入。这是一个基础设施问题,而非智能问题,这也解释了为什么 70% 的采用率只带来个位数的实际部署。
这两个数字之间的差距,正是一个尚未有人为其构建基础设施的市场。
查看原文
1人点赞了这条动态
赞赏
1
评论
转发
分享
torygreen
07-01 08:51
2026年人工智能的制约因素不是模型质量,而是电网容量。
PJM刚刚发布了弗吉尼亚州容量电价833%的涨幅。该州目前约40%的电力输送给数据中心,并且进口的电力比加利福尼亚州还多。都柏林消耗着爱尔兰国家电网近80%的电力。法兰克福则占到区域供电量的42%。
国际能源署认为,到2030年数据中心的需求将再次大致翻倍,而美国正在开发的项目中有一半集中在已经使电网紧张的地区。
我们正越来越擅长压缩每个代币的焦耳消耗,并且人工智能在每项任务上的效率也在持续提升。但运行人工智能的地理位置并未改变。而这一地理位置正是无人能够优化掉的制约因素。
查看原文
赞赏
点赞
2
转发
分享
nil3437:
美光(MU)空投:注册即可零门槛赢取美股,CFD交易奖励高达8股MU https://www.gate.com/campaigns/5371?ch=4468&ref=VLARAFKMAQ&ref_type=132
查看更多
torygreen
06-30 07:41
花时间研究推理数据,反复出现的一项统计是这样的:
到2026年,70%的AI推理发生在边缘。不是在超大规模数据中心,也不在AWS上。对于工业系统、自动化设备以及联网设备而言,与云端服务器之间的往返通信并非只是“延迟问题”,而是一种故障模式。
1060亿美元的推理市场之所以增长,并不是因为人们向AI发送了更多“聊天”查询;增长的原因在于,AI正在被嵌入到持续运行的物理基础设施中。这些基础设施运行在没有可靠网络的环境里,而且无法承受等待。
超大规模的建设确实存在。7250亿美元的资本开支承诺也确实存在。只是投向了那30%。
查看原文
1人点赞了这条动态
赞赏
1
评论
1
分享
torygreen
06-29 11:53
显然,离这种实体技术近几乎与真正采用它没有多大关系。
加利福尼亚州汇聚了所有重要的前沿AI实验室。纽约的财富500强企业数量比任何其他州都多。但两者都被科罗拉多州超过了:该州实现了23.2%的商业AI采用率,而纽约为13.8%。
科罗拉多州和亚利桑那州所拥有的,并不是什么更好的基础设施或人才。关键在于——在行业发出“安全”信号之前,它们就愿意先动手。离技术最近的州往往也是部署最慢的,因为它们在“事物如何按原有方式运行”上投入得最多。
到2026年,四分之三的美国企业仍未以任何有意义的方式使用AI;而关于AI如何重塑经济的每一条头条新闻,都在描绘一个这样的世界:77%的企业尚未进入。
尽管模型每个月都在变得更好、成本也更低,但最终仍归结为一个分发(distribution)问题;而解决分发的那一层,从来都不是构建产品的那一层。
查看原文
赞赏
点赞
评论
转发
分享
torygreen
06-28 09:09
理论上,人工智能成本本应已经暴跌。
同样的前沿级任务,在2023年GPT-4发布时每百万token成本30美元,如今GPT-5仅需1.25美元。三年间下降了96倍,且适用于所有公布价格的命名模型。
按照任何常规逻辑,企业AI账单本应大幅下降。然而,财富500强企业的平均AI预算从2024年的$7M 增至2026年的$19M 。两个预算周期内增长了近3倍。
原因在于:廉价的token不会被节省下来,而是被武器化。聊天机器人发射一次token就停止。而执行实际工作的智能体在相同任务上消耗5到30倍的token,一旦推理变得如此便宜,你就会将其指向一切。每次降价所释放的使用量都超过其节省的量。
成本中心并未缩小。它从模型层转移到了其下的基础设施层。真正的账单正在那里产生,而大多数公司尚未打开它。
查看原文
2人点赞了这条动态
赞赏
2
评论
转发
分享
torygreen
06-27 10:35
今年,AI计算领域悄然发生了一次反转,而这种反转改变了基础设施建设的真正目的。
2023年,AI计算中三分之二的算力用于训练,即构建模型的实际工作。另一小部分用于推理,即模型构建完成后实际运行的工作。但这一比例开始悄然反转。
根据德勤的数据,推理目前占三分之二,且仍在攀升,而用于运行推理的芯片今年已突破$50B 。
这一反转之所以重要(且并非百分比原因),在于训练和推理是两种截然不同的工作负载。训练是爆发式的,在一个巨型集群上完成,然后结束。推理从不停止。每次有人发送提示词或代理采取步骤时,推理都在运行,并且随着你增加的用户数量而扩展。一个是建设项目,另一个是永远增长的费用账单。
关于AI基础设施的所有假设都围绕训练展开,因为资金曾流向那里。然而,资金现在正转向不需要位于单一集群中运行的工作负载。
查看原文
赞赏
点赞
评论
转发
分享
torygreen
06-26 21:14
两年前,这张图表上的开放模型几乎排在末尾。闭源实验室领先了好几代,正是这个差距让人们选择租用模型而非拥有自己的模型。
现在GLM-5.2在@ArtificialAnlys指数上排名第51位。
开放权重,中国实验室,总排名第五。并且将Fable从列表中剔除,因为它不可用,而开放权重模型的实际位置远比排名所显示的更接近顶端。
闭源模型的卖点一直是领先优势。付费使用API,接受条款,在你无法控制的东西上构建,因为模型足够领先,值得这样做。现在领先优势只剩几个百分点,而GLM在进入英伟达芯片限制名单的情况下仍达到了这一水平,这更加令人印象深刻。
溢价是根据差距来定价的。差距几乎消失,但溢价却没有变化。
好奇一年后我们会处于什么位置。
GLM
-1.39%
查看原文
赞赏
点赞
评论
转发
分享
torygreen
06-25 10:51
关于AI计算的分化,很少有人正在用正确方式读懂它。
前沿训练每个季度都在更加集中:数千块GPU必须放在同一个地方,并用线缆连成一体。但在2026年,训练只占需求的30%。其余70%是推理,而在hyperscaler(超大规模云)上运行推理,意味着你要为那种为最苛刻工作负载建造的基础设施付费,却用来做最简单的任务。
在分布式网络上,同样的推理本可以便宜45%到75%,而对任何在测算AI基础设施预算的人来说,这个差距就是全部故事。
训练出于必要性而集中;推理则被拆分,因为当你不再需要为一个不需要AWS利润率的工作负载支付这些利润率时,在规模上这样做就不再说得通。
查看原文
赞赏
点赞
评论
转发
分享
torygreen
06-24 21:38
最近一直在想GLM 5.2的新闻,大家都在讨论开源权重这个角度,但其实他们完全忽略了另一个截然不同的视角。
所有人的注意力都集中在中国实验室达到了前沿水平并开源了这一事实,但真正值得深思的是它是如何做到的。ZAI和其他中国实验室在2025年初就被切断了英伟达的供应,所以大概从那时起,它们就拿不到H100和H200芯片了。
他们却用一颗很可能由中国硅片训练的模型,达到了与前沿水平仅相差几个点的表现。 $128B
出口管制本意是拖慢中国。但实际上却迫使竞争转向了电力而非芯片——而电力恰恰是中国供应过剩的要素。中国一年新增了543吉瓦的装机容量,比整个印度的电网规模还大。
自2021年以来,中国新增的发电量已超过美国电网的总容量,而美国电网在AI需求的压力下已经不堪重负。
你可以限制芯片供应。但你无法限制电力。而当受限制的一方还在持续发布开源权重时,整个行业都将从中受益。
GLM
-1.39%
查看原文
赞赏
点赞
评论
转发
分享
torygreen
06-24 10:17
95%的企业GPU容量目前处于空闲状态。
这个数字来自Cast AI测量的23,000个真实生产集群,而不是一项普通的调查。
平均利用率为5%,而正是在英伟达将H200价格提高15%的同时发生的,这是20年来的首次涨价。大家说稀缺的硬件大部分其实都没有在使用。
如果你试图弄清楚为什么计算资源感觉难以获得,这就是原因。没有人会退还他们等待了数月的配额。因此,资源池以5%的利用率运转,按小时计费,稀缺性相互促进。这似乎是协调失败,而不是供应问题。
查看原文
赞赏
点赞
评论
转发
分享
torygreen
06-23 08:40
一些重大的欧盟人工智能政策动向据报道即将到来,但这是他们所依赖的基础设施现实。
> 2026年欧盟主权人工智能基础设施支出:126亿美元。
> 同一年美国超大规模云服务提供商的资本支出:7250亿美元。
欧洲花了六年时间建造了19个AI工厂和14台超级计算机,而仅亚马逊今年两周内的支出就将超过整个欧洲的努力。
大多数欧洲AI团队不使用欧洲基础设施。他们从弗吉尼亚和爱荷华租用,并在超大规模云服务提供商的利润基础上支付GDPR合规溢价作为特权。新的英伟达硬件在美国东部之后3到6个月到达欧盟数据中心。这个大陆在结构上依赖于它不设计的芯片、在它不控制的工厂制造的芯片,由优先考虑本土市场的公司分配。
电网是另一个瓶颈。爱尔兰的数据中心已经消耗了全国电力的22%。到年底,欧盟的空置率将压缩到6.5%。
你无法通过政策声明弥补57倍的差距。计算资源已经在38个国家存在。问题是它们没有连接成任何可用的系统。
查看原文
赞赏
点赞
评论
转发
分享
torygreen
06-22 08:41
我没想到今年会出现这个数字。
到目前为止,GitHub 2026 年的提交量预计将达到 140 亿次。相比 2025 年的 10 亿次,这增长了 14 倍,而其中大部分并不是人类在编写代码。
负载变得如此严重,以至于拥有并运营着地球上第二大云的微软不得不通过 AWS 转发流量以保持平台在线。仅五月就发生了九次服务中断。可用性下降到 88.4%。
对于每个工程团队、基础设施供应商和云服务提供商来说,仍在为人类速度的开发调整容量的基准,已经发生了数量级的变化。
查看原文
1人点赞了这条动态
赞赏
1
评论
转发
分享
torygreen
06-20 08:26
英伟达的收入证明了“代理计算”不是一个理论。它已经体现在财务报表中。
$26B 四年前。去年为2159亿美元。在大多数人工智能仍然停留在等待你提问的聊天框中的情况下,这一增长达到了8倍。
重要的不是增长本身。而是英伟达将其架构变成了几乎所有其他公司路线图中不可谈判的输入。实验室、云端、企业。API上的标志不同,底层芯片相同。在本轮AI基础设施的每一美元几乎都泄露到他们的技术堆栈中。
现在来看詹森的说法,代理AI大约需要生成式AI的10倍计算能力。这不是炒作,而是硬件连接。聊天机器人只需一次前向传播,然后空闲。一个能规划、执行、检查自己工作并在多步骤任务中重试的代理,单个结果就需要数十或数百次传播。没有“关闭”开关,因为工作不会停止。
企业AI目前的渗透率约为8%,预测到2032年将接近67%。这个曲线上的每一个百分点,意味着额外的84亿美元基础设施需求。
训练构建了模型。推理将它们放在API后面。代理阶段则持续运行它们,作为永久的运营成本。
英伟达$216B 年的收入不是最高的。这是当代理曲线真正进入生产阶段时的热身。
完整财务数据:
查看原文
赞赏
点赞
评论
转发
分享
torygreen
06-19 16:48
我没想到高盛的五年数字会如此庞大。
预计五大超大规模科技公司将在2025年至2030年间在人工智能基础设施上花费5.3万亿美元。2022年它们的总支出为$162B 。
今年它们的支出有望达到7250亿美元。到2027年,分析师预测单年支出将达到1万亿美元。
对于那些在这五大财务报表之外构建人工智能产品或基础设施的人来说,这一轨迹是你规划假设中最重要的数字。
它们能部署的规模与其他所有人可以访问的规模之间的差距,每年都在不断扩大。
查看原文
1人点赞了这条动态
赞赏
1
评论
转发
分享
torygreen
06-18 19:30
每个人都预测人工智能会首先接管重复的行政工作。数据却显示不同的情况。
决策现在占工作场所人工智能活动的28%。最主要的用例不是自动化,而是判断。
人们使用人工智能来分析选项、权衡利弊,并支持他们负责的结论,这种转变在劳动力市场问题之外也具有重要意义。
基于判断的工作负载持续运行,每次会话需要更多的上下文,并且不能高效批处理。
帮助你全天做出决策的人工智能所需的基础设施与起草电子邮件的基础设施完全不同。
查看原文
2人点赞了这条动态
赞赏
2
1
转发
分享
Millionairetasks:
每个人都能拥有的绝佳机会
torygreen
06-18 08:12
2026年第一季度全球云基础设施。单季度达1290亿美元。同比增长35%。
市场正在快速扩展,但集中度没有变化。AWS、Azure 和 Google Cloud 两年前的市场份额大致与今天相同,但它们与其他所有竞争者之间的绝对差距在美元方面比以往任何时候都更大。
这就是百分比图没有显示的部分。“其他”部分并没有成为真正的替代方案。它保持比例不变,而这三大云服务提供商每个季度都在增加数十亿美元的绝对收入。
不同分布模式出现的窗口正在变得越来越窄。
查看原文
1人点赞了这条动态
赞赏
1
评论
转发
分享
torygreen
06-16 22:28
PJM 运营着横跨美国13个州、6500万人口的电网。它是世界上最大的竞争性批发电力市场。
其容量市场清算价格——即传递未来电力供应能否满足需求的信号价格——已从2024年的每兆瓦28.92美元升至2026年的329.17美元。经历了两个拍卖周期。
数据中心需求被确定为主要驱动因素。2027/2028年的拍卖刚以333.44美元清算完成,而PJM 直接将5100 MW的负载增量归因于数据中心。
这不是供给冲击,也不是地缘政治事件。这是由 AI建设扩张、推动落地扩容所带来的影响:它落在了未为此而设计的电网上。
在大多数地区,将新设施接入电网需要4到10年。建造设施需要2到3年。
每个卡在这段时间差里的项目,都在支付市场清算价,同时等待。
算力已经准备好了。电力还没有。
查看原文
3人点赞了这条动态
赞赏
3
2
转发
分享
dive nate:
2026 加油 👊
查看更多
热门话题
查看更多
#
gStocks代币化股票上线
481.8万 热度
#
非农爆冷打压加息预期
107.26万 热度
#
预测世界杯巴西VS挪威
23.3万 热度
#
ETH突破1700
1.52亿 热度
#
Meta卖算力引发存储股大跌
141.39万 热度
置顶
网站地图