"FLASH"的搜索结果
今天
04:05

蚂蚁集团 Ling-2.6-flash 模型开源:1040B 参数、7.4B 有效参数,达成多项 SOTA 基准

Gate 新闻简报,4月29日——蚂蚁集团的 Ling-2.6-flash 模型权重现已开源;此前这些权重仅通过 API 提供。该模型总参数量为 1040 亿,单次推理激活为 74 亿,拥有 256K 上下文窗口,并采用 MIT 许可。提供 BF16、FP8 和 INT4 精度版本,现已在 HuggingFace 与 ModelScope 上提供。 Ling-2.6-flash 相较 Ling 2.0 引入了混合线性注意力改进:将原始的 GQA 升级为 1:7 MLA,并结合 Lightning Linear 的混合架构,同时配合高度稀疏的 MoE。推理效率显著超过同类模型:在 4x H20 GPU 上,峰值生成速度达到 340 tokens/s;在可比的开源模型上,prefill 与 decode 的吞吐量约高出 4 倍。与智能体相关的基准测试显示出强劲表现:BFCL-V4、TAU2-bench、SWE-bench Verified 61.2%、Claw-Eval 以及 PinchBench 达到或接近 SOTA 水平。在完整的 Artificial Analysis 基准测试套件中,总 token 消耗仅为 1500 万。在 AIME 2026 上,该模型得分为 73.85%。 蚂蚁集团的官方网站同样列出了 Ling-2.6-1T 万亿参数旗舰版本 以及 Ling-2.6-mini 轻量版本 ;不过截至发布,权重仍未在 HuggingFace 上发布,当前仅提供 flash 系列下载。
展开
06:13

Google 发布 Gemini 3.1 Flash TTS:增强情感表达与多说话人能力

Google 发布了 Gemini 3.1 Flash TTS,这是一款先进的文本转语音模型,具备改进的情感表达与控制能力。其功能包括自然语言音频标签、用于生成更细腻输出的“导演模式”,以及多说话人能力,可实现更逼真的对话。该模型支持 70 多种语言,并以高效为设计目标,旨在增强 AI 生成内容并应对不实信息。该发布反映了语音技术领域竞争的加剧,尤其来自 OpenAI 和 Meta。
展开
02:27

美团开源560B参数定理证明模型,72次推理通过率97.1%刷新开源SOTA

美团LongCat团队于3月21日开源了LongCat-Flash-Prover,一个5600亿参数的MoE模型,专注于Lean4形式化定理证明。模型分为自动形式化、草图生成和完整证明生成三项能力,结合推理工具与Lean4编译器实现实时验证。训练采用Hybrid-Experts Iteration Framework和HisPO算法,防止奖励作弊。基准测试表明,该模型在自动形式化和定理证明方面刷新了开源权重模型的记录。
展开
03:19

Ripple进军澳大利亚支付市场:申请金融牌照扩展亚太业务,跨境加密支付或迎新机遇

Ripple通过收购BC Payments寻求获得澳大利亚金融服务牌照,推动亚太地区跨境支付业务的发展。若申请成功,将增强其在当地市场的竞争力,简化交易流程并减少对中介的依赖。该举措可能推动区块链支付技术在受监管金融体系中的应用,但市场竞争仍在加剧,传统金融系统与加密服务尚存在摩擦。
展开
05:51

机构:AI存储需求激发HDD替代效应 NAND

根据TrendForce调查,AI推理应用推动了对大容量存储产品的需求,导致HDD市场供应缺口加大,NAND Flash业者加速生产超大容量SSD,以应对未来市场需求。
展开