全球 AI 行业大模型与监管动态

追踪 OpenAI、Anthropic、Google、DeepSeek 等大模型发布、融资与监管事件;含纯 AI 行业热点,不局限于加密,但影响市场情绪与叙事。
ALLAI AgentAI 行业动态AI 代币AI 工具应用

谷歌就由 Gemini 驱动的网络钓鱼诈骗起诉中国团体

谷歌已就一项诉讼起诉 Outsider Enterprise,这是一家据称使用谷歌的 Gemini AI 来自动化大规模网络钓鱼诈骗、针对 Android 用户的中国网络犯罪团伙。该团伙通过 Telegram 运作,为“钓鱼即服务”(phishing-as-a-service)提供几乎 300 个诈骗模板,使其能够创建模仿谷歌、YouTube 以及纽约等政府机构(如 New York 的 E-ZPass)的虚假网站。根据谷歌的法律文件,该行动向 Android 用户发送了超过 250 万条恶意短信,其中大约 5.5 万条在上个月为期两周的时间内送达。诈骗者利用 Gemini 的能力生成令人信服的虚假网站,用于窃取受害者的个人数据和银行信息,这些受害者点击了声称存在账户问题或包裹派送问题的链接。谷歌正与执法部门以及移动运营商 AT&T、Verizon 和 T-Mobile 合作打击该网络;该网络已被关联到 9,000 个虚假网站和 100 万个 URL,且据称已有数百人因这些骗局损失了金钱。 Outsider Enterprise 通过 Telegram 运营“钓鱼即服务” 根据谷歌的法
Oliver Grant·48 分钟前

谷歌因利用 Gemini 自动化网络钓鱼骗局起诉一家中国网络犯罪网络

根据 Google 的法律文件,公司上个月因使用 Gemini AI 来自动化网络钓鱼骗局而起诉了中国网络犯罪组织 Outsider Enterprise。Outsider Enterprise 通过 Telegram 运作,提供关于如何使用 Gemini 来创建仿冒 Google、YouTube 和政府机构的欺诈网站的指引,并向用户提供了近 300 个诈骗模板。 该网络促成的骗局导致向 Android 用户发送了超过 250 万条短信,且上个月在为期两周的时间里发送了 5.5 万条消息。Google 已追踪到该行动中关联的 9,000 个假网站和 100 万个 URL。Google 与 AT&T、Verizon 和 T-Mobile 合作,拦截了这些恶意信息。
Gate News·49 分钟前

MiniMax 开源 MiniMax M3 模型,拥有 4280 亿参数和 100 万 token 上下文

据 Beating 称,MiniMax 已在 Hugging Face 上开源其原生多模态混合专家(MoE)模型 MiniMax M3 的权重。该模型总参数规模达 4280 亿,且每个 token 激活 230 亿参数,能够原生支持最高 100 万 token 的上下文长度。开发团队发布了 MXFP8 量化版本,并集成了对主流推理框架的支持,包括 SGLang、vLLM 和 Transformers。MiniMax 还开源了轻量级 MiniMax 稀疏注意力(MSA)内核库,在 NVIDIA Blackwell 架构优化下,实现了在 100 万 token 上下文中预填充快 9 倍、解码快 15 倍。
Gate News·2小时前

SpaceX 计划在地面和轨道部署数据中心,并在 2027 年底前发射首颗 AI1 卫星

据 SpaceX 总裁兼首席运营官 Gwynne Shotwell 于 6 月 12 日表示,公司计划在火箭和发射场制造之外扩展,在地面和轨道上部署数据中心。Shotwell 表示,SpaceX 在人工智能领域是“100% 的新竞争者”,并计划于 2027 年底发射其首颗 AI1 卫星,届时将先由部分 Starlink 宽带和移动通信卫星接收计算能力。 Shotwell 强调,投资者应将 Starlink 用户增长和 Starship 开发进度作为关键指标,同时指出 Starlink Mobile 以及 Grok 生态系统业务的扩张。
Gate News·2小时前

Google DeepMind 报告:AI 能抵消研究放缓,但物理约束限制超智能

根据 Google DeepMind 最新的研究报告,人工智能可以抵消由研究成本上升所导致的科研生产力放缓。尽管自 1970 年代以来,为维持摩尔定律所需的研究人员数量已增长十八倍,但数字智能可以被无限复制,从而使研究资源在数小时内实现二十倍规模扩张。然而,DeepMind 识别出限制向超智能过渡的五个核心瓶颈,其中出现了物理延迟,成为关键约束。由于新的概念需要与真实的物理世界进行交互以克服具身限制,验证流程就会受到真实世界实验速度的约束,从而限制递归式硬件改进。
Gate News·4小时前

OpenClaw v2026.6.6 添加了失败关闭的批准超时,并集成了 Claude Fable 5 自适应思考

根据 Beating,OpenClaw 发布了 v2026.6.6,通过多重防护措施收紧安全沙箱边界,包括转录隔离、沙箱绑定限制以及失败关闭的审批超时。该更新通过阻止协议构件并禁用 Codex/Harmony 协议中的媒体指令,来防止敏感信息泄漏,同时在转录历史中对敏感图像进行脱敏。该框架还集成了 Claude Fable 5 的自适应思维能力,增加 OpenRouter OAuth 绑定,并保持对 Gemma 4 推理的推理回放。
Gate News·5小时前

OpenAI 推出 Codex 速率限制重置存储功能;用户获得 1 次免费重置

根据 OpenAI 于 6 月 12 日发布的官方公告,Codex 现在支持存储速率限制重置以供将来使用。Go、Plus、Pro 和 Business 用户将获得一次免费的重置机会。此外,Plus 和 Pro 用户最多可以在未来两周内邀请三位朋友来试用 Codex;在受邀的朋友发送他们的第一条 Codex 消息时,邀请者和被邀请者都将获得一项额外可用的重置。
Gate News·5小时前

百度发布 PP-OCRv6,支持 50 种语言,10M 级参数匹配百亿级 VLMs

百度的 PaddlePaddle 团队最近发布了 PP-OCRv6,这是一套新的 OCR 系统,提供三个版本:Tiny(1.5M 参数)、Small(7.7M)和 Medium(34.5M)。与 PP-OCRv5 相比,Medium 模型在检测准确率方面提升了 4.6%,在识别准确率方面提升了 5.1%,同时将中文、英文、日文以及 46 种拉丁字母脚本语言整合为一个统一模型。 该系统采用结构重参数化技术,以降低计算开销并提升准确率。在 OpenVINO 优化下,Medium 版本的 CPU 推理速度最高可提升 5.2 倍。根据官方基准测试,尽管仅使用数百万参数,PP-OCRv6 仍能与部分十亿级参数的视觉-语言模型相匹敌或超过其性能。代码已集成进开源的 PaddleOCR 项目中。
Gate News·5小时前

非洲 AI 法律照搬欧盟模式尽管存在落地差距,学者警告

非洲各国正越来越多地制定以欧盟标准为蓝本的 AI 立法,但科技法律学者认为,这种做法忽视了本地现实以及落地实施方面的挑战。毛里求斯于 2018 年推出了该大陆首个国家级 AI 战略,随后已有十多个非洲国家出台 AI 政策,非洲联盟也建立了一个大陆层面的框架。肯尼亚和埃塞俄比亚目前已提交了采用欧盟基于风险的监管模式的 AI 法案草案,而摩洛哥、埃及和尼日利亚正考虑类似立法。然而,利兹大学的 Kinfe Yilma 和斯特拉斯莫尔大学的 Grace Mutung'u 警告称,将欧洲的监管框架“移植”过来,可能会产生一些仍无法落实、停留在愿景层面的法律,从而映射出该大陆在执行现有数据保护立法方面所遭遇的困难。 非洲各国采用欧盟基于风险的 AI 监管模式 肯尼亚和埃塞俄比亚的 AI 法案草案都采用了欧盟的基于风险的监管思路。该框架通过根据 AI 系统所带来的风险性质对其进行监管:被认为存在“不可接受风险”的系统将被完全禁止,而风险较低的系统则需要满足特定要求。肯尼亚的 AI 法案在国内设立 AI 专员和 AI 咨询委员会,作为 AI 系统的监管者。 数据保护法律在整个大陆范围内仍基本无法落地执
Oliver Grant·6小时前

Mistral 探索为其自身芯片进行设计,以控制 AI 技术栈

据 CNBC 报道,Mistral 首席执行官 Arthur Mensch 在最近的一次播客采访中首次透露,这家欧洲 AI 公司正在探索设计自家芯片。此举与 Google 和 Amazon 等美国大型科技公司的战略类似。Mistral 的数据中心目前高度依赖 Nvidia 芯片,但公司旨在拥有更完整的技术栈,从 AI 模型到计算基础设施。Mensch 还讨论了企业在采用 AI 时面临的挑战,他指出,随着组织扩大代理式 AI 应用,结构化自动化以及人类在回路(human-in-the-loop)的流程仍然至关重要。
Gate News·6小时前

华为在 6 月 12 日发布开源 Pangu 2.0,参数规模最高可达 5050 亿,上下文长度达 512K

据 PANews 报道,6 月 12 日,华为在 HDC 2026 上发布开源大语言模型 openPangu 2.0,提供 Pro 和 Flash 两个版本,均支持 512K 上下文窗口。Pangu 2.0 Pro 拥有 5050 亿总参数,其中激活参数为 180 亿;而 Pangu 2.0 Flash 拥有 920 亿总参数,其中激活参数为 60 亿。华为称,其 Ascend AI 处理器上的单卡吞吐量可达到主流开源模型的 2 倍,并提供对 HarmonyOS 的增强兼容性。该公司计划从 6 月 30 日起,逐步开源 7 个组件,包括预训练代码、后训练代码和训练算子。
Gate News·6小时前

Fable 在 UC Berkeley ALE 考试中 5 次未能完成所有最难任务,比竞争对手多花 4-12 倍费用

根据 UC Berkeley RDI,本周发布的 Agents' Last Exam (ALE) 最新评估结果显示,在所有被测试的 AI 代理中,包括新发布的 Fable 5,面对需要持续推理和深厚专业知识的最难任务,其成功率为 0%。在按任务计费的 API 成本方面,Fable 5 收取了 15.70 美元——比 GPT-5.5 的 3.80 美元高 4 倍,并且比 Composer 2.5 的 1.33 美元高 12 倍。该评估覆盖 55 个专业领域,包含超过 1,500 项经专家验证的任务,发现代理最常见的失败方式是过早宣称成功,而不对结果进行验证。
Gate News·6小时前

英伟达开始向中国推介 Vera CPU,定价超 2 万美元,8 月开始发货

据路透社报道,6 月 12 日,英伟达已开始向中国云服务提供商推介其新的 Vera AI 数据中心 CPU,首批出货目标为 8 月。一家主要的中国云服务提供商计划在测试之前下单超过 300 台双 Vera 服务器,然后再决定更大规模的部署。 Vera 每颗芯片价格超过 20,000 美元;一台满配的 256 芯机架成本约为 1000 万美元。英伟达预计其 2024 财年 Vera 收入为 200 亿美元。
Gate News·6小时前

Baseten 揭示仍在 KV Cache 压缩方法,实现 200 倍压缩率

根据 Beating,Baseten 研究团队发布了 Still,这是一种 KV cache 压缩方法,能够在单次前向传递中实现最高 200 倍压缩,同时无需在线优化或梯度更新。Still 集成了轻量级 Perceiver 压缩器——其规模约为基础模型参数的 1%——并将其应用到每个 Transformer 层中,通过对完整 KV cache 进行交叉注意力来直接生成压缩后的 cache。在 RULER 基准上,Still 在 8k 到 64k 的上下文窗口、8 倍到 200 倍的压缩率下对 Qwen 和 Gemma 模型进行了测试,既保持了高精度,又在表现上优于 SnapKV、H2O 和 KV-Distill 等可比方法。
Gate News·6小时前

Moonshot AI 发布 Kimi K2.7 代码模型,性能提升 21.8%,高速版本将于 6 月 15 日发布

据 Beating 称,Moonshot AI 今天发布并开源了 Kimi K2.7 Code,这是一个升级的编程模型,能够将代币消耗降低 30%,并使代码评测基准上的性能提升 21.8%。开发者现在可以通过 Kimi API 调用该模型,定价为每 1M 输入代币 6.5 元、每 1M 输出代币 27 元,仍与 K2.6 模型保持不变。 公司宣布将于 6 月 15 日推出高速度版本,输出速度快 5-6 倍。在常规场景下,可达到约 180 tokens/秒,该版本的定价为标准版本的两倍。
Gate News·6小时前