Gate 新闻消息,4月23日——Google 研究人员(包括何凯明和谢赛宁)发布了一篇论文,介绍 Vision Banana,这是一种通用型视觉理解模型,通过对该公司 Nano Banana Pro (Gemini 3 Pro Image) 图像生成模型进行轻量指令微调而创建。关键创新将所有视觉任务的输出统一为 RGB 图像,使得在不需要任务特定架构或损失函数的情况下,通过图像生成即可实现分割、深度估计和表面法线预测。
在语义分割方面,Vision Banana 在 Cityscapes 上比专门模型 SAM 3 高 4.7 个百分点;在指列表达式分割(referring expression segmentation)方面,它超过了 SAM 3 Agent。不过,在实例分割(instance segmentation)方面,它落后于 SAM 3。对于 3D 任务,度量深度估计在四个标准数据集上取得了 0.929 的平均准确率,超过 Depth Anything V3 的 0.918;推理时仅使用合成数据,无需真实深度信息或相机参数。表面法线估计在三个室内基准测试上达到了最先进的结果。
微调过程仅将少量视觉任务数据混入原始图像生成训练,从而保留了模型的生成能力——在生成质量测试中,其性能与原始 Nano Banana Pro 相当。论文提出,视觉中的图像生成预训练与语言中的文本生成预训练相类似:模型在生成过程中学习图像理解所需的内部表征,而指令微调只是释放这种能力。
免责声明:本页面信息可能来自第三方,不代表 Gate 的观点或意见。页面显示的内容仅供参考,不构成任何财务、投资或法律建议。Gate 对信息的准确性、完整性不作保证,对因使用本信息而产生的任何损失不承担责任。虚拟资产投资属高风险行为,价格波动剧烈,您可能损失全部投资本金。请充分了解相关风险,并根据自身财务状况和风险承受能力谨慎决策。具体内容详见
声明。
相关文章
AISI 评估:GPT-5.5 的网络攻击能力与 Anthropic Mythos 持平
AISI 于 5 月公布 GPT-5.5 網路攻擊能力評估:Expert 难度 71.4%、Mythos Preview 68.6%,差距在误差内,持平。GPT-5.5 成为继 Mythos 之后第二个可自动完成「The Last Ones」32 步骤企业入侵的系统。另发现 universal jailbreak,约 6 小时即可开发,能绕过恶意查询过滤。未来将观察下一轮评估时程与 OpenAI 对此更新。
鏈新聞abmedia1小时前
五角大楼与 7 家 AI 大厂签署机密军网部署合同:Anthropic 仍被排除
美国国防部于5月宣布与SpaceX、OpenAI、Google、NVIDIA、Reflection、Microsoft、Amazon Web Services等7家签署机密军用网络部署合约,另加入Oracle成为第8家。合约允许在Impact Level 6/7最高机密层级运行模型,重点三大应用为数据整合、作战决策与战场态势感知,强调分散风险与避免供应商绑定。Anthropic因拒绝军方安全护栏而被列入黑名单,未获签。AMD未直接列入,GPU由NVIDIA等提供。后续观察Anthropic是否让步,以及Reflection等新入选者的角色。
鏈新聞abmedia1小时前
Cerebras 瞄准 $4B IPO,估值约 400 亿美元
总部位于加利福尼亚州桑尼维尔的 AI 芯片制造商 Cerebras Systems 正寻求最高 40 亿美元的 IPO,可能使公司估值约 400 亿美元,据彭博报道。正式路演最早可于 5 月 4 日启动,银行将收到超过 100 亿美元的初步意向,这些意向反映了其中(indications of)需求,其中包括
Crypto Frontier1小时前
中国 AI 公司考虑在 Meta 的 Manus 收购叫停后拆解红筹结构
据 Beating 称,中国国家发展和改革委员会叫停了 Meta 对 AI 代理公司 Manus 的 20 亿美元收购,促使中国证券监督管理委员会加强对红筹公司(持有境内资产的中国公司)在香港 IPO 上市的批准要求
GateNews2小时前
马斯克完成 OpenAI 诉讼中为期三天的作证,援引 130-1500 亿美元的损害赔偿主张
据多家媒体报道,埃隆·马斯克在针对 OpenAI 的诉讼中,于 4 月 28 日至 30 日完成了三天的作证,其累计作证时间超过 7 小时。马斯克于 2015 年与最初投资 3800 万美元共同创立 OpenAI,他声称该公司放弃了其非营利
GateNews3小时前
Meta 于 5 月 1 日收购机器人 AI 初创公司 Assured Robot Intelligence
据彭博社报道,Meta 于 5 月 1 日收购了 Assured Robot Intelligence,这是一家总部设在圣迭戈和纽约的人工智能机器人创业公司。被收购团队(包括联合创始人 Lerrel Pinto 和 Xiaolong Wang)将加入 Meta 超级智能实验室,并与 Meta Robotics Studio 合作。财务
GateNews3小时前