DeepSeek представила метод Visual Primitives для усиления мультимодального рассуждения 30 апреля

GateNews

2026-04-30 11:04:21

Согласно техническому отчёту DeepSeek, 30 апреля компания представила Visual Primitives — метод, который встраивает базовые визуальные единицы, такие как точки и ограничивающие рамки, в цепочки рассуждений, чтобы решить проблему Reference Gap в мультимодальных задачах. Метод снижает потребление токенов изображений за счёт сжатия KV cache.

В бенчмарках на счёт и пространственное мышление подход демонстрирует сопоставимую производительность с GPT-5.4, Claude-Sonnet-4.6 и Gemini-3-Flash по выбранным измерениям. DeepSeek заявил, что откроет исходные части бенчмарков и наборов данных, а веса моделей будут выпущены после интеграции.

Посмотреть источник

Отказ от ответственности: Информация на этой странице может поступать от третьих лиц и не отражает взгляды или мнения Gate. Содержание, представленное на этой странице, предназначено исключительно для справки и не является финансовой, инвестиционной или юридической консультацией. Gate не гарантирует точность или полноту информации и не несет ответственности за любые убытки, возникшие от использования этой информации. Инвестиции в виртуальные активы несут высокие риски и подвержены значительной ценовой волатильности. Вы можете потерять весь инвестированный капитал. Пожалуйста, полностью понимайте соответствующие риски и принимайте разумные решения, исходя из собственного финансового положения и толерантности к риску. Для получения подробностей, пожалуйста, обратитесь к Отказу от ответственности.

Связанные статьи

Белый дом готовит проект меморандума о политике в области ИИ, предписывающий госорганам США использовать нескольких поставщиков ИИ 30 апреля

Новости индустрии ИИ

По данным источников, на которые ссылается PANews 30 апреля, должностные лица Белого дома разрабатывают всеобъемлющую записку о политике в области искусственного интеллекта, которая предписывает государственным ведомствам США привлекать нескольких поставщиков AI-услуг и избегать опоры на одного вендора. В записке также говорится, что все AI-компании, с которыми заключаются контракты

GateNews42м назад

Управление киберпространства Китая запускает 4-месячную кампанию по пресечению хаоса в работе приложений на базе ИИ 30 апреля

Новости индустрии ИИ

По данным CCTV News, Администрация киберпространства Китая запустила общенациональную четырехмесячную кампанию 30 апреля для решения проблемы хаоса в применении ИИ. Инициатива, развернутая в два этапа, нацелена на такие проблемы, как отсутствие регистраций моделей, недостаточные возможности по безопасности и проверке платформ,

GateNews53м назад

Forefront Tech завершает $100M ценообразование IPO, листинг на Nasdaq под кодом FTHAU

Акции Новости индустрии ИИ

По данным ChainCatcher, компания специального назначения по слияниям и поглощениям Forefront Tech завершила ценовое размещение IPO на сумму 100 миллионов долларов 30 апреля и будет торговаться на Nasdaq под тикером FTHAU. Компания планирует использовать вырученные средства для поиска возможностей слияний и поглощений в блокчейне, финтехе, искусственном

GateNews2ч назад

Anthropic Claude Code обошлось пользователю в $200,98 из-за ошибки в выставлении счетов; сначала отказали в возврате средств, прежде чем в итоге компенсировали полностью

Новости индустрии ИИ

По данным мониторинга от Beating, ошибка в биллинге в сервисе Anthropic Claude Code привела к тому, что подписчика Max 20x переплатили $200,98 за дополнительные комиссии за использование при том, что они использовали только 13% своего ежемесячного лимита. Ошибка срабатывала, когда в истории коммитов git-репозитория пользователя содержались заглавные буквы

GateNews2ч назад

NVIDIA выпускает веса флагманской модели Cosmos-Reason2-32B и расширяет контекстное окно до 256 тыс. токенов

Новости индустрии ИИ

По сообщению Beating, NVIDIA выпустила веса для Cosmos-Reason2-32B — флагманской версии своего физического AI-модели рассуждений для зрения и языка (VLM), предназначенной, чтобы помочь роботам и системам автономного вождения понимать пространственные, временные и физические принципы. Модель с 32-миллиарда параметров,

GateNews3ч назад

OpenAI раскрыл, почему Codex запрещает говорить «гоблинов»: награда за «ботанический» типаж вышла из-под контроля

Новости индустрии ИИ

OpenAI в официальном блоге объяснила запрет Codex на «гоблинов» и другие существа: это связано с предпочтением биоморфных метафор в поощрительных сигналах, которые использовались при обучении шизоидного «книжного» типа личности, что привело к межличностному загрязнению и ошибочному RLHF-наведению. Инцидент раскрыл Barron Roth после того, как были опубликованы системные инструкции; OpenAI применяет две стратегии — краткосрочное жесткое кодирование и долгосрочное удаление поощрительных сигналов, — предупреждая о хрупкости дизайна наград и необходимости более точного посттренировочного аудита.

ChainNewsAbmedia3ч назад

комментарий

0/400

Нет комментариев