Naver 2-го числа представила новую модель ИИ, которая использует информацию из постов на мам-кафе и отзывов о ресторанах для повышения точности ответов. Модель была представлена в ходе сессии под названием «От поиска к исполнению: технология следующего поколения ИИ, создающая поиск Naver AI», проходившей в Naver D2SF Gangnam. Легковесная модель на базе HyperCLOVA X применяет «инженерию упряжи» для отражения жизненно ориентированной информации в экосистеме Naver, что позволяет ИИ давать ответы, основанные на реальном пользовательском опыте, а не на общих данных.
Модель ИИ, используемая в поисковом сервисе Naver «AI Tab», применяет инженерию упряжи — структуру, которая контролирует и направляет поведение агента ИИ, подобно тому, как упряжь направляет лошадь. Когда пользователи ищут стоимость занятий в математических академиях, система даёт ответы на основе недавних обсуждений родителей на мам-кафе. Когда пользователи спрашивают о наличии парковки в ресторане, ИИ учитывает не только официальную информацию о заведении, но и реальные отзывы клиентов, которые там парковались.
Хан Сын-гюн, руководитель службы поиска Naver AI, сравнил инженерию упряжи с «рабочим чутьём» ИИ, заявив, что «для создания агентов ИИ, которые хорошо работают в сервисах, необходима инженерия упряжи, одновременно обеспечивающая экономическую эффективность и стабильность, а не только большие языковые модели (LLM)». Хан добавил, что «опыт соединения поисковой инфраструктуры и ноу-хау, накопленных за 27 лет, огромного контента, такого как блоги и кафе, а также различных сервисных активов, включая покупки и места, с технологией ИИ для перехода от поиска к действию, — это уникальная конкурентоспособность Naver, которую никто не сможет легко повторить».
Naver построил структуру малой языковой модели (SLM) с разделением труда для повышения эффективности AI Tab. Вместо одной гигантской LLM, обрабатывающей все задачи, Naver комбинирует SLM, специализированные на определённых ролях, что снижает эксплуатационные расходы, одновременно повышая скорость и качество ответов. Используя этот метод, Naver снизил эксплуатационные расходы на оборудование до 3 раз и повысил скорость ответа более чем в 2 раза.
Naver обучил ИИ с помощью технологии Clarify RL (обучение с подкреплением), которая гарантирует, что ИИ не будет произвольно интерпретировать неоднозначные запросы, а подтвердит намерение пользователя с помощью дополнительных вопросов. В результате галлюцинации снизились до 30 процентных пунктов по сравнению с HyperCLOVA X.
Ли Ги-чанг, директор модели Naver Cloud HyperScale AI, подчеркнул, что «модель, применяемая в AI Tab, отличается оптимизацией всего процесса — от построения обучающих данных до проектирования модели и обучения с подкреплением — под сервисы Naver», добавив, что «цель состоит в том, чтобы создать модель, которая наиболее точно и эффективно работает в реальных сервисных процессах, таких как поиск, покупка и бронирование пользователями Naver».
Naver раскрыл стратегию развития мультимодальной технологии с использованием SmartLens, расположенного в передней части строки поиска AI Tab. Мультимодальная технология позволяет ИИ понимать и использовать различные формы информации, включая изображения и видео, а не только текст.
Пользователи могут загружать изображения вместо текста в строку поиска и давать команды, например «найти похожие товары» или «забронировать место с такой атмосферой». Хотя поиск изображений и видео был возможен с помощью существующего ИИ, модели LLM сначала распознавали изображения, а затем проводили текстовый поиск. В отличие от этого, мультимодальный агент Naver понимает весь процесс — от ввода изображения до выполнения — как единый запрос.
Юн Сан-ду, руководитель будущего центра ИИ Naver, заявил, что «технология визуального поиска, которую Naver накапливал с помощью SmartLens почти 10 лет, является ключевой технологией для создания глаз, через которые агенты ИИ видят мир», добавив, что «в будущем сервис агента ИИ Naver будет развиваться в направлении понимания намерений пользователя не только через текст, но и через изображения, и перехода к реальным действиям».
Что Naver представил 2-го числа? Naver 2-го числа представил новую модель ИИ в Naver D2SF Gangnam, которая использует жизненно ориентированную информацию из постов на мам-кафе и отзывов о ресторанах. Модель основана на HyperCLOVA X и использует инженерию упряжи для отражения реального пользовательского опыта в своих ответах.
Насколько Naver снизил эксплуатационные расходы с помощью новой модели ИИ? Naver снизил эксплуатационные расходы на оборудование до 3 раз, используя структуру малой языковой модели (SLM). Компания также повысила скорость ответа более чем в 2 раза и снизила количество галлюцинаций до 30 процентных пунктов по сравнению с HyperCLOVA X.
Что такое мультимодальная технология SmartLens в поисковом ИИ Naver? SmartLens — это мультимодальная технология Naver, которая позволяет пользователям загружать изображения в строку поиска и получать ответы на команды, такие как «найти похожие товары» или «забронировать места с такой атмосферой». Технология понимает весь процесс — от ввода изображения до выполнения — как единый запрос, используя технологию визуального поиска, накопленную Naver почти за 10 лет.
Связанные новости
Meta Cloud: выход в облачный сервис улучшает перспективы оценки Naver и Samsung SDS
Корейские банки ускоряют внедрение ИИ для борьбы с финансовым мошенничеством
Запущена Глобальная комиссия AI for Good для расширения доступа и доверия
THEA привлекает $8M для создания уровня координации ИИ на базе Solana