Naver dévoile un modèle d'IA intégrant les publications de Mom Cafe et les avis de restaurants

Naver a dévoilé un nouveau modèle d'IA le 2, intégrant des informations réelles issues de posts de « mom cafe » et d'avis de restaurants pour améliorer la précision des réponses. Le modèle a été présenté lors d'une session intitulée « De la recherche à l'exécution : la technologie d'IA de nouvelle génération créant la recherche IA de Naver » tenue à Naver D2SF Gangnam. Ce modèle léger, basé sur HyperCLOVA X, applique l'« ingénierie du harnais » pour refléter les informations axées sur la vie quotidienne présentes dans l'écosystème Naver, permettant à l'IA de fournir des réponses ancrées dans des expériences utilisateur réelles plutôt que dans des données génériques.

Naver applique l'ingénierie du harnais pour intégrer le contenu généré par les utilisateurs

Le modèle d'IA déployé dans le service de recherche « AI Tab » de Naver utilise l'ingénierie du harnais, une structure qui contrôle et oriente le comportement de l'agent IA comme un harnais guide un cheval. Lorsque les utilisateurs recherchent les frais de scolarité d'une académie de maths, le système fournit des réponses basées sur les discussions récentes de parents dans les « mom cafe ». Lorsque les utilisateurs s'informent sur la disponibilité du parking d'un restaurant, l'IA reflète non seulement les informations officielles de l'établissement, mais aussi les avis réels de clients qui s'y sont garés.

Han Seung-kyun, responsable du service de recherche IA de Naver, a comparé l'ingénierie du harnais au « sens du travail » de l'IA, déclarant que « pour créer des agents IA qui fonctionnent bien dans les services, une ingénierie du harnais qui conçoit simultanément l'efficacité des coûts et la stabilité est essentielle, et non seulement les grands modèles de langage (LLM). » Han a ajouté que « l'expérience de connexion de l'infrastructure de recherche et du savoir-faire accumulés au cours des 27 dernières années, le vaste contenu comme les blogs et les cafés, et divers actifs de services tels que le shopping et les lieux avec la technologie IA pour passer de la recherche à l'exécution est la compétitivité unique de Naver que personne ne peut facilement imiter. »

Naver réduit ses coûts d'exploitation de 3 fois grâce aux petits modèles de langage

Naver a construit une structure de petits modèles de langage (SLM) avec division du travail pour accroître l'efficacité de l'AI Tab. Au lieu d'un seul LLM géant gérant toutes les tâches, Naver combine des SLM spécifiques à des rôles pour réduire les coûts d'exploitation tout en améliorant la vitesse et la qualité des réponses. Grâce à cette méthode, Naver a réduit les coûts d'exploitation des équipements jusqu'à 3 fois et amélioré la vitesse de réponse de plus de 2 fois.

Naver a formé l'IA en utilisant la technologie Clarify RL (apprentissage par renforcement), qui garantit que l'IA n'interprète pas arbitrairement les demandes ambiguës mais confirme l'intention de l'utilisateur par des questions supplémentaires. En conséquence, l'hallucination a diminué jusqu'à 30 points de pourcentage par rapport à HyperCLOVA X.

Lee Ki-chang, directeur du modèle d'IA hyper-échelle de Naver Cloud, a souligné que « le modèle appliqué à l'AI Tab se caractérise par l'optimisation de l'ensemble du processus, de la construction des données d'entraînement à la conception du modèle et à l'apprentissage par renforcement, pour s'adapter aux services Naver », ajoutant que « l'objectif est de créer un modèle qui fonctionne le plus précisément et efficacement dans les processus de service réels tels que la recherche, l'achat et la réservation par les utilisateurs de Naver. »

Naver intègre la technologie multimodale SmartLens dans la recherche IA

Naver a dévoilé sa stratégie d'avancement de la technologie multimodale utilisant SmartLens placé à l'avant de la barre de recherche de l'AI Tab. La technologie multimodale permet à l'IA de comprendre et d'utiliser diverses formes d'informations, y compris les images et les vidéos, et pas seulement le texte.

Les utilisateurs peuvent télécharger des images au lieu de texte dans la barre de recherche et émettre des commandes telles que « trouver des produits similaires à celui-ci » ou « réserver un endroit avec cette ambiance ». Alors que la recherche d'images et de vidéos était possible avec l'IA existante, les modèles LLM reconnaissaient d'abord les images puis effectuaient des recherches textuelles. En revanche, l'agent multimodal de Naver comprend l'ensemble du processus, de la saisie d'image à l'exécution, comme une seule requête.

Yoon Sang-doo, responsable du Future AI Center de Naver, a déclaré que « la technologie de recherche visuelle que Naver a accumulée via SmartLens depuis près de 10 ans est une technologie centrale pour créer des yeux à travers lesquels les agents IA voient le monde », ajoutant que « à l'avenir, le service d'agent IA de Naver évoluera dans une direction qui comprend l'intention de l'utilisateur non seulement par le texte mais aussi par les images et se connecte à des actions réelles. »

FAQ

Qu'est-ce que Naver a dévoilé le 2 ? Naver a dévoilé un nouveau modèle d'IA le 2 à Naver D2SF Gangnam, intégrant des informations axées sur la vie quotidienne issues de posts de « mom cafe » et d'avis de restaurants. Le modèle est basé sur HyperCLOVA X et utilise l'ingénierie du harnais pour refléter les expériences utilisateur réelles dans ses réponses.

De combien Naver a-t-il réduit ses coûts d'exploitation avec le nouveau modèle d'IA ? Naver a réduit les coûts d'exploitation des équipements jusqu'à 3 fois en utilisant une structure de petits modèles de langage (SLM). L'entreprise a également amélioré la vitesse de réponse de plus de 2 fois et réduit l'hallucination jusqu'à 30 points de pourcentage par rapport à HyperCLOVA X.

Qu'est-ce que la technologie multimodale SmartLens dans la recherche IA de Naver ? SmartLens est la technologie multimodale de Naver qui permet aux utilisateurs de télécharger des images dans la barre de recherche et d'obtenir des réponses à des commandes comme « trouver des produits similaires » ou « réserver des endroits avec cette ambiance ». La technologie comprend l'ensemble du processus, de la saisie d'image à l'exécution, comme une seule requête, en exploitant la technologie de recherche visuelle que Naver a accumulée depuis près de 10 ans.

Avertissement : Les informations figurant sur cette page peuvent provenir de sources tierces et sont fournies à titre indicatif uniquement. Elles ne reflètent pas les points de vue ou opinions de Gate et ne constituent pas un conseil financier, d’investissement ou juridique. Le trading des actifs virtuels comporte des risques élevés. Veuillez ne pas vous fonder uniquement sur les informations de cette page pour prendre vos décisions. Pour en savoir plus, consultez l’avertissement.
Commentaire
0/400
Aucun commentaire