Depuis près de deux ans, Monoprix consolide ses données produits, réunissant des articles proches mais présentés de façon distincte par les fournisseurs. Les algorithmes de normalisation automatique du français Yzr (prononcez Wiser, plus judicieux) sont mis à contribution.
La consolidation des données textuelles, issues de sources variées, procure à la fois un gain de qualité sur les données produits, un gain de temps et des gains financiers à l’enseigne. Elle est mise en œuvre, en mode SaaS, dans une logique de reporting essentiellement.
Deux étapes clés à suivre
D’abord la standardisation, ensuite le fuzzy matching (ou correspondance floue) : la catégorisation des produits passe par ces deux étapes, menées dans cet ordre, rappelle Hadrien Diesbescq, responsable des ventes de l’éditeur Yzr. L’objectif est d’assurer une interopérabilité optimale des données, en vue de leur réutilisation.
« Nous permettons à Monoprix d’accélérer sa standardisation sur de gros volumes, de labelliser ses données fournisseurs en détectant les marques, textures, quantités présentes dans des champs bruts. Grâce au fuzzy matching, on détecte les doublons présents dans les catalogues fréquemment renouvelés. Dès que l’IA repère une forte similitude entre deux variantes, les métiers sont sollicités pour la confirmer ou pas. Le système apprend ainsi au gré des interactions avec les utilisateurs, » précise-t-il.
La dernière édition du salon Big Data & IA 2021 confirme d’autres tendances déjà observées précédemment. Selon Hadrien Diesbescq, les sujets d’IA se banalisent, deviennent plus naturels pour tous les métiers. Et l’usage de solutions déployées dans le cloud, délivrées sous la forme de services SaaS, devient le modèle dominant.
C’est le choix retenu par Yzr dès son démarrage en 2019 lorsque Sébastien Garcin, ex-Chief Data Officer de L’Oréal France s’est associé à Jean-Philippe Poisson, fondateur d’un cabinet de conseil en transformation digitale. Seize personnes ont rejoint la start-up depuis et relèvent les défis d’hétérogénéité de données d’acteurs de la distribution, de la banque et de l’assurance principalement.
Collaboration métiers et normalisation automatique
« A l’origine, l’outil était destiné aux professionnels de la data science, mais nous avons pivoté et c’est devenu un outil collaboratif pour les métiers. Il établit un pont entre les professionnels, donne la main aux équipes métiers pour faire de la normalisation et de la préparation de données, » observe Hadrien Diesbescq.
Yzr poursuit sa mission de recherche, en interne, avec l’intégration de ses premiers docteurs experts du NLP (Natural Language Processing). « Un super-accélérateur pour nous. Nous sommes aussi en discussion avec des structures externes pour continuer à innover sur ce sujet, » conclut-il.