Simplifier l’analyse des small data et conquérir le Machine Learning embarqué. Tel est le double défi que se fixe l’équipe MyDataModels.
« Nous avons mis au point une technologie, inspirée des algorithmes évolutifs, capable de répondre à deux objectifs : permettre aux experts métiers de faire leurs modèles prédictifs sans exiger la présence d’un data scientist et exploiter ces small data qui résident dans les tableurs comme base pour leurs prédictions » , explique Simon Gazikian, co-fondateur et PDG de MyDataModels.
Tout a commencé par un prototype réalisé aux USA il y a quatre ans. Fin 2017, c’est l’heure du retour en Europe, pour participer à une course internationale qui vient juste de démarrer.
La bataille de l’IA n’est pas perdue pour l’Europe, malgré les investissements massifs consentis aux USA et en Chine : « Si les GAFA/BATX ont pris une sérieuse avance sur le marché B2C, c’est encore loin d’être le cas dans l’embarqué, la vision artificielle et le B2B » , estime le manager.
Son ultime but ? Faire de MyDataModels un leader mondial du Machine Learning pour les small data, là où un acteur comme Dataiku cible les big data et la productivité des data scientists.
« Les acteurs reconnus du marché se focalisent sur la partie visible de l’iceberg. Dans la partie immergée, la plus importante du marché, on trouve les small data des experts métiers. Les automates, machines et capteurs de l’entreprise vont générer de nombreuses données lors des cinq prochaines années, qui resteront départementales. »
Il s’agit donc d’être en mesure d’analyser les données précieuses aux experts métiers pour faire des prédictions à leur niveau, là où elles sont stockées. L’approche traditionnelle du big data exige plusieurs mois de collecte et de nettoyage de données pour les faire parler via un datalake qui freine le retour sur investissement.
Analyses simplifiées sans outil de programmation
« Les experts métiers connaissent bien leurs données : ils savent faire des modèles prédictifs seuls avec notre technologie, pour un RoI de quelques semaines seulement. La préparation des données demeure essentielle et représente jusqu’à 80% du travail, à cause de data manquantes ou incohérentes au niveau de leur structure. Il faut avoir des données propres avant de faire des modèles. Nous avons beaucoup travaillé sur la simplicité d’usage, avec un processus automatisé qui n’exige pas de recourir aux outils de programmation. »
Comme pour accéder aux méthodes agiles, un Bot aide les utilisateurs à la compréhension et à l’analyse des données tel un formateur virtuel expert en modélisation des données de proximité.
Industries, labos de recherche et biotech en tête
Qui sont les premiers clients ? « Une quinzaine de grands groupes, mais aussi des ETI, des PME et PMI. Chez Thales, nous accompagnons des réalisations industrielles dans le civil et la défense. Les premiers usages sont surtout dans l’industrie, les recherches publiques & privées et les biotechnologies (agriculture, semences). D’une dizaine de cas d’usage actuels, nous devrions passer à environ 50 d’ici à la fin 2019. Les banques, la pharmacie, le transport aérien sont des utilisateurs potentiels car leurs données techniques sont physiques et reposent sur des systèmes déterministes. Il y a peu de Data Scientist dans l’industrie, c’est une opportunité fantastique, pour la prédiction de pannes ou de défauts de qualité. »
Malgré une forte concurrence, les usages au niveau des services marketing et commerciaux concernent surtout la lutte contre la fuite des clients ou bien la prédiction de ventes par famille de clients. Un domaine ou l’humain entre en jeu avec ses comportements aléatoires. Pour l’analyse de parcours clients et de parcours d’achats, les technologies statistiques fondées sur le big data sont préférables.
Un modèle économique atypique
Quel est le modèle économique suivi par MyDataModels ? « Il est à la fois conventionnel et atypique avec deux éditions digitales et deux offres classiques (Pro et Enterprise), le programme pouvant fonctionner en cloud privé, sur serveur PC sous linux, sur Mac, poste de travail, en accès aux API ou en approche collaborative. Les ventes directes profitent des salons spécialisés, tandis qu’un réseau de partenaires est créé en parallèle, autour d’ESN de taille moyenne à grande, de sociétés technologiques et de prestataires cloud tel AWS, via sa marketplace. L’offre freemium permet de goûter au programme gratuitement, avec une limitation de 5 Mo et de quelques usages par jour. Pour accéder à la version Premium, il faut opter pour une licence de 3 000 Euros par an et par utilisateur ou s’abonner via une carte de crédit. »