Starburst veut fédérer les données d’agents IA

Issue de Trino, le moteur open source de requêtes SQL distribué, Starburst est une plateforme data/IA conçue pour traiter des requêtes interactives sur plusieurs réservoirs hétérogènes.

Accélérer l’accès au datalake ne suffit plus. A l’ère des agents IA, toute plateforme de données doit devenir un socle unifié et gouverné de fédération d’indices d’aide à la décision, avec recherche vectorielle et métadonnées contextuelles à la clé. Starburst se distingue par ses connecteurs incluant ElasticSearch, Exadata (Oracle), MongoDB et Teradata.

Les enjeux RSE et le green IT ne sont pas oubliés, puisque le découplage des calculs du stockage devrait contribuer à réduire l’empreinte carbone des infrastructures soutenant les projets big data-IA d’entreprises et de collectivités.

Pascal Gasp, Architecte solutions Starburst

« Il faut penser à Starburst comme à une passerelle de données, recommande Pascal Gasp, Senior Solutions Architect. Son principe permet aux ingénieurs de dissocier le calcul des données, tout en simplifiant la fourniture des informations nécessaires aux métiers. »

Selon lui, de nombreux clients s’inscrivent dans une migration move-to-cloud internationale. Cependant, ils notent que certaines de leurs données ne peuvent pas être hébergées sur un cloud, ou bien portées d’un cloud vers un autre. « Starburst peut être exécuté sur une infrastructure interne, par exemple pour identifier de possibles fraudes à partir d’un cluster dédié, » tranche-t-il.

Parmi les clients français de Starburst, citons de grandes banques comme BNP Paribas ou le Crédit Mutuel Arkéa, l’opérateur Orange Wholesale, ou encore le logisticien Geodis. La capacité de virtualisation des données du data lakehouse de Starburst apporte à une banque l’agilité et l’évolutivité nécessaires au service informatique pour intégrer de façon sécurisée de nouvelles sources de données, afin d’accélérer la prise de décision ou d’optimiser les résultats financiers des équipes.

Nathan Vega, Senior Director of Product

« Nous répondons aux besoins d’innovation, de souveraineté et de recherche d’économies, en minimisant les copies et en offrant un meilleur contrôle des données, » assure Nathan Vega, Senior Director of Product de l’éditeur.

Lorsque de gros dossiers techniques ou juridiques doivent être compilés rapidement, l’usage du RAG sur des métadonnées bibliographiques permet d’interagir en langage naturel et en mode conversationnel avec des collections, pour en extraire les quelques pages de documents les plus pertinentes au cas du jour.

Les données les plus sensibles pourront être automatiquement classifiées, tandis que des indicateurs de performances réunis dans une table seront confiés à un modèle LLM pour structurer de prochains rendez-vous client. En somme, la plateforme de données entend devenir un outil de collaboration augmenté par l’IA apte à relever la productivité des équipes et à améliorer la qualité des échanges clients.

Auteur de l’article : la Rédaction

Journaliste et fondateur de l'agence éditoriale PulsEdit, Olivier Bouzereau coordonne la communauté open source OW2, conçoit des services et contenus en ligne, des conférences et formations pour les professionnels du numérique, des médias et de la santé. Profil LinkedIn.