Adoptés par des écosystèmes privés ou des administrations publiques, les data spaces requièrent des cloud souverains interopérables, pouvant s’entendre sur des règles de partage, de gouvernance et de conformité réglementaire.
Plus de 33 zettaoctets de données ont été générés dans le monde en 2018, un chiffre qui devrait atteindre 175 zettaoctets d’ici à la fin 2025. Cette énorme volume de données peut révéler des informations essentielles pour comprendre les modèles de comportement et d’activités humaines. Les données privées en particulier possèdent un fort potentiel pour servir l’intérêt général en éclairant la prise de décision, en apportant de nouvelles connaissances scientifiques et en résolvant des questions politiques pour améliorer la prestation de services publics.
Trop souvent fragmentées et dispersées, ces données s’avèrent cruciales pour l’innovation des citoyens, des entreprises et des collectivités territoriales. On estime ainsi que 80% des données industrielles ne sont jamais exploitées. C’est pourquoi, la Commission Européenne a présenté dès 2020, ses stratégies de données numériques et d’intelligence artificielle, afin de développer un marché unique, contribuant à l’apprentissage d’algorithmes d’IA.
« Le paquet législatif européen sur les services numériques comprend une loi sur l’ouverture des données (Data Act) constituant une étape importante dans la mise en place d’une numérisation équitable, centrée sur l’humain. Le Data Act clarifie les droits et obligations des parties dans les transactions de données et garantit l’équité dans la répartition de la valeur des données entre les acteurs de l’économie des données. »
Margrethe Vestager, Vice-présidente de la Commission européenne
Le Data Act doit stimuler la création de nouveaux services autour d’espaces européens communs de données, des catalogues où le transfert de données s’effectue de manière bilatérale, selon des règles prédéfinies et bien sûr, en toute souveraineté. Ces espaces pourront regrouper des données des secteurs privés et des domaines publics, en respectant des valeurs telles que la protection des données européennes, l’ouverture et la transparence, la modularité et l’interopérabilité.
Des espaces de données à encadrer
Le Data Act invite les responsables numériques à s’entendre sur une définition et sur les caractéristiques de tels espaces proposant la libre circulation de données entre plusieurs secteurs, au bénéfice des chercheurs, d’entreprises ou d’administrations publiques.
Qu’est-ce qu’un data space ?
- Il s’agit en fait d’une infrastructure informatique sécurisée, préservant la vie privée pour regrouper, accéder, traiter, utiliser et partager les données.
- Le data space dispose d’un mécanisme de gouvernance des données, comprenant un ensemble de règles de nature législative, administrative et contractuelle qui déterminent les droits d’accès, de traitement, d’utilisation et de partage des données d’une manière fiable et transparente.
- Les détenteurs de données contrôlent qui peut avoir accès à leurs données, à quelles fins et dans quelles conditions elles peuvent être utilisées.
- De grandes quantités de données peuvent être réutilisées sous certaines conditions contre rémunération ou gratuitement, selon la décision du détenteur des données.
- Un nombre ouvert d’organisations / d’individus peuvent participer.
Relever les défis du pacte vert par une maîtrise de l’énergie
Grâce aux dispositions sur l’accès aux données, sur leur utilisation et leur interopérabilité, la loi sur les données devrait contribuer à la disponibilité d’un plus grand nombre de données, et d’espaces de données sectoriels.
Par exemple, « en s’appuyant sur la loi sur les données, l’espace européen commun des données énergétiques pourra améliorer l’interopérabilité des actifs et des services énergétiques, ainsi que la flexibilité, la sécurité et la fiabilité globales du système énergétique. Dans le cadre du plan d’action pour la numérisation de l’énergie, cela contribuera aux priorités du pacte vert de l’UE (Green Deal ) et à celles de la décennie numérique de l’Europe, » illustre la commission européenne dans un document FAQ dédié au Data Act.
Gaia-X, socle d’espaces et de services de données
L’initiative Gaia-X, poussée par l’Allemagne et la France depuis 2019, fédère des éditeurs et hébergeurs européens, respectueux des règlementations européennes. A ce jour, ce n’est pas le cloud souverain attendu par de nombreuses entreprises en Europe, encore moins « l’Airbus du Cloud » espéré par Bruno Le Maire, le Ministre Français de l’Économie, des Finances et de la Souveraineté industrielle et numérique. Il s’agit plutôt d’un socle cloud décentralisé pouvant accueillir des espaces de stockage et des services de données communs aux sociétés et aux administrations européennes.
Avec 1484 services recensés depuis quelques semaines, le catalogue Gaia-X CISPE fait la part belle aux acteurs européens du cloud, mais aussi à l’hyperscaler américain AWS. Yann Lechelle, le PDG de Scaleway y voyait dès 2021 « une concurrence déséquilibrée », et décidait en novembre de la même année de retirer la filiale d’Iliad du projet.
« Dans de nombreux domaines d’activité, les données deviennent un atout stratégique pour la durabilité et l’avantage concurrentiel. En outre, je note une demande croissante de collaborations fondées sur des données partagées entre les organisations. En s’appuyant sur les valeurs européennes, Gaia-X a conçu un système de données fédérées performant, compétitif, sécurisé et fiable, » apprécie déjà Ulrich Ahle, le nouveau CEO de l’association européenne Gaia-X.
Dans le cadre de l’initiative de financement Gaia-X, le ministère fédéral allemand de l’économie et de l’action climatique cofinance le projet européen Open GPT-X, à hauteur d’environ 15 millions d’euros. En tout, onze organisations allemandes issues du monde des affaires, de la science et des médias préparent une réponse européenne à ChatGPT, autour du Centre ZIH de l’Université technique de Dresde.
Avec le centre de recherche Jülich, le centre ZIH doivent fournir des capacités de calcul à haute performance pour optimiser les performances des modèles de langage et l’utilisation du matériel, tandis que le département de recherches en IA Fraunhofer IAIS développe les modèles d’IA en collaboration avec le centre allemand de recherche sur l’intelligence artificielle DFKI, la startup d’Heidelberg Aleph Alpha et la société de conseils Alexander Thamm GmbH. Parmi les partenaires du projet, le prestataire de services de gestion de sinistres ControlExpert travaille aux côtés du WDR (média public de la province Rhénanie-du-Nord-Westphalie, le Westdeutscher Rundfunk informe 18 millions d’habitants), pour développer un cas d’usage et fournir des données spécifiques au domaine pour le développement des modèles. L’intégration dans la structure Gaia-X est gérée par l’opérateur cloud IONOS, lequel fournit des capacités de calcul cloud. et GPU évolutives, crée la base d’une plateforme MLOps pour soutenir la mise en service d’une version conforme à GAIA-X du prototype de nœud OpenGPT-X et exploiter ce prototype tout au long du projet.
Des Européens en compétition pour l’IA générative
AWS est très actif dans les services d’IA où une compétition féroce l’oppose aux géants américains Google (Bard et Gemini), et Microsoft–OpenAI (ChatGPT).
La start-up française Mistral AI pilotée par Arthur Mensch a levé 385 millions d’euros lors d’un second tour de table récent associant le groupe Nvidia, l’éditeur Salesforce, la banque BNP Paribas, et le transporteur CMA CGM. Xavier Niel (Illiad-Free) et Eric Schmidt (ex-PDG de Google) finançaient déjà son développement depuis sa première levée de fonds.
Pour accélérer dans l’IA générative, l’allemand Aleph Alpha a préféré, pour sa part, s’adosser à des partenaires industriels locaux incluant Lidl et Bosch, aux côtés de sociétés de capital-risque et aussi, nul n’est prophète en son pays… du groupe américain HP.
En conclusion, Rainer Sträter, Vice President Cloud Services and Global Platform Hosting de IONOS choisit une métaphore : « Pour simplifier, nous construisons un Alexa pour l’Europe. Nous voulons progresser autour de modèles linguistiques ouverts qui nous permettent de mieux reconnaître et numériser les données vocales de l’Union Européenne. »