Chez NTT DATA, j’ai pu constater de première main comment l’intelligence artificielle — en particulier la GenAI ces dernières années, et désormais l’IA agentique — peut transformer les organisations dans tous les secteurs.
Les systèmes autonomes d’IA agentique raisonnent, planifient et agissent pour atteindre des objectifs, souvent en coordination avec d’autres agents. Toutefois, ces systèmes ne peuvent offrir le retour sur investissement attendu que s’ils ont accès à de vastes volumes de données de haute qualité, riches en contexte et en temps réel.
Cela signifie que le véritable potentiel de l’IA agentique ne peut être exploité qu’en comprenant et en atteignant un niveau optimal de Data Readiness. Comme l’a justement souligné un leader mondial de l’IT lors d’un événement auquel j’ai récemment assisté : « C’est la combinaison des données et de l’IA qui vous fera réellement avancer. »
Le fondement de l’IA agentique
Dans le Global GenAI Report de NTT DATA, seulement 53 % des organisations déclaraient avoir déjà abordé la question de la Data Readiness lors de l’évaluation des opportunités commerciales liées à la GenAI. Pourtant, 95 % prévoyaient de l’avoir fait dans l’année suivante, ce qui témoigne d’une prise de conscience croissante de son importance. Les répondants ont également indiqué que la Data Readiness était la principale leçon tirée de leurs précédents déploiements de GenAI.
Si ces statistiques et les propos du leader mondial de l’IT sont vrais pour la GenAI, ils prennent encore plus de sens dans le contexte de l’IA agentique, où les données deviennent l’épine dorsale de tout l’écosystème.
Prenons l’exemple d’un fabricant de boissons multinational souhaitant mettre en œuvre une IA agentique pour optimiser sa chaîne d’approvisionnement. Le système devrait accéder à d’importants volumes de données provenant de diverses sources : capteurs, prestataires logistiques, analystes de marché, etc. Si ces données ne sont pas correctement nettoyées, intégrées et gouvernées, le système prendra des décisions sous-optimales.
Le résultat indésirable ne serait pas dû à un manque de technologie ou de stratégie, mais simplement à une insuffisante préparation des données.
Qu’est-ce que la Data Readiness ?
Se concentrer sur la Data Readiness avant de déployer l’IA, c’est un peu comme préparer les ingrédients avant de faire un gâteau. Vous avez peut-être acheté tout ce qu’il faut, mais si les ingrédients ne sont pas de bonne qualité, bien dosés ou correctement mélangés, le résultat risque d’être décevant.
Dans le monde de la GenAI, cela signifie disposer de données de qualité, bien structurées, propres et pertinentes, afin que l’IA puisse générer du contenu créatif sans accroc. Plus les données sont fiables, meilleures seront les performances de votre moteur GenAI.
L’IA agentique, en particulier, nécessite des flux de données dynamiques, multisources et multiformats pour pouvoir raisonner et agir. Ces données doivent être riches en contexte, interopérables sur le plan sémantique (c’est-à-dire non seulement partagées, mais aussi comprises par différentes plateformes ou applications) et disponibles en temps réel.
De plus, les systèmes multiagents ont besoin d’environnements de données synchronisés pour permettre la collaboration, la délégation et la négociation entre agents.
Dans un tel système, différents agents peuvent être responsables de divers aspects de la chaîne d’approvisionnement, comme les achats, la gestion des stocks ou la logistique. Pour que le système fonctionne efficacement, les données de chaque agent doivent être synchronisées et intégrées en temps réel, afin de permettre une prise de décision collaborative fondée sur une compréhension partagée de la chaîne d’approvisionnement.
6 étapes vers la Data Readiness pour l’IA agentique
Atteindre un niveau de Data Readiness adapté à l’IA agentique peut se décomposer en six étapes clés :
1. Comprendre vos processus décisionnels
Clarifier les données nécessaires à la prise de décision est essentiel, quelle que soit la technologie utilisée pour générer et exploiter les insights. Cela implique de comprendre les processus métier, d’identifier les décisions clés à prendre et de déterminer les données nécessaires pour les soutenir.
2. Vérifier la qualité et l’intégrité des données
Des données structurées, étiquetées et fiables sont indispensables. La validation humaine (human-in-the-loop) joue ici un rôle crucial pour garantir l’exactitude et la fiabilité des données.
3. Planifier l’ingestion et l’intégration des données
Des pipelines en temps réel et des interfaces de programmation (API) sont nécessaires pour alimenter en continu les agents. Les outils ETL (Extract, Transform, Load) pilotés par l’IA permettent d’automatiser l’ingestion depuis des systèmes existants, facilitant ainsi l’intégration des données à moindre coût.
4. Lancer la migration des données
Passer de systèmes en silos à des architectures cloud-native prêtes pour les agents est une étape clé. Le process mining (analyse des processus métier à partir des journaux d’événements) permet d’identifier et de hiérarchiser les cibles de migration, en commençant par les données les plus critiques.
5. Gérer la codification et la sémantique des données
La capacité des agents à raisonner repose sur des ontologies, taxonomies et métadonnées.
Les taxonomies classent les éléments en catégories hiérarchiques selon leurs caractéristiques communes. Les ontologies vont plus loin en définissant les relations entre ces catégories et en structurant les interactions entre concepts. Les métadonnées fournissent des informations sur le contenu, le contexte et la structure des données (créateur, date, type de fichier, etc.). Par exemple, un agent chargé de recommander des produits à des clients doit comprendre les relations entre produits, préférences et historique d’achat. Ces outils sémantiques lui permettent d’interpréter des données complexes et de proposer des recommandations pertinentes.
6. Assurer la gouvernance et la conformité des données
Il est essentiel que vos agents d’IA respectent les cadres réglementaires et éthiques. Mettez en place des pistes d’audit, des contrôles d’accès et des mécanismes d’explicabilité pour garantir une utilisation responsable des données, conforme aux réglementations de votre secteur.Comment l’IA peut accélérer vos efforts
L’intelligence artificielle — sous ses nombreuses formes — peut jouer un rôle clé dans l’accélération de votre préparation des données. Elle peut être utilisée pour le profilage des données, la classification automatique, l’évaluation de la qualité des données, ainsi que pour automatiser la déduplication, la normalisation et l’étiquetage contextuel.
Les grands modèles de langage peuvent classifier automatiquement vos données et les enrichir avec du contexte et du sens supplémentaires, facilitant ainsi leur intégration et leur analyse à partir de sources diverses.
L’IA peut également accélérer les processus ETL traditionnels, surveiller l’utilisation des données, détecter les anomalies et appliquer les politiques de manière autonome.
Chez NTT DATA, nous avons développé plusieurs accélérateurs pour vous aider à avancer plus rapidement dans votre parcours de préparation des données. Cela inclut des outils d’IA pour le profilage et le nettoyage des données, ainsi que des cadres de gouvernance des données permettant de garantir l’exactitude, la fiabilité et la conformité réglementaire de vos données.
Défis courants à surmonter
Malgré des avantages évidents, plusieurs défis peuvent freiner l’atteinte d’un bon niveau de Data Readiness.
Pour commencer, vous pouvez utiliser des outils tels que les modèles de maturité et les calculateurs de ROI pour évaluer votre situation actuelle. Il est également judicieux de faire appel à des partenaires experts, ayant une expérience concrète dans la mise en œuvre non seulement de systèmes d’IA agentique, mais aussi des écosystèmes technologiques plus larges dans lesquels ces systèmes opèrent.
Les silos de données peuvent être surmontés grâce à des approches comme le federated learning (apprentissage fédéré, qui permet l’entraînement de modèles d’IA sur des données décentralisées) et les stratégies de data mesh (où la responsabilité des données est répartie entre les équipes, favorisant une gestion plus agile).
Si vous utilisez un système hérité incompatible avec les architectures modernes, vous pouvez recourir à un AI wrapper pour extraire les données et les intégrer à d’autres sources. Cela permet de valoriser les données sans devoir remplacer l’ensemble du système.
Enfin, la gestion du changement reste essentielle. Alignez vos équipes métier et IT à travers des évaluations de maturité et des programmes pilotes.
Êtes-vous prêt ?
La préparation des données est un impératif stratégique qui déterminera le succès de vos initiatives en matière d’intelligence artificielle.
En comprenant ce que signifie réellement la préparation des données et en prenant des mesures concrètes pour y parvenir, vous pouvez positionner l’IA, la GenAI et en particulier l’IA agentique comme moteur de la transformation numérique de votre organisation.
Êtes-vous prêt à vous lancer dans cette aventure ? Nous sommes là pour vous accompagner à chaque étape.