Du laboratoire à la prise en main par les acteurs métiers
Les 14 et 15 Septembre derniers s’est déroulé le salon Big Data & AI 2020, réunissant plus de 10 000 visiteurs, qui a confirmé l’apparition d’une tendance de fond sur le marché : la rupture avec le POC confidentiel pour un déploiement et une prise en main par les utilisateurs métiers, signe d’une diffusion élargie de la culture Data.
Pour les entreprises, prendre le virage de la data et de l’IA
2020 sonne l’heure de la maturité pour la data et l’IA. Depuis plusieurs années maintenant, les entreprises ont investi et les projets autour de ses technologies se sont multipliés avec le développement d’une réelle expertise et des ambitions fortes, que ce soit via un DataLab ou par la mise en place d’une organisation Data soutenant l’usage diffus de la donnée. A l’image de Carrefour et ses 2,8Mds € d’investissements d’ici 2022 ou encore d’Air Liquide et le déploiement de « Smart Innovative Centers » partout dans le monde, les grandes entreprises se sont mobilisées. Les équipes Data Science et Data Engineering montent en compétence, les architectures data se se redessinent pour fluidifier l’ingestion continue et temps réel de la donnée et les initiatives data sont lancées dans tous les services de l’entreprise autour de grandes thématiques, comme la relation client (chatbots, analyse sémantique), le marketing (marketing automation, personnalisation des campagnes et recommandations), l’automatisation des process (RPA) ou encore l’excellence opérationnelle (maintenance prédictive). Dans tous ces domaines, de nombreux POC ont été mis en œuvre afin de démontrer la valeur d’usage de la donnée, avec des équipes data qui en restent les principales détentrices et utilisatrices. Pour délivrer les ROI promis au regard des investissements importants réalisés, passer à une industrialisation massive est maintenant l’enjeu. Cette étape permettra de rapprocher la data des utilisateurs métiers et de mettre réellement la data au service de la performance au quotidien.
La data comme levier de génération de valeur
Ce déploiement de la data dans les métiers de l’entreprise repose sur la mise en place d’un modèle data-driven de gouvernance et d’organisation. Dans ce modèle, les décisions stratégiques et opérationnelles s’appuient sur l’exploitation de données et la mise à disposition permanente d’analyses quantitatives à tous les échelons, du top management au terrain, raccourcissant ainsi la distance et le temps entre la décision et l’action. Pour cela, l’approche data doit partir des priorités stratégiques et des enjeux métiers prioritaires. Total Direct Energie, et son programme Prédidém chargé de prédire le déménagement des souscripteurs, s’inscrit dans cette optique en souhaitant, par la collaboration entre l’outil qui établit les listes de clients et l’humain chargé d’accompagner le client tout au long de son parcours, mieux appréhender l’une des principales causes de churn du secteur. Globalement, la valorisation de la donnée peut prendre deux formes :
- Valorisation interne : marketing prédictif, ultra-personnalisation de l’expérience client, optimisation des processus internes, etc.
- Valorisation externe: monétisation de la donnée client, relations de partenariat autour de la data, etc.
Le Big Data se mue progressivement en Smart Data où l’intelligence et la maîtrise des données remplacent le stockage à outrance et la réflexion a posteriori, pour exploiter au niveau métier l’effet de levier que peut générer une analyse fine de données (marché, clients, concurrentielles, etc.). En regroupant, structurant et analysant toutes les données qui influent sur le pricing, notamment les données d’environnement concurrentiel, un retailer spécialisé dans l’équipement de la maison a pu ainsi obtenir une visibilité nouvelle sur son positionnement prix multicanal et sur les pistes d’optimisation de ses marges. Le traitement de la donnée met en lumière les pistes à suivre et les erreurs à corriger et appuie les prises de décisions des dirigeants et des opérationnels.
La démocratisation de la data au sein des organisations par le développement de cas d’usages concrets
Les cas d’usages d’IA se répandent : Traitement automatique d’e-mails, aide au diagnostic médical, détection automatique de défauts de qualité d’un produit, prédiction d’évènements ne représentent qu’une infime partie du champ d’application de l’IA pour les entreprises. L’IA est ainsi une opportunité pour humaniser et améliorer qualitativement la relation. C’est en tout cas la conviction de Manutan qui a profité d’une collaboration avec la solution d’analyse sémantique Golem.ai pour développer 3 cas d’usages (assistance à la réponse d’appel d’offres, traitement automatique de bons de commande et traitement automatique d’emails) et optimiser ses processus. Rapprocher les salariés de l’exploitation de la data est donc devenu une priorité pour les entreprises qui multiplient par conséquent les programmes de démocratisation et de formations internes.
Pour devenir data centric et donc exposer en permanence les nouvelles données aux collaborateurs pour qu’ils en exploitent au maximum la valeur d’usage, l’entreprise à essentiellement 3 challenges à relever. Le premier au niveau de sa “fabrique de données”. L’organisation doit être pensée pour ingérer en continu les nouvelles données, les enrichir pour les exposer au plus vite, au plus grand nombre. Le cloud s’est imposé comme réponse à ce nouveau type de consommation de données, car il n’est plus possible de gérer les montées de version ou les passages à l’échelle dans un monde régi par les données massives.
Le second challenge concerne les hommes : pour faire la connexion entre le métier et ces données libérées il faut non seulement réunir de nouveaux profils tels que datascientists, data engineers, data analysts, devops, data architects, data stewards, business translators, data officers… mais aussi faire évoluer les profils traditionnels pour pouvoir se comprendre, travailler main dans la main avec ces spécialistes de la donnée et l’utiliser opérationnellement. Programme de formation en ligne (MooC), création de lab d’innovation, organisation de challenges data, partenariats écoles, communication interne sur les bénéfices de l’IA, retours d’expérience, rachat de startups ou création d’incubateur, café IA… sont parmi les leviers apparus pour acculturer l’ensemble des employés.
Et pour fédérer ces deux premiers challenges, reste celui de la gouvernance des données. C’est peut-être le plus critique et celui qui permet de séparer les leaders des suiveurs. En effet une culture assumée de la donnée portée par des règles bien établies permet des gains élevés dans un contexte où la donnée vit. Pour cela chacun doit connaître son rôle dans la chaîne de valeur de la donnée. Selon le contexte, les datascientists seront regroupés ou dispatchés dans les services au plus proche des métiers, un chief data officer aura été nommé et de plus en plus un Data Protection Officer pour respecter les normes d’exploitation de données type RGPD. Cette organisation est aussi portée par des outils de gouvernance comme Collibra (la petite pousse belge… déjà valorisée 1 milliards d’euros) pour que l’utilisateur soit en permanence informé des données disponibles, dispositif d’autant plus important depuis que la donnée est désilotée, qu’elle est mise à jour en permanence et qu’il est possible d’accéder à de nombreuses données externes sur la concurrence, sur les comportements consommateurs, sur l’environnement.
La data et l’IA dans le contexte actuel perturbé par la Covid
Malgré ces perspectives, les acteurs à l’ère du numérique sont actuellement confrontés à un nouveau défi : L’épidémie de Covid-19 et ses brusques changements de tendance et d’habitudes de consommation ont mis à mal une partie des algorithmes prédictifs basés sur les données historiques, l’IA montre des limites dans ce contexte. La Covid-19 pousse à revisiter les approches établies sur des historiques, à intégrer dans les modèles davantage de données externes pour identifier les signaux faibles en temps réel et détecter des tendances. Le contexte actuel a ainsi souligné les travers de l’IA mais a également paradoxalement fait apparaître le rôle que peut jouer l’analyse de données face à l’incertitude et au manque de visibilité.
L’accélération des transformations induites par la période COVID aura servi de révélateur : Alors qu’on s’attendait à voir apparaître les gros écarts de performance induits par l’usage de la donnée à horizon 2025, collaboration distante, automatisation de flux, révisions d’algorithmes prédictifs ont mis à jour plus vite que prévu le différentiel d’aisance entre acteurs. L’année 2021 sera l’année de la confirmation d’une bascule vers le pilotage et l’usage généralisés des entreprises à partir de la data. Les enjeux sont multiples pour réussir la diffusion de ces technologies dans l’ensemble des couches d’une entreprise, et à l’industrialisation réussie de nombreux projets qui restent parfois encore au stade de POC.