search Le média de ceux qui réinventent l'entreprise

Le data catalog, ou comment accompagner la culture de la donnée dans votre entreprise

Le data catalog, ou comment accompagner la culture de la donnée dans votre entreprise

Par Jennifer Montérémal

Mis à jour le 28 octobre 2020, publié initialement en 3 juillet 2020

Avez-vous déjà songé à équiper votre entreprise d’un data catalog, ou catalogue de données ?

Aujourd’hui, nul ne peut nier l’importance capitale que revêt l’utilisation des data dans le développement et le pilotage de toute activité. Désormais, finies les stratégies business impulsées par l’intuition : la donnée est maîtresse, et les entreprises deviennent de plus en plus data driven.

Dans un tel contexte, où l’exploration des données et leur gouvernance représentent un enjeu de taille, le data catalog se révèle un outil précieux, en soutenant notamment la diffusion d’une culture de la donnée, même auprès des profils moins techniques.

Mais c’est quoi, exactement, un data catalog ? Et comment les organisations peuvent-elles mettre l’utilisation de cet outil au profit de leur croissance ? Définition, fonctionnalités, cas d’usage et exemple de logiciels à découvrir dans cet article.

Qu’est-ce qu’un data catalog ?

Définition d'un data catalog

Un data catalog se définit comme un système qui indexe, centralise et offre une vue unifiée de l’ensemble des métadonnées d’une entreprise.

Le data catalog présente également une vue complète des caractéristiques de chaque donnée, peu importe sa provenance (CRM, ERP, sources externes, etc.) et sa nature (structurée ou non structurée, dynamique ou statique).

Mais cet outil va encore plus loin, en permettant l’automatisation des actions entreprises sur cette data (classification ou traçabilité par exemple).

💡 Qu’est-ce qu’une métadonnée ? Littéralement «donnée sur la donnée», il s’agit de l’ensemble des informations servant à décrire une donnée (type de fichier, origine, date, etc.).

Fonctionnalités principales d'un data catalog

Les fonctionnalités peuvent évidemment évoluer d’une solution data catalog à une autre. Certaines demeurent néanmoins incontournables :

  • Le registre de métadonnées : il s’agit d’un système permettant d’obtenir les caractéristiques business et techniques précises de chaque élément. Cette fonctionnalité inclut également la création d’une taxonomie, avec usage de tags par exemple.
     
  • Le moteur de recherche : dans un environnement où la quantité de data est de plus en plus massive, le moteur de recherche d’un data catalog vous aide à accéder aux données à partir d’une requête, de les filtrer, de les trier, de les classifier, etc.
     
  • La collaboration et le crowdsourcing : puisque la collaboration et le partage des connaissances relatives à la data s’avèrent des enjeux de la culture de la donnée, encore faut-il que l’outil propose des fonctionnalités collaboratives. Citons par exemple la possibilité d’apposer des annotations, de partager, d’assigner des données, etc.
     
  • Le data lineage : le data lineage consiste à élaborer une cartographie du cycle de vie de la donnée, afin de savoir d’où elle provient et quelles sont les évolutions qu’elle a connues. Ces différentes transformations sont ensuite consignées dans un registre de traitements, permettant notamment de répondre aux exigences de la réglementation européenne (RGPD).
     
  • Le data profiling : le data profiling, ou profilage des données, sert à analyser les data et à en tirer un résumé afin d’obtenir un aperçu de certains éléments exploitables pertinents pour l’entreprise, comme le repérage des données sensibles ou les tendances générales.
     
  • Les connecteurs : les data catalogs sont connectés aux différentes sources de données, comme vos systèmes ERP ou CRM par exemple, afin de collecter en temps réel l’ensemble de vos métadonnées.
     
  • Les outils d’aide à la prise de décision : la présence de tableaux de bord, par exemple, offre un aperçu sur la performance de l’entreprise en matière de gestion de la donnée. Certaines solutions, par ailleurs, intègrent des fonctionnalités de scoring afin de déterminer la qualité des data, et ainsi faciliter les prises de décision stratégiques.
     
  • La gestion des accès et des systèmes : il s’agit d’avoir la possibilité, par exemple, de définir en amont les rôles des collaborateurs : qui a accès à quoi, quelles actions sont possibles pour chacun, etc.
     
  • La documentation : un data catalog peut contenir de la documentation permettant d’accompagner les utilisateurs dans la gestion de leurs métadonnées.

© Pexels

Avantages du data catalog

Selon Forrester, l’avantage généré par les entreprises qui ont recours au big data depuis son essor s’élèverait… à 1 200 milliards de dollars !

Face à un tel constat, l’utilisation du data catalog se présente comme un atout précieux, et ce pour plusieurs raisons :

Culture de la donnée et collaboration

Le data catalog ouvre le champ des possibles en matière d'usage de data, en faisant notamment sortir l’exploitation des ensembles de données de la sphère purement technique. L’ensemble des métiers peut alors explorer les data de son entreprise et les valoriser plus facilement afin de répondre aux enjeux business.

En parallèle, les spécialistes de la donnée disposent d’un outil les aidant à évangéliser les équipes et à insuffler une véritable culture de la donnée axée sur la collaboration.

Fiabilité et sécurité

Grâce aux mises à jour ou encore à la récolte de données en temps réel, les utilisateurs s’assurent d’exploiter des data correctes, afin de ne pas corrompre leurs prises de décision.

Le data catalog répond par ailleurs à des objectifs de sécurité : contrôlez les accès à la donnée et définissez des rôles pour déterminer quel collaborateur a accès à telle ou telle information.

Gain de temps et efficience

Enfin, précisons que le recours à un data catalog génère un gain de temps important. Recherche ou encore identification des données sont simplifiées et fluidifiées. Conséquence ? Les équipes disposent de plus de bande passante à consacrer à des actions génératrices de valeur.

Utilisateurs et usages fonctionnels du data catalog au sein de l'entreprise

Plusieurs métiers sont concernés par l’usage d’un data catalog au sein de l’entreprise.

Citons les principaux :

🧑‍💻  Les data analysts : ils ou elles sont en charge du traitement et de l’analyse des données de l’entreprise. Leur objectif est d’en prélever des informations exploitables afin de soutenir la croissance de l’entreprise en contribuant, par exemple, à la définition d’une stratégie marketing.

👉  Le data catalog se révèle, pour les data analysts, un facilitateur d’accès à la donnée. Grâce à cet outil, ils trouvent facilement et rapidement toutes les informations nécessaires à leur analyse.

🧑‍💻  Les gouverneurs de données : ils ou elles adoptent une vision long-termiste de l’utilisation des data, afin de maintenir et d’améliorer leur qualité dans l’objectif de répondre au développement business de l’entreprise.

🧑‍💻  Les data stewards : plus concentrés sur la donnée elle-même, leur rôle est d’organiser «l’intendance» de la data (comment elle est stockée, consultée, utilisée, etc.).

👉  Notez que dans les petites structures, l’intendance et la gouvernance des données sont souvent assurées par une seule et même personne. Le data catalog lui permet, entre autres, d’organiser et de qualifier la donnée, de disposer d’un système pour insuffler une culture de la data solide au sein de l’organisation, mais aussi de gérer les accès aux informations.

Mais la force du data catalog, c’est aussi de s’adresser à d’autres profils que les équipes data (équipes marketing et business analysts par exemple), grâce notamment à la simplicité d’utilisation de certaines solutions.

© Shutterstock/Branislav Nenin

Data catalog : quelle solution choisir ?

Focus sur trois solutions data catalog performantes disponibles sur le marché :

🛠️  DataGalaxy : DataGalaxy se présente comme un data catalog 360°, conçu pour s’adapter aussi bien aux besoins informatiques que métier. Il comprend toutes les fonctionnalités indispensables à un catalogue de données efficace (moteur de recherche, data lineage, collaboration, etc.). Par ailleurs, la solution se distingue par son accessibilité, sa simplicité d’utilisation et son déploiement rapide.

🛠️  Google Cloud Data Catalog (ou data catalog GCP) : Google Cloud, que l’on ne présente plus, a également développé sa propre offre data catalog. Si la solution propose les fonctionnalités classiques que l’on attend s’agissant de catalogage, elle offre de surcroît à ses utilisateurs la puissance de la technologie Google en matière d’infrastructure et de sécurité.

🛠️  Talend Data Catalog : l’éditeur Talend, à l’origine de Data Services Platform, a enrichi son offre d’une solution de data catalog. Cette dernière permet un gain de temps grâce à l’automatisation de nombreux processus (gestion des accès, traçabilité, gestion de la protection des données, etc.), permise par les relations intelligentes et le machine learning.

Alors, prêt·e à passer à une culture 100 % data driven grâce au catalogue de donnée ? Faites-nous part de votre expérience en commentaires.

Jennifer Montérémal

Jennifer Montérémal, Editorial Manager, Appvizer

Actuellement Editorial Manager, Jennifer Montérémal a rejoint la team Appvizer en 2019. Depuis, elle met au service de l’entreprise son expertise en rédaction web, en copywriting ainsi qu’en optimisation SEO, avec en ligne de mire la satisfaction de ses lecteurs 😀 !

Médiéviste de formation, Jennifer a quelque peu délaissé les châteaux forts et autres manuscrits pour se découvrir une passion pour le marketing de contenu. Elle a retiré de ses études les compétences attendues d’une bonne copywriter : compréhension et analyse du sujet, restitution de l’information, avec une vraie maîtrise de la plume (sans systématiquement recourir à une certaine IA 🤫).

Une anecdote sur Jennifer ? Elle s’est distinguée chez Appvizer par ses aptitudes en karaoké et sa connaissance sans limites des nanars musicaux 🎤.