Logiciels de BI : le Data Mining maintenant à la portée de tous
Les outils d'analyse de données envahissent petit à petit l'ensemble des entreprises car bien que l'intérêt ne soit pas nouveau, les logiciels ont évolué vers beaucoup plus d'accessibilité. Au delà de cette tendance, l'évolution des usages va aujourd'hui vers le Data Mining. Pourquoi et comment ? Un didactitiel sur l'analyse de données s'impose : décryptage.
Data Mining : définition
Le Data Mining ou l'exploration de données regroupe l'ensemble des méthodes, techniques et outils qui permettent de mettre à jour une connaissance à partir d'un grand volume de données. Contrairement à la Business Intelligence dont l'objet est de créer des rapports et des tableaux de bord pour comprendre une situation et prendre des décisions, le Data Mining vise à dégager des corrélations et de nouvelles informations inconnues.
Révolution des pratiques grâce aux logiciels en ligne de BI
Le Data Mining existe depuis très longtemps. Certains considèrent d'ailleurs que les premières fouilles de données ont été réalisées par les empereurs Chinois il y a quasiment 4300 ans. Le facteur de rupture ayant produit la dernière révolution dans l'informatique décisionnelle est la migration des données vers le Cloud.
En effet, le fait que les données les plus importantes des entreprises soient hébergées sur des Cloud privés ou publics change la donne à plus d'un titre :
- L'accès aux données est possible via une simple connexion Internet ;
- Il est possible d'agréger les données en un endroit unique ;
- La lecture des données peut se faire en temps réel ;
- L'archivage des données n'a plus de limite en temps et en volume grâce aux coûts décroissants du stockage.
Cette rupture technologique s'accompagne en sus de la simplification des outils d'exploration de données. L'américain Zendesk avec son outil de Business Intelligence Bime en est le parfait exemple. Il rend possible pour un Web Marketer, un Responsable Commercial ou un Contrôleur de Gestion de créer lui-même les tableaux de bord dont il a besoin pour piloter son activité.
Plus concrètement cela signifie que celui qui est concerné par les données (le métier) n'a pas besoin de passer par un Business Intelligence Analyst pour requêter les bases de données et extraire les informations contenues dans les données. Bime dispose de plus de 60 connecteurs qui permettent à l'utilisateur de se "brancher" aux sources de données dont il a besoin puis de créer ses tableaux ou cubes à la manière d'un tableau croisé dynamique sous Excel. Parmi ces sources données on compte :
- Les réseaux sociaux : Twitter, Facebook, Linkedin, YouTube, Instagram, Vimeo ;
- Les données de sites Web : Google Analytics, MySQL ;
- Les fichiers statiques : Excel, CSV, Google Drive, DropBox, XML ;
- Les logiciels marketing : Campaign Monitor, MailChimp, Zendesk, Salesforce ;
- Et bien d'autres sources
De la Business Intelligence au Data Mining
L'utilisation d'un outil comme Bime permet non seulement de concevoir des tableaux de bord interactifs dont les données sont lues en temps réel, mais aussi de mettre un pied dans le Data Mining grâce à des pratiques faciles à mettre en place.
- L'agrégation de multiples sources de données permet de dégager des corrélations statistiques entre données éloignées. Par exemple en mixant ses données Facebook et celles de son site e-commerce, on peut découvrir que les femmes sont plus enclins à réaliser un achat suite à une campagne sur les réseaux sociaux alors que les hommes achètent sur la base de comparatifs produits.
- La fonction de drill-down permet de décomposer les données en sous segments. Prenons l'exemple d'une campagne marketing en France : le logiciel de BI permettra de séparer les revenus par canaux (Adwords, Emailing, Affichage dans les lieux publics) puis de prendre l'un de ces canaux et d'observer les résultats par ville. L'intérêt est d'orienter plus efficacement les budgets marketing.
- L'algorithme du moteur d'analyse permet par ailleurs de dégager des tendances (stagnation, diminution, augmentation) ainsi que des prévisions intégrant des saisonnalités. Cela permet de capitaliser sur des résultats passés pour anticiper le chiffre d'affaire à venir par exemple.
Le Data Mining n'est pas une discipline facile. Elle fait appel à beaucoup de rigueur et de méthode. En revanche, un outil comme Bime brise les verrous externes à l'utilisateur comme l'accès aux données sans requête SQL ou extraction, et la manipulation des données sans formules ou calculs manuels.
Explorer ses données en 4 étapes simples
1. Définir sa problématique
La première étape consiste à concentrer son attention sur l'objectif à atteindre. Cela peut être la résolution d'un problème (ex : comprendre pourquoi les ventes baissent au mois de Mai), l'optimisation de budgets marketing ou l'amélioration d'un produit.
Il s'agit par ailleurs de formaliser les graphiques qui permettront de comprendre le problème.
2. Connecter et structurer ses sources de données
Les logiciels comme Bime se connectent aux sources de données de deux manières : par import d'un fichier (CSV, Excel) ou avec des identifiants et mots de passe quand il s'agit d'une source "Cloud". Si vous souhaitez récupérer les données de votre site Web ou toute autre base de données privée, vous devrez ajouter une étape pour ventiler les champs en deux groupes : attributs et mesures. Les attributs sont des noms, des mots, des identifiants quand les mesures sont des valeurs numériques.
3. Créer des requêtes et les présenter en graphiques
La création de requêtes et de graphiques est l'étape qui prend le plus de temps car, en plus de la création, elle fait appel à votre esprit d'analyse. Bime permet d'analyser une source de données unique ou plusieurs sur un même graphique grâce au Query Blender.
Ce tutoriel permet de comprendre comnent prendre en main ce volet :
4. Tableaux de bord et rapports
La finalité d'un logiciel de BI est de pouvoir formaliser et diffuser des résultats riches en informations "actionnables". L'utilisateur ajoute les graphiques de son choix à des tableaux de bord qui seront accessibles par un nombre illimité de lecteurs grâce à des identifiants. Le grand avantage d'un outil comme Bime par rapport à une solution de Business Intelligence classique est d'offrir un accès à des données en temps réel : chaque rafraîchissement du tableau de bord le remet à jour avec les données "live".
Quels sont les bénéfices du Data Mining pour l'entreprise ?
L'exploration de données permet d'aller plus loin que la simple compréhension de l'activité de l'entreprise. Elle permet de se pencher sur des zones inconnues d'un marché ou d'une activité qui peuvent potentiellement révolutionner l'avenir de l'entreprise.
Au regard du prix d'une licence Bime et d'un peu de temps de la part de l'utilisateur, le Data Mining est une vraie opportunité pour créer de la compétitivité dans les entreprises. La collecte des données et les découvertes qui en découlent font prendre des parts de marché à ceux qui y consacrent de l'intérêt.
Conclusion
Le Data Mining est rendu accessible grâce à des outils en ligne et ergonomiques de Business Intelligence ainsi qu'à la prospérité des données dans le Cloud. Cette discipline est par ailleurs passée des mains des techniciens dans celles des responsables métiers plus enclins à comprendre les informations qu'ils explorent. Bien que les verrous techniques soient tombés, l'exploration de données nécessite toujours de la méthode et de la rigueur. Enfin, le Data Mining est une vraie opportunité business pour les entreprises cherchant des relais de croissance et de compétitivité.