Forage de données (Data mining)

Le datamining est l’exploration et l’analyse de grandes quantités de données afin de découvrir des formes et des règles significatives, afin de décerner des relations et des « patterns » qu’elles (les données) peuvent contenir. Le datamining analyse des données et produit des résultats concrets (connaissances) afin de générer des actions. Les outils de Data mining, également appelés « forage des données » ou « extraction de la connaissance », s’appuient sur le constat qu’il existe au sein de chaque entreprise des informations dont le sens ou les liens sont cachés dans le gisement des données de l’entreprise.

Le data mining permet de faire apparaître des corrélations cachées dans ces gisements de données. Il s’agit en fait d’une amélioration des approches d’analyse des données traditionnelles. C’est une extension de leurs champs d’application par l’utilisation d’une nouvelle génération d’outils d’analyse. Ces derniers sont rendus plus performants par l’intégration de nouveaux types d’algorithmes dits génétiques ou neuronaux, plus connus sous l’appellation d’outils d’intelligence artificielle. Dans le contexte actuel, où l’information intelligente est à la base du développement de toute affaire, on comprend aisément l’intérêt du recours au datamining. Il ne faut cependant pas perdre de vue qu’à la base de toute action d’analyse, il est nécessaire de disposer d’une information complète, riche, structurée et actualisée; sans quoi même les plus performants des outils de ce type ne pourraient révéler aucune « connaissance » à valeur ajoutée.

Les premiers adeptes du datamining sont les acteurs de la grande distribution qui cherchent à comprendre le profil et le comportement des consommateurs, l’objectif étant de créer de nouveaux besoins en vue d’augmenter la consommation. Les exemples classiques des compagnies de cartes de crédit, les opérateurs de télécommunication et les organismes financiers ne sont pas en reste à ce niveau.
American Express est un exemple typique de data mining avec Système Expert, un programme de réduction des fraudes qui a eu pour effet d’augmenter la productivité de 20%).
En résumé, le data mining est une technique d’analyse utilisant un logiciel pour dénicher des tendances ou des corrélations cachées parmi des masses de données, ou encore pour détecter des informations stratégiques ou découvrir de nouvelles connaissances, en s’appuyant sur des méthodes de traitement statistique.