Le Data Mining
Le Data Mining
Définition
Une traduction "mot à mot" de Data Mining peut-être exploration de données ou encore extraction de connaissances à partir de données.
Usama M. Fayyad (qui a notamment exercé les fonctionnalités de vice-président et de responsable des données chez Yahoo),
a proposé en 1996 la définition suivante du Data Mining :
Processus non-trivial d'identification de structures inconnues,
valides et potentiellement exploitables dans les bases de données
Autrement dit, on cherche, par un processus complexe (du fait du volume et/ou de l'hétérogénéité des données), à connaitre quelque chose de nouveau, qui soit vrai, et éventuellement utilisable dans les bases données.
D'où vient le Data Mining
L'analyse de données et les statistiques exploratoires existent depuis plus de 30 ans. On peut voir le Data Mining comme un prolongement de ces domaines, avec des différences notables :
- ajout de techniques issues de l'Intelligence Artificielle (ex : Machine Learning)
- travail potentiel sur données non structurées
- caractère business souvent présent (exploitation commerciale...)
Big Data
Cette expression de "Big Data", a fait le buzz pendant plusieurs mois, le Data Mining y est étroitement lié. Certains y voient une potentielle 4ème révolution industrielle, tant les avancées potentielles et les domaines d'application sont nombreux. Je vous conseille cet article très intéressant pour en savoir plus sur le sujet.