Le data mining et la statistique sont de plus en plus répandus dans les entreprises et les organisations soucieuses d’extraire l’information pertinente de leurs bases de données, qu’elles peuvent utiliser pour expliquer et prévoir les phénomènes qui les concernent. Cette édition fait le point sur le data mining, ses fondements théoriques, ses méthodes, ses outils et ses applications, qui vont du scoring jusqu’au web mining et au text mining. Nombre de ses outils appartiennent à l’analyse des données et la statistique « classique » mais certains sont plus spécifiques au data mining, comme les arbres de décision, les réseaux de neurones, les SVM, etc. Ces outils sont disponibles dans des logiciels de plus en plus puissants, aptes à exécuter de nombreux algorithmes sur de grands volumes de données. Les aspects méthodologiques vont de la conduite des projets jusqu’aux facteurs de réussite et aux pièges à éviter, en passant par l’évaluation et la comparaison des modèles, leur intégration dans les processus opérationnels, sans oublier les contraintes juridiques dès que l’on traite des données à caractère personnel.