Data Mining
Présentiel
Format de la formation
Il n'y a pas encore de taux de satisfaction sur ce produit.
Formation

Durée
28 heures sur 4 jours
Groupe
De 3 à 8 personnes
Tarifs
Inter : 2 490 € NET 4 jours
Intra : Nous consulter
Programme
Prérequis
Public concerné
Responsables infocentre et marketing, statisticiens, chefs de projet, experts décisionnels et gestionnaires de bases de données.
Objectifs pédagogiques
- Comprendre le Data Mining
- Mettre en place d’une solution de Datamining
- Connaitre les techniques du Data Mining
- Intégrer une méthodologie
Contenu
1/ Comprendre le Data Mining
- Définition et finalité du Data Mining (DM). A quoi sert le DM ?
- Quel lien entre le DM et les statistiques, quelle dépendance entre le DM et l’ « informatique » ?
- Les attentes des entreprises, les réponses du DM.
- Les principales applications du DM
2/ Mise en place d’une solution de Datamining
2.1 Les données de l’entreprise : entre qualité et quantité ?
-Les différents types de données.
-Qualité des données et administration des données.
-Processus de collecte et d’exploration.
-Création d’agrégats et de nouvelles données.
-Transformation des données.
2.2 Méthodologie de projet
-Définition du problème métier à résoudre et des objectifs à atteindre.
-Inventaire, description et classement des données.
-Exploration, segmentation des entités analysées.
-Etablissement du ou des modèles d’analyse.
-Application des modèles et validation des résultats.
-Itérations, déploiement auprès des utilisateurs (formation, accompagnement du changement…).
-Maintenance du modèle et logiciel associé.
2.3/ Panorama des outils
-Les principaux outils : SAS, R, Python, KNIME, IBM SPSS, Oracle Data Mining, SQL Server DM…
-Zoom sur un ou deux outils au choix (de préférence KNIME, open source et code free, possibilité de pratiquer en séance)
-Quels critères de choix pour ce type d’outils ?
3/ Les techniques du Data Mining
-Les différentes familles du DM : apprentissage supervisé, non supervisé
-L’analyse factorielle, la classification ou clustering, la détection de liens.
-Les arbres de décisions, les forêts aléatoires, les SVM, les réseaux de neurones, les modèles paramétriques.
-Classification des techniques de DM : Quelle technique choisir pour un type de problème donné ?
4/ Méthodologie et applications
4.1/ Construire une segmentation clients
-Définition et méthodologie.
-Choix des critères pour structurer les données à classer. Combien de classes viser ?
-Utilisation de variables.
-Evaluation et validation des classes obtenues. Comment mesurer la qualité d’une bonne segmentation ?
-Utilisations pratiques
4.2/ Le Scoring : prédire un évènement
-Définition du Scoring.
-Dans quels domaines d’activité est-il utilisé ? Pour quel type de problèmes ?
-Quelle est la finalité ?
-Les catégories de Scoring (appétence, risque, octroi).
-La méthodologie de Scoring.
-Cas pratique de Scoring dans une banque ou assurance.
4.3/ Les systèmes de recommandations de produits
- De quoi s’agit-il ?
-Technique et méthodologie
-Dans quels domaines d’activité sont-ils utilisés ? Quel type d’utilisation ?
-Cas pratique
Méthodes Pédagogiques
Cas pratiques
Support de cours
Modalités d'évaluation
Accessibilité
Date de modification
26/02/2025
