Data Science avec Python
Objectif : initiation aux fonctionnalités spécifiques de Python
Public admis : demandeur d’emploi, salarié, entreprise, étudiant, particulier
Pré-requis : Python – Base
Certification : TOSA
Référence : 81881
PROGRAMME
1. ÉCOSYSTÈME PYTHON SCIENTIFIQUE
- Panorama de l’écosystème scientifique de Python : les librairies incontournables
- Savoir où trouver de nouvelles librairies et juger de leur pérennité
- Les principaux outils et logiciels open source pour la data science
2. TRAVAILLER LES DONNÉES AVEC PYTHON
- Le socle scientifique Python : la SciPy Stack
- Les bonnes pratiques pour bien démarrer votre projet de data science avec Python
- Les formats de fichiers scientifiques et les librairies pour les manipuler
- Pandas : l’analyse de données tabulaires (fichiers csv, excel), statistiques, pivots, filtres et recherche
- Numpy : calcul numérique et algèbre linéaire (les vecteurs, matrices, images)
- L’extraction des données, la préparation et le nettoyage
3. LA MODÉLISATION, INTRODUCTION
- Les étapes de construction d'un modèle
- Les algorithmes supervisés et non supervisés
- Le choix entre la régression et la classification
4. PROCÉDURES D’ÉVALUATION DE MODÈLES
- Les techniques de ré-échantillonnage en jeu d'apprentissage, de validation et de test
- Test de représentativité des données d'apprentissage
- Mesures de performance des modèles prédictifs
- Matrice de confusion, de coût et la courbe ROC et AUC
5. LES ALGORITHMES SUPERVISÉS
- Le principe de régression linéaire univariée
- La régression multivariée
- La régression polynomiale
- La régression régularisée
- Le Naive Bayes
- La régression logistique
6. LES ALGORITHMES NON SUPERVISÉS
- Le clustering hiérarchique
- Le clustering non hiérarchique
- Les approches mixtes