Machine Learning avec Python
Objectif : initiation aux fonctionnalités spécifiques de Python
Public admis : demandeur d’emploi, salarié, entreprise, étudiant, particulier
Pré-requis : Python – Base
Certification : TOSA
Référence : 51862
PROGRAMME
1. IMPORT DES DONNÉES ET PREPROCESSING
- L'environnement de développement Python / Anaconda / Jupyter Notebook
- Pandas : l’analyse de données tabulaires (CSV, Excel), statistiques, pivots, jointures et filtres
- Traitement des valeurs manquantes : imputation par la moyenne, médiane, interpolation, knn
- Traitement des Outliers : analyse graphique, méthode de l’IQR, Z-score
- Standardisation
- Normalisation : Skewness et Kurtosis
- Données non balancées : Undersampling, Oversampling, SMOTE
2. ENTRAINEMENT DE MODÈLES ET ÉVALUATION
- Modèles d’apprentissage supervisés et non-supervisés les plus courants
- Entraînement de modèles avec Scikit-learn
- Méthodes d’évaluations : savoir choisir les bonnes métriques pour chaque problématique
3. OPTIMISATION DES MODÈLES ET LOG DES PERFORMANCES
- Présentation des librairies Optuna et Hyperopt
- Présentation de l’approche Grid Search pour identifier les meilleurs hyper paramètres d’un modèle
- Log des hyper paramètres et des performances dans Mlflow
4. MODÈLE ET DATA DRIFT
- Intérêt de vérifier le modèle Drift et le Data Drift
- Présentation des librairies Evidently et Streamlit
5. INDUSTRIALISATION ET DÉPLOIEMENT DANS LE CLOUD
- Présentation du service AWS EC2
- Présentation de Flask pour la mise à disposition d’un modèle de machine learning par le biais d’une API
- Présentation de divers outils de connexion à l’environnement virtuel tels que Putty et Visual Studio Code
- Déploiement du code par le biais de GitHub