Stratégies d’évaluation des modèles, données creuses, de type textuelles (Embedding)
- 00:00 Introduction
- 03:28 Petit retour sur la séquence précédente
- 09:00 Première partie : Stratégie d’évaluation des modèles
- 44:16 Trouver la bonne métrique ?
- 56:56 Seconde partie : Données creuses de type textuelles
- 59:39 One-hot encoding
- 1:07:55 Embedding
- 1:21:55 Exemple 1, avec du One-hot Encoding
- 1:39:31 Exemple 2, avec de l’Embedding
Une séquence en deux parties, presque indépendantes :-)
Partie 1 : Nous nous intéresserons aux stratégies d’évaluation des modèles.
- Quelle reproductibilité pour un apprentissage ?
- Validation simple (Hold out) - Validation simple itérative (Iterative hold out)
- Validation croisée (k-fold) - One metric to rule them all, but which one ;-)?
Partie 2 : Nous nous intéresserons ensuite aux données creuses/textuelles
- Principes de l’Embedding (Keras, CBOW, Skip-Gram)
- Comment réduire les dimensions ?
- Illustrations : analyse de sentiment avec une analyse de critiques de films.
Nous discuterons également du jeux Cémantix, qui repose sur cette technologie ;-)
Durée : 2h