Natural Language Processing
Etablissement : ECOLE DU NUMERIQUE
Langue : Français
Formation(s) dans laquelle/lesquelles le cours apparait :
- MASTER DATA ET IA [ECTS : 4,00]
Période : S2
- Connaissance du langage python
- Connaissance en machine Learning
- Savoir extraire les informations d’un texte
- Être en mesure d’analyser le contenu d’un texte
- Mettre en œuvre un modèle de machine Learning (de sa formalisation à son évaluation) pour la classification de texte
- Introduction
- Les éléments d’un texte : Tokenization, Part Of Speech (POS), Name Entity Recognition (NER), la Lemmatization
- L’analyse statistique du contenu d’un texte
- Le modèle de Markov caché appliqué aux Part Of Speech
- Machine Learning appliqué au NLP
- Comparaison de textes à l’aide de la vectorisation (utilisation de la cosine similarity)
- La vectorization : TF, TF-IDF, Bag Of Word, de Word 2 Vec
- La régression logistique appliquée à la classification de texte
- Naïve bayes appliqué à la classification de texte