Natural Language Processing

Etablissement : ECOLE DU NUMERIQUE

Langue : Français

Période : S2


  • Connaissance du langage python

  • Connaissance en machine Learning


  • Savoir extraire les informations d’un texte

  • Être en mesure d’analyser le contenu d’un texte

  • Mettre en œuvre un modèle de machine Learning (de sa formalisation à son évaluation) pour la classification de texte


  • Introduction

    • Les éléments d’un texte : Tokenization, Part Of Speech (POS), Name Entity Recognition (NER), la Lemmatization

    • L’analyse statistique du contenu d’un texte

    • Le modèle de Markov caché appliqué aux Part Of Speech






  • Machine Learning appliqué au NLP

    • Comparaison de textes à l’aide de la vectorisation (utilisation de la cosine similarity)

    • La vectorization : TF, TF-IDF, Bag Of Word, de Word 2 Vec

    • La régression logistique appliquée à la classification de texte

    • Naïve bayes appliqué à la classification de texte