Formation/Cours

Logo UCL monochrome

Natural Language Processing

Etablissement : ECOLE DU NUMERIQUE

Langue : Français

Période : S2

  • Connaissance du langage python
  • Connaissance en machine Learning

  • Savoir extraire les informations d’un texte
  • Être en mesure d’analyser le contenu d’un texte
  • Mettre en œuvre un modèle de machine Learning (de sa formalisation à son évaluation) pour la classification de texte

  • Introduction

    • Les éléments d’un texte : Tokenization, Part Of Speech (POS), Name Entity Recognition (NER), la Lemmatization
    • L’analyse statistique du contenu d’un texte
    • Le modèle de Markov caché appliqué aux Part Of Speech

  • Machine Learning appliqué au NLP

    • Comparaison de textes à l’aide de la vectorisation (utilisation de la cosine similarity)
    • La vectorization : TF, TF-IDF, Bag Of Word, de Word 2 Vec
    • La régression logistique appliquée à la classification de texte
    • Naïve bayes appliqué à la classification de texte