Modélisation Statistique

Etablissement : ECOLE DU NUMERIQUE

Langue : Français

Période : S2


  • Savoir réaliser une exploration détaillée des données (phase critique avant la mise en œuvre d’algorithmes de machine Learning)

  • Mettre en œuvre les outils statistiques adéquats

  • Apporter un regard critique sur les données


  • Les ensembles

  • Description d’une série statistique

    • Le vocabulaire de la statistique (Population, échantillon, type de caractéristiques)

    • Effectifs et fréquences (cumulés et non cumulés)

    • La discrétisation de caractéristiques continues (Règles de Sturges, de Rice, de Scott, de Freedman-Diaconis)

    • Le tableau de contingence



  • Analyses statistique univariée

    • Les caractéristiques de position (mode, moyenne, quantiles)

    • Les caractéristiques de dispersion (variance, écart-type sur population et échantillon, pourquoi n-1 dans le calcul de la variance et de l’écart-type corrigés ?)

    • Les caractéristiques de formes (Skewness et Kurtosis)



  • Analyses statistique bi/multivariées

    • Le tableau de contingence pour l’analyse multivariée

    • Liaison entre deux caractéristiques continues (covariance, le coefficient de correlation linéaire de Pearson)

    • Liaison entre deux caractéristiques numériques ou ordinales (Coefficient de corrélation des rangs de Pearson, Tau de Kendall, Test du Chi-Deux)



  • Statistiques inférentielles

    • Introduction aux probabilités et au tests statistiques



  • Analyses factorielles

    • Analyse en composantes principale

    • Analyse factorielle des correspondances

    • Analyse des correspondances multiples






  • Statistiques et Machine Learning

    • La régression linéaire