BL SET Formations en statistique

tests, régressions, apprentissage
logiciel R et Python



Logiciel R initiation

Présentation de R et de R studio

Principales structures de données, objets et fonctions Principaux éléments de R studio

aperçu de la séquence

Principales structures de données, objets et fonctions

  • vecteurs
  • types de données
  • dataframe : structure de base des traitements statistiques

Principaux éléments de R studio

  • object browser, packages, fenêtre de scripts
  • Sauvegarder l’espace de travail, charger un fichier sauvegardé — travailler en mode projet
  • importer un fichier CSV/Excel dans une dataframe

Langage R

Approfondissement des éléments du language R

aperçu de la séquence
  • extraire des parties d’un vecteur
  • concaténer, supprimer, insérer
  • facteurs
  • regrouper/ réordonner les niveaux d’un facteur — extraire des parties d’une matrice
  • extraire des parties d’une liste
  • dataframe en tant que liste et en tant que matrice

Statistique descriptive

Principaux résumés statistiques sur des données numériques ou nominales

aperçu de la séquence
  • médiane, moyenne, quantiles
  • distribution statistique
  • corrélations et covariances
  • tableaux de contingences
  • aperçu de quelques fonctions graphiques

Quelques tests d'hypothèse sous R

quelques tests d'hypothèse sous R

aperçu de la séquence
  • comparaisons de moyennes
  • tests de proportions,
  • tests d’homogénéité de distributions,
  • tests d’indépendance, test de normalité.
  • tests non paramétriques (Wilcoxon, kruskal wallis)

Régression linéaire sous R

Régression linéaire sous R

aperçu de la séquence

Les notions de corrélation partielle, semi-partielle et multiple sont vues à travers l’utilisation des résidus de la régression lors d’exemples.

  • diagnostics, sélection de modèles.
  • intervalles de confiance des estimations
  • sélection du modèle de pas à pas (stepwise) — table ANOVA
  • facteur d’inflation de la variance
  • test de Breusch-Pagan de l’hétéroscédasticité
  • test de Durbin-Watson pour autocorrélation
  • test RESET pour non-linéarité

Traitement de données sous R

Techniques élémentaires de filtrage, sélection et transformation sous R

aperçu de la séquence
  • choisir le type de chaque variable — convertir le type d’une variable — créer/supprimer des variables
  • renommer des variables
  • nommer les lignes du jeu de données
  • insérer/supprimer des lignes
  • catégoriser une variable numérique
  • convertir une variable numérique en facteur — filtrer et /ou agréger les données
  • filtrer les outliers ou les données manquantes — fusionner des dataframes

Graphiques

Visualiser des données multi-variées sous R

aperçu de la séquence
  • histogrammes,
  • box-plots, dot plots, scatter plot, — graphiques en barre,
  • graphiques en mosaïques,
  • fonction qplot de ggplot2.
Logiciel R initiation
Traiter des données, extraire et synthétiser des informations avec R
— se familiariser avec l’utilisation des scripts de traitements — construire un projet contenant des requêtes, des états statistiques et graphiques et des exports vers Excel ou d’autres fichiers. — effectuer des analyses statistiques usuelles — réaliser des graphiques
Obtenir un devis
Retour