Post

TD3 Quanti Quali

Télécharger le TD3 Quanti Quali en pdf

Pages : 1 2

Page 1 : Ingénieurs 1ère année Data exploration Analyse bivariée : Quantitatif-Qualitatif 1 Analyse bivariée Quantitatif-Qualitatif Durée : 3h L’objectif de ce TP est d’étudier un lien éventuel entre deux variables, l’une qualitative et l’autre quantitative, à l’aide de la formule de décomposition de la variance. Exercice 1 Décomposition de la variance Dans une population Ω de taille n, on observe deux variables : • une qualitative, x=xkk=1,…,n, à p modalités notées, m1,…,mp • une quantitative continue y=ykk=1,…,n de moyenne y et de variance2ys . On suppose que les modalités de la série x définissent des sous-populations p1Ω...ΩΩ= où =jiΩΩ, de tailles respectives n1,…,np. On peut alors considérer les restrictions de la caractéristiques y sur chacune des sous-populations et calculer les indicateurs numériques usuels pour chaque modalités de x, - moyennes : iy , i=1,…,p - variances : 2is , i=1,…,p 1 Montrez que ==p1iiiynn1y 2 Montrer que 2R2Ep1i2iip1i2ii2ysssnn1yynn1s+=+=== A quoi correspondent les termes 2Es et 2Rs ? On définit un indice de liaison entre les deux caractéristiques x et y par le rapport de corrélation 2y2Ey/xSss= 3 Donnez un encadrement de Sy/x. A quoi correspondent les cas Sy/x=0 et Sy/x=1 ? 4 Que se passe-t-il si n=p ?

page 1

Page 2 : Ingénieurs 1ère année Data exploration Analyse bivariée : Quantitatif-Qualitatif 2 Exercice 2 Données : Salaires.txt Le fichier présente les salariés d’une entreprise ayant 3 sites A, B et C. On y indique leur sexe, leur salaire annuel, leur catégorie CS : cadre supérieur, CM : cadre moyen, OE : ouvrier employé, leur âge et leur site. 1 Sur un même graphique, représentez les boites de Tuckey du salaire en fonction des catégories avec R 2 Y-a-t-il une différence de salaire entre les catégories ? Justifiez votre réponse à l’aide d’un indicateur numérique avec un tableur. 3 De la même façon, étudiez le lien entre l’âge et les catégories et entre l’âge et les établissements. 4 Sur un même graphique, représentez les boites de Tuckey du salaire en fonction des établissements. Pensez-vous pertinent de calculer le rapport de corrélation pour ces séries ? Exercice 3 Données : EnsSuperieur.txt Le fichier EnsSuperieur.xls comptabilise le nombre d'étudiants par sexe dans l'enseignement supérieur de premier et deuxième cycles. Il s’agit chiffres relevés par Eurostat en 2008. Illustrez et commentez ces chiffres en travaillant dans un premier temps sur le nombre d’étudiants et ensuite sur le taux d’étudiants pour 1000 habitants.

page 2

Pages : 1 2

Le contenu de cet article est la propriété exclusive de son auteur.