Post

Rattrapage 2023 2024 GIM Correction

Télécharger le Rattrapage 2023 2024 GIM Correction en pdf

Pages : 1 2 3 4

Page 1 : Corrigé Rattrapage Data Explo 20241. Exercice 1 :1 Population, taille : les 209 pays. Variables : Espérance de vie et PIB/habitant. Nature : les 2 variables sont quantitatives continues.2 a Un nuage allongé suivant une ligne droite indiquerait une bonne régression linéaire.b Une valeur atypique a tendance à détourner la droite de régression des autres points du nuage, et à induire une régression de mauvaise qualité.c L'élimination d'une valeur pourrait révéler d'autres points atypiques qui étaient cachés.3 a , == 16.36x⏨3420209== 70.47y⏨14728209Var x = s =- 16.36= 338.34 ⟹s == 18.4 2x1266772092x338.34Var y = s =- 70.47= 98.54 ⟹s == 9.93 2y10584612092y98.54Cov x, y = c=- 16.36 × 70.47 = 78.62xy257436209b r=== 0.43xycs sxyx y78.62338.34 × 98.54Ce coefficient est positif, indiquant que le PIB/hab. évolue dans le même sens que l'espérance de vie.Mais il est plutôt faible. L'espérance de vie n'explique qu'une petite partie de la variabilité du PIB/hab.c et === 0.232acsxy2x78.62338.34=-= 70.47 - 0.232 × 16.36 = 66.67by⏨a x⏨L'équation de la droite de régression est : y = 0.232 x + 66.67d Pour , on obtient : x = 15y = 0.232 × 15 + 66.67 = 70.15L'epérance de vie serait de ans pour un pays au PIB/hab. de milles 70.1515dollars.

page 1

Page 2 : 4 a seulement de la variabilité de l'espérance de vie R = 0.02164 ⟹2.164 2sont expliqués par le PIB/hab.b Le coef de corrélation est la racine carrée positive de car le coef. R2= 3.27 × 10 0a-5r== 0.147xy0.02164c L'équation de la droite de régression donnée par R est la suivante :y = 3.27 × 10x + 75.69-5d Le coef. de corrélation est passé de à 0.430.147La nouvelle droite de régression explique encore moins l'espérance de vie qu'avant.La régression est encore moins justifiée. Ceci s'explique par le fait que l'on s'est limié aux pays les plus riches où les différences d'espérance de vie peuvent s'expliquer par des choses bien différentes du PIB/hab., par le système de santé par exemple. 2. Exercice 2 :1 conducteurs sont agés de 18 à 30 ans et ont eu un seul accident.n= 742,1 conducteurs sont agés de 41 à 50 ans.n= 865▪,3 des conducteurs ont eu un seul accident.f== 6.762,▪3385000

page 2

Page 3 : 2 La somme de chaque colonne vaut , il s'agit donc de profils-colonnes.13 Ces profils-colonnes doivent être comparés au profil-colonne moyen obtenu en divisant les effectifs marginaux des nombres d'accidents par l'effectif total. On obtient :0,90040,06760,02420,00784 Le profil-colonne 18-30 est légèrement différent tout comme celui des 70.On peut s'attendre à un faible lien entre âge et nombre d'accidents.5 6 Ce tableau d'effectifs théoriques est calculé sous l'hypothèse d'indépendance entre les 2 variables.La formule de calcul est n==i,j,theon× nni,▪▪,j▪,▪×total lignetotal colonneeffectif totalL'effectif en gras a été obtenu par : = 19.7121 × 81250007 La distance du khi2 est donnée par : .𝜒=2i,jn- nni,j,theoi,j,obs2i,j,theo8 Le nombre de degrés de liberté est : d.d.l.4 - 1 6 - 1 = 15Le seuil est donc .C = 25.00Les 2 variables sont liées.𝜒= 27.57 C ⟹23. Exercice 3 :

page 3

Page 4 : 1 Si on note les durées de chômage des ouvriers qualifiés, la moyenne est : oqi.oq15050i=1iSi on note les durées de chômage des cadres, et la moyenne, la variance est cic⏨donnée par : c -=c -125ni=1 ic⏨2125ni=12ic⏨22 La variance intra-classes est donnée par : V=25 × 1.51 + 50 × 5.26 + 75 × 3.15 = 3.58intra11503 La variance inter-classes est donnée par : V=25 × 3.92 - 6.47+ 50 × 7.34 - 6.47+ 75 × 6.74 - 6.47inter1150222V= 1.37inter4 La formule de décomposition de la variance assure que :V= V+ VtotaleintrainterEt on a bien : 3.58 + 1.37 4.965 Le rapport de corrélation donne : R === 27.62VVintertotale1.374.96Conclusion : La catégorie socio-professionnelle explique environ de la 27.6variabilité de la durée de chômage.

page 4

Pages : 1 2 3 4

Le contenu de cet article est la propriété exclusive de son auteur.