Post

DS 2024 2025 GIM V2

Télécharger le DS 2024 2025 GIM V2 en pdf

Pages : 1 2

Page 1 : ExamenData Exploration - ING1 MANDate : 18 décembre 20252 feuilles R/V manuscrites autorisées, Calculatrice autoriséeDurée : 1hNombre de pages : 2Deux rendus sont attendus : le code réalisé sur RStudio et un document écritprésentant vos réponses explications, suivis d'une présentation orale.1Partie I : Statistiques 5ptL'étudiant peut eectuer les calculs soit à la main, soit à l'aide de RStudioUn enseignant étudie les notes que ses élèves ont eu à son dernier examenNotes5679101213Eectifs11587641. 1.5pt Rentrer les données dans Rstudio.2. 1.5pt Donner les valeurs de la moyenne, le première quartile, le troisième quartile, la variance,l'écart inter-quartile et l'étendue.3. 1pt L'enseignant décide d'ajouter un point à tout le monde. Quels indicateurs ne sont pasimpactés ? Expliquer.4. 1pt L'élève ayant eu 5 bénécie d'un tier-note. Quels indicateurs ne sont pas impactés ?Expliquer.2Partie II : Data exploration2.1Présentation de donnéesConsidérons les données des valeurs nutritionnelles de 34 légumes enregistrées dans un data-framesur R nommé tab, dont voici un extrait pour 9 légumes :legumes Pour 100genergie kcaleau gbres gglucidesgprotidesglipidesgfamille· · ·· · ·· · ·· · ·· · ·· · ·· · ·· · ·Petit pois8074612.360.7grainePissenlit4085.53.55.72.70.7feuillesPoireau2790.53.5420.3feuillesPoivron219123.51.10.3fruitPomme de terre85772.11920.1racinePotiron2092.81.34.10.80.1fruitRadis1594.51.530.60.1tigeSalsis3079451.40.4racineTopinambour31797.64.52.40.4racineLégende : kcal : kilocalorie. g : grammeLa dernière colonne concerne une classication selon la partie de la plante que l'on consomme.1

page 1

Page 2 : 2.2Importer les données et statistiques univariées 4pt1. 0.5pt Lire le jeu de données à l'aide de l'instruction : tab = read.table....2. 1pt Combien y a-t-il d'observations ? Combien y a-t-il de variables ?3. 1.5pt Choisir une variable quantitative et réaliser une représentation graphique appropriée desa distribution. Avec la même variable, tracer également une boîte de Tukey boxplot. Est-cequ'il y a des individus atypiques ?4. 1pt Nommer la variable qualitative et réaliser une représentation graphique appropriée.2.3Statistiques bivariées2.3.1Quantitative × Quantitative 3ptÀ l'aide de la fonction lm avec les variables energie et glucides, répondre aux questions suivantes :1. 0.5pt Tracer nuage de point de ces deux variables. Deviner relation entre elles. Donner lecoecient de corrélation entre elles.2. 1pt Donner la droite de régression de energie en fonction de glucides.3. 0.5pt Tracer la droite sur graphique.4. 0.5pt Le modèle est-il valide ? Expliquer.5. 0.5pt Pour une légume dont valeur glucides est 12, donner la valeur prédite de energie.2.3.2Quantitative × Qualitative 2ptÀ l'aide de la fonction lm avec les variables energie et type, répondre aux questions suivantes :1. 1pt Quelles sont la variance inter-classe et la variance intra-classe ?2. 1pt Existe-t-il une relation entre les type et la variable energie ?2.4Eectuer une ACP 6ptRéaliser une ACP avec la fonction PCA du package FactoMineR, en ajoutant la variable type commevariable supplémentaire. Le package factoextra peut être utilisé pour l'achage des résultats.1. 0.5pt Réaliser une ACP2. 1pt Combien d'axes au total ? Combien d'axes doit-on retenir pour l'étude ? Justier votreréponse.3. 0.5pt Combien de groupes de variables observe-t-on ?4. 1.5pt Quelles variables contribuent le plus à la construction de l'axe 1 ? de l'axe 2 ? Donnezla réponse sous forme numérique et ajoutez un graphique pour faciliter la visualisation.5. 2pt Quelle est la contribution moyenne d'une observation ? Certaines observations ont-ellesune contribution anormalement importante sur l'axe 1 et l'axe 2 ? Donnez la réponse sous formenumérique et ajoutez un graphique pour faciliter la visualisation.6. 0.5pt Interpréter les caractéristiques du maïs2

page 2

Pages : 1 2

Le contenu de cet article est la propriété exclusive de son auteur.