Statistiques à deux variables et estimation en Terminale
Cours complet, points clés à retenir et exercices d'entraînement de statistiques à deux variables et estimation pour les élèves de Terminale. Conforme au programme officiel.
Réviser notion par notion
Ce que tu vas réviser
- Nuage de points et corrélation linéaire
- Ajustement affine par moindres carrés
- Intervalle de confiance d'une proportion
- Prise de décision et risque
- Tableur et traitement statistique
Nuage de points et corrélation linéaire
Un nuage de points est la représentation graphique de deux variables quantitatives. La corrélation linéaire mesure le lien entre ces deux variables : elle est forte si les points s'alignent, faible s'ils sont dispersés.
Exemple
Relation entre le temps d'étude et la note obtenue à un examen : plus on étudie, plus la note augmente généralement. Les points forment une tendance.
À retenir : Le coefficient de corrélation $r$ varie entre -1 et 1 : plus $|r|$ est proche de 1, plus la corrélation est forte.
Ajustement affine par moindres carrés
C'est la méthode pour trouver la meilleure droite qui passe au plus près de tous les points du nuage. Cette droite minimise la somme des carrés des écarts verticaux entre les points et la droite.
Exemple
Un magasin veut prédire ses ventes en fonction de ses dépenses publicitaires. On trace la droite qui représente au mieux cette relation pour faire des prévisions.
À retenir : La droite d'ajustement a pour équation $y = ax + b$ où $a = \frac{\text{cov}(x,y)}{V(x)}$ et $b = \bar{y} - a\bar{x}$.
Intervalle de confiance d'une proportion
C'est une plage de valeurs qui contient probablement la vraie proportion d'une population, calculée à partir d'un échantillon. Plus l'intervalle est étroit, plus on est précis.
Exemple
Un sondage auprès de 1000 personnes montre que 55% votent pour un candidat. L'intervalle de confiance à 95% indique que la vraie proportion se situe entre 52% et 58% environ.
À retenir : L'intervalle de confiance à 95% pour une proportion est $\left[p - 1.96\sqrt{\frac{p(1-p)}{n}}, p + 1.96\sqrt{\frac{p(1-p)}{n}}\right]$ où $p$ est la fréquence observée et $n$ la taille de l'échantillon.
Prise de décision et risque
Avant de prendre une décision statistique, on fixe un risque acceptable (généralement 5%). Si la probabilité d'observer le résultat est inférieure à ce risque, on rejette l'hypothèse initiale.
Exemple
Un fabricant affirme que 90% de ses produits fonctionnent. On teste 100 produits et seulement 82% marchent. Le risque de 5% nous permet de décider si cette affirmation est vraie ou fausse.
À retenir : On compare la p-valeur (probabilité observée) au seuil de risque (généralement 0.05) : si p-valeur < 0.05, on rejette l'hypothèse.
Tableur et traitement statistique
Un tableur (Excel, Calc) permet de calculer rapidement les statistiques : moyennes, variances, coefficients de corrélation, et de créer des graphiques pour visualiser les données.
Exemple
Avec un tableur, on peut entrer les notes de 200 élèves en deux colonnes, calculer la moyenne avec =MOYENNE(), tracer un nuage de points et ajouter une courbe de tendance automatiquement.
À retenir : Les fonctions principales du tableur sont : =MOYENNE(), =VAR(), =COVARIANCE(), =PEARSON() pour le coefficient de corrélation, et les graphiques XY pour les nuages de points.
Les points clés
- La corrélation mesure le lien linéaire entre deux variables, pas une relation de cause à effet
- La droite des moindres carrés minimise les écarts verticaux et permet de faire des prédictions
- Un intervalle de confiance à 95% signifie qu'on a 95% de chance que la vraie valeur s'y trouve
- La prise de décision repose sur la comparaison entre la p-valeur et le seuil de risque fixé
- Le tableur automatise les calculs et permet de visualiser rapidement les tendances
L'essentiel
L'ajustement affine par moindres carrés permet de modéliser la relation entre deux variables et de faire des prédictions fiables, à condition que la corrélation soit suffisamment forte.
Exercices d'entraînement
Entraîne-toi sur ces exercices, puis fais-toi corriger pas à pas par le tuteur.
Exercice 1
On étudie la relation entre le nombre d'heures de sommeil par nuit (x) et la performance sportive (y) sur 10 athlètes. Les données donnent $\bar{x} = 7.5$, $\bar{y} = 75$, $V(x) = 1.2$, $\text{cov}(x,y) = 18$. Déterminez l'équation de la droite d'ajustement et prédisez la performance pour 8 heures de sommeil.
Corrige cet exercice avec le tuteur →Exercice 2
Un sondage auprès de 400 personnes montre que 60% sont satisfaites d'un service. Calculez l'intervalle de confiance à 95% pour la proportion de satisfaction dans la population totale.
Corrige cet exercice avec le tuteur →