OEF Statistiques inférentielles --- Introduction ---

Ce module regroupe 15 exercices d'introduction à l'inférence statistique.

Notions abordées :

distribution d'une variable numérique
distribution normale
distribution d'échantillonnage de la moyenne
intervalle de fluctuation d'une moyenne
distribution d'échantillonnage de la fréquence (distribution binomiale)
intervalle de fluctuation d'une fréquence
test psychométrique
test de typicalité d'une fréquence
test d'hypothèse
intervalle de confiance d'une fréquence
tests de comparaison de moyennes (t de Student)
test de corrélation (t de Student)
test d'indépendance de 2 variables qualitatives (khi-2)

Les exercices A1 à A5 (distributions) puis B1 à B5 (tests) sont à faire en premier, dans cet ordre.
Les exercices C1 à C3 portent sur des données numériques.
Les exercices D1 et D2 portent sur la liaison entre 2 variables.

Références

Henry Rouanet, Jean-Marc Bernard, Brigitte Le Roux, Statistiques en Sciences Humaines : Analyse inductive des données, Paris, Dunod, 1990.
Henry Rouanet, Brigitte Le Roux, Statistiques en Sciences Humaines : Exercices et solutions, Paris, Dunod, 1995.

A1 - Distribution d'une variable numérique discrète

Un exercice est noté sur points. Le tableau ci-dessous donne la distribution des notes obtenues dans un groupe de élèves.

1. Calculer la moyenne et l'écart-type des notes (2 décimales).

moyenne
écart-type

2. Calculer la proportion des élèves ayant une note inférieure ou égale à (en %, avec 2 décimales).

proportion		%

3. Calculer la proportion des élèves ayant une note supérieure ou égale à (en %, avec 2 décimales).

proportion		%

A5 - Distribution d'échantillon. de la fréquence (approchée)

Les individus d'une population de très grande taille sont décrits par une variable binaire (réponse oui ou non à une question).
La fréquence de la réponse oui dans cette population est .

1. On considère la distribution d'échantillonnage de la fréquence pour des échantillons de taille .
Calculer l'écart réduit associé à un échantillon de fréquence (2 décimales).
En déduire la proportion des échantillons ayant une fréquence inférieure à (en %, avec 2 décimales).


		%

2. On considère la distribution d'échantillonnage de la fréquence pour des échantillons de taille .
Calculer l'écart réduit associé à un échantillon de fréquence (2 décimales).
En déduire la proportion des échantillons ayant une fréquence supérieure à (en %, avec 2 décimales).


		%

3. Pour des échantillons de taille , calculer l'intervalle de fluctuation à 95% de la fréquence (2 déc.).

(

)

A3 - Distribution d'échantillonnage de la moyenne

Une variable numérique (scores à une épreuve psychométrique) a, dans une population de très grande taille, une distribution normale de moyenne et d'écart-type .

1. On considère l'ensemble des échantillons de taille .
Calculer l'écart réduit associé à un échantillon de moyenne (2 décimales).
En déduire la proportion des échantillons ayant une moyenne inférieure à (en %, avec 2 décimales).


		%

2. On considère l'ensemble des échantillons de taille .
Calculer l'écart réduit associé à un échantillon de moyenne (2 décimales).
En déduire la proportion des échantillons ayant une moyenne supérieure à (en %, avec 2 décimales).


		%

3. Pour des échantillons de taille , calculer l'intervalle de fluctuation à 95% de la moyenne (2 déc.).

(

)

A4 - Distribution d'échantillonnage de la fréquence (exacte)

Les individus d'une population de très grande taille sont décrits par une variable binaire (réponse oui ou non à une question).
La fréquence de la réponse oui dans cette population est .
On considère la distribution d'échantillonnage de la fréquence pour des échantillons de taille .

1. Calculer la proportion des échantillons ayant une fréquence de réponse oui égale à , et (5 décimales).
En déduire la proportion des échantillons ayant une fréquence de réponse oui inférieure ou égale à (5 décimales).

2. Calculer la proportion des échantillons ayant une fréquence de réponse oui égale à et (5 décimales).
En déduire la proportion des échantillons ayant une fréquence de réponse oui supérieure ou égale à (5 décimales).

A2 - Distribution normale

Une variable numérique (scores à une épreuve psychométrique) a, dans une population de très grande taille, une distribution normale de moyenne et d'écart-type .

1. Calculer l'écart réduit de la valeur (2 décimales). En déduire la proportion des individus ayant un score inférieur à (en %, avec 2 décimales).


		%

2. Calculer l'écart réduit de la valeur (2 décimales). En déduire la proportion des individus ayant un score supérieur à (en %, avec 2 décimales).


		%

3. En déduire la proportion des individus ayant un score compris entre et (en %, avec 2 décimales).

		%

B3 - Inférence sur une fréquence : test de typicalité (appro

Les individus d'une population de référence de très grande taille sont décrits par une variable binaire (réponse oui ou non à une question).
La fréquence de la réponse oui dans la population de référence est .
On observe réponses oui dans un groupe d'observations de individus.
On réalise le test de typicalité avec la méthode approchée.

1. Calculer la fréquence observée de la réponse oui dans le groupe d'observations (3 décimales) et énoncer une conclusion descriptive.

La fréquence de la réponse oui est plus dans le groupe d'observations que dans la population de référence.

2. Calculer la valeur de la statistique de test (3 décimales).

3. Situer par rapport aux valeurs critiques.

4. En déduire le résultat du test.

Le résultat du test est au seuil .

5. Conclusions

Pour la fréquence de la réponse oui, le groupe d'observations de la population de référence, au seuil .

La fréquence de la réponse oui
au seuil .

6. Interprétation

Il de chercher à expliquer la de la réponse oui dans le groupe d'observation.

B2 - Inférence sur une fréquence, test de typicalité (exact)

Les individus d'une population de référence de très grande taille sont décrits par une variable binaire (réponse oui ou non à une question).
La fréquence de la réponse oui dans la population de référence est .
On observe oui dans un groupe d'observations de individus.
On réalise le test de typicalité avec la méthode exacte.

1. Calculer la fréquence observée de la réponse oui dans le groupe d'observations (3 décimales) et énoncer une conclusion descriptive.

La fréquence de la réponse oui est plus dans le groupe d'observations que dans la population de référence.

La réponse oui est dans le groupe d'observations.

2. Comparer et .

On a donc on calcule

3. Calculer la valeur du seuil observé unilatéral (5 décimales).

4. Situer le seuil observé ( ou ) par rapport aux seuils-repères unilatéraux traditionnels.

5. En déduire le résultat du test.

Le résultat du test est au seuil .

6. Conclusions

Pour la fréquence de la réponse oui, le groupe d'observations de la population de référence,

au seuil .

La fréquence de la réponse oui

au seuil .

7. Interprétation

Il de chercher à expliquer la de la réponse oui dans le groupe d'observations.

B5 - Inférence sur une fréquence, test d'hypothèse approché

Les individus d'une population de très grande taille sont décrits par une variable binaire (réponse oui ou non à une question).
La fréquence de la réponse oui dans cette population est inconnue.
On observe réponses oui dans un échantillon au hasard de individus.

1. Calculer la fréquence observée de la réponse oui dans l'échantillon (3 décimales).

I - Test d'hypothèse

2. On souhaite tester, avec la méthode approchée, l'hypothèse nulle .
Calculer la valeur observée de la statistique de test (3 décimales).

3. Situer par rapport aux valeurs critiques.

4. En déduire le résultat du test.

Le résultat du test est au seuil .

5. Conclusion

La fréquence de la réponse oui au seuil .

II - Intervalle de confiance

6. Calculer (3 décimales) la demi-largeur de l'intervalle de confiance de la fréquence au seuil bilatéral .

7. En déduire (3 décimales) les limites de l'intervalle de confiance de la fréquence au seuil bilatéral .

( ; )

8. Vérifier la cohérence entre l'intervalle de confiance et le résultat du test.

La fréquence parente testée ci-dessus, , est située à de l'intervalle de confiance.
Cette hypothèse est donc avec les données
et le test donne bien un résultat .

B4 - Inférence sur une fréquence : test d'hypothèse (exact)

Les individus d'une population de très grande taille sont décrits par une variable binaire (réponse oui ou non à une question).
La fréquence de la réponse oui dans cette population est inconnue.
On observe oui dans un échantillon au hasard de individus.

1. Calculer la fréquence observée de la réponse oui dans l'échantillon (3 décimales).

2. On souhaite tester, avec la méthode exacte, l'hypothèse nulle d'une fréquence parente égale à .

On a donc on calcule

3. Calculer la valeur du seuil observé unilatéral (5 décimales).

4. Situer le seuil observé ( ou ) par rapport aux seuils-repères unilatéraux traditionnels.

5. En déduire le résultat du test.

Le résultat du test est au seuil .

6. Conclusion

La fréquence de la réponse oui au seuil .

C2 - Inférence sur 2 moyennes (groupes appariés)

Chacun des individus d'un échantillon au hasard d'une population passe une épreuve dans deux conditions c1 et c2.
Le score obtenu est un indicateur direct de performance (plus le score est élevé, meilleure est la performance).
La moyenne observée des différences individuelles (calculée dans le sens c2 - c1) est .
L'écart-type corrigé des différences individuelles est .

I - Analyse descriptive

1. Conclusion descriptive

Dans cette expérience, selon la moyenne des scores, la condition est que la condition .

II - Analyse inductive : test d'hypothèse

On souhaite tester l'hypothèse nulle d'égalité des deux moyennes parentes, soit .

2. Calculer la valeur de la statistique de test (3 décimales).

3. Donner le nombre de degrés de liberté associé au test.

4. Situer par rapport aux valeurs critiques.

5. En déduire le résultat du test.

Le résultat du test est au seuil .

6. Conclusion inductive

Selon la moyenne des scores, au seuil .

7. Interprétation

L'hypothèse nulle ( ) est donc avec les données.

III - Analyse inductive : intervalle de confiance

8. Calculer (3 décimales) la demi-largeur de l'intervalle de confiance de la moyenne des différences individuelles au seuil . En déduire les limites de l'intervalle de confiance.

Limite inférieure ; limite supérieure

9. Relation entre le test d'hypothèse et l'intervalle de confiance

La valeur testée ( ) est située de l'intervalle de confiance.
L'hypothèse nulle est donc avec les données et le résultat du test est .

C3 - Inférence sur 2 moyennes (groupes indépendants)

Soit individus extraits d'une population par échantillonnage au hasard. Ces individus sont répartis aléatoirement en deux groupes et .
Ils passent une même épreuve évaluée par un score (plus le score est élevé, meilleure est la performance).

Les sujets du groupe passent l'épreuve dans une condition .
Les sujets du groupe passent l'épreuve dans une condition .

Dans le groupe , il y a individus .
Leurs scores ont pour moyenne et pour variance corrigée .

Dans le groupe , il y a individus .
Leurs scores ont pour moyenne et pour variance corrigée .

I - Analyse descriptive

1. Calculer la différence entre les 2 moyennes (dans le sens ) (3 décimales).

2. Conclusion descriptive sur le sens de l'effet

Dans cette expérience, selon la moyenne des scores, la condition est que la condition .

3. Calculer l'écart-type corrigé intra (3 décimales).

4. Calculer (3 décimales) l'effet calibré (ou d de Cohen).

5. Conclusion descriptive sur l'importance de l'effet

Dans cette expérience, selon l'effet calibré, la différence entre les moyennes des deux conditions est jugée .

II - Analyse inductive : test d'hypothèse

On souhaite tester l'hypothèse nulle d'égalité des deux moyennes parentes, soit .

6. Calculer la valeur de la statistique de test (3 décimales).

7. Donner le nombre de degrés de liberté associé au test.

8. Situer par rapport aux valeurs critiques.

9. En déduire le résultat du test.

Le résultat du test est au seuil .

10. Conclusion inductive

Selon la moyenne des scores, au seuil .

11. Interprétation

L'hypothèse nulle ( ) est donc avec les données.

III - Analyse inductive : intervalle de confiance

12. Calculer (3 décimales) la demi-largeur de l'intervalle de confiance de la différence des deux moyennes au seuil .

13. En déduire les limites de l'intervalle de confiance.

Limite inférieure : ; limite supérieure :

14. Relation entre le test d'hypothèse et l'intervalle de confiance

La valeur testée ( ) est située de l'intervalle de confiance.
L'hypothèse nulle est donc avec les données et le résultat du test est .

C1 - Inférence sur une moyenne

Les individus d'une population de très grande taille sont décrits par une variable numérique (score à une épreuve psychométrique).
La moyenne de la variable dans cette population est inconnue.
Dans un échantillon au hasard de individus, la moyenne des scores est et l'écart-type corrigé est .

I - Test d'hypothèse

1. On souhaite tester l'hypothèse nulle .
Calculer la valeur observée de la statistique de test de Student (3 décimales).

2. Donner le nombre de degrés de liberté associé au test.

3. Situer par rapport aux valeurs critiques.

4. En déduire le résultat du test.

Le résultat du test est au seuil .

5. Conclusion inductive

La moyenne des scores au seuil .

6. Interprétation

L'hypothèse nulle est avec les données.

II - Intervalle de confiance

7. Calculer (3 décimales) la demi-largeur de l'intervalle de confiance de la moyenne au seuil . En déduire les limites de l'intervalle de confiance.

Limite inférieure ; limite supérieure

8. Relation entre le test d'hypothèse et l'intervalle de confiance

La valeur testée ( ) est située de l'intervalle de confiance.
L’hypothèse nulle est donc avec les données et le résultat du test est .

D1 - Inférence sur une corrélation

Les individus d'une population de très grande taille sont décrits par deux variables numériques ( et ).
Dans cette population, la corrélation entre les deux variables est inconnue.

Dans un échantillon au hasard de individus, le coefficient de corrélation est .

On souhaite tester l'hypothèse d'une corrélation nulle dans la population parente.

1. Calculer la valeur de la statistique de test (3 décimales) et donner le nombre de degrés de liberté associé au test.

2. Situer par rapport aux valeurs critiques.

3. En déduire le résultat du test.

Le résultat du test est au seuil .

4. Conclusion inductive

Entre les deux variables et , au seuil .

6. Interprétation

L'hypothèse nulle d'absence de corrélation est donc avec les données.

D2 - Inférence sur un tableau de contingence

Un groupe de individus constitue un échantillon au hasard d'une population parente.
Chacun de ces individus est décrit par les deux variables qualitatives et , d'où le tableau de contingence d'effectifs ci-dessous.

On souhaite tester l'hypothèse nulle d'absence de liaison entre les deux variables et dans la population parente.

1. Calculer (3 décimales) les 6 effectifs théoriques du tableau et vérifier les sommes marginales.

2. Calculer (4 décimales) les 6 contributions absolues au khi-2.

3. En déduire (3 décimales) la valeur de la statistique de test khi-2 et donner le nombre de degrés de liberté.

=
=

4. Situer par rapport aux valeurs critiques.

5. En déduire le résultat du test.

Le résultat du test est au seuil .

6. Conclusion inductive

La liaison entre les deux variables et est au seuil .

7. Interprétation

L'hypothèse nulle d'absence de liaison entre les deux variables est avec les données.

B1 - Test psychométrique

On note la variable numérique formée par les scores obtenus à une épreuve psychométrique.
Dans une population de référence, cette variable a une distribution normale de moyenne et d'écart-type .

Un individu obtient un score de points à cette épreuve.

1. Calculer la valeur de la statistique de test associée au score (3 décimales).

2. Situer par rapport aux valeurs critiques.

3. Conclusion

L'individu qui obtient un score de points par rapport à la population de référence au seuil .

Cette page n'est pas dans son apparence habituelle parce que WIMS n'a pas pu reconnaître votre navigateur web.

Veuillez noter que les pages WIMS sont générées interactivement; elles ne sont pas des fichiers HTML ordinaires. Elles doivent être utilisées interactivement EN LIGNE. Il est inutile pour vous de les ramasser par un programme robot.

Description: introduction à l'inférence statistique (échantillonnage, tests d'hypothèse et intervalles de confiance). This is the main site of WIMS (WWW Interactive Multipurpose Server): interactive exercises, online calculators and plotters, mathematical recreation and games
Keywords: wims, mathematics, mathematical, math, maths, interactive mathematics, interactive math, interactive maths, mathematic, online, calculator, graphing, exercise, exercice, puzzle, calculus, K-12, algebra, mathématique, interactive, interactive mathematics, interactive mathematical, interactive math, interactive maths, mathematical education, enseignement mathématique, mathematics teaching, teaching mathematics, algebra, geometry, calculus, function, curve, surface, graphing, virtual class, virtual classes, virtual classroom, virtual classrooms, interactive documents, interactive document, statistical_test,, inferential_statistics, sampling_distribution, binomial_distribution, normal_distribution, prediction_interval, statistical_test, binomial_test, student_test, chisquare_test, confidence_interval, correlation, contingency_table