Intéressant

Exemple de calcul ANOVA

Exemple de calcul ANOVA



We are searching data for your request:

Forums and discussions:
Manuals and reference books:
Data from registers:
Wait the end of the search in all databases.
Upon completion, a link will appear to access the found materials.

Une analyse factorielle de la variance, également appelée ANOVA, nous permet de faire des comparaisons multiples de plusieurs moyennes de population. Plutôt que de le faire par paires, nous pouvons examiner simultanément tous les moyens considérés. Pour effectuer un test ANOVA, nous devons comparer deux types de variation, la variation entre les moyennes des échantillons, ainsi que la variation au sein de chacun de nos échantillons.

Nous combinons toutes ces variations en une seule statistique, appeléeF statistique, car elle utilise la distribution F. Nous faisons cela en divisant la variation entre les échantillons par la variation au sein de chaque échantillon. La façon de procéder est généralement gérée par un logiciel. Cependant, il est utile de voir un tel calcul effectué.

Il sera facile de se perdre dans ce qui suit. Voici la liste des étapes que nous allons suivre dans l'exemple ci-dessous:

  1. Calculez la moyenne des échantillons pour chacun de nos échantillons ainsi que la moyenne de toutes les données de l'échantillon.
  2. Calculez la somme des carrés d'erreur. Ici, au sein de chaque échantillon, nous comparons l'écart entre chaque valeur de donnée et la moyenne de l'échantillon. La somme de tous les écarts carrés est la somme des carrés d'erreur, en abrégé SSE.
  3. Calculez la somme des carrés de traitement. Nous comparons l'écart entre la moyenne de chaque échantillon et la moyenne globale. La somme de tous ces écarts carrés est multipliée par un de moins que le nombre d'échantillons que nous avons. Ce nombre est la somme des carrés de traitement, abrégé SST.
  4. Calculez les degrés de liberté. Le nombre total de degrés de liberté est égal à un de moins que le nombre total de points de données de notre échantillon, ou n - 1. Le nombre de degrés de liberté de traitement est égal à un de moins que le nombre d'échantillons utilisés, ou m - 1. Le nombre de degrés de liberté d'erreur est le nombre total de points de données moins le nombre d'échantillons, ou n - m.
  5. Calculez le carré moyen d'erreur. Ceci est noté MSE = SSE / (n - m).
  6. Calculez le carré moyen de traitement. Ceci est noté MST = SST /m - '1.
  7. Calculez le F statistique. C'est le rapport entre les deux carrés moyens que nous avons calculés. Alors F = MST / MSE.

Tout cela se fait très facilement par logiciel, mais il est bon de savoir ce qui se passe dans les coulisses. Dans ce qui suit, nous élaborons un exemple d’ANOVA en suivant les étapes décrites ci-dessus.

Données et exemples de moyennes

Supposons que nous ayons quatre populations indépendantes qui remplissent les conditions pour une ANOVA à facteur unique. Nous souhaitons tester l'hypothèse nulle H0: μ1 = μ2 = μ3 = μ4. Pour les besoins de cet exemple, nous utiliserons un échantillon de taille trois de chacune des populations à l’étude. Les données de nos échantillons sont:

  • Échantillon de la population n ° 1: 12, 9, 12. La moyenne de l'échantillon est de 11 personnes.
  • Échantillon de la population n ° 2: 7, 10, 13. L'échantillon est en moyenne de 10.
  • Échantillon de la population n ° 3: 5, 8, 11. L'échantillon est en moyenne de 8 personnes.
  • Échantillon de la population n ° 4: 5, 8, 8. L'échantillon est en moyenne de 7 personnes.

La moyenne de toutes les données est de 9.

Somme des carrés d'erreur

Nous calculons maintenant la somme des écarts carrés de la moyenne de chaque échantillon. C'est ce qu'on appelle la somme des carrés d'erreur.

  • Pour l'échantillon de la population n ° 1: (12 - 11)2 + (9- 11)2 +(12 - 11)2 = 6
  • Pour l'échantillon de la population n ° 2: (7 - 10)2 + (10- 10)2 +(13 - 10)2 = 18
  • Pour l'échantillon de la population n ° 3: (5 - 8)2 + (8 - 8)2 +(11 - 8)2 = 18
  • Pour l'échantillon de la population n ° 4: (5 - 7)2 + (8 - 7)2 +(8 - 7)2 = 6.

Nous additionnons ensuite toutes ces sommes d’erreurs et obtenons 6 + 18 + 18 + 6 = 48.

Somme des carrés de traitement

Maintenant, nous calculons la somme des carrés de traitement. Nous examinons ici les écarts carrés de la moyenne de chaque échantillon par rapport à la moyenne globale, et multiplions ce nombre par un de moins que le nombre de populations:

3(11 - 9)2 + (10 - 9)2 +(8 - 9)2 + (7 - 9)2 = 34 + 1 + 1 + 4 = 30.

Degrés de liberté

Avant de passer à l'étape suivante, nous avons besoin des degrés de liberté. Il y a 12 valeurs de données et quatre échantillons. Ainsi, le nombre de degrés de liberté de traitement est 4 - 1 = 3. Le nombre de degrés de liberté d'erreur est 12 - 4 = 8.

Carrés moyens

Nous divisons maintenant notre somme de carrés par le nombre approprié de degrés de liberté afin d'obtenir les carrés moyens.

  • Le carré moyen pour le traitement est 30/3 = 10.
  • Le carré moyen d'erreur est 48/8 = 6.

La statistique F

La dernière étape consiste à diviser le carré moyen du traitement par le carré moyen de l’erreur. Ceci est la statistique F des données. Ainsi pour notre exemple F = 10/6 = 5/3 = 1.667.

Des tableaux de valeurs ou des logiciels peuvent être utilisés pour déterminer la probabilité d'obtenir une valeur de la statistique F aussi extrême que cette valeur par hasard.


Voir la vidéo: l'ANOVA en 3 minutes ;- (Août 2022).