Conseils

Comment trouver des degrés de liberté dans les statistiques

Comment trouver des degrés de liberté dans les statistiques



We are searching data for your request:

Forums and discussions:
Manuals and reference books:
Data from registers:
Wait the end of the search in all databases.
Upon completion, a link will appear to access the found materials.

De nombreux problèmes d'inférence statistique nous obligent à trouver le nombre de degrés de liberté. Le nombre de degrés de liberté sélectionne une seule distribution de probabilité parmi un nombre infini. Cette étape est un détail souvent négligé mais crucial dans le calcul des intervalles de confiance et le fonctionnement des tests d'hypothèse.

Il n’existe pas une seule formule générale pour le nombre de degrés de liberté. Cependant, des formules spécifiques sont utilisées pour chaque type de procédure dans les statistiques inférentielles. En d'autres termes, le paramètre dans lequel nous travaillons déterminera le nombre de degrés de liberté. Ce qui suit est une liste partielle de certaines des procédures d'inférence les plus courantes, ainsi que du nombre de degrés de liberté utilisés dans chaque situation.

Distribution normale normale

Les procédures impliquant une distribution normale standard sont énumérées pour des raisons d'exhaustivité et pour dissiper certaines idées fausses. Ces procédures ne nous obligent pas à trouver le nombre de degrés de liberté. La raison en est qu’il n’ya qu’une seule distribution normale standard. Ces types de procédures englobent celles impliquant une moyenne de population lorsque l'écart-type de population est déjà connu, ainsi que les procédures concernant les proportions de la population.

Un échantillon de procédures T

Parfois, la pratique statistique nous oblige à utiliser la distribution t de Student. Pour ces procédures, telles que celles concernant une moyenne de population avec un écart type de population inconnu, le nombre de degrés de liberté est inférieur de un à la taille de l'échantillon. Ainsi, si la taille de l'échantillon est n, alors il y a n - 1 degrés de liberté.

Procédures T avec données appariées

Souvent, il est judicieux de traiter les données comme des paires. L'appariement est généralement effectué en raison d'une connexion entre la première et la deuxième valeur de notre paire. Plusieurs fois, nous apparions avant et après les mesures. Notre échantillon de données appariées n'est pas indépendant. Cependant, la différence entre chaque paire est indépendante. Ainsi, si l'échantillon a un total de n paires de points de données (pour un total de 2n valeurs) alors il y a n - 1 degrés de liberté.

Procédures T pour deux populations indépendantes

Pour ces types de problèmes, nous utilisons toujours une distribution t. Cette fois, il y a un échantillon de chacune de nos populations. Bien qu'il soit préférable que ces deux échantillons soient de la même taille, cela n'est pas nécessaire pour nos procédures statistiques. Ainsi, nous pouvons avoir deux échantillons de taille n1 et n2. Il existe deux manières de déterminer le nombre de degrés de liberté. La méthode la plus précise consiste à utiliser la formule de Welch, une formule fastidieuse en calcul impliquant la taille et les écarts-types des échantillons. Une autre approche, appelée approximation conservatrice, peut être utilisée pour estimer rapidement les degrés de liberté. C'est simplement le plus petit des deux nombres n1 - 1 et n2 - 1.

Le Chi-Square pour l'Indépendance

Une des utilisations du test du khi-deux est de voir si deux variables catégorielles, chacune avec plusieurs niveaux, présentent une indépendance. Les informations sur ces variables sont consignées dans un tableau à double sens avec r rangées et c colonnes. Le nombre de degrés de liberté est le produit (r - 1)(c - 1).

Bien-être de l'ajustement chi-carré

La qualité de l'ajustement du chi-carré commence par une seule variable catégorique avec un total de n les niveaux. Nous testons l'hypothèse que cette variable correspond à un modèle prédéterminé. Le nombre de degrés de liberté est inférieur de un au nombre de niveaux. En d'autres termes, il y a n - 1 degrés de liberté.

ANOVA à un facteur

L’analyse de variance à un facteur (ANOVA) nous permet d’effectuer des comparaisons entre plusieurs groupes, éliminant ainsi la nécessité de recourir à plusieurs tests d’hypothèses paires. Comme le test nous oblige à mesurer à la fois la variation entre plusieurs groupes et la variation au sein de chaque groupe, nous nous retrouvons avec deux degrés de liberté. La statistique F, utilisée pour une ANOVA à un facteur, est une fraction. Le numérateur et le dénominateur ont chacun des degrés de liberté. Laisser c soit le nombre de groupes et n est le nombre total de valeurs de données. Le nombre de degrés de liberté du numérateur est égal à un de moins que le nombre de groupes, ou c - 1. Le nombre de degrés de liberté du dénominateur est le nombre total de valeurs de données, moins le nombre de groupes, ou n - c.

Il est clair que nous devons faire très attention à savoir avec quelle procédure d’inférence nous travaillons. Cette connaissance nous informera du nombre correct de degrés de liberté d'utilisation.