Le test de Mac Nemar est un cas particulier du chi carré d'indépendance. Il s'applique lorsque la table de contingence contient des données pairées.
Dans cet exemple, nous allons considérer les situations où deux mesures sont prises sur des individus. Typiquement, une première mesure est prise avant le traitement qui est en test, et une seconde est prise après, de telle manière que chaque individu est son propre contrôle.
Par exemple, on pourrait se poser la question: est-ce que la consommation d'un aliment particulier augmente la probabilité d'être allergique à une substance ? Les individus inclus dans l'expérience seraient testés pour l'allergie à la substance une première fois avant de recevoir l'aliment, puis retestés une seconde fois quelque temps après la prise de l'aliment. Les résultats seraient alors présentables sous la forme d'une table 2 X 2, dans laquelle les lignes correspondraient aux deux états possibles (allergique ou pas) avant la prise de l'aliment, et les deux colonnes correspondraient aux deux états possibles après la prise de l'aliment. On pourrait obtenir un tableau comme celui-ci:
Après | |||
Positif | Négatif | ||
Avant | Positif | 100 | 30 |
Négatif | 20 | 80 |
Si le traitement n'a pas d'influence sur le taux d'allergie, il devrait y avoir autant de changements de positif vers négatif que de changements de négatif vers positif. En d'autres termes, il devrait y avoir autant d'individus allergiques avant la prise de l'aliment qui ne le sont plus après, que d'individus initialement non-allergiques qui le sont devenus après la prise de l'aliment.
H0: Pas d'effet de l'aliment sur le taux d'allergie.
H1: Effet de l'aliment sur le taux d'allergie.
Dans les données présentées dans le tableau ci-dessus, 30 individus initialement allergiques ne le sont plus après avoir pris l'aliment, alors que 20 ont suivi le chemin inverse. On peut tester si l'asymétrie entre les deux groupes représente une écart significatif par rapport à la situation où le traitement alimentaire n'a aucune influence. Si le traitement alimentaire n'avait aucune influence on s'attendrait à avoir autant de changements de positif vers négatif que de changements de négatif vers positif c'est-à-dire 25.
On reconnait le test de Mac-Nemar. On va donc d'abord calculer la statistique de chi-carré, c'est-à-dire l'écart entre les données observées et les données attendues si l'hypothèse nulle était correcte. Ensuite, on va cacluler la probabilité d'avoir une valeur de chi-carré aussi élevée si l'aliment n'a pas d'effet sur le taux d'allergie. Dans R, cela s'écrit:
obs<-c(20,30)
att<-c(25,25)
chi2<-sum((obs-att)^2/att)
chi2 # Valeur de chi-carré
## [1] 2
1-pchisq(chi2,1) # Probabilité d'obtenir une valeur de chi-carré aussi élevée si H0 est vraie
## [1] 0.1572992
#Autre façon de calculer la probabilité:
pchisq(chi2,1, lower.tail=FALSE)
## [1] 0.1572992
Ou en utilisant la fonction ad hoc de R:
table<-matrix(c(100,30,20,80), nrow=2, byrow=TRUE)
mcnemar.test(table, correct=FALSE)
##
## McNemar's Chi-squared test
##
## data: table
## McNemar's chi-squared = 2, df = 1, p-value = 0.1573
On observe donc une valeur de chi-carré égale à 2 avec 1 degré de liberté. La probabilité d'obtenir une valeur de chi-carré aussi élevée si l'hypothèse nulle est vraie est de 0.1573. Etant donné que cette probabilité est supérieure au seuil de 0.05, on peut accepter l'hypothèse nulle et conclure que le traitement n'a pas d'influence sur le taux d'allergie.
On pourrait arriver à la même conclusion en comparant la valeur de chi-carré obtenue à la valeur de chi-carré dans la table avec un degré de liberté (3.84). Etant donné que la valeur de chi-carré observée est inférieure à la valeur de chi-carré limite (2 < 3.84), on accepte l'hypothèse nulle: le traitement est non significatif.