Comparaison d'une moyenne à un standard


Il s'agit dans ce cas de figure de tester si la moyenne de la population dont provient un échantillon, moyenne estimée par la moyenne de l'échantillon, est identique à une moyenne de référence.
Pour illustrer ce type de problème, on peut considérer l'exemple suivant: les veaux blanc-bleu belges pèsent en moyenne 35 kilos à la naissance. Afin de légèrement diminuer le poids des veaux pour limiter les problèmes de dystocies, un régime alimentaire est administré aux vaches en fin de gestation. Les poids de 10 veaux nés de telles vaches sont mesurés, et donnent le résultat suivant:

32.935.137.529.621.6 31.426.626.031.428.4

On peut tester l'hypothèse nulle selon laquelle la moyenne des veaux dont les mères ont été traitées est égale à celle des veaux des mères non traitées, soit 35 kilos.

H0: Moyenne des veaux dont les mères ont été traitées = moyenne des veaux dont les mères ont été non traitées = 35
H1: Moyenne des veaux dont les mères ont été traitées < moyenne des veaux dont les mères ont été non traitées


On a vu dans le cours théorique que ce test était réalisé à l'aide d'un test de t pour un échantillon. De manière explicite, on peut calculer la valeur de t et employer la distribution correspondante pour en déduire la probabilité d'observer un résultat qui s'écarte aussi fort, voire plus fort, de ce que prédisait la moyenne.
Pour rappel, la formule pour calculer la valeur de t est:

\[t=\frac{\bar{X}-\mu}{\frac{S}{\sqrt{n}}}\]

Commençons par calculer la moyenne de l'échantillon, puis la valeur de t et la probabilité correspondante:

poids<-c(32.9,35.1,37.5,29.6,21.6,31.4,26.6,26.0,31.4,28.2)
moy<-mean(poids)
moy
## [1] 30.03
mu<-35
t<-(moy-mu)/sqrt(var(poids)/10)
t
## [1] -3.366958
pt(t,9)
## [1] 0.004148478

On observe que la moyenne de l'échantillon est de 30.03. Avoir une moyenne si faible, voire plus faible, n'a qu'une probabilité de 0.00414878 de survenir si la vraie moyenne est en réalité de μ = 35. On rejette dès lors cette hypothèse (nulle): le traitement appliqué aux mères a bien pour effet de diminuer le poids des veaux à la naissance.

Le code qui suit montre la manière directe d'arriver à cette conclusion en utilisant la fonction t.test(<arguments>) de R:

poids<-c(32.9,35.1,37.5,29.6,21.6,31.4,26.6,26.0,31.4,28.2)
t.test(poids,mu=35, alternative="less")
## 
##  One Sample t-test
## 
## data:  poids
## t = -3.367, df = 9, p-value = 0.004148
## alternative hypothesis: true mean is less than 35
## 95 percent confidence interval:
##      -Inf 32.73588
## sample estimates:
## mean of x 
##     30.03

La réponse à cette fonction nous donne toutes les informations nécessaires pour effectuer le test:

On obtient évidemment le même résultat que lorsqu'on fait le calcul manuellement. La probabilité otbenue étant très faible (< 0.05), on rejette l'hypothèse nulle. Le régime a un effet significatif sur le poids des veaux.
Noter que dans ce cas-ci, on se trouve dans un test unilatéral: on regarde dans une seule direction (le régime diminue-t-il le poids des veaux?). On doit donc préciser à R le sens de notre hypothèse alternative. C'est pourquoi on inscrit dans la fonction alternative="less". Si on ne précise rien, par défaut, R réalise un test bilatéral. Si l'hypothèse alternative était une augmentation du poids suite au régime, on aurait dû écrire : alternative="greater".