Régression logistique
- Les données suivantes ont été collectées sur 100 individus disponibles pour participer à une étude sur le CHD ("Coronary Heart Disease"):
Id | Groupe âge | Age | CHD |
1 | 1 | 20 | 0 |
2 | 1 | 23 | 0 |
3 | 1 | 24 | 0 |
4 | 1 | 25 | 0 |
5 | 1 | 25 | 1 |
6 | 1 | 26 | 0 |
7 | 1 | 26 | 0 |
8 | 1 | 28 | 0 |
9 | 1 | 28 | 0 |
10 | 1 | 29 | 0 |
11 | 2 | 30 | 0 |
12 | 2 | 30 | 0 |
13 | 2 | 30 | 0 |
14 | 2 | 30 | 0 |
15 | 2 | 30 | 0 |
16 | 2 | 30 | 1 |
17 | 2 | 32 | 0 |
18 | 2 | 32 | 0 |
19 | 2 | 33 | 0 |
20 | 2 | 33 | 0 |
21 | 2 | 34 | 0 |
22 | 2 | 34 | 0 |
23 | 2 | 34 | 1 |
24 | 2 | 34 | 0 |
25 | 2 | 34 | 0 |
26 | 3 | 35 | 0 |
27 | 3 | 35 | 0 |
28 | 3 | 36 | 0 |
29 | 3 | 36 | 1 |
30 | 3 | 36 | 0 |
31 | 3 | 37 | 0 |
32 | 3 | 37 | 1 |
33 | 3 | 37 | 0 |
34 | 3 | 38 | 0 |
35 | 3 | 38 | 0 |
36 | 3 | 39 | 0 |
37 | 3 | 39 | 1 |
38 | 4 | 40 | 0 |
39 | 4 | 40 | 1 |
40 | 4 | 41 | 0 |
41 | 4 | 41 | 0 |
42 | 4 | 42 | 0 |
43 | 4 | 42 | 0 |
44 | 4 | 42 | 0 |
45 | 4 | 42 | 1 |
46 | 4 | 43 | 0 |
47 | 4 | 43 | 0 |
48 | 4 | 43 | 1 |
49 | 4 | 44 | 0 |
50 | 4 | 44 | 0 |
51 | 4 | 44 | 1 |
52 | 4 | 44 | 1 |
53 | 5 | 45 | 0 |
54 | 5 | 45 | 1 |
55 | 5 | 46 | 0 |
56 | 5 | 46 | 1 |
57 | 5 | 47 | 0 |
58 | 5 | 47 | 0 |
59 | 5 | 47 | 1 |
60 | 5 | 48 | 0 |
61 | 5 | 48 | 1 |
62 | 5 | 48 | 1 |
63 | 5 | 49 | 0 |
64 | 5 | 49 | 0 |
65 | 5 | 49 | 1 |
66 | 6 | 50 | 0 |
67 | 6 | 50 | 1 |
68 | 6 | 51 | 0 |
69 | 6 | 52 | 0 |
70 | 6 | 52 | 1 |
71 | 6 | 53 | 1 |
72 | 6 | 53 | 1 |
73 | 6 | 54 | 1 |
74 | 7 | 55 | 0 |
75 | 7 | 55 | 1 |
76 | 7 | 55 | 1 |
77 | 7 | 56 | 1 |
78 | 7 | 56 | 1 |
79 | 7 | 56 | 1 |
80 | 7 | 57 | 0 |
81 | 7 | 57 | 0 |
82 | 7 | 57 | 1 |
83 | 7 | 57 | 1 |
84 | 7 | 57 | 1 |
85 | 7 | 57 | 1 |
86 | 7 | 58 | 0 |
87 | 7 | 58 | 1 |
88 | 7 | 58 | 1 |
89 | 7 | 59 | 1 |
90 | 7 | 59 | 1 |
91 | 8 | 60 | 0 |
92 | 8 | 60 | 1 |
93 | 8 | 61 | 1 |
94 | 8 | 62 | 1 |
95 | 8 | 62 | 1 |
96 | 8 | 63 | 1 |
97 | 8 | 64 | 0 |
98 | 8 | 64 | 1 |
99 | 8 | 65 | 1 |
100 | 8 | 69 | 1 |
On demande:
- d'effectuer un graphique du CHD en fonction de l'âge.
- de représenter graphiquement la probabilité de CHD en fonction de la classe d'âge.
- de calculer les valeur de la fonction logistique π(X). On utilisera comme valeurs pour β0 et β1, -4 et 0.2 respectivement.
- de calculer les valeurs correspondantes de la fonction logit g(X).
- de calculer les erreurs d'estimation (observé - prédit).
- de calculer la vraisemblance et d'estimer β0 et β1.
- de calculer la probabilité de CHD à l'âge de 38 ans.
- de tester le modèle.
Résolutions |
 |