La loi normale en pratique
Récapitulons
La loi normale est bien adaptée au cas où des tailles
d'événements sont soumises au hasard ou à un
ensemble de facteurs eux-mêmes soumis au hasard.
Elle exprime la densité
de probabilité attachée à chaque mesure
possible. Elle s'exprime mathématiquement par la formule
où |
x est la mesure prise comme variable
aléatoire |
|
y est la densité de probabilité
de la mesure
|
|
m est la mesure moyenne et correpond
à la densité maximum |
|
est
l'écart-type
(moitié de la largeur qu'a la courbe au niveau de ses
points d'inflexion) |
Cette formule est représentée par
une "courbe en cloche", où se visualisent aisément
la moyenne et l'écart-type:
Déception !
Lorsque nous avons cessé
de nous limiter aux nombres entiers, nous avons dû
renoncer à attacher une probabilité à chaque
nombre, pour l'attacher désormais à des intervalles
de nombres. C'est pourquoi la courbe ci-dessus est une courbe des
densités de probabilité, et nous avons déjà
remarqué qu'elle a la nature d'une dérivée.
C'est pourquoi la probabilité d'un intervalle est l'intégrale
de la densité dans cet intervalle, ce qui se représente
par la surface comprise sous cette courbe dans cet intervalle.
... avec pour conséquence que la surface
totale, sous cette courbe, est égale à 1.
Nous nous attendons maintenant à ce qu'une
formule nous permette de calculer ces probabilités pour tout
intervalle souhaité. Eh bien, non! Motif: la fonction
y(x), donnée plus haut, n'est pas "intégrable":
elle n'a pas d'intégrale. Les mathématiciens en sont
alors réduits à estimer ces valeurs par des méthodes
numériques, ce qui leur permet d'établir le tableau
suivant, pour le courbe normale réduite ("réduite":
pour rappel: m=0 et =1).
x |
Probabilité d'obtenir
une mesureinférieure à x
|
-4 |
0,00003169 |
-3,5 |
0,0002
|
-3 |
0,0013 |
-2,5 |
0,0062 |
-2 |
0,0228 |
-1,5 |
0,0668 |
-1 |
0,1587 |
-0,5 |
0,3085 |
0 |
0,5 |
0,5 |
0,6915 |
1 |
0,8413 |
1,5 |
0,9332 |
2 |
0,9772 |
2,5 |
0,9938 |
3 |
0,9987 |
3,5 |
0,9998 |
4 |
0,99996831 |
|
Ce tableau (que l'on trouvera beaucoup plus détaillé
dans les tables mathématiques) nous aidera plus que
nous pourrions le croire. En effet, pour toute loi normale
de moyenne m et d'écart-type
appliquée à une variable aléatoire,
nous pouvons utiliser ce tableau en substituant à
x la valeur (x-m)/.
(en bon français: l'unité de mesure est alors
l'écart-type et les mesures s'expriment par différence
à la moyenne).
Exemple
Supposons que nous sachions que les tailles des citoyens
d'un pays répondent à une loi de distribution
normale de moyenne 165 (cm) et d'écart-type 15 (cm).
Tirons un individu au hasard. Quelle chance avons-nous qu'il
mesure entre 150 et 172,5 cm?
Nous remarquons que 172,5, en valeur réduite, correspond
à (x-m)/
= (172,5-165)/15 = 7,5/15 = 0,5 dans le tableau.
La probabilité que l'individu mesure moins de 172,5
cm est donc (voir tableau) 0,6915.
De même, la valeur réduite de 150 est
(x-m)/
= (150-165)/15 = -15/15 = -1.
La probabilité que l'individu mesure moins de 150
cm est donc (voir tableau) 0,3413.
Donc, la probabilité que la taille de l'individu
soit comprise entre 150 et 172,5 est 0,6915-0,3413 = 0,3502.
Si nous tirons au sort cent individus, le plus probable
est que 35 se situeront dans cet intervalle de tailles.
|
Remarque: les valeurs de la colonne de droite sont symétriques
par rapport à la valeur centrale (0,5), en sorte que la moitié
d'entre elles peuvent être calculées à partir
des autres.
A quoi reconnaît-on une distribution "normale"?
J'ai ramassé hier au hasard 200 feuilles
d'un chêne, arrachées par les premiers vents d'automne,
et les ai mesurées. Seules 188 se sont avérées
mesurables. Voici les mesures obtenues.
En regroupant ces mesures par intervalles de 10
mm, on peut les représenter comme suit:
Visuellement, cette distribution ressemble à
une distribution normale . En examinant les chiffres, on peut penser
qu'il s'agit de celle ayant pour moyenne 67 et pour écart-type
17.
Voici la comparaison de ma récolte avec
cette distribution normale.
Une autre récolte donnerait un résultat
différent, et conduirait sans doute à une courbe normale
légèrement différente.
On reconnaît qu'une distribution
observée est "normale" au fait qu'elle correspond
au tableau des probabilités donné plus haut
|
à commencer
par le fait que la proportion de cas compris entre (m-)
et (m+)
est de (0,8413-0,1587) = 0,6826, soit environ 68 %
et que la proportion de cas comprise entre (m-2)
et (m+2)
est environ 95,5 %
|
|