La loi normale en pratique

Récapitulons

La loi normale est bien adaptée au cas où des tailles d'événements sont soumises au hasard ou à un ensemble de facteurs eux-mêmes soumis au hasard.

Elle exprime la densité de probabilité attachée à chaque mesure possible. Elle s'exprime mathématiquement par la formule

x est la mesure prise comme variable aléatoire
 

y est la densité de probabilité de la mesure

  m est la mesure moyenne et correpond à la densité maximum
  est l'écart-type (moitié de la largeur qu'a la courbe au niveau de ses points d'inflexion)

Cette formule est représentée par une "courbe en cloche", où se visualisent aisément la moyenne et l'écart-type:

Déception !

Lorsque nous avons cessé de nous limiter aux nombres entiers, nous avons dû renoncer à attacher une probabilité à chaque nombre, pour l'attacher désormais à des intervalles de nombres. C'est pourquoi la courbe ci-dessus est une courbe des densités de probabilité, et nous avons déjà remarqué qu'elle a la nature d'une dérivée. C'est pourquoi la probabilité d'un intervalle est l'intégrale de la densité dans cet intervalle, ce qui se représente par la surface comprise sous cette courbe dans cet intervalle.

... avec pour conséquence que la surface totale, sous cette courbe, est égale à 1.

Nous nous attendons maintenant à ce qu'une formule nous permette de calculer ces probabilités pour tout intervalle souhaité. Eh bien, non! Motif: la fonction y(x), donnée plus haut, n'est pas "intégrable": elle n'a pas d'intégrale. Les mathématiciens en sont alors réduits à estimer ces valeurs par des méthodes numériques, ce qui leur permet d'établir le tableau suivant, pour le courbe normale réduite ("réduite": pour rappel: m=0 et =1).

x

Probabilité d'obtenir une mesureinférieure à x

-4 0,00003169
-3,5

0,0002

-3 0,0013
-2,5 0,0062
-2 0,0228
-1,5 0,0668
-1 0,1587
-0,5 0,3085
0 0,5
0,5 0,6915
1 0,8413
1,5 0,9332
2 0,9772
2,5 0,9938
3 0,9987
3,5 0,9998
4 0,99996831


Ce tableau (que l'on trouvera beaucoup plus détaillé dans les tables mathématiques) nous aidera plus que nous pourrions le croire. En effet, pour toute loi normale de moyenne m et d'écart-type appliquée à une variable aléatoire, nous pouvons utiliser ce tableau en substituant à x la valeur (x-m)/.
(en bon français: l'unité de mesure est alors l'écart-type et les mesures s'expriment par différence à la moyenne).

Exemple

Supposons que nous sachions que les tailles des citoyens d'un pays répondent à une loi de distribution normale de moyenne 165 (cm) et d'écart-type 15 (cm). Tirons un individu au hasard. Quelle chance avons-nous qu'il mesure entre 150 et 172,5 cm?

Nous remarquons que 172,5, en valeur réduite, correspond à (x-m)/ = (172,5-165)/15 = 7,5/15 = 0,5 dans le tableau.
La probabilité que l'individu mesure moins de 172,5 cm est donc (voir tableau) 0,6915.

De même, la valeur réduite de 150 est
(x-m)/ = (150-165)/15 = -15/15 = -1.
La probabilité que l'individu mesure moins de 150 cm est donc (voir tableau) 0,3413.

Donc, la probabilité que la taille de l'individu soit comprise entre 150 et 172,5 est 0,6915-0,3413 = 0,3502.
Si nous tirons au sort cent individus, le plus probable est que 35 se situeront dans cet intervalle de tailles.


Remarque: les valeurs de la colonne de droite sont symétriques par rapport à la valeur centrale (0,5), en sorte que la moitié d'entre elles peuvent être calculées à partir des autres.

A quoi reconnaît-on une distribution "normale"?

J'ai ramassé hier au hasard 200 feuilles d'un chêne, arrachées par les premiers vents d'automne, et les ai mesurées. Seules 188 se sont avérées mesurables. Voici les mesures obtenues.

En regroupant ces mesures par intervalles de 10 mm, on peut les représenter comme suit:

Visuellement, cette distribution ressemble à une distribution normale . En examinant les chiffres, on peut penser qu'il s'agit de celle ayant pour moyenne 67 et pour écart-type 17.

Voici la comparaison de ma récolte avec cette distribution normale.

Une autre récolte donnerait un résultat différent, et conduirait sans doute à une courbe normale légèrement différente.

On reconnaît qu'une distribution observée est "normale" au fait qu'elle correspond au tableau des probabilités donné plus haut

 

 

à commencer par le fait que la proportion de cas compris entre (m-) et (m+) est de (0,8413-0,1587) = 0,6826, soit environ 68 %
et que la proportion de cas comprise entre (m-2) et (m+2) est environ 95,5 %