M. Zerbato

Note sur la détermination du mode

 

La détermination du mode, immédiate dans le cas où le caractère statistique est discret, est plus problématique dans le cas où le caractère est continu.

 

I. Cas discret

Dans ce cas, les valeurs possibles du caractère (les modalités) sont toutes explicitement énumérées et le mode est la modalité associée à l’effectif le plus élevé (ou à la fréquence la plus forte).

On le lit directement dans le tableau.

Graphiquement, dans le diagramme différentiel, on repère le mode avec la bâton le plus haut.

 

II. Cas continu

Dans ce cas, les modalités sont des intervalles de valeur. On ne sait donc pas comment l’effectif d’une classe est distribué suivant les valeurs de l’intervalle correspondant.

Par convention, on trace le diagramme différentiel en représentant l’effectif d’une classe par l’aire d’un rectangle dont la base est l’intervalle de classe et la hauteur la densité de la classe (di est l’effectif par unité de mesure de l’intervalle de classe i).

Cette convention traduit l’hypothèse d’homogénéité (ou d’équirépartition au sein de chaque classe), qui revient à considérer que chaque individu de l’effectif d’une classe prend une valeur différente, tout l’intervalle de valeurs étant couvert.

C’est, implicite ou explicite, l’hypothèse faite quand on trace la fonction de répartition en joignant deux points par un segment de droite. C’est aussi l’hypothèse faite quand on " calcule " la médiane par interpolation linéaire.

Alors les individus sont répartis à sous-intervalles égaux dans la classe, le premier ayant pour valeur la borne de gauche, le dernier la borne de droite moins un sous-intervalle.

Avec une classe [ ; [ d’effectif , le premier de la classe vaut et le dernier .

On a alors le choix entre deux attitudes : s’en tenir à cette hypothèse, ou en introduire une autre.

 

A- Hypothèse d’équirépartition

Sans hypothèse particulière sur la distribution intra-classe, on s’en tient à la densité, qui est une moyenne : dans ce cas, chaque valeur possible de l’intervalle est ni plus ni moins fréquente que n’importe quelle autre.

• Le mode est alors l’ensemble des valeurs de plus forte densité : c’est la classe modale.

- Dans le tableau, on la repère en lisant les densités.

- Sur l’histogramme, on la repère par le rectangle le plus haut (le plus dense par construction).

• Néanmoins, dans ce cas on prend souvent pour mode le centre de la classe modale.

C’est implicitement ce que l’on fait en traçant le polygone des fréquences (en n’oubliant pas que les densités sont calculées pour des intervalles égaux à l’unité d’amplitude).

 

B- Hypothèse du barycentre

On peut en effet considérer que la densité moyenne cache une hétérogénéité de répartition dans l’intervalle de classe, et supposer alors que les individus d’une classe se pressent vers la valeur centrale de la distribution (vers la borne de droite pour les classes à gauche de la classe modale, vers la borne de gauche pour celles qui sont à droite).

Il y aurait alors dans la classe modale, une valeur pour laquelle la densité est maximale.

Pour estimer ce mode, on cherche la valeur telle que le rapport de ses écarts aux bornes de la classe est égal à celui des différences de l’effectif de la classe aux effectifs des classes adjacentes : c’est un calcul de barycentre.

 

• Graphiquement, la méthode des diagonales donne la valeur du mode :

 

image74.gif (3361 octets)

ce qui signifie que est entre et comme est entre et .

 

• Algébriquement, on a :

 

soit :  

ou :    .

 

(C’est une simple application du théorème de Thalès.)

 

Attention : il faut bien voir qu’il n’y a pas d’un côté le choix de s’arrêter à la classe modale et de l’autre la volonté d’aller plus loin jusqu’au calcul du mode. En réalité, il y a deux hypothèses différentes : l’une pour laquelle toute valeur de la classe modale est un mode possible et l’autre qui qui privilégie une valeur particulière.

Les deux hypothèses sont également légitimes. Le calcul numérique s’impose quand on a besoin d’une valeur du mode pour le situer par rapport aux autres valeurs centrales dans des relations numériques (asymétrie, " relation empirique de Pearson ", etc.). Le calcul du barycentre est alors un choix possible, mais on peut tout aussi bien choisir le centre de la classe modale.

Remarque : lorsqu’on trace le polygone des fréquences, on fait encore une autre hypothèse.

En effet, lorsqu’en vertu du principe de conservation des aires on trace ledit polygone en joignant les milieux de chaque intervalle unitaire de classe, on redistribue les effectifs vers le centre de la classe modale.

Généralisons. Soit un intervalle unitaire de classe de densité . Sur cet intervalle, le polygone des

fréquences fait alors varier la densité de pour   à  pour .

 

Pour l’intervalle modal de l’histogramme, la densité est maximale (égale à ) au centre de la classe ; pour les autre intervalles, elle est maximale sur la borne de droite (de gauche) pour les intervalles à gauche (à droite) de l’intervalle modal ; elle peut être constante sur tout ou partie de l’intervalle.

 

Retour en haut de la page                                              Retour à l'accueil