Schlumberger
 
L'énigme mathématique du mois : août 2005
Les secrets de la loi de Benford

SEED
 
Nombre

L'énigme mathématique du mois précédent traitait de la loi de Benford qui stipule que si on considère un grand nombre de données, la répartition des chiffres, de 1 à 9, situés en première position n'est pas aléatoire. On constate au contraire que le chiffre 1 est celui qui apparaît le plus souvent en première position. Les autres chiffres y apparaissent selon un ordre décroissant.

Voici quelques exemples supplémentaires :

Juan Calvarado a observé les tailles des fichiers se trouvant dans le répertoire /system32/ de son ordinateur.


Premier
Chiffre
Nombre de fichiers commençant par ce chiffre Pourcentage total

1

587

29

2

311

15

3

236

12

4

169

8

5

185

9

6

250

12

7

115

6

8

112

5

9

85

4


 

Le chiffre qui apparaît le plus souvent en première place est le chiffre 1, la fréquence d'apparition des autres chiffres suit un ordre presque décroissant.

Parmi les 235 pays indiqués sur le site Web GeoHive, 64 pays ont une population dont le premier chiffre est 1. Ce qui représente 27 %.

Le site Web finfacts (en anglais) répertorie les résultats du Nikkei, l'indice du marché boursier japonais, pour les 9 années consécutives, c'est-à-dire entre 1914 et 2004 inclus. On constate que le taux d'intérêt annuel a commencé par 1 durant 30 de ces années, soit un pourcentage de 33 %.

José Navarro explique la loi de Benford de la manière suivante :

Je pense que les explications les plus simples doivent s'articuler autour de deux ou trois axes. Il faut d'abord prouver que toute mesure subissant une multiplication (comme les valeurs boursières) obéit à la loi de Benford. Nous démontrerons ensuite que toute mesure qui répond à une invariance d'échelle (telles que les unités arbitraires, comme la distance en km ou le poids en kg) est également une mesure multiplicative. Elle obéit donc à la loi de Benford. Pour terminer, nous établirons que ce phénomène est bien plus universel qu'il n'y paraît.

1. Multiplication
Intuitivement, c'est la partie la plus simple à comprendre. Elle fait référence aux mesures qui sont obtenues par multiplication de la dernière valeur, telles que les données journalières des valeurs boursières qui sont modifiées au moyen d'un pourcentage quelle que soit leur valeur actuelle.

Malcolm Browne affirme dans un article du New York Times : Suivre la loi de Benford revient à rechercher le chiffre 1.

La plupart des chiffres que nous voyons quotidiennement ne représentent pas des quantités aléatoires. Ils sont souvent le fruit de calculs comportant des multiplications.

Prenons un exemple dont l'augmentation est basée sur un pourcentage, l'indice Dow Jones par exemple. En général, il progresse de quelques pour cent chaque année. Supposons, à titre d'exemple, que le Dow Jones progresse en moyenne de 7 % chaque année. A cette allure, il double tous les dix ans environ. Supposons que l'indice Dow Jones soit égal à 10 000. Le chiffre 1 qui aura été en première ligne pendant dix ans disparaît finalement pour laisser place au chiffre 2 (20 000). Dix ans s'écoulent à nouveau, mais durant cette période, le nombre double et passe à 40 000 et non à 30 000. Par conséquent, au cours de ces dix ans, la première place a été partagée en premier lieu par le 2, puis par le 3. Dix ans s'écoulent à nouveau, le nombre double encore et passe à 80 000. Lors des dix années qui vont s'écouler le premier chiffre sera le 4, puis le 5, le 6 et le 7 occupera la première place dans seulement dix ans. Nous arrivons enfin à 100 000 et nous voilà avec le 1 en première place pendant à nouveau dix ans. Choisissez une date au hasard. Vous avez deux fois plus de chance que l'indice Dow Jones, ce jour-là, commence par le chiffre 1 que par le chiffre 2, et quatre fois plus de chances qu'il commence par 1 que par 5.

2. Invariance d'échelle
Imaginez que vous ayez une mesure qui corresponde à la longueur d'une rivière en kilomètres. Lorsque vous regardez le premier chiffre, vous observez une répartition particulière des chiffres de 1 à 9. A présent, convertissez la longueur en une autre unité de mesure, les milles par exemple, en multipliant les données par 0,62. Le premier chiffre n'est alors plus le même. Si vous considérez maintenant que, parce que les deux unités sont arbitraires, vous devriez retrouvez le même premier chiffre dans les deux systèmes métriques, alors cette invariance d'échelle dans la première répartition des chiffres est identique à l'invariance que requiert la multiplication. Vous trouverez une approche rigoureuse de ce phénomène sur de nombreux sites, comme par exemple sur le site MathWorld (en anglais).

3. La limite centrale ou répartition des répartitions
Il est également vrai que si vous commencez avec une répartition uniforme du premier chiffre, après un certain nombre de multiplications et de conversions, vous obtenez une répartition de Benford. Considérez qu'il s'agit d'une répartition restreinte après un nombre suffisant de multiplications, quelle que soit la répartition avec laquelle vous avez commencé. Il existe également des références à ce phénomène sur le site MathWorld» (en anglais).

Pour terminer, voici un exemple qui semble contredire le principe d'invariance d'échelle que José vient de décrire. Le site Large Lakes of the World (en anglais) dresse la liste des 35 plus grands lacs au monde :


Noms et pays
milles carrés km

Mer Caspienne
Azerbaïdjan-Russie- Kazakhstan-Turkménistan-Iran

152 239

394 299

Supérieur, Etats-Unis-Canada

31 820

82 414

Victoria, Tanzanie-Ouganda

26 828

69 485

Huron, Etats-Unis-Canada

23 010

59 596

Michigan, Etats-Unis

22 400

58 016

Aral, Kazakhstan-Ouzbékistan

13 000

33 800

Tanganyika, Tanzanie-Congo

12 700

32 893

Baïkal, Russie

12 162

31 500

Great Bear, Canada

12 000

31 080

Nyassa, Malawi-Mozambique-Tanzanie

11 600

30 044

Great Slave, Canada

11 170

28 930

Tchad, Tchad-Niger-Nigeria

9 946

25 760

Erié, Etats-Unis-Canada

9 930

25 719

Winnipeg, Canada

9 094

23 553

Ontario, Etats-Unis-Canada

7 520

19 477

Balkhash, Kazakhstan

7 115

18 428

Ladoga, Russie

7 000

18 130

Onega, Russie

3 819

9 891

Titicaca, Bolivie-Pérou

3 141

8 135

Nicaragua, Nicaragua

3 089

8 001

Athabaska, Canada

3 058

7 920

Rudolf, Kenya

2 473

6 405

Reindeer, Canada

2 444

6 330

Eyre, Australie du Sud

2 400

6 216

Issyk-Kul, Kirghizistan

2 394

6 200

Urmia, Iran

2 317

6 001

Torrens, Australie du Sud

2 200

5 698

Vänern, Suède

2 141

5 545

Winnipegosis, Canada

2 086

5 403

Mobutu Sese Seko, Ouganda

2 046

5 299

Nettilling, île de Baffin, Canada

1 950

5 051

Nipigon, Canada

1 870

4 843

Manitoba, Canada

1 817

4 706

Grand lac salé, Etats-Unis

1 800

4 662

Kioga, Ouganda

1 700

4 403



Si la surface des lacs est mesurée en milles carrés, 11 lacs, soit 31 %, ont une surface commençant par 1. Mais, si la surface des lacs est mesurée en kilomètres carrés, seulement 3 de ces lacs, soit moins de 9 %, ont une surface dont le premier chiffre est 1. Pourquoi ? Une petite note sous le tableau de la page Web nous donne une réponse : seuls les lacs dont la superficie est supérieure à 1 700 milles carrés figurent dans ce tableau. Cela signifie que les cinq plus petits lacs, dont la superficie commence avec le chiffre 1 lorsqu'elle est mesurée en milles carrés passe aux alentours de 4 000 lorsqu'elle est mesurée en kilomètres carrés.

Si la limite d'inclusion avait été 1 700 kilomètres carrés, le résultat aurait pu être très différent. Peut-être pourriez-vous effectuer des recherches en ce sens.

SEED
 L'énigme du mois   Envoyez-nous vos réponses  Enigmes des mois précédents
 
 

...tentez d'autres expériences...
Gros plan sur l'espace
Sciences de la terre
Electricité et magnétisme
Propriétés des liquides

 

...essayez nos expériences interactives…
Labo virtuel

...ou testez vos compétences...
Défi technique de la saison

Pour en savoir plus? interrogez nos experts...