|
L'énigme mathématique du mois précédent traitait de la loi de Benford qui stipule que si on considère un grand nombre de données, la répartition des chiffres, de 1 à 9, situés en première position n'est pas aléatoire. On constate au contraire que le chiffre 1 est celui qui apparaît le plus souvent en première position. Les autres chiffres y apparaissent selon un ordre décroissant.
Voici quelques exemples supplémentaires :
a observé les tailles des fichiers se trouvant dans le répertoire /system32/ de son ordinateur.
|
Premier
Chiffre |
Nombre de fichiers
commençant par ce chiffre |
Pourcentage total |
1 |
587 |
29 |
2 |
311 |
15 |
3 |
236 |
12 |
4 |
169 |
8 |
5 |
185 |
9 |
6 |
250 |
12 |
7 |
115 |
6 |
8 |
112 |
5 |
9 |
85 |
4 |
|
Le chiffre qui apparaît le plus souvent en première place est le chiffre 1, la fréquence d'apparition des autres chiffres suit un ordre presque décroissant.
Parmi les 235 pays indiqués sur le site Web GeoHive, 64 pays ont une population dont le premier chiffre est 1. Ce qui représente 27 %.
Le site Web finfacts (en anglais) répertorie les résultats du Nikkei, l'indice du marché boursier japonais, pour les 9 années consécutives, c'est-à-dire entre 1914 et 2004 inclus. On constate que le taux d'intérêt annuel a commencé par 1 durant 30 de ces années, soit un pourcentage de 33 %.
explique la loi de Benford de la manière suivante :
Je pense que les explications les plus simples doivent s'articuler autour de deux ou trois axes. Il faut d'abord prouver que toute mesure subissant une multiplication (comme les valeurs boursières) obéit à la loi de Benford. Nous démontrerons ensuite que toute mesure qui répond à une invariance d'échelle (telles que les unités arbitraires, comme la distance en km ou le poids en kg) est également une mesure multiplicative. Elle obéit donc à la loi de Benford. Pour terminer, nous établirons que ce phénomène est bien plus universel qu'il n'y paraît.
Intuitivement, c'est la partie la plus simple à comprendre. Elle fait référence aux mesures qui sont obtenues par multiplication de la dernière valeur, telles que les données journalières des valeurs boursières qui sont modifiées au moyen d'un pourcentage quelle que soit leur valeur actuelle.
Malcolm Browne affirme dans un article du New York Times : Suivre la loi de Benford revient à rechercher le chiffre 1.
La plupart des chiffres que nous voyons quotidiennement ne représentent pas des quantités aléatoires. Ils sont souvent le fruit de calculs comportant des multiplications.
Prenons un exemple dont l'augmentation est basée sur un pourcentage, l'indice Dow Jones par exemple. En général, il progresse de quelques pour cent chaque année. Supposons, à titre d'exemple, que le Dow Jones progresse en moyenne de 7 % chaque année. A cette allure, il double tous les dix ans environ. Supposons que l'indice Dow Jones soit égal à 10 000. Le chiffre 1 qui aura été en première ligne pendant dix ans disparaît finalement pour laisser place au chiffre 2 (20 000). Dix ans s'écoulent à nouveau, mais durant cette période, le nombre double et passe à 40 000 et non à 30 000. Par conséquent, au cours de ces dix ans, la première place a été partagée en premier lieu par le 2, puis par le 3. Dix ans s'écoulent à nouveau, le nombre double encore et passe à 80 000. Lors des dix années qui vont s'écouler le premier chiffre sera le 4, puis le 5, le 6 et le 7 occupera la première place dans seulement dix ans. Nous arrivons enfin à 100 000 et nous voilà avec le 1 en première place pendant à nouveau dix ans. Choisissez une date au hasard. Vous avez deux fois plus de chance que l'indice Dow Jones, ce jour-là, commence par le chiffre 1 que par le chiffre 2, et quatre fois plus de chances qu'il commence par 1 que par 5.
Imaginez que vous ayez une mesure qui corresponde à la longueur d'une rivière en kilomètres. Lorsque vous regardez le premier chiffre, vous observez une répartition particulière des chiffres de 1 à 9. A présent, convertissez la longueur en une autre unité de mesure, les milles par exemple, en multipliant les données par 0,62. Le premier chiffre n'est alors plus le même. Si vous considérez maintenant que, parce que les deux unités sont arbitraires, vous devriez retrouvez le même premier chiffre dans les deux systèmes métriques, alors cette invariance d'échelle dans la première répartition des chiffres est identique à l'invariance que requiert la multiplication. Vous trouverez une approche rigoureuse de ce phénomène sur de nombreux sites, comme par exemple sur le site MathWorld (en anglais).
Il est également vrai que si vous commencez avec une répartition uniforme du premier chiffre, après un certain nombre de multiplications et de conversions, vous obtenez une répartition de Benford. Considérez qu'il s'agit d'une répartition restreinte après un nombre suffisant de multiplications, quelle que soit la répartition avec laquelle vous avez commencé. Il existe également des références à ce phénomène sur le site MathWorld» (en anglais).
Pour terminer, voici un exemple qui semble contredire le principe d'invariance d'échelle que José vient de décrire. Le site Large Lakes of the World (en anglais) dresse la liste des 35 plus grands lacs au monde :
|
Noms et pays
|
milles carrés |
km |
Mer Caspienne
Azerbaïdjan-Russie- Kazakhstan-Turkménistan-Iran
|
152 239 |
394 299 |
Supérieur, Etats-Unis-Canada
|
31 820 |
82 414 |
Victoria, Tanzanie-Ouganda
|
26 828 |
69 485 |
Huron, Etats-Unis-Canada
|
23 010 |
59 596 |
Michigan, Etats-Unis
|
22 400 |
58 016 |
Aral, Kazakhstan-Ouzbékistan
|
13 000 |
33 800 |
Tanganyika, Tanzanie-Congo
|
12 700 |
32 893 |
Baïkal, Russie
|
12 162 |
31 500 |
Great Bear, Canada
|
12 000 |
31 080 |
Nyassa, Malawi-Mozambique-Tanzanie
|
11 600 |
30 044 |
Great Slave, Canada
|
11 170 |
28 930 |
Tchad, Tchad-Niger-Nigeria
|
9 946 |
25 760 |
Erié, Etats-Unis-Canada
|
9 930 |
25 719 |
Winnipeg, Canada
|
9 094 |
23 553 |
Ontario, Etats-Unis-Canada
|
7 520 |
19 477 |
Balkhash, Kazakhstan
|
7 115 |
18 428 |
Ladoga, Russie
|
7 000 |
18 130 |
Onega, Russie
|
3 819 |
9 891 |
Titicaca, Bolivie-Pérou
|
3 141 |
8 135 |
Nicaragua, Nicaragua
|
3 089 |
8 001 |
Athabaska, Canada
|
3 058 |
7 920 |
Rudolf, Kenya
|
2 473 |
6 405 |
Reindeer, Canada
|
2 444 |
6 330 |
Eyre, Australie du Sud
|
2 400 |
6 216 |
Issyk-Kul, Kirghizistan
|
2 394 |
6 200 |
Urmia, Iran
|
2 317 |
6 001 |
Torrens, Australie du Sud
|
2 200 |
5 698 |
Vänern, Suède
|
2 141 |
5 545 |
Winnipegosis, Canada
|
2 086 |
5 403 |
Mobutu Sese Seko, Ouganda
|
2 046 |
5 299 |
Nettilling, île de Baffin, Canada
|
1 950 |
5 051 |
Nipigon, Canada
|
1 870 |
4 843 |
Manitoba, Canada
|
1 817 |
4 706 |
Grand lac salé, Etats-Unis
|
1 800 |
4 662 |
Kioga, Ouganda |
1 700 |
4 403 |
|
Si la surface des lacs est mesurée en milles carrés, 11 lacs, soit 31 %, ont une surface commençant par 1. Mais, si la surface des lacs est mesurée en kilomètres carrés, seulement 3 de ces lacs, soit moins de 9 %, ont une surface dont le premier chiffre est 1. Pourquoi ? Une petite note sous le tableau de la page Web nous donne une réponse : seuls les lacs dont la superficie est supérieure à 1 700 milles carrés figurent dans ce tableau. Cela signifie que les cinq plus petits lacs, dont la superficie commence avec le chiffre 1 lorsqu'elle est mesurée en milles carrés passe aux alentours de 4 000 lorsqu'elle est mesurée en kilomètres carrés.
Si la limite d'inclusion avait été 1 700 kilomètres carrés, le résultat aurait pu être très différent. Peut-être pourriez-vous effectuer des recherches en ce sens.
|
|