Legge di Benford (numerazione binaria):
per ogni numero maggiore di zero, "1" compare come prima cifra
nel 100% dei casi.
Il problema era questo: si consideri la
prima cifra nella espansione decimale di 2n per n ≥ 0 : 1, 2, 4, 8,
1, 3, 6, 1, 2, 5, 1, 2, 4, …
La cifra 7 appare in questa sequenza? Appare
più di frequente 7 o 8? Quanto più di frequente?
All’epoca non sapevo quale fosse il modo
corretto di risolvere il problema, ma io lo approcciai così: in scala
logaritmica i prodotti si trasformano in somme, per esempio moltiplicare per 2
equivale a sommare log(2) e si ottiene in sequenza: 1, 2, 4, 8, 16, 32, 64, 128,
…
Le prime cifre della sequenza sono appunto: 1,
2, 4, 8, 1, 3, 6, 1, 2, 5, 1, 2, 4, 8, 1, 3, 6, 1, 2, 5, 1, 2, 4, 8, 1, 3, 6,
1, 2, 5, 1, 2, 4, 8, 1, 3, 6, 1, 2, 5, 1, 2, 4, 8, 1, 3, 7, 1, 2, 5, 1, 2, 4,
9, 1, 3, 7, 1, 2, 5, 1, 2, 4, 9, 1, 3, 7, 1, 2, 5, 1, 2, 4, 9, 1, 3, 7, 1, 3,
6, 1, 2, 4, 9, 1, 3, 7, 1, 3, 6, 1, 2, 4, 9, 1, 3, …
Sloane’s On-Line
Encyclopedia of Integer Sequences A008952
Per definizione la posizione 1 è posta a
log10 1 = 0, mentre la posizione 10 a 1 (log10
10 = 1) e 100 a 2 (log10 100 = 2), le posizioni
intermedie sono a:
log10 2 = 0.3010, log10
3 = 0.4771, log10 4 = 0.6020, … , log10 9
= 0.9542
Ogni intervallo I(m) di numeri
che iniziano con la cifra m è compreso tra log(m) e log(m+1),
per cui i vari intervalli valgono:
log(m+1) - log(m) = log((m+1)/m)
= log(1 + 1/m)
Tornando al problema, la cifra 7 appare log(1
+ 1/7) = 0.05799 = 5.8%
e per vederla apparire dobbiamo aspettare 246
= 70368744177664.
Alla seconda domanda si può rispondere che
appare maggiormente 7,
e per n > 209, la frequenza f(7) della cifra
7 è maggiore di quella di 8:
f (7) / f (8) tende a log10(1 + 1/7) / log10(1
+ 1/8) = 1,133706496
Nota:
I(1) = I(2)+I(3) = I(4)+I(5)+I(6)+I(7)
La legge di Benford nasce dall'osservazione che
in molte raccolte di numeri, ad es. tabelle matematiche, dati della vita reale
o loro combinazioni in varie unità di misura, le cifre significative iniziali
non sono distribuite uniformemente, come ci si potrebbe aspettare, ma sono maggiori
per le cifre più piccole.
Afferma che le cifre significative in molti insiemi
di dati seguono una distribuzione logaritmica. Nella sua formulazione più
comune, è anche nota come “legge della prima cifra” e prende il nome dal fisico
americano Frank Benford (1883-1948) che la formulò nel 1938, anche se era
già stata evidenziata dall’astronomo americano Simon Newcomb (1835-1909)
nel 1881.
Benford osservò che le tavole logaritmiche,
usate all’epoca per i calcoli, avevano le prime pagine molto sgualcite e ne
dedusse quindi che i numeri comincianti per 1 ricorrevano più spesso di
quelle comincianti per le altre cifre.
Questa distribuzione ha una proprietà
caratteristica nota come “invarianza di scala” e viene spesso usata per
scoprire dati “contraffatti”.
Se doveste falsificare dei numeri, fate in modo
che la cifra 1 appaia circa nel 30% dei casi, 2 nel 17% e così
via.
Per un dato numero di cifre, è possibile
calcolare la probabilità di incontrare un numero che inizia con la stringa di
cifre n di quella lunghezza. Qui di seguito quanto riportato in
Wikipedia alla voce “Benford's law”.
La distribuzione dell'n-esima cifra,
all'aumentare di n, si avvicina rapidamente a una distribuzione uniforme con il
10% per ciascuna delle dieci cifre, come mostrato di seguito:
Benford Online
Bibliography
https://mathworld.wolfram.com/BenfordsLaw.html
Benford's Law (mathpages.com)
034.PDF (rudimathematici.com)
La
legge di Benford (xmau.com)
Index to OEIS: Section Be -
OeisWiki
https://oeis.org/A008952
Zibaldone Scientifico: 133. Regolo calcolatore (zibalsc.blogspot.com)
opgave2004-1B.pdf (jaapspies.nl)
Wohl_Benford.pdf (williams.edu)