giovedì 18 marzo 2021

252. Legge di Benford

 

Legge di Benford (numerazione binaria):

per ogni numero maggiore di zero, "1" compare come prima cifra nel 100% dei casi.


Il problema era questo: si consideri la prima cifra nella espansione decimale di 2n per n ≥ 0 : 1, 2, 4, 8, 1, 3, 6, 1, 2, 5, 1, 2, 4, …

La cifra 7 appare in questa sequenza? Appare più di frequente 7 o 8? Quanto più di frequente?

 

All’epoca non sapevo quale fosse il modo corretto di risolvere il problema, ma io lo approcciai così: in scala logaritmica i prodotti si trasformano in somme, per esempio moltiplicare per 2 equivale a sommare log(2) e si ottiene in sequenza: 1, 2, 4, 8, 16, 32, 64, 128, …


Le prime cifre della sequenza sono appunto: 1, 2, 4, 8, 1, 3, 6, 1, 2, 5, 1, 2, 4, 8, 1, 3, 6, 1, 2, 5, 1, 2, 4, 8, 1, 3, 6, 1, 2, 5, 1, 2, 4, 8, 1, 3, 6, 1, 2, 5, 1, 2, 4, 8, 1, 3, 7, 1, 2, 5, 1, 2, 4, 9, 1, 3, 7, 1, 2, 5, 1, 2, 4, 9, 1, 3, 7, 1, 2, 5, 1, 2, 4, 9, 1, 3, 7, 1, 3, 6, 1, 2, 4, 9, 1, 3, 7, 1, 3, 6, 1, 2, 4, 9, 1, 3, …


Sloane’s On-Line Encyclopedia of Integer Sequences A008952





Per definizione la posizione 1 è posta a log10 1 = 0, mentre la posizione 10 a 1 (log10 10 = 1) e 100 a 2 (log10 100 = 2), le posizioni intermedie sono a:

log10 2 = 0.3010, log10 3 = 0.4771, log10 4 = 0.6020, … , log10 9 = 0.9542


Ogni intervallo I(m) di numeri che iniziano con la cifra m è compreso tra log(m) e log(m+1), per cui i vari intervalli valgono:


log(m+1) - log(m)  =  log((m+1)/m)  =  log(1 + 1/m)

Tornando al problema, la cifra 7 appare log(1 + 1/7) = 0.05799 =  5.8%

e per vederla apparire dobbiamo aspettare 246 = 70368744177664.

Alla seconda domanda si può rispondere che appare maggiormente 7,

e per n > 209, la frequenza f(7) della cifra 7 è maggiore di quella di 8:


f (7) / f (8)  tende a log10(1 + 1/7) / log10(1 + 1/8) = 1,133706496


Nota:    I(1) = I(2)+I(3) = I(4)+I(5)+I(6)+I(7)


La legge di Benford nasce dall'osservazione che in molte raccolte di numeri, ad es. tabelle matematiche, dati della vita reale o loro combinazioni in varie unità di misura, le cifre significative iniziali non sono distribuite uniformemente, come ci si potrebbe aspettare, ma sono maggiori per le cifre più piccole.

Afferma che le cifre significative in molti insiemi di dati seguono una distribuzione logaritmica. Nella sua formulazione più comune, è anche nota come “legge della prima cifra” e prende il nome dal fisico americano Frank Benford (1883-1948) che la formulò nel 1938, anche se era già stata evidenziata dall’astronomo americano Simon Newcomb (1835-1909) nel 1881.

Benford osservò che le tavole logaritmiche, usate all’epoca per i calcoli, avevano le prime pagine molto sgualcite e ne dedusse quindi che i numeri comincianti per 1 ricorrevano più spesso di quelle comincianti per le altre cifre.

Questa distribuzione ha una proprietà caratteristica nota come “invarianza di scala” e viene spesso usata per scoprire dati “contraffatti”.

Se doveste falsificare dei numeri, fate in modo che la cifra 1 appaia circa nel 30% dei casi, 2 nel 17% e così via.


Per un dato numero di cifre, è possibile calcolare la probabilità di incontrare un numero che inizia con la stringa di cifre n di quella lunghezza. Qui di seguito quanto riportato in Wikipedia alla voce “Benford's law”.



La distribuzione dell'n-esima cifra, all'aumentare di n, si avvicina rapidamente a una distribuzione uniforme con il 10% per ciascuna delle dieci cifre, come mostrato di seguito:

 

 

 

Benford Online Bibliography

https://mathworld.wolfram.com/BenfordsLaw.html

Benford's Law (mathpages.com)

034.PDF (rudimathematici.com)

La legge di Benford (xmau.com)

Index to OEIS: Section Be - OeisWiki

https://oeis.org/A008952

Zibaldone Scientifico: 133. Regolo calcolatore (zibalsc.blogspot.com)


opgave2004-1B.pdf (jaapspies.nl)

Wohl_Benford.pdf (williams.edu)


Nessun commento:

Posta un commento