LA LEGGE DI BENFORD: CONNESSIONE CON I NUMERI DI

Versione 1.0
27/11/2014
Pagina 1 di 21
LA LEGGE DI BENFORD: CONNESSIONE CON I
NUMERI DI FIBONACCI E UN’APPLICAZIONE CON
LE TARGHE AUTOMOBILISTICHE
Ing. Pier Franz Roggero, Dott. Michele Nardelli, P.A. Francesco Di Noto
Abstract:
In this paper we show s connection between Benford’s law and Fibonacci
numbers.
Also we study an application with license plates of Italian and German car.
Versione 1.0
27/11/2014
Pagina 2 di 21
Indice:
1. LEGGE DI BENFORD E CONNESSIONE CON I NUMERI DI FIBONACCI.........3
2. ESEMPIO SULLE TARGHE AUTOMOBILISTICHE............................................. 13
2.1 APPLICAZIONE SULLE TARGHE ITALIANE ................................................. 13
2.2 APPLICAZIONE SULLE TARGHE TEDESCHE ............................................... 16
2.3 CONCLUSIONI..................................................................................................... 19
3. RIFERIMENTI ........................................................................................................... 21
Versione 1.0
27/11/2014
Pagina 3 di 21
1. LEGGE DI BENFORD E CONNESSIONE CON I NUMERI DI
FIBONACCI
In questo breve lavoro mostreremo una connessione tra la legge statistica di
Benford ( o delle cifre iniziali) e i numeri di Fibonacci, con la possibilità , sia pure
ancora soltanto teorica, di eventuali algoritmi per analizzare alcuni bigdata per
estrarne informazioni utili ad eventuali previsioni e applicazioni. Qualcosa di
simile, insomma, agli algoritmi hft ((high frequency trading) anche qui sono
coinvolti i numeri di Fibonacci) per prevedere e sfruttare al meglio l’andamento
del mercato azionario da parte degli addetti ai lavori (brokers, ecc.)
°°°°°°°°°°°°°°°°°°°°°
Recentemente abbiamo letto ( sulla nuova Garzantina di Matematica (Garzanti
Ed.), a pag. 1408 la voce “ Cifre iniziali dei numeri - (Frank Benford, 1938) e
abbiamo scoperto una connessione con i numeri di Fibonacci, che esporremo in
questo breve lavoro.
Dalla relativa voce di Wikipedia riportiamo parzialmente :
Legge di Benford
Da Wikipedia, l'enciclopedia libera.
Vai a: navigazione, ricerca
Versione 1.0
27/11/2014
Pagina 4 di 21
La distribuzione di Benford meglio nota come legge di Benford o legge della prima
cifra è una distribuzione di probabilità che descrive la probabilità che un numero
presente in molte raccolte di dati reali (p.es. popolazione dei comuni, quotazione delle
azioni, costanti fisiche o matematiche, numero di strade esistenti nelle località) cominci
con una data cifra, ad esempio "1", che secondo questa variabile casuale discreta
dovrebbe essere nel 30,1% dei casi la prima cifra. La funzione di probabilità è data da
P(n ) = log10 (n + 1) − log10 (n ) = log10 (1 + 1 / n )
Una delle estensioni della legge
di
Benford,
prende
in
considerazione la coppia delle
prime due cifre (da 10 a 99
dunque), lasciando invariata la
formula, ma semplicemente
modificando l'intervallo di
validità da [1,9] a [10,99].
prima cifra
n P(x=n)
1 30,1%
2 17,6%
3 12,5%
4 9,7%
5 7,9%
6 6,7%
7 5,8%
8 5,1%
9 4,6%
prime due cifre
n P(x=n)
10 4,1%
11 3,8%
12 3,5%
13 3,2%
14 3,0%
... ...
ecc.
...
99 0,4%
Una
breve
e
intuitiva
spiegazione del perché in
"natura" accade ciò, e che
quindi la cifra 1 si presenti con
maggior frequenza, poi la cifra
2 e così via, è dato dal fatto che
noi contiamo a iniziare dal
numero 1 in avanti sino al 9. Se
proviamo a pensare alle cifre da
1 a 9 è chiaro che abbiamo le
stesse probabilità che una cifra
inizi con 1 o 2 o 3 o 9. Se, però,
prendiamo già i numeri da 1 a
20 ecco che da 11 a 19 ho molti
più numeri che iniziano con la
cifra 1. Se prendiamo quelli da Diagramma a torta della distribuzione della prima cifra
Versione 1.0
27/11/2014
Pagina 5 di 21
1 a 30 ne ho molti che iniziano con 1 ma anche con 2. Come si può facilmente notare,
per avere numeri che inizino con 9, ad es, devo andare molto in là con i numeri e quindi
aumento anche la quantità di quelli che inizieranno con 1 o con 2 e quindi con cifre
basse, per cui in una distribuzione di numeri legati a superfici, popolazioni, sarà più alta
la probabilità di averne che inizino con 1 piuttosto che con 9. La cosa comunque
singolare è che Benford riuscì a far vedere che, per molte distribuzioni, la probabilità
che un numero inizi con una certa cifra tra 1 e 9 è sempre la stessa (30,1% per la cifra 1,
17,6% per la cifra 2, 4,6% per la cifra 9)
...
Connessione con il numero e :
Funzione di probabilità
La funzione di probabilità è
P( x = n ) = log10 (n + 1) − log10 (n )
Il valore atteso è E(X)=µ=3,44, la varianza pari a σ²=6,06 e l'asimmetria =0,79, nel caso che x debba
essere compreso tra 1 e 9 (inclusi).
Al di là delle spiegazioni "comuni", la v.c. di Benford può essere costruita facendo ricorso a ζ la
funzione zeta di Riemann (vedasi pure variabile casuale Zeta).
Invarianza di scala[modifica | modifica wikitesto]
Se un fenomeno segue la legge di Benford, allora moltiplicando tutti i valori per un
numero prefissato, si ottiene una nuova raccolta di valori che seguono a loro volta
la legge di Benford.
Esempio: se le quotazioni espresse in Lire delle azioni quotate in borsa seguono la
legge di Benford, allora le stesse quotazioni espresse in Euro seguono anch'esse la
legge di Benford.
L'invarianza di scala richiede che
Versione 1.0
27/11/2014
Pagina 6 di 21
P(kx ) = f (k )P( x )
Essendo richiesto che
∫ P(x )dx = 1
k
e che anche
∫ P(kx )dx = 1
k
si ricava che la forma
dev'essere del tipo 1/x. Effettivamente
P(x ) =
log10 e
x
per 0,1 ≤ x ≤ 1
è una distribuzione continua di probabilità che produce valori casuali le cui prime
cifre rispettano la legge di Benford.
...
“.
Ma noi abbiamo trovato, come prima accennato, una nuova connessione anche
con i numeri di Fibonacci .
Prendiamo la tabella iniziale:
TAB. 1
Se prendiamo i numeri della seconda colonna e li scriviamo in orizzontale e solo la
Versione 1.0
27/11/2014
Pagina 7 di 21
loro parte intera, abbiamo:
30 17 12 9 7
6
5 5 4,
con una prima e più debole connessione con i numeri di Fibonacci:
30 ≈ 34 17 12 ≈ 9 ≈ 8 ≈ 7
6
5= 5 = 5
4 ≈ 3;
ma se scriviamo sotto le loro differenze successive, e consecutive abbiamo, in
rosso, in rosso, per esempio
30-17= 13, ecc:
13 5 3 2 1 1 0 1 corrispondenti a numeri di Fibonacci, tranne il numero 8 tra 5
e 13
Scriviamo invece le differenze alternate, per es. 30 -12 = 18 , 17 -9 = 8, ecc.
avremo ora la serie di differenze
18 8 5 3 2
1 1
Ora recuperiamo il numero 8, ma perdiamo il 13.
Però lo recuperiamo, sia pure parzialmente , poiché 18 è circa la media tra 13 e 21
= 17, cosa che si verifica spesso in altri fenomeni naturali o matematici che
coinvolgono i numeri di Fibonacci.
I numeri di Fibonacci più piccoli sono ovviamente relativi alle cifre con minori
frequenze percentuali, mentre i più grandi, 8 e 18 come circa la media tra 13 e
Versione 1.0
27/11/2014
Pagina 8 di 21
21, sono relativi rispettivamente alle cifre 2 e 1
Le due tabelle seguenti rendono meglio l’idea
Tabella 1
Numeri interi di
Benford
30
17
12
9
7
6
5
5
4
Differenze =
Numeri interi di
Benford slittati di un Numeri di Fibonacci
posto
tranne l’8
17
13
12
5
9
3
7
2
6
1
5
1
5
0
4
1
Tabella 2
Numeri interi di
Benford
30
17
12
9
7
6
5
5
4
Numeri interi di
Differenze =
Benford slittati di due Numeri di Fibonacci
posti
tranne l’8
12
18 ≈ 17= (13+21)/2
9
8
7
5
6
3
5
2
5
1
4
1
Se ora invece prendiamo i piccoli numeri della tabella di Wikipedia (ultima
Versione 1.0
27/11/2014
Pagina 9 di 21
colonna, parzialmente), relativi alla seconda cifra notiamo un’altra piccola
connessione di Fibonacci: i rapporti successivi sono mediamente
lievemente superiori alla 2^3 -esima radice di 1,618 = numero aureo
Tabella 3
Numeri di Benford
Relativi alla seconda
cifra
4,1
3,8
3,5
3,2
Rapporti successivi
1,0619 valore reale
≈ 2^3 -esima radice di
1,618
4,1/3,8 =
1,078 ≈ 1,0619
3,8/3,5=
1,085 ≈ 1,0619
3,5/3,2=
1,093 ≈ 1,0619
3,2/3,0
1,066 ≈ 1,0619
La prima connessione con i numeri di Fibonacci tramite le differenze è
evidentissima (la seconda un po’ meno).
Ricordiamo che il numero aureo Φ = 1,61803398… è connesso con π e con i modi
che corrispondono alle vibrazioni fisiche delle stringhe bosoniche, tramite le
seguenti due formule:




3 
5
,
π = 2Φ −
R(q) +
20 
 1 q f 5 (−t ) dt  
3+ 5

1+
exp

1/ 5
4/5  
∫
2
 5 0 f (−t ) t  

π=

24
log 
142


 10 + 11 2 

+


4


 10 + 7 2  

 .


4


Versione 1.0
27/11/2014
Pagina 10 di 21
che possono essere connesse nell’unica formula:




3 
5
⇒
R(q) +
π = 2Φ −
5

q
20
 1
3+ 5
f (−t ) dt  

1+
exp

1/ 5
4/5  
∫
2
 5 0 f (−t ) t  


24
log 
π=
142


 10 + 7 2  
 10 + 11 2 

+ 





4
4




Con tale nuova nostra connessione, la scoperta di Benford, già nota in statistica e
già usata per qualche applicazione, specialmente in campo fiscale, vedi Nota 3,
potrebbe essere oggetto di altre possibili applicazioni pratiche, per esempio nel
campo dei bigdata in ogni campo, per estrarre, dalla loro grande massa di
informazioni, solo quelle più interessanti per fare previsioni utili sull’andamento
dei relativi fenomeni naturali ( per es. clima, epidemie, ecc. ecc.) .
Per esempio, già con la serie di Fibonacci, e dei relativi e potenti algoritmi, gli hft
(high frequency trading), si è già in grado di prevedere in modo attendibile
l’andamento azionario e di sfruttarlo per speculazioni finanziarie, acquistando o
vendendo azioni al momento opportuno, con relativi e lauti guadagni.
Un nostro lavoro teorico in tal senso, già sul sito
Versione 1.0
27/11/2014
Pagina 11 di 21
www.divinesection.net/doc/Finanza_Aurea.pdf
è “Finanza aurea” . Comunque, una maggiore conoscenza di questo argomento
statistico ( legge di Benford) e, possibilmente, anche della nostra modesta
correlazione con la serie di Fibonacci, potrebbe essere molto utile ai ricercatori sui
bigdata, già richiestissimi e pagatissimi essendo ancora molto rari (ma già si
stanno preparando appositi stage universitari) , per poter “spremere” dai bigdata
che essi studieranno in futuro, le informazioni necessarie per conoscere e prevedere
meglio l’andamento futuro del fenomeno studiato, sia esso naturale (per es. clima)
o artificiale ( es. mercato azionario).
Nota 3 sulla applicazione della legge di Benford in campo fiscale:
La recente “Garzantina” di matematica (Garzanti), riporta a pag. 1408 la voce “
Cifre iniziali dei numeri(Frank Benford, 1938), con una breve nota finale, che
riportiamo testualmente:
“La legge di Benford non costituisce solo un ‘intrigante
curiosità matematica, ma si presta anche a delle interessanti applicazioni pratiche.
Per esempio, negli USA viene utilizzata per scovare gli evasori fiscali: tutte le
dichiarazioni di reddito
I cui importi non presentano un’adeguata distribuzione delle prime cifre vengono
considerate sospette e sottoposte ad un controllo più accurato: Si narra che , in un
accertamento del genere, fosse incappato anche Clinton, prima di diventare
presidente degli USA.”
Versione 1.0
27/11/2014
Pagina 12 di 21
Nostro commento.
Ecco un esempio di buona applicazione della legge di Benford in campo fiscale,
applicazione che potrebbe essere ancora migliorata, possibilmente e
sperabilmente, anche con la nostra relazione con Fibonacci. E così pure per altre
possibili applicazioni statistiche in altri campi . Ben 76 anni dopo l’intuizione di
Benford, la sua legge statistica è stata migliorata con la nostra osservazione , che
la connette chiaramente ai numeri di Fibonacci, e con nuovi e possibili risvolti
applicativi.
Una volta tanto, nessuno si rivolta nella tomba, poichè pensiamo che a Benford la
nostra connessione sarebbe proprio piaciuta.
Versione 1.0
27/11/2014
Pagina 13 di 21
2. ESEMPIO SULLE TARGHE AUTOMOBILISTICHE
Vediamo come si comporta la legge di Benford o legge della prima cifra, considerando
l’esempio delle targhe automobilistiche e precisamente facciamo un confronto tra quelle
italiane e quelle tedesche per sapere qual è il metodo migliore.
2.1 APPLICAZIONE SULLE TARGHE ITALIANE
Dal 1994 la targa automobilistica italiana è stata rivoluzionata con un nuovo sistema di
numerazione: scompare la sigla della provincia e la targa si compone di una
combinazione di sette caratteri alfanumerici costituiti da lettere nelle prime due e nelle
ultime due posizioni e numeri nelle tre posizioni centrali (Esempio: AB123CD).
L'ordine è seriale per i tre numeri e poi per le quattro lettere, cosicché la targa AA999AA
segue la targa AA998AA e precede la targa AA000AB.
Vengono utilizzate in totale 22 lettere (quelle dell'alfabeto inglese ad esclusione di I, O,
Q e U) che formerebbero un totale di 22^4*1000 = 234.256.000 possibili combinazioni.
Rappresentazione schematica:
AB 123 CD
Le targhe vengono assegnate alle province a lotti, seguendo indicativamente la
frequenza di immatricolazioni.
In virtù della distribuzione a lotti delle targhe anche questo sistema di numerazione
consente di risalire alla provincia di prima immatricolazione, sempre che non vi siano
stati "prestiti" fra le province per sopperire a ritardi nelle consegne o a consumi
anomali.
Versione 1.0
27/11/2014
Pagina 14 di 21
In questo caso la prima cifra è una lettera, che varia dalla lettera “A” alla lettera “Z”, e
quindi per poter applicare la legge di Benford si deve introdurre un sistema numerico a
base B=23.
Dobbiamo far corrispondere alla lettera “A” la cifra 1, alla lettera “B” la cifra 2 e così
via fino all’ultima lettera “Z” la cifra 22.
La probabilità della prima "lettera o cifra corrispondente" diventa
ln(1 + 1 / d ) / ln B
ln(1 + 1/d)/ln 23
dove d indica la prima "lettera o cifra corrispondente" e ln il logaritmo naturale di base e
(vale a dire ln=loge)
Versione 1.0
27/11/2014
Pagina 15 di 21
Avremo i seguenti valori:
TAB. 2
1°
lettera
A
B
C
D
E
F
G
H
J
K
L
M
N
P
R
S
T
V
W
X
Y
Z
!° cifra Probabilità
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
22,1
12,9
9,2
7,1
5,8
4,9
4,3
3,8
3,4
3,0
2,8
2,6
2,4
2,2
2,1
1,9
1,8
1,7
1,6
1,6
1,5
1,4
Versione 1.0
27/11/2014
Pagina 16 di 21
2.2 APPLICAZIONE SULLE TARGHE TEDESCHE
Le targhe automobilistiche tedesche sono formate da una, due o tre lettere iniziali,
seguite da un trattino, poi vengono una o due lettere e infine ancora una, due, tre o
quattro cifre. I caratteri sono di colore nero su fondo bianco.
Le lettere iniziali corrispondono al circondario rurale o città extracircondariale in cui il
veicolo è stato registrato, mentre le altre combinazioni di lettere o numeri sono del tutto
casuali, non identificano alcuna appartenenza ad una località (una lettera in genere per
area rurale, due lettere per area urbana). Le maggiori città hanno una sola lettera iniziale
identificativa della località, mentre le città più piccole possono avere due o tre lettere
identificative.
Analizziamo bene le combinazioni che ne derivano in quanto si tratta di un sitema
mobile e non fisso come quello italiano.
Vengono utilizzate in totale:
Le 3 lettere iniziali coprono in questo momento 383 circondari
Una o 2 lettere che seguono coprono 26 + 26^2 = 702 combinazioni
Una o due o tre o quattro cifre coprono 9 + 90 + 900 + 9000 = 9999 combinazioni
Infatti:
•
Gruppo a: 1 lettera, 1–3 cifre,
combinazioni
da A 1 a Z 999 → 26 × 999 = 25.974
Versione 1.0
27/11/2014
Pagina 17 di 21
•
•
•
•
Gruppo b: 2 lettere, 1–2 cifre, da AA 1 a ZZ 99 → 26 × 26 × 99 = 66.924
combinazioni
Gruppo c: 2 lettere, 3 cifre, da AA 100 a ZZ 999 → 26 × 26 × 900 = 608.400
combinazioni
Gruppe d: 1 lettera, 4 cifre, da A 1000 a Z 9999 → 26 × 9000 = 234.000
combinazioni
Gruppo e: 2 lettere, 4 cifre, da AA 1000 a ZZ 9999 → 26 × 26 × 9000 =
6.084.000 combinazioni
In totale avremo 383*702*9.999 = 2.688.391.134 possibili combinazioni.
La prima “cifra” da considerare è in questo caso la prima lettera dopo il circondario e in
questo caso abbiamo 26 lettere.
Applicando la legge di Benford la probabilità della prima "lettera o cifra
corrispondente" diventa
ln(1 + 1 / d ) / ln B
ln(1 + 1/d)/ln 27
dove d indica la prima "lettera o cifra corrispondente"
Versione 1.0
27/11/2014
Pagina 18 di 21
Avremo i seguenti valori:
TAB. 3
1°
lettera
A
B
C
D
E
F
G
H
I
J
K
L
M
N
O
P
Q
R
S
T
U
V
W
X
Y
Z
!° cifra Probabilità
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
21,0
12,3
8,7
6,8
5,5
4,7
4,1
3,6
3,2
2,9
2,6
2,4
2,2
2,1
2,0
1,8
1,7
1,6
1,6
1,5
1,4
1,3
1,3
1,2
1,2
1,1
Versione 1.0
27/11/2014
Pagina 19 di 21
2.3 CONCLUSIONI
Il sistema “fisso” delle targhe italiane si rivela decisamente peggiore di quello “mobile”
delle targhe tedesche.
In primo luogo si hanno circa 12 volte più combinazioni teoriche possibili.
Teoriche perché alcune possibilità non sono permesse né nel sistema italiano né in
quello tedesco.
Per la legge di Benford il sistema italiano avrebbe il 22,1% di probabilità (vedi TAB. 2)
di iniziare con la prima lettera “A” ma purtroppo le targhe vengono distribuite non in
maniera sequenziale ma a gruppi o “lotti” fissi alle diverse provincie italiane in maniera
del tutto casuale.
Quindi purtroppo la legge di Benford non ci può, in alcun modo, aiutare per individuare
più facilmente le targhe.
Invece per il sistema tedesco la legge di Benford ci è di grande aiuto.
Innanzitutto la prima lettera, dopo il circondario che aiuta a capire la provenienza
dell’auto, ha una probabilità del 21% di essere la lettera “A” (vedi TAB. 3)
Anche la prima cifra numerica ha la consueta probabilità del 30,1 % di essere il numero
“1” (vedi TAB. 1).
E’ quindi molto probabile che una qualsiasi targa di un qualsiasi circondario, di cui
peraltro già conosciamo le prime 1-3 lettere, dopo inizi con:
<circondario: 1-3 lettere> Ax 1xxxx
La probabilità che si verifichi la combinazione congiunta della lettera “A” con la cifra
“1” è circa del 6,3%, che è già molto mentre prese singolarmente la lettera “A” e lacifra
“1” abbiamo visto che sono rispettivamente del 21% e del 30,1%.
Inoltre nel sistema tedesco sappiamo anche che nel proprio luogo di abitazione
circolano, con grande probabilità, automobili di quel luogo, così evitiamo di dover
ricordare a memoria lettere diverse all’inizio della targa come capita invece in quelle
italiane.
Abbiamo quindi che potendo applicare la legge di Benford nelle targhe tedesche e non
Versione 1.0
27/11/2014
Pagina 20 di 21
in quelle italiane si hanno una serie di vantaggi non indifferente.
Se dobbiamo ricordarci una targa è molto più facile il sistema tedesco dove è anche
permesso “speculare” sulle prime lettere o cifre che dovrebbero comparire con
maggiore frequenza.
Versione 1.0
27/11/2014
Pagina 21 di 21
3. RIFERIMENTI
1) Wikipedia, “Legge di Benford”
2) Finanza aurea, file :
www.divinesection.net/doc/Finanza_Aurea.pdf
3) Garzantina di matematica, Ed. Garzanti