Benford's Law Covid-19 in municipiul Bucuresti

Embed Download grafic
 
 
 
 
 

Cod Embed Grafic:

Legea lui Benford

Legea lui Benford sugereaza ca distributia primei cifre din numerele unui set de date urmeaza o anumita curba. Cifra 1 va fi cea mai prezenta ca prima cifra cu o probabilitate de 30.1%, cifra 2 va avea probabilitatea de aparitie de 17.6% pana la cifra 9 cu cea mai mica probabilitate de aparitie, de 4.6%.

d123456789
P (d) 30.1% 17.6% 12.5% 9.7% 7.9% 6.7% 5.8% 5.1% 4.6%

Deviatia

Deviatia (d*) reprezinta distanta Euclidiana intre seria de date (cazuri, teste, etc.) si distributia Benford. Aceasta poata sa fie intre 0 si 1. Daca distributia primei cifre intr-un set de date este exact ca distribuita Benford, d* va fi 0. Cu cat datele se abat mai mult de la aceasta distributie, d* se va apropia de 1. Se sugereaza ca un posibil indicator al faptului ca seria de date este corupta e un d* > 0.25 [1].

Formula de calcul a d* [2]

Referinte

1. William Goodman (2016), "The promises and pitfalls of Benford's law" Royal Statistical Society: https://rss.onlinelibrary.wiley.com/doi/full/10.1111/j.1740-9713.2016.00919.x

2. Anran Wei, Andre E. Vellwock (2020), "Is COVID-19 data reliable? A statistical analysis with Benford's Law": https://www.researchgate.net/publication/344164702_Is_COVID-19_data_reliable_A_statistical_analysis_with_Benford%27s_Law

3. Benford's law Wikipedia: https://en.wikipedia.org/wiki/Benford%27s_law


d* pentru seriile de date din grafic

  • Cazuri noi - d*: 0.05
  • Cazuri totale - d*: 0.25