Definición de la Ley de Benford - Ejemplos, e Historia

Carlos F. Lira Gómez
MSc. en Ciencias Marinas

La ley de Benford (referida como ley del primer dígito), es un enunciado que sostiene que en conjuntos naturales de eventos, medidas u objetos, el 1 será el primer dígito que represente los números o medidas de los elementos el 30,1% de las ocasiones, seguido por el número 2, que será el primer dígito el 17,6% de las veces, y de así subsecuentemente, a medida que aumente el valor del primer dígito, disminuirá su frecuencia de aparición hasta llegar al número 9 con 4,6%.

Se sustenta en la idea de que la distribución de dígitos en números naturales de varios dígitos, no es aleatoria, sino que sigue un patrón predecible.

Es aplicable solo a números naturales. Los números naturales son aquellos que no están ordenados en un esquema de numeración particular, y no son generados en forma aleatoria.

Cuanto más grande sea la muestra (conjunto de datos), mejor se ajustará al enunciado. La ley de Benford funciona mejor con conjuntos de datos grandes. Si bien ha demostrado ser eficiente para conjuntos de datos que presentan 50, 100 o 200 números, muchos expertos consideran que 500 o más, es el conjunto de datos ideal para este análisis estadístico.

En el valor de la variable a analizar de un conjunto de datos, cada número del 1 al 9 debe tener la misma probabilidad teórica de ser el primer dígito.

Por ejemplo, si consultamos la masa atómica de los elementos de la tabla periódica, nos encontramos que, el hidrógeno, por ejemplo, tiene una masa atómica de 1,0079 g/mol; la del boro es de 10,811; y la del oxígeno, 15,9994. Si continuamos analizando la tabla periódica, nos encontraremos que, además de estos tres elementos, existen otros 39 elementos en los cuales el 1 es el primer dígito de su masa atómica.

En cambio solo 5 elementos poseen una masa atómica cuyo valor tiene al 9 como primer dígito: Berilio, Zirconio, Niobio, Molibdeno y Tecnecio.

Algo interesante y general de esta ley, es que conjuntos de datos que siguen la ley de Benford, al ser multiplicados por una constante matemática, su resultado seguirá ajustándose a dicha ley.

Son diversas las formulaciones matemáticas que satisfacen la ley de Benford, sin embargo la más general es:

P (d) = log 10 (1 + 1 / d) para d = 1, 2,…, 9

Donde d = el primer dígito significativo; P (d) representa la probabilidad del primer dígito significativo d en un punto de datos elegido arbitrariamente.

Ejemplos de aplicación

Detección de fraudes contables

Hal Varian en 1972 y Mark Nigrini en 1992, sugirieron que la ley podría usarse para la detección de posibles fraudes, de hecho fueron la tesis doctoral de Nigrini (1992) y las subsecuentes publicaciones de este profesor de contabilidad, las que popularizaron la ley de Benford.

Mark Nigrini combinó los trabajos de Charles Carslaw (1988) y Thomas J.K. (1989), sobre contabilidad creativa y el trabajo de Benford, para realizar su tesis doctoral acerca de la detección de evasión fiscal, mediante el análisis de distribuciones de dígitos.

Hoy en día muchas firmas contables y gobiernos en todo el mundo emplean la ley de Benford para detectar posibles fraudes contables y financieros.

Detección de fraudes electorales

El politólogo y estadístico Walter Mebane, fue el primero en utilizar la ley de Benford del segundo dígito (prueba 2BL), en la ciencia forense electoral para identificar posibles fraudes. Aunque los resultados de Mebane han sido criticados y tildados de engañosos por algunos investigadores, este autor aun considera que sus resultados son bastante fiables, aunque reconoce y acepta algunas estas las críticas.

La ley de Benford ha sido aplicada como prueba estadística para determinar la posible existencia de fraude electoral en las elecciones presidenciales de EE.UU. (2000 y 2004), Irán (2009), elecciones federales alemanas (2009), entre otras.

COVID- 19

El matemático Chase Marchand y el informático Dalton Maahs han publicado recientemente un artículo en la revista CHANCE, titulado “Ley de Benford y datos COVID-19”. En este artículo evalúan el potencial uso de los datos suministrados por los gobiernos, sobre las cifras del COVID-19, ante las muchas dudas acerca de sí dichos datos son fiables.

Marchand y Maahs determinaron con datos analizados de los EE.UU., del año 2020, que en ciertos casos (por ejemplo casos confirmados + casos probables, y muertes acumuladas confirmadas + probables), se ajustan perfectamente a la ley de Benford.

Además sugieren que mientras más datos son suministrados por los gobiernos, más y mejor se ajustan a la ley de Benford.

Conjunto de números que se ajustan a la ley de Benford

Después de que en el año 1992 se hiciese popular la ley de Benford, muchos matemáticos, ingenieros, estadísticos y entusiastas de las matemáticas, comenzaron a buscar coincidencias de conjuntos de números que se ajustaran o no a la misma, demostrando que los siguientes datos siguen el patrón predictivo:

- Los tiempos de duración entre las notas musicales en una canción, crean un conjunto de datos que al ser analizados se ajustan muy bien a la curva de Benford.

- Las estadísticas deportivas: goles, puntos, carreras, pases, cambios, patadas, faltas, entre otros.

- Las estadísticas poblacionales.

- El precio del mercado de valores.

- Conjunto de números que no se ajustan a la ley de Benford

- No todos los conjuntos de datos siguen la ley de Benford, ejemplo de ellos son:

- Los números de teléfono de un área determinada, ya que el código de área es el mismo número.

- Poblaciones con rangos definidos, por ejemplo de 300 a 800 habitantes.

- La altura de los humanos adultos.

- Números provenientes de distribuciones uniformes, por ejemplo las loterías.

Historia

Este patrón predecible de distribución de dígitos de números naturales, fue descubierto por primera vez por el astrónomo y matemático canadiense-estadounidense Simon Newcomb, y publicado en 1881 en el American Journal of Mathematics.

Newcomb durante el empleo de tablas de logaritmos, notó que las primeras páginas de la tabla que estaba utilizando estaban mucho más desgastadas que las últimas, fenómeno que se repetía en otras tablas logarítmicas.

Debido a esto, Newcomb dedujo que las personas utilizaban y consultaban en las tablas con mayor frecuencia el logaritmo de números que comienzan con dígitos pequeños, que el de los que empiezan por dígitos altos.

Así pues, los logaritmos de números que comienzan con 1 son buscados con más frecuencia que los que comienzan con 2, los números que comienzan con 2 son buscados con mayor frecuencia que los comienzan con 3, y así sucesivamente hasta los logaritmos de números que comienzan con 9, que son los menos buscados respecto a los otros números.

Sin embargo, el astrónomo no aportó una explicación matemática robusta a este hecho, por lo que su publicación fue tomada como una sencilla curiosidad matemática, que pronto fue olvidada por la comunidad.

Este fenómeno matemático permaneció olvidado, o mejor dicho sin ser analizado, hasta 1938 (57 años después), cuando el físico e ingeniero eléctrico estadounidense Frank Albert Benford Jr. lo redescubrió.

Frank Benford, trabajando para la General Electric Company notó el mismo patrón de desgaste en las hojas de las tablas logarítmicas que años antes había observado Newcomb, así que, emocionado con tal hallazgo probó y publicó sus resultados del análisis de 20 conjuntos de datos (algunos autores dicen que fueron 17 conjuntos de datos) completamente diferentes e independientes unos de otros, y por esta razón se le atribuyó el mérito del descubrimiento al bautizar la ley con su nombre.

Los conjuntos de datos analizados por Benford incluían la superficie de 335 ríos, el número de personas en 3.259 poblaciones de EE. UU., la tasa de mortalidad de 418 localidades, 5000 entradas de un manual de matemáticas, las direcciones de las primeras 342 personas enumeradas en American Men of Science, 104 constantes físicas, 1458 datos de la liga americana de beisbol, 1800 masas moleculares, entre otros.

Aunque Benford aportó numerosos datos para comprobar la universalidad de este fenómeno matemático, no fue capaz de explicar el por qué ocurría, ni por qué en muchos otros conjuntos de datos no ocurría lo mismo.

Fue en 1961 que el matemático estadounidense Roger Pinkham dio los primeros pasos para resolver los problemas que Benford y otros no pudieron.

Pinkham en su artículo titulado "Sobre la distribución de los primeros dígitos significativos", propuso el siguiente razonamiento: suponiendo que existe realmente una ley de frecuencias de dígitos, en tal caso, dicha ley debería ser completamente universal. Tanto si calculamos los precios en dólares, como en euros, colones o yenes, o si medimos la longitud en centímetros, pulgadas, metros o kilómetros, la frecuencia de aparición de los dígitos debería permanecer inalterada.

Así pues, Pinkham afirmó y demostró que la distribución de frecuencias de los dígitos es invariable frente a cambios de escala, por lo que concluyó que se estaba ante la presencia de una ley universal, a pesar de la existencia de opiniones adversas a este razonamiento.

Hasta la fecha han sido varios los autores que han contribuido al conocimiento de esta ley, entre los que destacan Ralph Raimi, Mark Nigrini, Theodore Hill, entre otros.

Definición. Siguiente >>

Referencias bibliográficas

Garcia, M. (2019). Aplicación de la ley de Benford en la detección de fraudes. Universidad y Sociedad 11(5): 421-427.

Marchand, C. & Maahs, D. (2021). Benford’s Law and COVID-19 Data. https://chance.amstat.org/2021/04/benfords-law/

Martínez, R.A. & Canizales, C.E. (2009). Ley de Benford y sus aplicaciones. Trabajo de grado para optar al título de Licenciatura en Estadistica. Universidad de El Salvador. 134 pp.

Mebane, W. (2008). Election forensics: The second digit Benford's Law test and recent American presidential elections. Detecting and Deterring Electoral 9 Manipulation. Washington: Brooking Press.

Autor

Escrito por Carlos F. Lira Gómez para la Edición #105 de Definición MX , en 11/2021. Carlos es MSc. en Ciencias Marinas, mención Biología Marina del Inst. Oceanográfico de Venezuela, UDO. Profesor de Carcinología y Zoología Gral. en la UDO.

Más definiciones del autor