Cómo mentir con estadísticas por Darrell Huff

Calificación: 9/10

Leer más en Amazon

Lee gratis mi colección de más de 250 resúmenes de libros

Pensamientos de alto nivel

El libro es un manual fantástico sobre cómo nos engaña, a diario, el uso furtivo de las estadísticas. Es una lectura obligada para que cualquiera pueda interpretar de manera más inteligente las noticias, los medios de comunicación e incluso la investigación médica. Una vez que aprenda a ver estos trucos, no podrá dejar de verlos. 

Resumen en español

No se deje engañar por los datos faltantes: el  hecho de que tomar un medicamento alivie un resfriado en una semana no significa que no se hubiera curado en una semana por sí solo.

Muestras sesgadas

Muchas de las conclusiones que ves provienen de muestras que son demasiado pequeñas, sesgadas o ambas cosas.

Cuando escuche una estadística, digamos, que el estadounidense promedio se cepilla los dientes 1.02 veces al día, pregúntese: “¿Cómo pudieron haberlo descubierto?” ¿Tiene sentido que se haya podido investigar de forma eficaz? En este caso, habrían tenido que preguntar, ¿y no crees que es una suposición segura que la gente mintió?

“Para que valga mucho, un informe basado en muestreo debe utilizar una muestra representativa, que es aquella de la que se han eliminado todas las fuentes de sesgo”.

Si un psiquiatra dice que “prácticamente todo el mundo es neurótico”, ¿supone que su impresión ha sido sesgada por su línea de trabajo? 

Promedios sesgados

Hay tres tipos de promedios:

La media: sumar todos los valores y dividir por la cantidad de valores La moda: el valor más común La mediana: el valor en el medio de la muestra

Estos pueden ser números muy diferentes, y los periodistas y otros elegirán el que mejor respalde su argumento.

En las distribuciones normales, los tres estarán cerca uno del otro, pero en las distribuciones irregulares (por ejemplo, el ingreso familiar anual) obtendrá números muy diferentes para cada uno.

Datos descartados

Las empresas seguirán realizando experimentos hasta que obtengan los resultados que desean, descartando los experimentos que “no produjeron hallazgos significativos”.

Con muestras más pequeñas, tiene una mayor variación. Con 10 lanzamientos de moneda, puede obtener 8 caras, pero es mucho menos probable que obtenga 80 caras en 100 lanzamientos de moneda.

Manipulación de gráficos

Estos tres son todos el mismo gráfico (en cuanto a datos), pero en cuanto a impresiones muy diferentes:

Debe observar el rango de datos que se utilizan en ambos ejes. Otro ejemplo:

La figura adosada

“Si no puede probar lo que quiere probar, demuestre algo más y finja que son lo mismo”.

Por ejemplo: “No puede probar que su olfato cura los resfriados, pero puede publicar (en letras grandes) un informe de laboratorio jurado de que media onza de ese material mató 31.108 gérmenes en un tubo de ensayo en once segundos”.

Más: “El 27 por ciento de una gran muestra de médicos eminentes fuma Throaties, más que cualquier otra marca”. La cifra en sí puede ser falsa, por supuesto, de varias maneras, pero eso realmente no hace ninguna diferencia. La única respuesta a una cifra tan irrelevante es “¿Y qué?” Con el debido respeto hacia la profesión médica, ¿saben los médicos más que usted sobre las marcas de tabaco? ¿Tienen alguna información privilegiada que les permita elegir el menos dañino entre los cigarrillos? Por supuesto que no, y su médico sería el primero en decirlo. Sin embargo, ese “27 por ciento” de alguna manera logra sonar como si significara algo”.

O: “Con el mismo tipo de tonterías que utilizó el autor del artículo, puedes demostrar que el tiempo despejado es más peligroso que el tiempo con niebla. Se producen más accidentes con tiempo despejado, porque hay más tiempo despejado que con niebla. De todos modos, la niebla puede ser mucho más peligrosa para conducir”.

También puede representar los mismos datos de muchas formas diferentes: “A menudo hay muchas formas de expresar cualquier figura. Puede, por ejemplo, expresar exactamente el mismo hecho llamándolo un uno por ciento de rendimiento sobre las ventas, un quince por ciento de rendimiento sobre la inversión, una ganancia de diez millones de dólares, un aumento en las ganancias del cuarenta por ciento (en comparación con el promedio de 1935-39), o una disminución del sesenta por ciento con respecto al año pasado”.

Correlación frente a causalidad

“Es el que dice que si B sigue a A, entonces A ha causado B. Se está asumiendo una suposición injustificada de que, dado que fumar y las calificaciones bajas van de la mano, fumar causa calificaciones bajas. ¿No podría ser al revés?”

“Esta es la mejor falacia post hoc. Dice que estas cifras muestran que si usted (su hijo, su hija) asiste a la universidad probablemente ganará más dinero que si decide pasar los próximos cuatro años de otra manera. Esta conclusión injustificada tiene como base la suposición igualmente injustificada de que, dado que las personas con formación universitaria ganan más dinero, lo hacen porque fueron a la universidad. En realidad, no lo sabemos, pero estas son las personas que habrían ganado más dinero incluso si no hubieran ido a la universidad”.

Cómo responder a una estadística

Estas cinco preguntas le ayudarán a evitar ser engañado por las estadísticas.

¿Quién lo dice?

“Lo primero que hay que buscar es el sesgo: el laboratorio con algo que probar por el bien de una teoría, una reputación o una tarifa; el periódico cuyo objetivo es una buena historia; mano de obra o gerencia con un nivel salarial en juego”.

¿Cómo lo sabe?

“Esté atento a la evidencia de una muestra sesgada, una que ha sido seleccionada incorrectamente o, como con esta, se ha seleccionado a sí misma. Haga la pregunta que tratamos en un capítulo anterior: ¿Es la muestra lo suficientemente grande como para permitir una conclusión confiable?

¿Qué falta?

“Tenga cuidado con una variedad promedio no especificada, en cualquier asunto en el que se pueda esperar que la media y la mediana difieran sustancialmente”.

“A veces son los porcentajes los que se dan y las cifras sin procesar lo que faltan, y esto también puede ser engañoso. Hace mucho tiempo, cuando la Universidad Johns Hopkins acababa de comenzar a admitir mujeres estudiantes, alguien que no estaba particularmente enamorado de la coeducación informó una verdadera sorpresa: ¡Treinta y tres y un tercio por ciento de las mujeres en Hopkins se habían casado con miembros de la facultad! Las cifras crudas dieron una imagen más clara. Había tres mujeres inscritas en ese momento, y una de ellas se había casado con un profesor”.

“Un informe de un gran aumento en las muertes por cáncer en el último cuarto de siglo es engañoso a menos que se sepa cuánto es producto de factores tan extraños como estos: El cáncer a menudo se enumera ahora donde antes se usaba “causas desconocidas”; las autopsias son más frecuentes, dando diagnósticos más seguros; la elaboración de informes y la compilación de estadísticas médicas son más completos; y las personas alcanzan con mayor frecuencia las edades más susceptibles ahora. Y si está mirando el total de muertes en lugar de la tasa de mortalidad, no descuide el hecho de que ahora hay más personas de las que solía haber”.

¿Alguien cambió de tema?

¿Es esa la estadística real o lo que alguien informó? (por ejemplo, con qué frecuencia se bañaban).

“La población de una gran área en China era de 28 millones. Cinco años después eran 105 millones. Muy poco de ese aumento fue real; la gran diferencia sólo podría explicarse teniendo en cuenta los propósitos de las dos enumeraciones y la forma en que la gente se sentiría inclinada a sentirse al ser contada en cada caso. El primer censo fue para fines fiscales y militares, el segundo para aliviar el hambre”.

¿Tiene sentido?

“Las audiencias sobre enmiendas a la Ley del Seguro Social se han visto frecuentadas por varias formas de declaraciones que solo tienen sentido cuando no se las analiza de cerca. Es un argumento que dice así: dado que la esperanza de vida es de solo sesenta y tres años, es una farsa y un fraude establecer un plan de seguridad social con una edad de jubilación de sesenta y cinco años, porque prácticamente todo el mundo muere antes de eso. . “