Premios Xataka México 24 powered by Schneider Electric

La ciencia lleva más de 100 años usando este antiguo parámetro gracias a alguien que no quiso pagar regalías por unas tablas

En todas las áreas del conocimiento existen mitos y tradiciones arraigadas con historias interesantes. Tal es el caso de la "significatividad del 95%", una medida que no suele usarse como indicador de veracidad absoluta, ya que no determina si un estudio es correcto o incorrecto.

Este concepto deriva de una tradición que se originó hace más de cien años a raíz de una disputa sobre derechos de autor. Según un artículo de Brent Goldfarb y Andrew King, su origen se remonta a los años veinte, con Karl Pearson y Ronald Fisher, dos figuras ampliamente conocidas entre quienes han estudiado estadística.

La investigación revela que Pearson fue el creador de las tablas de referencia para calcular p-valores, una medida que permite evaluar la probabilidad de que los resultados de un estudio ocurran por azar o que puedan considerarse confiables.

Cada vez que estas tablas se incluían en libros de estadística, Pearson recibía regalías, lo cual Fisher deseaba evitar. En respuesta, Fisher desarrolló su propio método para calcular la significatividad, empleando dos umbrales de p-valor: 0.05 y 0.01.

Goldfarb y King concluyen que "una interpretación justa de esta historia es que los p-valores se usan, al menos en parte, porque un estadístico temía que compartir su trabajo afectara sus ingresos".

Los cálculos estadísticos

El concepto de p-valor se refiere a la probabilidad de cometer un error al calcular un parámetro estadístico. Por ejemplo, puede emplearse para evaluar si los pacientes que recibieron un tratamiento realmente mejoran más que aquellos que solo recibieron un placebo.

Si el p-valor es mayor que cero, existe la posibilidad de que la premisa inicial —la eficacia del medicamento— sea incorrecta. Así, los resultados podrían atribuirse al azar en lugar de mostrar una diferencia real entre los grupos estudiados.

Este p-valor también se utiliza para medir niveles específicos de significatividad. Es decir, se emplean umbrales predeterminados para determinar si un resultado es significativo, estableciéndose comúnmente en el 95%, aunque también puede aplicarse el 99% o hasta el 99.9%, con p-valores de 0.05, 0.01 o 0.001, respectivamente.

El riesgo en los resultados

Goldfarb y King mencionan que Fisher reconoció eventualmente que su sistema, basado en un rango de p-valores, superaba su método binario. Según él, "ningún trabajador científico había fijado un nivel de significatividad al cual, de año en año y en toda circunstancia, se rechacen hipótesis nulas; por lo tanto, se debería dejar la decisión a cada caso en particular, basado en sus pruebas e ideas".

Esta interpretación binaria sobre la significatividad, según los autores del estudio, puede llevar a una falsa confianza en los resultados, considerando que la certeza absoluta no existe y que la probabilidad de error debe incluirse en la ecuación.

Los autores también critican las publicaciones en el ámbito del marketing. Señalan que entre el 24% y el 40% de los estudios en esta área no producirían los mismos resultados si se replicaran, un proceso crucial en la ciencia para confirmar o refutar teorías y estudios previos.

La ciencia enfrenta múltiples sesgos, entre ellos, la presión por publicar y la reticencia de las revistas a aceptar estudios que confirmen teorías ya establecidas. Estos factores también contribuyen a este margen de error.

En conclusión, el método científico sigue siendo la mejor herramienta disponible, aunque no es perfecto y requiere algunos ajustes, como superar tradiciones arraigadas para alcanzar mejores conclusiones.

Ver todos los comentarios en https://www.xataka.com.mx

VER 0 Comentario

Portada de Xataka México