Ejemplo[editar]
Supongamos que dos amigos están en un bar y uno le dice a otro que es capaz de distinguir un
whisky barato de uno caro. Como el otro amigo no lo cree, deciden hacer una prueba. El amigo
bravucón dice que acierta qué tipo de whisky está tomando al menos el 90% de las veces, ya
que a veces los hielos le distorsionan la cata. Deciden hacerle probar 20 whiskys (en días
distintos) y obtienen el resultado de que acertó sobre el contenido del vaso que estaba probando
en 14 noches. Dado que nuestro amigo dijo que acertaría el 90% de las veces y sólo acertó el
70% de ellas (14 de 20 noches), ¿podemos creer a nuestro amigo, o nos está engañando? ¿es
posible que fallara por mala suerte, pero si le dejamos seguir intentándolo a la larga acertará el
90%? Está claro que si hubiera acertado todas las noches, o 19 de ellas le creeríamos sin lugar
a dudas, también si hubiera fallado todas o casi todas le desmentiríamos sin dudar, pero con 14
sobre 20 es algo dudoso. Esto es lo que podemos medir con el valor de p.
Si suponemos que la hipótesis nula es cierta, esto quiere decir que las catas de nuestro amigo
se distribuyen según una binomial de parámetro 0,90, esto es, como una moneda que saliera
cara el 90% de las veces y cruz el 10%. ¿Cuál es la probabilidad de que una distribución
binomial de parámetro 0,9 repetida 20 veces nos dé como resultado 14 caras y 6 cruces?
Calculando esa probabilidad nos queda p = 0,008867 ≃ 0,89%.
Si a este valor le sumamos la probabilidad de que acierte sólo 13 veces, más la probabilidad de
que acierte sólo 12 veces y así hasta la probabilidad de que no acierte ninguna vez, es decir la
probabilidad de que acierte 14 o menos veces esto nos da p = 0,011253 ≃ 1,13%. Este es el
valor de p.
¿Qué significa esto? Esto significa que si realmente suponemos que nuestro amigo acierta el
90% de las veces que prueba una copa y ha probado 20 copas, la probabilidad de que acierte
menos de 15 copas es del 1,13%. Por tanto, si damos una potencia de contraste usual de 0,05,
que significa que aceptamos equivocarnos el 5% de las veces si repitiéramos el experimento,
como el valor de p es inferior a la potencia del contraste, rechazamos la hipótesis nula, y
declaramos que nuestro amigo es un fanfarrón. Estadísticamente, esto lo hacemos porque el
resultado observado (14 aciertos de 20 intentos) es muy poco probable si suponemos que
acierta el 90% de las veces, por lo tanto asumimos que no era cierta la hipótesis nula.
¿Que hubiera pasado si hubiera acertado las 20 veces? En ese caso el valor de p saldría muy
alto, ya que es muy probable que una distribución binomial de parámetro 0,90 repetida 20 veces
nos dé 20. Por tanto no rechazamos la hipótesis nula. Es decir, diríamos que es verosímil que
acierte el 90% de las veces, es posible que lleve razón, no tenemos evidencias significativas en
contra de ello ya que el p-valor nos ha resultado muy favorable.
El valor p es la probabilidad de que de la población propuesta por la hipótesis nula se obtenga la
muestra observada o una aún más alejada. El valor p está relacionado con la probabilidad
de error de tipo I.
1. Los valores de p pueden indicar cómo son los datos de incompatibles con cierto modelo
estadístico.
2. Los valores de p no miden la probabilidad de que la hipótesis nula sea cierta, ni tampoco
la probabilidad de que los datos hayan sido producidos enteramente al azar.