Anda di halaman 1dari 2

Valor p

En contrastes de hipótesis y en estadística general, el valor de p (a veces conocido


simplemente como el p-valor, la p, valor de pconsignado, o bien directamente en inglés p-value)
se define como la probabilidad correspondiente al estadístico de ser posible bajo la hipótesis
nula, si cumple con la condición de ser menor al nivel de significancia impuesto arbitrariamente,
entonces la hipótesis nula será, eventualmente, rechazada. (valor del estadístico calculado).
Es fundamental tener en cuenta que el valor de p está basado en la asunción de la hipótesis de
partida (o hipótesis nula). El valor pes por tanto una medida de significación estadística.
Se rechaza la hipótesis nula si el valor de p asociado al resultado observado es igual o menor
que el nivel de significación establecido, convencionalmente 0,05 ó 0,01. Es decir, el valor p nos
muestra la probabilidad de haber obtenido el resultado que hemos obtenido si suponemos que
la hipótesis nula es cierta.
Si el valor de p es inferior al nivel de significación, lo más verosímil es que la hipótesis de partida
sea falsa. Sin embargo, también es posible que estemos ante una observación atípica, por lo
que estaríamos cometiendo el error estadístico de rechazar la hipótesis nula cuando ésta es
cierta basándonos en que hemos tenido la mala suerte de encontrar una observación atípica.
Este tipo de errores se puede subsanar rebajando el valor de p; un valor p de 0,05 es usado en
investigaciones habituales sociológicas mientras que valores p de 0,01 se utilizan en
investigaciones médicas, en las que cometer un error puede acarrear consecuencias más
graves. También se puede tratar de subsanar dicho error aumentando el tamaño de la muestra
obtenida, lo que reduce la posibilidad de que el dato obtenido sea casualmente raro.
El valor de p es un valor de probabilidad, por lo que oscila entre 0 y 1. Así, se suele decir que
valores altos de p NO RECHAZAN la hipótesis nula o, dicho de forma correcta, no permiten
rechazar la H0. De igual manera, valores bajos de p rechazan la H0.
Es importante recalcar que un contraste de hipótesis no permite aceptar una hipótesis;
simplemente la rechaza o no la rechaza, es decir que la tacha de verosímil (lo que no significa
obligatoriamente que sea cierta, simplemente que es más probable de serlo) o inverosímil.

Ejemplo[editar]
Supongamos que dos amigos están en un bar y uno le dice a otro que es capaz de distinguir un
whisky barato de uno caro. Como el otro amigo no lo cree, deciden hacer una prueba. El amigo
bravucón dice que acierta qué tipo de whisky está tomando al menos el 90% de las veces, ya
que a veces los hielos le distorsionan la cata. Deciden hacerle probar 20 whiskys (en días
distintos) y obtienen el resultado de que acertó sobre el contenido del vaso que estaba probando
en 14 noches. Dado que nuestro amigo dijo que acertaría el 90% de las veces y sólo acertó el
70% de ellas (14 de 20 noches), ¿podemos creer a nuestro amigo, o nos está engañando? ¿es
posible que fallara por mala suerte, pero si le dejamos seguir intentándolo a la larga acertará el
90%? Está claro que si hubiera acertado todas las noches, o 19 de ellas le creeríamos sin lugar
a dudas, también si hubiera fallado todas o casi todas le desmentiríamos sin dudar, pero con 14
sobre 20 es algo dudoso. Esto es lo que podemos medir con el valor de p.
Si suponemos que la hipótesis nula es cierta, esto quiere decir que las catas de nuestro amigo
se distribuyen según una binomial de parámetro 0,90, esto es, como una moneda que saliera
cara el 90% de las veces y cruz el 10%. ¿Cuál es la probabilidad de que una distribución
binomial de parámetro 0,9 repetida 20 veces nos dé como resultado 14 caras y 6 cruces?
Calculando esa probabilidad nos queda p = 0,008867 ≃ 0,89%.
Si a este valor le sumamos la probabilidad de que acierte sólo 13 veces, más la probabilidad de
que acierte sólo 12 veces y así hasta la probabilidad de que no acierte ninguna vez, es decir la
probabilidad de que acierte 14 o menos veces esto nos da p = 0,011253 ≃ 1,13%. Este es el
valor de p.
¿Qué significa esto? Esto significa que si realmente suponemos que nuestro amigo acierta el
90% de las veces que prueba una copa y ha probado 20 copas, la probabilidad de que acierte
menos de 15 copas es del 1,13%. Por tanto, si damos una potencia de contraste usual de 0,05,
que significa que aceptamos equivocarnos el 5% de las veces si repitiéramos el experimento,
como el valor de p es inferior a la potencia del contraste, rechazamos la hipótesis nula, y
declaramos que nuestro amigo es un fanfarrón. Estadísticamente, esto lo hacemos porque el
resultado observado (14 aciertos de 20 intentos) es muy poco probable si suponemos que
acierta el 90% de las veces, por lo tanto asumimos que no era cierta la hipótesis nula.
¿Que hubiera pasado si hubiera acertado las 20 veces? En ese caso el valor de p saldría muy
alto, ya que es muy probable que una distribución binomial de parámetro 0,90 repetida 20 veces
nos dé 20. Por tanto no rechazamos la hipótesis nula. Es decir, diríamos que es verosímil que
acierte el 90% de las veces, es posible que lleve razón, no tenemos evidencias significativas en
contra de ello ya que el p-valor nos ha resultado muy favorable.
El valor p es la probabilidad de que de la población propuesta por la hipótesis nula se obtenga la
muestra observada o una aún más alejada. El valor p está relacionado con la probabilidad
de error de tipo I.

Principios para el correcto uso e interpretación del valor


de p[editar]
En 2016, la American Statistical Association publicó seis principios para el correcto uso e
interpretación del valor de p. Muchos de estos principios abordan concepciones equivocadas y
empleos erróneos. Los seis principios son los siguientes: 1 2 3

1. Los valores de p pueden indicar cómo son los datos de incompatibles con cierto modelo
estadístico.
2. Los valores de p no miden la probabilidad de que la hipótesis nula sea cierta, ni tampoco
la probabilidad de que los datos hayan sido producidos enteramente al azar.

3. Conclusiones científicas y decisiones políticas o empresariales no deberían basarse


únicamente en el hecho de que un valor de p p supere un umbral especificado.

4. Una inferencia apropiada implica un informe completo y transparencia.

5. Ni el valor de p p ni la significación estadística miden el tamaño de un efecto o la


importancia de un resultado.

6. En sí mismo, un valor de p p no es una medida apropiada de la evidencia de un modelo


o hipótesis

Anda mungkin juga menyukai