Anda di halaman 1dari 15

La Falacia de la colocacin de la confianza en los intervalos de confianza

Estimaciones de intervalo - estimaciones de los parmetros que incluyen un ajuste por


la incertidumbre del muestreo
- Durante mucho tiempo han sido promocionado como un componente clave de los
anlisis estadsticos. Hay varios tipos de estimaciones de intervalo, pero los ms
populares son los intervalos de confianza (IC): intervalos que contienen el verdadero
valor del parmetro en alguna proporcin conocida de muestras repetidas, en
promedio. La anchura de los intervalos de confianza se cree que el ndice de precisin
de una estimacin; los valores de los parmetros contenidos dentro de un CI se cree
que son ms plausible que los que estn fuera del intervalo; y el coeficiente de
confianza del intervalo (tpicamente 95%) se piensa que es ndice de la verosimilitud
de que el verdadero parmetro est incluido en el intervalo. Mostramos en una serie
de ejemplos que el CIS no necesariamente tiene cualquiera de estas propiedades, y
por lo general conducen a inferencias incoherentes. Por esta razn, se recomienda
contra el uso del mtodo de elementos de configuracin para la inferencia
El desarrollo de las estadsticas en el ltimo siglo ha visto la proliferacin de mtodos
diseados para hacer inferencias a partir de datos. Los mtodos varan ampliamente
en sus bases filosficas, las preguntas que se supone deben hacer frente, y su
frecuencia de uso en la prctica. Una clase popular y widely- promovido de mtodos
son estimaciones de intervalo, que in- cluyen los intervalos de confianza, frecuentistas
bayesianos intervalos crebles e intervalos ms alta densidad posterior (HPD),
intervalos de fiduciales, y los intervalos de probabilidad. Estos procedimientos difieren
en su base filosfica y la computacin, pero de manera informal estn diseados para
ser estimados de un parmetro que representan de conjunto de medicin o muestreo
de incertidumbre, al ceder un rango de valores para el parmetro en lugar de un nico
valor.
De los muchos tipos de estimaciones de intervalo, el ms popular es el intervalo de
confianza (IC). Los intervalos de confianza se introdu- cido textos de estadstica en
casi todos introductorias; son recomendada o requerida por las directrices
metodolgicas de muchas revistas prominentes (por ejemplo, Psychonomics Sociedad,
2012; Wilkinson y el Grupo de Trabajo sobre la inferencia estadstica, 1999); y que
forman la base de los programas propuestos reformadores metodolgicas "(Cumming,
2014; Loftus, 1996). Sin embargo, hay una enorme cantidad de confusin en los
investigadores, metodlogos, y los autores de libros de texto acerca de qu es
exactamente un intervalo de confianza es y cmo puede ser interpretada. Creemos
que la confusin sobre qu elementos de configuracin son unidades de su promocin;
si los investigadores comprendieron lo que en realidad son entidades de crdito, y qu
inferencias que pueden o no pueden apoyar, no se promoveran tan comnmente
como son. Nuestro objetivo es aliviar la confusin acerca de la CEI y de poner en
cuestin si pueden ser utilizados para la inferencia de sonido.
Comenzamos por definir con precisin los intervalos de confianza. A continuacin,
describimos tres mitos comunes sobre el intervalo de confianza que se han
perpetuado por los defensores de los intervalos de confianza. El uso de varios
ejemplos, se muestra cmo no es necesaria que los intervalos de confianza tienen
ninguna de las propiedades comnmente atribuidos a los mismos; es decir, los
intervalos de confianza, como herramientas generales de inferencia, se han

falsificado. Finalmente, se discuten los mtodos que - bajo ciertas suposiciones tienen las propiedades que los investigadores desean.
Intervalos de confianza
En un artculo clsico, Neyman (1937), ha establecido el fundamento formal para los
intervalos de confianza. Antes de definir los intervalos de confianza, se describe el
problema prctico que se vio Neyman intervalos de confianza como la solucin.
Supongamos que un investigador esta interesado en la estimacin de un parmetro,
que podemos llamar . Este parmetro puede ser una media de la poblacin, un
tamao del efecto, una varianza, o cualquier otra cantidad de inters. Neyman sugiere
que los investigadores realizan los tres pasos siguientes:
Realizar un experimento, recoger los datos pertinentes.
Calcular dos nmeros - el ms pequeo de lo que podemos llamar L, mayor de la que
U - formando un intervalo (L, T) de acuerdo con un algoritmo.
Estado que L < <U - es decir, que es en el intervalo.
Esta recomendacin se justifica por la eleccin de un algoritmo para la etapa (b) de tal
manera que, a la larga, la afirmacin del investigador en la etapa (c) ser correcta, en
promedio, un X% de las veces. Un intervalo de confianza es cualquier intervalo
calculado utilizando un procedimiento de este tipo.
Definicin 1 (Intervalo de confianza) confianza Un X% inter- valo de parmetro es un
intervalo (L, T) generada por un algoritmo que en el muestreo repetido tiene un% de
probabilidad X de que contenga el verdadero valor de (Neyman, 1937).
A pesar de su escepticismo sobre la utilidad de los intervalos de confianza se inici tan
pronto como Neyman expuso la teora (por ejemplo, la discusin de Neyman, 1934) 1,
los intervalos de confianza han crecido en popularidad a ser los timators es- intervalo
ms ampliamente utilizados. Tal vez el CI ms comnmente utilizado es el CI para la
media de la distribucin normal con varianza desconocida.

donde x y s son la media y la desviacin estndar de la muestra, N es el tamao de la


muestra, y t * el cuantil del Estudiante de tn-1 distribucin elegido de tal manera que
Pr(|tN1| < |t|) = X%

para un CI X%. Este intervalo de confianza se le ensea a los estudiantes de


estadstica de primer ao en todo el mundo y se utiliza en trabajos en la literatura
cientfica.
La Figura 1 muestra los intervalos de confianza 50% al azar 200, todos construidos a
partir de sorteos de tamao de la muestra N = 2 de la misma (100152) poblacin
normal. Algunos de los intervalos de confianza, que se denota por lneas oscuras,
incluyen la media real = 100; otros no lo hacen y se denotan con lneas de luz. De
esta de la muestra de los intervalos de confianza del 200, 107 (53,5%) contener el
valor verdadero; si tuviramos que seguir el muestreo de ms elementos de
configuracin, esta proporcin se acercara el coeficiente de confianza X = 50%.
Tenga en cuenta que con dos observaciones * t = 1 y S = | x1 - x2 | / 2,

lo que significa que t IC del 50% de los estudiantes es simplemente el intervalo entre
las dos observaciones. Hacemos uso de la simplicidad de la IC del 50% con dos
observaciones en todas partes.
La definicin de un intervalo de confianza al parecer, a primera vista, es: un IC es un
intervalo generado por algn procedimiento que crea intervalos que contienen el
verdadero valor de un parmetro en alguna proporcin fija de muestras repetidas, en
promedio. Dicho de otro modo, si uno fuera a hacer la demanda siempre dicotmica
que el verdadero valor est en un intervalo especfico calculado a partir del
procedimiento, uno sera correcto en esa misma proporcin de muestras repetidas.
"Confianza" es, pues, una propiedad promedio de un procedimiento, por lo tanto, para
distinguir entre un procedimiento de confianza (CP) y un intervalo de confianza (CI).
Para los propsitos de este trabajo vamos a utilizar el procedimiento de la confianza
trmino para denotar el algoritmo, y el intervalo de confianza para denotar los
recursos especficos del algoritmo.

Figura 1. 200 azar 50% IC para una media normal con varianza desconocida, basado
en 2 se basa en una distribucin normal (100, 152). (azul) lneas oscuras denotan
elementos de configuracin que contienen la verdadera media; (rojo) las lneas de luz
denotan aquellos que no lo hacen. IC estn ordenadas segn la longitud.
Mitos de confianza
Los intervalos de confianza se describen ampliamente como herramientas para la exContratante la informacin necesaria sobre el parmetro de los datos. Sin embargo, la
relacin entre la definicin del intervalo de confianza y todo lo que un investigador
quiere saber es claro: que conozcamos las propiedades medias del procedimiento,
pero qu implicaciones tiene esto para la inferencia de un intervalo de tiempo
especfico? Varias explicaciones heursticos son utilizados por los autores de libros de
texto y los defensores de los intervalos de confianza en la literatura para ayudar a
cerrar la brecha entre la definicin terica del intervalo de confianza y las propiedades
que son importantes para los analistas, como la plausibilidad de valores de
parmetros especficos o la precisin de una estimacin. En esta seccin, se explica
cmo las diversas explicaciones heursticas de los intervalos de confianza son en
realidad mitos: no son verdad de los intervalos de confianza en general. Se presentan
dos ejemplos que muestran cmo la lgica de la inferencia por CI falla.
Por ejemplo, en esta discusin Bowley afirma "Tiene [el intervalo de confianza]
realmente nos lleve a lo que necesitamos - la posibilidad de que en el universo que
estamos muestreando la proporcin est dentro de estos lmites determinados? Creo
que no lo hace. Creo que estamos en la posicin de saber que ya sea un evento
improbable, se ha producido o la proporcin de la poblacin est dentro de los lmites.

Para equilibrar estas cosas hay que hacer una estimacin y formar un juicio acerca de
la probabilidad de que la proporcin en el universo [es decir, una probabilidad a priori]
- La misma cosa que se supone que debe ser eliminada ".
La eleccin ms tpica de confianza del 95% es, por supuesto, arbitrarios. Todos los
puntos que hacemos en este trabajo se extienden a 95% IC y N> 2, con el
inconveniente de que los argumentos seran ms matemticamente involucrados y
menos transparente. Debido a que nuestro objetivo es demostrar que la lgica del uso
de intervalos de confianza para la inferencia es errnea, optamos por utilizar el caso
ms sencillo

Un sumergible de investigacin de 10 metros de largo con varias personas a


bordo ha perdido el contacto con su buque de apoyo de la superficie. El
sumergible tiene una escotilla de rescate exactamente a medio camino a lo
largo de su longitud, a la que el buque de apoyo dejar caer una lnea de
rescate. Debido a que los equipos de rescate slo reciben un intento de
rescate, es crucial que cuando la lnea se redujo a la nave en la profunda agua
que la lnea sea lo ms cerca posible de esta escotilla. Los investigadores en el
buque de apoyo no saben donde el sumergible es, pero si saben que forme
burbujas distintivos. Estas burbujas pueden formar en cualquier lugar a lo largo
de la nave de longitud, de forma independiente, con igual probabilidad, y flotan
a la superficie, donde pueden ser vistos por el buque de apoyo.
La situacin se muestra en la Figura 2A. La escotilla de rescate es el lugar
desconocido?, Y las burbujas puede elevarse en cualquier lugar de? 5 metros
(la proa del sumergible) a? +5 Metros (la popa del submarino). Los equipos de
rescate quieren utilizar estas burbujas para saber dnde se encuentra la
escotilla, por lo que consulten el estadstico a bordo. El estadstico, debe ser
un defensor de la utilizacin de intervalos de confianza, le dice a los equipos de
rescate cmo los intervalos de confianza se pueden utilizar para estimar la
ubicacin de la escotilla. Se observa que la ubicacin de estos dos primeros
burbujas forman un intervalo de confianza del 50% para el?, Porque hay una
probabilidad de 50% que dos burbujas estarn en lados opuestos de la
escotilla. En trminos ms familiares, el estadstico se ha elegido el
procedimiento confianza del 50%

Donde x1 y x2 son las ubicaciones de la primera y segunda burbujas,


respectivamente, y x es la ubicacin media. El estadstico justifica este
procedimiento confianza sobre la base de que es el mismo que el
procedimiento de la t de Student 50% con N = 2. Denotamos este
procedimiento confianza Procedimiento 1 (CP1). Los equipos de rescate ver las
dos primeras burbujas, que se muestran como crculos en la Figura 2A. Las dos
burbujas estn muy juntos, produciendo el intervalo de confianza del 50%
estrecho se muestra ms arriba de las burbujas. El estadstico informa con
entusiasmo a los trabajadores de rescate que este IC estrecho indica que el
conocimiento de la ubicacin de escotilla es bastante precisa, y que es 50%
seguro de que la escotilla se encuentra en el intervalo de confianza. Se les
aconseja a abandonar la lnea de rescate.
El dictamen de la estadstica se ha guiado por las afirmaciones hechas por los
defensores de las EC. La relacin entre las entidades de crdito y de precisin,
o poder, se cita a menudo como una de las razones principales que deben ser
utilizados durante las pruebas de significacin hiptesis nula (por ejemplo,
Cumming & Finch, 2005; Cumming, 2014; Fidler y Loftus, 2009; Loftus, 1993 ,

1996). Por ejemplo, escribe Cumming (2014) que "[l] ong intervalos de
confianza (IC) que pronto nos dej saber si nuestro experimento es dbil y
puede dar slo estimaciones imprecisas", y el estado joven y Lewis (1997) que
"[t] que la anchura del intervalo de confianza nos da informacin sobre la
precisin de la estimacin puntual ".
Uno de los trabajadores de rescate, sin embargo, es escptico. Ella observa que
hay una amplia gama de lugares que son posibles para la ubicacin de la
escotilla. Debido a que la embarcacin es de 10 metros de largo, ninguna
burbuja puede originar ms de 5 metros de la escotilla. Dado dos burbujas, las
nicas posibles ubicaciones para la escotilla estn dentro de los 5 metros de
ambas burbujas. Estos valores se muestran como la regin sombreada en la
figura 2A con la etiqueta "posterior". Las burbujas se dan ninguna razn para
preferir cualquiera de estos lugares sobre otro. El trabajador de rescate
escptico dice que debido a que la segunda burbuja estaba tan cerca de la
primera, de manera colectiva las burbujas han proporcionado informacin
realmente muy impreciso. Ella sugiere esperar para ms burbujas antes de
cortar la conexin.
El estadstico, en la autoridad de los muchos defensores de los intervalos de
confianza, convence a los equipos de rescate para dejar la lnea dentro del IC
50%. La lnea de rescate no alcanza la escotilla por 3,75 metros. Por el
momento los trabajadores de rescate se dan cuenta de que han perdido la
escotilla, no hay ms tiempo para otro intento. Toda la tripulacin a bordo del
sumergible se pierde.
El estadstico ha sido vctima de un mito sobre los intervalos de confianza que
nos doblaje del "error de precisin":
Mito 1 (El error de precisin) "La amplitud de un intervalo de confianza indica la
precisin de nuestro conocimiento sobre el parmetro.Los intervalos de
confianza estrechos muestran un conocimiento preciso, mientras que los
errores de confianza amplios demuestran conocimiento impreciso.
No hay una conexin necesaria entre la precisin de una estimacin y el
tamao de un intervalo de confianza. En el caso de que el submarino, el
intervalo de confianza estrecho proporcion informacin imprecisa sobre la
localizacin de la escotilla de un submarino. De hecho, como veremos ms
adelante, la estrechez de un intervalo de CP1 y la precisin en realidad esta
inversamente relacionada, como la siguiente situacin va a dejar en claro.
Por extrao que parezca, un segundo barco est en una situacin similar a otro
extremo del mundo Los investigadores en el barco tienen contacto con su
sumergible, y al igual que el primer barco estn planeando montar un rescate
utilizando las burbujas distintivos. Que consulten a su estadstico, que les
informa que esperar las dos primeras burbujas y utilizan un IC del 50% de
confianza Procedimiento 1. Mientras que el equipo de rescate espera a que
aparezcan las burbujas, el estadstico seala que el CP1 no hace directamente
el uso de la varianza conocida de los lugares de burbujas. Rpidamente se

calcula un procedimiento de confianza de 50% alternativa, que denotamos


Procedimiento de confianza 2 (CP2)
Este procedimiento confianza hace uso del hecho de que hay un 50% de
probabilidad de que x est comprendida en 5-5/sqrt(2) =1.46 metros de la
escotilla. Los equipos de rescate alertan al estadstico que se han respetado las
dos primeras burbujas, como se muestra en la Figura 2B. Las burbujas estan a
casi 10 metros de distancia.
El estadstico calcula los intervalos de confianza utilizando CP1 y CP2. El
intervalo de CP1 es casi tan ancho como lo pueda ser. En un primer momento,
el estadstico se desespera, pensando que las dos primeras burbujas han dado
lugar a una informacin muy imprecisa. Pero entonces el estadstico observa
que la amplitud del intervalo de CP2 nunca cambia, confusamente lo que
sugiere que la anchura de la CI no tiene que estar en funcin de la precisin en
los datos

Ante la informacin aparentemente contradictoria de las dos EC sobre la


precisin de los X estimacin, el estadstico decide seguir una lnea de
razonamiento diferente. Pensando que su CP2 es superior debido al hecho de
que se utiliza directamente la informacin sobre la anchura del sumergible, se
razona acerca de los valores probables para la ubicacin de la escotilla. Ella
cree que en virtud de estar contenida en su intervalo, los valores dentro del
intervalo de confianza del todo debe ser tomado en serio como estimaciones
de la ubicacin escotilla. Esta segunda interpretacin ampliamente equivocada
de intervalos - que los parmetros especficos en el intervalo son "probables" o
"plausibles" - nos desva de la probabilidad de error:
Mito 2 (el error de probabilidad) "Un intervalo de confianza contiene los valores
probables para el parmetro. Los valores dentro del intervalo de confianza son
ms propensos que los que estn fuera. "Este error existe en diversas
variedades, a veces con la verosimilitud, credibilidad, o razonabilidad de las
creencias sobre el parmetro.
Loftus (1996), por ejemplo, dice que el CI da una "indicacin de la seriedad con
el patrn observado de los medios debe ser tomado como una reflexin del
patrn subyacente de la poblacin de significa." Se utiliza Esta lgica cuando
se utilizan intervalos de confianza para probar la teora (Velicer et al., 2008) o
para argumentar a favor de la hiptesis nula (o prcticamente nula) hiptesis
(Loftus, 1996). El problema con la lgica del error ms probable es que un
intervalo de confianza puede contener valores imposibles, o puede excluir los
valores que son tan plausibles como las dentro del intervalo. Por ejemplo, el IC
para el primer submarino no pudo contener la mayor parte de los valores
probables, lo que lleva el estadstico para creer que su estimacin era muy
precisa.
La segunda estadstica seala que el intervalo entre el CP2 es de 2,93 metros
de ancho. Pensando que todos los valores dentro de este intervalo son

"probable", aconseja poner en riesgo a la espera de unas cuantas ms burbujas


para reducir el intervalo de confianza. Sin embargo, un trabajador de rescate
perceptivo desafa el estadstico. Seala que saben muy precisamente donde la
escotilla debe ser: a medio camino entre las dos burbujas! Las burbujas eran
casi tan distantes entre s como podran ser, lo que significa que deben haber
llegado desde extremos opuestos de la embarcacin. Si venan desde los
extremos opuestos de la embarcacin, a continuacin, la escotilla debe ser casi
exactamente en el medio. Las nicas posibles ubicaciones para la escotilla se
muestran en la lnea superior de la figura 2B, la etiqueta De hecho, casi todos
los valores contenidos en el 50% IC calculados a partir de CP1 y CP2 son
imposibles la escotilla no podra estar ubicada all.
El trabajador de rescate aconseja ignorar el estadstico y dejar caer la mitad a
medio camino entre la lnea de rescate de las burbujas. El argumento del
trabajador de rescate convence a los dems trabajadores de rescate. La lnea
de rescate se renen en la escotilla, y todos los miembros de la tripulacin a
bordo del sumergible se salvan.
En los intentos de rescate de ambos submarinos, los estadsticos utilizan la
misma lgica recomendadas por los defensores de los intervalos de confianza
en un ef? Ort para determinar la ubicacin de la escotilla de un submarino. En
ambos casos, la sentencia de la estadstica era defectuoso. Consideremos
ahora cmo el intervalo de confianza podra ser tan engaosa. En el ejemplo,
los errores de probabilidad y de precisin son fciles de ver; CIS puede
contener valores en su mayora imposibles, y la precisin de una estimacin
disponible en los datos pueden ser inversamente proporcional a la estrechez de
la CI, o no relacionada en absoluto. La lgica de la probabilidad y la precisin
de la interpretacin de las CIs simplemente no seguir a partir de la definicin
de un procedimiento de la confianza; algunos intervalos de confianza pueden
tener estas propiedades, otras no.
Si las interpretaciones de precisin y verosimilitud de los intervalos de
confianza son incorrectos, qu podemos decir acerca de los IC? La definicin
de un intervalo de confianza deja claro cmo interpretar un procedimiento de
confianza. Sin embargo, cuando se calcula un intervalo especfico de los datos
y hay que interpretarlo, nos enfrentamos con dificultad. No es obvio cmo
pasar de nuestro conocimiento de las propiedades del procedimiento para la
interpretacin del intervalo de confianza.
autores de libros de texto y los defensores de los intervalos de confianza salvar
la distancia sin problemas al afirmar que las propiedades de los procedimientos
de confianza se pueden aplicar a los intervalos de confianza individuales. Por
ejemplo, Masson y Loftus (2003) afirman que "la interpretacin del intervalo de
confianza construida redonda que media especfica sera que hay una
probabilidad del 95% de que el intervalo es uno de los 95% de todas las
posibles los intervalos de confianza que incluye la media poblacional. En
trminos ms sencillos, en ausencia de cualquier otra informacin, existe una
probabilidad del 95% de que el intervalo de confianza obtenido incluye la

media poblacional. "Cumming (2014) escribe que" podemos estar 95% seguros
de que nuestro intervalo incluye [el Parmetro] y se puede pensar en los
lmites inferior y superior de probabilidades ms bajas y lmites superiores para
[el parmetro]. Esta interpretacin, aunque aparentemente natural, es
incorrecta. Nos doblamos este razonamiento incorrecto de la "Falacia Confianza
Fundamental" (FCF). La FCF es fundamental, ya que parece fluir naturalmente
de la definicin del intervalo de confianza:
Mito 3 (La falacia Confianza Fundamental) "Si la probabilidad de que un
intervalo aleatorio contiene el valor verdadero es X%, entonces la verosimilitud
(o probabilidad) que un intervalo observado en particular contiene el valor
verdadero es tambin un X%."
El razonamiento detrs de la Falacia Confianza Fundamental parece plausible:
en una muestra dada, podramos obtener cualquiera de los posibles intervalos
de confianza. Debido a que el 95% de los posibles intervalos de confianza
contiene el valor verdadero, sin ninguna otra informacin parece razonable
decir que tenemos 95% de certeza de que el verdadero valor est en nuestro
intervalo de confianza calculado. Esta interpretacin es sugerida por el nombre
de "intervalo de confianza" en s mismo: la palabra "confianza", en uso laico,
est estrechamente relacionado con los conceptos de verosimilitud y la
creencia. El nombre de "intervalo de confianza" por lo tanto, invita a la FCF
como una interpretacin.
El primer indicio de que la FCF es una falacia es el hecho de que, como hemos
visto, para cualquier problema dado que podra haber ms de un
procedimiento confianza. Si el mero hecho de que un procedimiento de
confianza tiene un coeficiente de confianza del X% a entender que cualquier
intervalo calculado a partir de ese procedimiento tiene un X% probabilidad de
contener el verdadero valor del parmetro, a continuacin, dos intervalos
calculados con los mismos datos de dos procedimientos de confianza del 50% a
la vez tenga una probabilidad del 50% de contener el valor verdadero.
Considere CP1 y CP2; ambas se centran alrededor de x. Si los intervalos de
CP1 y CP2 tanto tienen una probabilidad 50% de los que contiene el valor
verdadero, entonces las leyes de probabilidad requieren que toda la
probabilidad 50% se concentrar en el ms corto de los dos intervalos- de lo
contrario, el ms largo de los dos intervalos tendra > 50% probabilidad de
contener el valor verdadero. Esto parece dar a entender que si tenemos dos
procedimientos que siempre estn anidados uno dentro del otro, como CP1 y
CP2 se encuentran, entonces podemos simplemente tomar el ms corto de los
dos- lo que es- como nuestro 50& Cl. Pero ya que tanto CP1 y CP2 se
encuentran 50% IC, entonces el procedimiento tomando el ms corto de los
dos debe contener el verdadero valor de menos de 50% del tiempo, lo que
significa que no puede ser un procedimiento de confianza del 50%. La FCF lleva
a contradiccin.

No necesitamos dos procedimientos de confianza para ver por qu la FCF es


una falacia. En el segundo escenario submarino, un estadstico utilizando el
CP1 bajo la FCF iba a creer, sobre la base de que se ha calculado un IC del
50%, que es 50% seguro de que el verdadero valor se encuentra entre las dos
burbujas. Teniendo en cuenta el hecho de que las burbujas no pueden ser ms
de 5 metros de la escotilla, si las burbujas se encuentran ms de 5 metros de
distancia de un CI calculado a partir de CP1 debe contener la ubicacin
escotilla. Todos IC del CP1 que son ms anchos que contienen 5 metros?, Con
certeza. En virtud de la FCF, los datos produciran tanto certeza del 100% y un
50% de certeza. Del mismo modo, en el primer escenario, las burbujas eran
slo 0,05 metros. De los intervalos de confianza que son 0,05 metros de ancho,
contiene slo el 5% del valor real (vase el suplemento para una explicacin).
Sobre la base de este hecho, se podra afirmar 5% de certeza de que la
escotilla se encuentra en el intervalo, y sin embargo la FCF llevara a reclamar
tambin un 50% de certeza. La FCF da lugar a mltiples inferencias
contradictorias de los mismos datos.
La falacia Confianza Fundamental parece seguir directamente de la definicin
de un intervalo de confianza. Cmo se puede utilizar un procedimiento de
confianza que produce el 50% IC, an no estn 50% seguro de que contienen
el verdadero valor? Exploramos las races de esta aparente paradoja.
Subconjuntos relevantes.
Usted puede haber odo la vieja broma sobre el estadstico que se ahog
vadear un ro. El saba que el ro era un metro de profundidad... en promedio.
La broma funciona (en lo que va), ya que cualquiera puede ver que la
estadstica era una locura para considerar slo la profundidad media del ro.
Seguramente en algn momento pudo ver que el agua estaba peligrosamente
profunda y sin embargo sigui adelante, presumiblemente, tranquilizado por la
sofisticacin de su investigacin en la profundidad del ro.
El estadstico de la broma no hizo uso de la profundidad correspondiente del ro
en su ubicacin para informar a sus acciones. La falacia fundamental confianza
implica una confusin similar: la confusin de las propiedades promedio de un
procedimiento de confianza con lo que se sabe acerca de un intervalo de
confianza determinado. Considere el ejemplo de submarinos: si tuviramos que
saber que el ancho del intervalo de confianza del CP1 tena una anchura de 9
metros, debemos Informe de confianza del 50% en el intervalo, o el 100% de
confianza? Es un CI 50% en el sentido de que se genera a partir de un
procedimiento de confianza 50%. Si restringimos nuestra atencin a intervalos
de 9 metros de ancho, sin embargo, nos encontramos con que el 100% de
estos intervalos contienen el valor verdadero.
Fisher (1959b) argumenta que las declaraciones de probabilidad como las que
anteriormente estaban plagado de errores fundamentales. En particular, al

observar los datos, se puede ver que los datos observados se encuentran parte
de un subconjunto del espacio de datos (es decir, datos posibles) para los que
la IC tiene una probabilidad diferente de la que contiene el verdadero valor de
la probabilidad media. En el ejemplo de submarino, estos subconjuntos pueden
ser identificados por lo lejos que estaban las burbujas. En casos como estos, el
subgrupo en el que la cada de datos pertinentes para determinar la
probabilidad de que el CI contiene el valor verdadero; por lo tanto, estos
subconjuntos especiales de los datos se llaman subconjuntos pertinentes
(Buehler, 1959; Buehler y FEDDERSEN, 1963; Casella, 1992; Robinson, 1979).
La existencia de subconjuntos pertinentes indica un fallo de adecuadamente
acondicionado en los datos: no es la informacin en datos que no se est
utilizando. Al no utilizar esta informacin relevante, los investigadores creen
que la falacia Confianza Fundamental se encuentran cerrando los ojos a los
aspectos importantes de los datos. Alguien que quera hacer un buen uso de
sus datos seguramente no querr utilizar un intervalo que admiti
subconjuntos pertinentes, ya que se incurrira haciendo caso omiso de lo que
se pudo ver claramente en los datos. Por otra parte, si uno cree que la falacia
confianza fundamental, la existencia de subconjuntos pertinentes puede causar
estados de confianza mutuamente contradictorias
Aunque no hay nada acerca de ellos mismos procedimientos de confianza que
impiden subconjuntos relevantes - su objetivo es un rendimiento promedio de
reserva de largo plazo, no para apoyar inferencias razonables, especficas podemos crear un procedimiento que elimina los subconjuntos relevantes en el
ejemplo sumergible. Intervalos bayesianos llamados intervalos de credibilidad
tienen en cuenta todos los datos a travs del condicionamiento. Si tomamos el
50% central de los intervalos marcados "posterior" en la Figura 2, se obtiene el
siguiente intervalo de credibilidad
Los intervalos de credibilidad para el primer y segundo escenarios de rescate
submarino se muestran en la Figura 2 a lo largo de la lnea denominada "Cred.
Int. "Ntese que el intervalo de credibilidad Bayesiano rastrea adecuadamente
la precisin dada por los datos (como se muestra por la posterior). Por cierto,
este procedimiento bayesiano produce otro procedimiento de confianza del
50%.
Es claro que para un cientfico cuidado sobre todo en lo que los datos en la
mano dicen acerca del parmetro, el intervalo bayesiano es preferible. El
intervalo bayesiano no pasa por alto la informacin en los datos dejando
subconjuntos pertinentes; no puede incluir valores imposibles; y su estrechez
es directamente proporcional a la precisin de derivan de los datos. Se deriva
de la distribucin posterior bayesiana, que es una declaracin nica sobre la
incertidumbre sobre el parmetro, dados los datos y un destino anterior. En
contraste, los intervalos de confianza no son exclusivos; para cualquier

problema dado, puede haber varios procedimientos de confianza mutuamente


contradictorias. Por ltimo, el intervalo bayesiano, a travs de su uso de un
antes, tiene la interpretacin de que los defensores del deseo: que la
plausibilidad que el verdadero valor se encuentra dentro del intervalo es de
50%.
Vamos a explorar las propiedades de los procedimientos bayesianos en la
discusin; por ahora, se presenta un escenario que ser ms familiar para los
investigadores psicolgicos: datos normales con intervalo de confianza t de
Student.
Example 2:
El ejemplo submarino fue diseado especficamente para mostrar cmo cada
uno de los tres grandes afirmaciones acerca de los intervalos de confianza
fallan. Muchos usuarios de IC, sin embargo, nunca se encontrarn con un
problema de este tipo. Sus datos son ms o menos normal y as que utilizan el
intervalo confianza t de Student casi exclusivamente. Como argumentaremos
en la discusin, esto no hace que el argumento en contra de IC menos potente:
IC se recomiendan como una herramienta inferencial general, por lo que
debera funcionar en general. Si las IC slo aparecen para tomar buenas
inferencias en un pequeo nmero de situaciones circunscritas, su base lgica
es sospechoso. Por otra parte, los propenents los IC a menudo declaran
directamente o dar a entender que todas las PC tengan las propiedades
errneamente atribuidos a los mismos, en virtud de los cuales son elementos
de configuracin (vase, por ejemplo, indirectamente, Cumming, 2014, que
establece que estas propiedades "se aplican en general a cualquier IC ").
Resulta, sin embargo, que las conclusiones contradictorias causadas por
subgrupos relevantes se producen incluso con intervalo de confianza t de
Student popular.
Considere una situacin en la que N = 2 observaciones deben ser extradas de
una distribucin normal con media desconocida Y la desviacin estndar como
se indic anteriormente, el procedimiento de la confianza t tpica 50% de
Student para estos datos es

o simplemente la observacin mnima para la observacin mxima. El hecho de


que este es un procedimiento de confianza 50% implica que si observamos los
datos, calcular la IC, y luego hacer la reclamacin dicotmica "el CI contiene el
valor verdadero," - o, alternativamente, "el CI no contiene el verdadero valor
"nuestro reclamo ser correcto el 50% de las veces, en promedio. Si existen
subconjuntos relevantes, entonces podemos encontrar una manera de mejorar
nuestra precisin superior al 50% de respuestas correctas utilizando slo la
informacin en los datos.

Aunque no nos apuntamos con anterioridad a cabo, ya hemos presentado las


pruebas de subconjuntos relevantes utilizando intervalos de t de Student. Si
reexaminemos Figura 1, es evidente que los intervalos de cerca de la parte
inferior de la figura - los intervalos cortos - casi nunca contienen el valor
verdadero. Los intervalos ms largos cerca de la parte superior, por el
contrario, casi siempre contienen el valor verdadero. En general, la
probabilidad de que una de la t de Student CI contiene el valor real es una
funcin creciente del error estndar.
Para explotar este hecho, se requiere una forma de separar intervalos cortos de
los largos. Buehler (1959) sugiri una estrategia simple para mejorar la
exactitud del 50% de los IC: escoger un nmero positivo - cualquier nmero
positivo har - y si la desviacin estndar muestral s es mayor que este
nmero, afirmar que el intervalo contiene el verdadero valor. Si la desviacin
estndar es ms pequeo sea el nmero seleccionado, afirmar que el intervalo
excluye el valor verdadero. No importa cul sea la verdadera media, desviacin
estndar real, y positivas nmero uno selecciona, esta estrategia dar lugar a
una tasa de xito superior al 50% para la seleccin de los intervalos que
aparecen o no contienen el valor verdadero.
Hasta dnde puede aumentar su precisin por encima de la tasa correcta 50%
nominal para el intervalo de confianza? La exactitud de la estrategia depende
del nmero que ha seleccionado para separar los intervalos cortos de los
largos. Si el nmero que ha seleccionado est cerca: 67 ?, se puede ganar
alrededor de 3/4 del tiempo. Su exactitud caer como su criterio mueve ms
lejos de este valor ptimo. La prueba de este hecho no es proporcionado por
Buehler (1959), pero hemos proporcionado en el suplemento porque va a
ayudar a entender por qu surgen los subconjuntos relevantes.
Teniendo en cuenta que su exactitud depende de lo bien que se puede adivinar
la verdadera desviacin estndar de la poblacin? podra parecer que el
aumento de su precisin superior al 50% requiere informacin previa sobre?. Es
importante hacer hincapi en que la probabilidad de que ests en lo correcto
con la estrategia de Buehler es siempre superior al 50%, no importa cul es el
criterio. Es cierto, sin embargo, que est limitada en 0.5. Si est muy, muy
lejos en su conjetura de? entonces su exactitud ser insignificantemente mayor
que 50%. Esta acotacin ha llevado estadsticos para llamar a este subconjunto
relevante un subconjunto semirelevante (Buehler,1959; Robinson, 1979), que
normalmente se considera menos problemtico que subconjuntos totalmente
pertinentes, donde la probabilidad est limitada lejos de 50%. Esto podra
causar una a sospechar que el problema no es tan malo como podra parecer;
Ciertamente, el problema con intervalos de t de Student no parece tan grave
como lo fue con el CI en el ejemplo de rescate de submarinos.
Hay dos respuestas a esta defensa del intervalo de confianza t de Student. En
primer lugar, como seala Buehler (1959), la informacin sobre el error en las

mediciones de uno - lo que estas medidas podran ser - es precisamente el tipo


de informacin que se sabe que es un experimentador competente, y que
obtendra un acuerdo aproximada a travs de los experimentadores. No se
necesita un conocimiento muy especializado de? para aumentar su precisin
sustancialmente por encima de 50%. Si, por ejemplo, usted subestima? por un
factor de 10 - una gran subestimacin que sospechamos que la mayora de los
experimentadores sera capaz de superar - la precisin seguir siendo
alrededor del 55%. Un estadstico puede encontrar este subconjunto semicorrespondiente, menos interesante, pero un cientfico que trata de hacer
inferencias razonables y exactas debe encontrar lo desconcertante.
a segunda respuesta a la defensa contra subconjuntos semirelevantes t de CI
del estudiante es que, de hecho, t de Student CI admite subconjuntos
totalmente pertinentes. Se presenta la primera semirelevantes para mayor
claridad conceptual. Considere el siguiente esquema, propuesto por Pierce
(1973). Supongamos que la muestra n = 2 observaciones de una poblacin
normal con media y varianza desconocida, a continuacin, calcular intervalo de
confianza t de Student 50%. A continuacin, realizar simultneamente una
prueba t de dos caras en contra de la hiptesis nula de que miu = 0 (es
irrelevante si o no estamos interesados en la hiptesis de que miu = 0). Si el
valor p para la prueba t es mayor que 0,25, entonces la probabilidad de que el
intervalo de confianza del 50% contiene el valor verdadero es mayor que o
igual a 2/3, independientemente de la verdadera media y la desviacin
estndar de la poblacin. De una manera similar, pero ms dramtica al (1959)
ejemplo de Buehler, el procedimiento de selecciona para grandes IC exigiendo
un valor p grande
(1973) subconjunto relevante de Pierce muestra que incluso con un intervalo
de confianza t de Student, se podra afirmar con un 50% de certeza de que la
verdadera media est dentro del CI, y al mismo tiempo saben que los datos se
encuentran parte de un subconjunto relevante para las que EC contienen el
verdadero decir, con una probabilidad de al menos 2/3. Procedimientos de
confianza fallan, ya que pueden ofrecer consejos contradictorios sobre la
confianza que debemos ser que el verdadero valor se encuentra dentro del
intervalo. De hecho, los procedimientos de confianza no fueron diseados para
dicho asesoramiento. Los procedimientos de confianza estn diseados
simplemente para permitir que el analista haga ciertos tipos de estados
dicotmicas acerca de si un intervalo contiene el valor verdadero, de tal
manera que las afirmaciones son ciertas una proporcin fija del tiempo en
promedio (Neyman, 1937). Esperando que hagan todo lo dems es esperar
demasiado simplemente
Inference without Relevant Subsets

Subconjuntos pertinentes amenazan la coherencia y la singularidad de


inferencias frecuentistas con intervalos de confianza y pueden ser

considerados como un ejemplo de un problema ms general, el problema de la


clase de referencia (Venn, 1888). de probabilidad se define como una
proporcin de largo plazo, o el nmero de eventos que se producen con una
propiedad especificada (por ejemplo, las EC que contienen el valor verdadero)
de alguna clase de referencia de los acontecimientos. Si hay subconjuntos
pertinentes, a continuacin, hay varios estados de probabilidad que podramos
hacer (Fisher, 1959a), dependiendo de la clase de referencia que elegimos.
El ejemplo submarino hace que las implicaciones claras. Es nuestra clase de
referencia todos los elementos de configuracin, en cuyo caso el 50% de los IC
contendr el verdadero valor? O es nuestra clase de referencia todas las IC con
una anchura determinada, en cuyo caso cualquier lugar del 0% (IC de muy
estrechos) a 100% (IC de manga superior a 5 metros)? De cualquier
declaracin de confianza es vlida, desde una perspectiva frecuencista, sino
que se contradicen entre s.
Parece claro que las clases de referencia restringidas son los preferibles:
cuando sea posible, nuestras conclusiones deben basarse en las descripciones
ms especficas de los datos posibles. Uno podra estar tentado a tratar de
resolver el problema simplemente: si nuestros datos son parte de un
subconjunto pertinente conocida, entonces deberamos condicionamos nuestra
inferencia en ese hecho. En (1973) ejemplo de Pierce anterior, si p> .25
entonces debemos informar de una de confianza mayor que o igual a 2/3. Sin
embargo, esta no es la solucin; una observacin puede ser miembro de varios
subconjuntos pertinentes superpuestas, y entonces el problema clase de
referencia asoma su fea cabeza de nuevo.

Anda mungkin juga menyukai