_______________________________________________________________ Apuntes: La comprobacin emprica de las hiptesis. Fras Navarro, D. (2008). Mtodos y Diseos de Investigacin, 2008-09. Facultad de Psicologa. Universidad de Valencia. (http://www.uv.es/friasnav/ )
1 Citar como: Fras-Navarro, D. (Diciembre, 2008). Evaluacin emprica de las hiptesis. Universidad de Valencia. http://www.uv.es/friasnav
Evaluacin emprica de las hiptesis Fras-Navarro, Dolores Universidad de Valencia Espaa
En el proceso del diseo de investigacin un elemento clave es la evaluacin emprica de las hiptesis. En los ltimos aos la evaluacin emprica de las hiptesis siempre va acompaada de los trminos basada en la evidencia. El trmino evidencia (en realidad la traduccin al castellano de evidence es prueba) est de moda en los ttulos de los trabajos de investigacin. Podemos decir que el trmino se ha convertido en un icono, en un lema que todo investigador que se precie debe seguir. Porque quin podra estar en contra de basar las decisiones en la evidencia o en pruebas? Lo que s est claro es que existen diferentes grados de evidencia vinculados con el tipo de metodologa utilizada en el diseo de investigacin donde el ensayo aleatorizado y controlado (metodologa experimental) ocupa la primera posicin como la regla de oro de los diseos, aportando las pruebas de mayor calidad y asegurando con ello, en gran medida, la validez de las relaciones encontradas entre las variables. Inferencia estadstica Una afirmacin emprica es posiblemente verdadera y posiblemente falsa. Para poder establecer su veracidad procedemos a la recoleccin de datos. En la mayor parte de las ocasiones el proceso de evaluacin emprica de las hiptesis se realiza mediante un modelo de decisin probabilstica a travs de la ejecucin de una prueba o test de significacin estadstica. La forma ms comn consiste en ejecutar la prueba de significacin de la hiptesis nula (Null Hypothesis Significance Testing, NHST). Este Mtodos y diseos de investigacin M Dolores Fras Navarro. Curso 2008-2009.
_______________________________________________________________ Apuntes: La comprobacin emprica de las hiptesis. Fras Navarro, D. (2008). Mtodos y Diseos de Investigacin, 2008-09. Facultad de Psicologa. Universidad de Valencia. (http://www.uv.es/friasnav/ )
2 procedimiento tiene una larga historia y una gran tradicin en su aplicacin por parte de los investigadores pero tambin ha recibido muchas crticas (vase una revisin en Nickerson, 2000 y Pascual, Fras y Garca, 2000) que han provocado cambios importantes en las normas de publicacin cientfica desde finales del siglo XX dando lugar a la denominada reforma estadstica. El propio grupo de trabajo de inferencia estadstica de la American Psychological Association (Wilkinson and the Task Force on Statistical Inference, 1999) propone en su informe final acompaar las pruebas de significacin estadstica con otros mtodos estadsticos como el tamao del efecto y sus intervalos de confianza o la aplicacin de la estadstica bayesiana. Es esencial, en opinin del grupo de trabajo, informar del tamao del efecto y su intervalo de confianza e interpretarlo dentro del contexto de los valores de tamao del efecto obtenidos en investigaciones previas (p. 599). Dicho informe provoc cambios importantes en las recomendaciones de la quinta edicin del Manual de Publicacin de la American Psychological Association (2001), destacando la necesidad de acompaar siempre los resultados del trabajo con la estimacin del tamao del efecto o de la magnitud de la relacin entre las variables. Como consecuencia, las polticas editoriales de las revistas tambin incluyen nueva normativa sobre los anlisis estadsticos y se han creado lneas de investigacin especficas para el desarrollo de software que contenga las tcnicas que los grandes paquetes estadsticos an no han incluido en los mens de su software como es el caso del SPSS. El siglo XXI comienza con un espritu de reforma estadstica que paulatinamente va cobrando fuerza y presencia en las publicaciones cientficas. La reforma estadstica cambia el punto de mira desde cun probable o improbable es el resultado muestral hacia dos cuestiones principalmente: cmo de grande es el tamao del efecto detectado y si se puede replicar. Es decir, hay que evaluar el valor del tamao del efecto estimado y situarlo en el contexto ms amplio de otras investigaciones de la misma temtica comparado e integrando los resultados de forma explcita y directa. Hay que tener en cuenta que la cuanta del tamao del efecto remite a su no trivialidad, pero no necesariamente; por ejemplo, un efecto pequeo en reduccin de muertes puede ser ms importante que otro ms grande en reduccin de Mtodos y diseos de investigacin M Dolores Fras Navarro. Curso 2008-2009.
_______________________________________________________________ Apuntes: La comprobacin emprica de las hiptesis. Fras Navarro, D. (2008). Mtodos y Diseos de Investigacin, 2008-09. Facultad de Psicologa. Universidad de Valencia. (http://www.uv.es/friasnav/ )
3 grasa corporal. Adems, la replicabilidad del efecto supone evaluar cun estables son los efectos en la literatura revisada y por lo tanto evaluar en qu medida son efectos directamente comparables. En definitiva, el nuevo comportamiento del investigador supone desarrollar el denominado pensamiento meta-analtico (Cumming y Finch, 2002). Sin embargo, la conducta de los investigadores no llega a consolidar las prcticas de la nueva prctica estadstica (Vacha-Haase, Nilsson, Reetz, Lance y Thompson, 2000). Seguramente los investigadores an no han reflexionado sobre la cuestin de que seguramente Dios ama al 0.06 (nivel de significacin estadstica) tanto como al 0.05 (Rosnow y Rosenthal, 1989, p.1277). Modelo tradicional de decisin estadstica: procedimiento de significacin de la hiptesis nula (NHST) En gran parte de las ocasiones, la meta principal de la investigacin es hacer una inferencia sobre un efecto en una poblacin a partir de los datos de una muestra que slo nos interesa como indicador de lo que ocurre en la poblacin. Se trata de un proceso de inferencia estadstica. El cientfico no puede verificar una teora pero s refutarla. El modelo tradicional de decisin estadstica implica definir dos hiptesis estadsticas que entran en competencia: la denominada Hiptesis Nula (H 0 ) o de nulidad de efectos que tpicamente mantiene que no hay efecto del tratamiento (efecto cero) o ausencia de relacin entre las variables (correlacin cero) y la Hiptesis Alternativa (H 1 ) que postula que s hay efecto (efecto diferente a cero) o s existe relacin entre las variables (correlacin diferente de cero) (ver Tabla 1). Cohen (1994) llam a la hiptesis nula de efectos cero la nil hypothesis frente a otras hiptesis nulas de efectos diferentes de Mtodos y diseos de investigacin M Dolores Fras Navarro. Curso 2008-2009.
_______________________________________________________________ Apuntes: La comprobacin emprica de las hiptesis. Fras Navarro, D. (2008). Mtodos y Diseos de Investigacin, 2008-09. Facultad de Psicologa. Universidad de Valencia. (http://www.uv.es/friasnav/ )
4 cero (non-nil hypothesis). Una nil hypothesis plantea que la correlacin o la diferencia de medias es literalmente cero.
Tabla 1. Hiptesis Nula/Hiptesis Alternativa HIPTESIS NULA HIPTESIS ALTERNATIVA Asume que no hay diferencias entre las poblaciones de los grupos. Es decir, el efecto en la poblacin es cero. Por lo tanto: 1) Las pequeas diferencias encontradas en las poblaciones sern debidas al azar 2) Las grandes diferencias ocurrirn en muy pocas ocasiones y sern tambin por azar Hay diferencias entre las poblaciones de los grupos. El efecto en la poblacin es diferente de cero. Por lo tanto: 1) Las pequeas o grandes diferencias estn provocadas por el efecto del tratamiento
Las hiptesis estadsticas son afirmaciones sobre parmetros de la poblacin como por ejemplo una media (H 0 : ! 1 = ! 2 ) o una proporcin y no son hiptesis sobre una muestra. La meta del procedimiento de decisin estadstica es por lo tanto evaluar si se puede o no rechazar la hiptesis nula (H 0 ) con un cierto grado de plausibilidad. En el caso de rechazar la hiptesis nula entonces se podr aceptar la hiptesis alternativa y aqu comienzan ya una de las crticas ms fuertes al procedimiento de significacin estadstica: aportar conclusiones sobre la hiptesis alternativa cuando es la hiptesis nula la que se postula en la decisin estadstica. Errores estadsticos Dentro del modelo de decisin estadstica se trabaja con un cierto grado de incertidumbre estadstica elegido por el investigador a priori mediante un criterio de decisin probabilstica conocido como alfa (!) o error de Tipo I (probabilidad de rechazar la hiptesis nula siendo realmente verdadera, es decir, cuando la diferencia entre las poblaciones est realmente provocada por el azar) (ver Tabla 2.). Es el nivel de significacin estadstica. Mtodos y diseos de investigacin M Dolores Fras Navarro. Curso 2008-2009.
_______________________________________________________________ Apuntes: La comprobacin emprica de las hiptesis. Fras Navarro, D. (2008). Mtodos y Diseos de Investigacin, 2008-09. Facultad de Psicologa. Universidad de Valencia. (http://www.uv.es/friasnav/ )
5 Tabla 2. Errores estadsticos y decisiones correctas Realidad del fenmeno Decisin estadstica H0 cierta p(H0) = 1 H1 cierta p(H0) = 0 Mantener la Hiptesis Nula Nivel de confianza (1 - alfa) Error de Tipo II (beta, ) Rechazar la Hiptesis Nula Error de Tipo I (alfa, Nivel de significacin) Potencia estadstica (1 beta)
Tradicionalmente el nivel de alfa mximo se ha fijado en 0.05 o en el 5%, es decir, cinco veces de cada cien se rechazar la hiptesis nula siendo realmente cierta. El resultado de 1 alfa es la probabilidad de mantener la hiptesis nula cuando realmente es verdadera (por ejemplo es el nivel de confianza de 0.95 cuando alfa es 0.05). El riesgo de no rechazar la hiptesis nula cuando realmente es falsa se conoce como beta (!) o error de Tipo II (probabilidad de mantener la hiptesis nula cuando realmente es falsa, es decir existe una diferencia real entre las poblaciones) y tambin se puede estimar evaluando la denominada potencia estadstica de la prueba estadstica o la probabilidad de rechazar la hiptesis nula cuando realmente es falsa. La potencia estadstica es 1 beta. En general, desde un punto de vista de planificacin de la investigacin, el valor mximo de beta se sita en 0.20 (por lo tanto potencia estadstica de 0.80). Sin embargo, a diferencia del valor de alfa (fijado a priori por el investigador) el investigador no tiene control directo del valor exacto de beta hasta que se ejecuta la prueba estadstica y slo puede planificarlo en funcin de una serie de parmetros como tamao del efecto, nmero de observaciones y alfa. De ah que cualquier cambio que se produzca en los datos respecto a tamao del efecto y nmero de observaciones afectar al valor de potencia estadstica a posteriori, es decir el obtenido en la investigacin. Dependiendo del contexto de investigacin, el tamao del efecto puede ser la diferencia entre medias de dos grupos o la correlacin entre dos variables. Como se observa, en el proceso de decisin estadstica se admite un mayor grado de error de Tipo II que de Tipo I, en concreto cuatro veces ms de error beta que de alfa. Es preferible no concluir que existe un efecto, aunque s exista, que hacer afirmaciones de efectos que realmente no se han producido. Mtodos y diseos de investigacin M Dolores Fras Navarro. Curso 2008-2009.
_______________________________________________________________ Apuntes: La comprobacin emprica de las hiptesis. Fras Navarro, D. (2008). Mtodos y Diseos de Investigacin, 2008-09. Facultad de Psicologa. Universidad de Valencia. (http://www.uv.es/friasnav/ )
6 La decisin de rechazar o no rechazar la hiptesis nula se realiza comparando la probabilidad de los datos obtenidos en la investigacin bajo el modelo de la hiptesis nula o de efectos cero (valor p de probabilidad) con el nivel de alfa elegido por el investigador. Si la probabilidad de los datos obtenidos en la investigacin, asumiendo que la hiptesis nula es cierta, es menor o igual al valor de incertidumbre asumido a priori en el diseo de investigacin (nivel de alfa) entonces se rechaza la hiptesis nula con ese margen de error o equivocacin en la decisin estadstica. Por lo tanto, el valor p es la probabilidad del resultado obtenido (o un resultado ms extremo) asumiendo que la hiptesis nula es cierta. As: -Si p = 1 entonces es completamente cierto que el dato obtenido pertenece a una distribucin que plantea la igualdad de las poblaciones (hiptesis nula). -Si p = 0 entonces es absolutamente imposible que el dato obtenido pertenezca a la distribucin que plantea la igualdad de las poblaciones (hiptesis nula) y por lo tanto pertenecer a la hiptesis alternativa que mantiene la diferencia entre las poblaciones. Evidentemente no hay dos grupos que sean exactamente iguales antes del tratamiento. Incluso aunque se utilice la asignacin aleatoria existirn diferencias individuales o cuestiones de muestreo que provocarn cierta variabilidad. La tcnica estadstica determina la probabilidad de que las diferencias observadas entre los grupos podran ser debidas al mismo proceso de asignacin aleatoria de las unidades experimentales que forman los grupos. Si la probabilidad (valor p) de encontrar dichas diferencias es baja entonces se asume que las diferencias entre los grupos estn causadas por el efecto del tratamiento y por lo tanto se rechaza la hiptesis nula. Si la probabilidad de encontrar diferencias debido al proceso de asignacin aleatoria es alta entonces la explicacin del azar es la mejor eleccin y por ello se mantiene la hiptesis nula o de nulidad de efectos en la poblacin. Decidir qu es una probabilidad alta o una probabilidad baja depende del valor que se seleccione a priori como alfa. Se considera que la probabilidad es baja cuando p es menor o igual a alfa y se considera que la probabilidad es alta cuando el valor de p es mayor al de alfa. En definitiva, la decisin estadstica (Mantener H 0 o Rechazar H 0 ) supone valorar si el Mtodos y diseos de investigacin M Dolores Fras Navarro. Curso 2008-2009.
_______________________________________________________________ Apuntes: La comprobacin emprica de las hiptesis. Fras Navarro, D. (2008). Mtodos y Diseos de Investigacin, 2008-09. Facultad de Psicologa. Universidad de Valencia. (http://www.uv.es/friasnav/ )
7 valor del efecto observado en la muestra es improbable bajo el modelo de la hiptesis nula en cuyo caso se rechaza la hiptesis nula. El valor de improbable (o probable) lo valoramos al comparar el valor p de probabilidad con el valor de alfa. De este modo: -Si p ! alfa entonces entra en la categora de improbable bajo el modelo de la hiptesis nula, asumiendo cierto error de Tipo I. Rechazamos la hiptesis nula y por lo tanto existe un efecto diferente de cero. Si el valor de alfa es igual a 0.05 entonces diremos que el efecto es estadsticamente significativo al 0.05 o al 5%. -Si p > alfa entonces no hay suficiente evidencia para rechazar la hiptesis nula y por lo tanto mantenemos que el resultado pertenece a la distribucin de dicha hiptesis hasta que se demuestre lo contrario. Las diferencias encontradas es muy probable que se deban al azar. Se mantienen la hiptesis nula, es decir, el efecto encontrado no es estadsticamente significativo. La denominada significacin estadstica estima la probabilidad, valor p, de los resultados muestrales dado el tamao de la muestra y asumiendo que dicha muestra procede de una poblacin descrita por la distribucin de la hiptesis nula (Cohen, 1994; Thompson, 1996). Por ejemplo, tenemos dos muestras con dos medias diferentes en una determinada variable. El investigador puede conocer si esa diferencia es slo azarosa o ha sido producida por algn proceso sistemtico. Si las dos muestras fueron configuradas a partir de una misma poblacin donde el parmetro de inters es distribuido normalmente, las leyes de la probabilidad permiten cuantificar la probabilidad condicional de la diferencia en los valores de los parmetros muestrales. Si la diferencia es muy improbable el investigador tiene dos opciones: concluir que ha ocurrido una diferencia improbable o concluir que la diferencia tiene otras causas adems de la variacin aleatoria. El rechazo de la hiptesis nula opta por la segunda opcin, sujeta tambin a error dado que podra tratarse nicamente de variacin muestral aleatoria (Error de Tipo I). Por lo tanto, y siguiendo el modelo tradicional de comprobacin de hiptesis, cuando se ejecuta la prueba de significacin estadstica, la hiptesis cientfica gana o pierde credibilidad a partir de los resultados de un contraste estadstico que somete a prueba el rechazo o no rechazo de la hiptesis nula, asumiendo desde el primer momento Mtodos y diseos de investigacin M Dolores Fras Navarro. Curso 2008-2009.
_______________________________________________________________ Apuntes: La comprobacin emprica de las hiptesis. Fras Navarro, D. (2008). Mtodos y Diseos de Investigacin, 2008-09. Facultad de Psicologa. Universidad de Valencia. (http://www.uv.es/friasnav/ )
8 que es una hiptesis cierta. El rechazo de la hiptesis nula supondr hacer inferencias sobre qu hiptesis alternativa es la que mejor explica los hallazgos. Si en el diseo de investigacin se han controlado adecuadamente las amenazas a la validez de los hallazgos habr que suponer que los efectos se deben a la hiptesis alternativa formulada en el estudio (siempre con un margen de error de Tipo I). Nunca se somete a contraste estadstico la hiptesis alternativa y es este punto el que inicia una lnea de crticas especialmente duras al proceso clsico de inferencia estadstica junto con la escasa credibilidad que la hiptesis nula tiene para el investigador (tamao del efecto de cero). Hasta aqu se ha presentado el procedimiento estndar que se utiliza para evaluar empricamente las hiptesis. Sin embargo, la interpretacin de los resultados aportados por la prueba de significacin estadstica no es unnime por parte de los investigadores. Realizado el proceso de decisin estadstica falta que el investigador interprete los hallazgos y aqu sus creencias y atribuciones sobre el significado y alcance de los resultados no siempre son correctas. El factor humano se convierte en tema de debate sobre los usos y abusos por parte de los investigadores de las pruebas de significacin estadstica (Monterde, Pascual y Fras, 2006; Oakes, 1986). Pongamos un ejemplo. Siguiendo el estudio clsico de Oakes (1996), se presento a una muestra de investigadores un listado de siete afirmaciones sobre la interpretacin de los resultados del contraste estadstico donde se obtuvo que el valor de p = 0.01 (p < alfa). Cada uno de ellos deba valorar el listado de afirmaciones siguiente como verdadera o falsa: a) La hiptesis nula es absolutamente rechazada b) Se ha determinado la probabilidad de la hiptesis nula c) La hiptesis alternativa es absolutamente rechazada d) Se ha deducido la probabilidad de la hiptesis alternativa e) Se conoce la probabilidad de que sea errnea la decisin f) Una replicacin posterior tendra 0.99 de probabilidad de ser significativa g) La probabilidad de obtener ese dato o ms extremo si la hiptesis nula es cierta De las seis afirmaciones anteriores slo la ltima es cierta. La confusin entre la Mtodos y diseos de investigacin M Dolores Fras Navarro. Curso 2008-2009.
_______________________________________________________________ Apuntes: La comprobacin emprica de las hiptesis. Fras Navarro, D. (2008). Mtodos y Diseos de Investigacin, 2008-09. Facultad de Psicologa. Universidad de Valencia. (http://www.uv.es/friasnav/ )
9 probabilidad de los datos asumiendo una hiptesis como cierta (p (D | H) y la probabilidad de la hiptesis dados ciertos datos (p (H | D) conduce a las interpretaciones errneas reflejadas en las opciones a, b, c, d y e. En la opcin f se confunde el valor de p con la potencia estadstica. El valor p de probabilidad informa de la probabilidad de los datos obtenidos dado que la hiptesis nula es cierta (p (D | H 0 ). Sin embargo, muchos investigadores siguen creyendo errneamente (opcin b de las afirmaciones anteriores) que el valor p de probabilidad es la probabilidad de que la hiptesis nula sea cierta dados los datos de la investigacin (p (H 0 | D). Una prueba de significacin estadstica ofrece la probabilidad posterior de los datos condicional a la verdad de la hiptesis sometida a contraste (la hiptesis nula). Por ello, las pruebas de significacin no son apropiadas cuando las muestras no han sido aleatoriamente configuradas de la poblacin. Las pruebas de significacin estadstica no ofrecen informacin de la probabilidad condicional de la hiptesis dados los datos obtenidos en la investigacin. Errneamente muchos investigadores creen que el valor p de probabilidad es el error de Tipo I o alfa observado en los datos. Sin embargo, no es cierto. El valor p de probabilidad es una medida de evidencia contra la hiptesis nula y no es una medida de apoyo a la hiptesis alternativa. El valor p depende de los datos del experimento, no es un valor fijo mientras que el valor de alfa no depende de los datos y s es un valor fijo que determina a priori el investigador. En definitiva, los problemas de interpretacin del alcance del proceso de decisin estadstica corresponden al factor humano y no a la prueba estadstica como procedimiento metodolgico. Es tarea de los docentes y de los manuales de metodologa explicar con precisin los conceptos implicados en la prueba de significacin estadstica. Sin embargo, el proceso de decisin estadstica s est sujeto a cuestiones metodolgicas que afectan a la validez de los resultados. Es el caso del tamao de la muestra o de la improbabilidad lgica de la hiptesis nula y su falta de plausibilidad. Cuestiones que abordaremos en otro momento. Mtodos y diseos de investigacin M Dolores Fras Navarro. Curso 2008-2009.
_______________________________________________________________ Apuntes: La comprobacin emprica de las hiptesis. Fras Navarro, D. (2008). Mtodos y Diseos de Investigacin, 2008-09. Facultad de Psicologa. Universidad de Valencia. (http://www.uv.es/friasnav/ )
10 Errores humanos implicados en el proceso de significacin estadstica Es cierto, resulta extremadamente difcil para los alumnos comprender el proceso de decisin estadstica y lo que realmente es la significacin estadstica y el valor p de probabilidad. Y no slo para los alumnos sino tambin para los profesores y profesionales de la Psicologa. Los procesos cognitivos implicados en la dificultad de comprensin de los conceptos que forma parte del proceso de decisin estadstica han sido analizados durante aos. Muchas estrategias de aprendizaje se han desarrollado para mejorar la comprensin pero los resultados no son alentadores. Una creencia errnea muy comn es confundir el valor p de probabilidad con el valor de alfa. Existe una gran confusin entre el valor p de probabilidad y el valor de alfa (error de Tipo I) del diseo. El valor p de probabilidad se calcula con los datos de la investigacin que se estn analizando en ese momento y refleja la probabilidad de los datos suponiendo que la hiptesis nula es cierta. Es un dato que slo se conoce a posteriori, es decir, cuando se ejecuta la prueba estadstica y por lo tanto est vinculado al valor obtenido con dicha prueba y los datos e indica la probabilidad de encontrar un resultado de la magnitud hallada en la investigacin (o mayor), condicional siempre a que la hiptesis nula sea cierta. Para calcular el valor p de probabilidad se necesita conocer la distribucin de la prueba estadstica bajo el modelo de la hiptesis nula (representada tpicamente en las tablas de los manuales de metodologa) y los grados de libertad del diseo de investigacin aplicado. El valor de alfa o error de Tipo I se fija a priori, antes de ejecutar la investigacin, y es una decisin que toma el investigador en funcin de la planificacin de su diseo de investigacin. Ese valor de alfa es la referencia que se utiliza como valor de comparacin con el valor p de probabilidad obtenido en el estudio para poder tomar la decisin estadstica. El valor p de probabilidad ni es la significacin estadstica ni tampoco seala la magnitud mayor o menor del efecto. El valor p de probabilidad es una medida de evidencia contra la hiptesis nula desde el modelo de Fisher, de tal modo que cuanto ms pequeo sea su valor mayor ser la evidencia. Desde el modelo de Neyman y Pearson se acompaa la hiptesis nula con la hiptesis alternativa y ahora hay que tomar la decisin de si se mantiene H 0 o en cambio Mtodos y diseos de investigacin M Dolores Fras Navarro. Curso 2008-2009.
_______________________________________________________________ Apuntes: La comprobacin emprica de las hiptesis. Fras Navarro, D. (2008). Mtodos y Diseos de Investigacin, 2008-09. Facultad de Psicologa. Universidad de Valencia. (http://www.uv.es/friasnav/ )
11 se rechaza a favor de H 1 . Aparecen entonces los conceptos de error de Tipo I y error de Tipo II. A partir de los dos modelos se crea un hbrido que se presenta en los manuales como el procedimiento de significacin estadstica donde el investigador realiza las siguientes consideraciones: 1. Formula la hiptesis nula (H0) y la hiptesis alternativa (H1). El procedimiento comienza con la asuncin de que la hiptesis nula es cierta. Sin embargo, realmente la meta es determinar si hay suficiente evidencia para inferir que la hiptesis alternativa es cierta 2. Establece el nivel de significacin (alfa) o el error de Tipo I a priori. Adems supuestamente se estima la potencia de la prueba estadstica (1-beta) teniendo en cuenta el tamao del efecto esperado y el tamao de la muestra 3. Se computa la prueba estadstica seleccionada por el investigador y se obtiene el valor p de probabilidad vinculado al valor del estadstico calculado 4 Finalmente se toma una decisin estadstica que conlleva cometer uno de los dos errores estadsticos: el error de Tipo I (rechazar una hiptesis nula verdadera) o el error de Tipo II (no rechazar una hiptesis nula falsa). Se establece la significacin estadstica utilizando el criterio de que si p ! alfa ese resultado es estadsticamente significativo con el margen de error de alfa y si p > alfa entonces el resultado no es estadsticamente significativo TESTIGO DE CARGO Vamos a utilizar la analoga entre la decisin del jurado en un juicio y el proceso de decisin estadstica para ofrecer una comparacin con un modelo de decisin que todos conocemos aunque sea por las pelculas o los documentales. Se va a utilizar como ejemplo de comparacin la clsica pelcula de Billy Wilder Testigo de Cargo (1957, Witness for the Prosecution) donde un afable personaje, Leonard Vole, es acusado del asesinato de una rica dama, la seora French, con quien mantena una relacin de carcter amistoso. El posible mvil del crimen es la herencia de una importante cantidad de dinero de la difunta. A pesar de que las pruebas en su contra son demoledoras, el prestigioso abogado criminalista de Londres Sir Wilfrid Roberts acepta su defensa al creer en su inocencia. Resulta imprescindible que el lector haga un visionado completo de la pelcula especialmente del momento donde se conocen Mtodos y diseos de investigacin M Dolores Fras Navarro. Curso 2008-2009.
_______________________________________________________________ Apuntes: La comprobacin emprica de las hiptesis. Fras Navarro, D. (2008). Mtodos y Diseos de Investigacin, 2008-09. Facultad de Psicologa. Universidad de Valencia. (http://www.uv.es/friasnav/ )
12 abogado y acusado (primera parte de la pelcula) y del final de la pelcula para abordar cono conocimiento la analoga del proceso de decisin estadstica. En un juicio con jurado el investigador acta como el fiscal o como acusacin particular y su objetivo es demostrar la falsedad de la hiptesis nula y como consecuencia la aceptacin de la hiptesis alternativa (culpabilidad del acusado). Los miembros del jurado y el juez son los encargados de evaluar la calidad de la evidencia aportada por el investigador. En el proceso de investigacin cientfica, la calidad de la evidencia aportada por un estudio es evaluada por otros investigadores, los denominados revisores de las revistas, los editores o los mismos lectores. El abogado defensor acta como revisor de la evidencia o pruebas aportadas por el fiscal tratando de mostrar los sesgos y deficiencias de dichas pruebas (validez), defendiendo la hiptesis nula (inocencia del acusado). El fiscal acta como defensor de la hiptesis alternativa y su tarea es aportar evidencias que apoyen la culpabilidad del acusado (presencia del efecto de tratamiento). Antes de iniciar un juicio es necesario que el juez valore que existe suficiente evidencia preliminar que incrimina al acusado (hiptesis alternativa) y por ello es necesario iniciar un juicio. La hiptesis alternativa es la razn por la que se arresta al acusado. Por ejemplo, para permitir una orden de arresto, el juez debe encontrar que hay una causa probable de que la persona ha cometido un crimen. Hay un mvil. Del mismo modo, para que un polica arreste a un individuo sin una orden judicial deber existir una causa razonable para creer que un crimen es inminente o que se acaba de cometer. En el proceso de investigacin cientfica se parte de una necesidad de conocimiento unida a una hiptesis sustantiva (generalmente vinculada a la hiptesis alternativa) que inicia el proceso de diseo estadstico. Todo proceso judicial comienza con la asuncin de que el acusado es inocente hasta que se demuestre lo contrario. Desde la fiscala o desde la acusacin particular se aportarn todas las pruebas que se encuentren durante el desarrollo del juicio y tengan calidad para demostrar que el acusado es culpable ms all de toda duda razonable (siempre podrn existir explicaciones o hiptesis alternativas pero sern muy improbables). Al final del juicio, el jurado y el juez tomarn una decisin: el acusado es No Culpable o el Mtodos y diseos de investigacin M Dolores Fras Navarro. Curso 2008-2009.
_______________________________________________________________ Apuntes: La comprobacin emprica de las hiptesis. Fras Navarro, D. (2008). Mtodos y Diseos de Investigacin, 2008-09. Facultad de Psicologa. Universidad de Valencia. (http://www.uv.es/friasnav/ )
13 acusado es Culpable (ver tabla 3). Tngase en cuenta que en un juicio nunca se concluye que el acusado es inocente, el veredicto es No Culpable. Es decir, no se han encontrado pruebas de suficiente calidad para poder declararlo culpable. En un proceso de decisin estadstica nunca se concluye que la hiptesis nula es cierta, slo se mantiene dado que hasta el momento la evidencia encontrada no permite rechazarla. Tabla 3. Sentencia y condicin del acusado Condicin real del acusado Sentencia del juez Inocente Culpable No Culpable Decisin correcta Decisin incorrecta Culpable Decisin incorrecta Decisin correcta
Por lo tanto, si las pruebas aportadas en el juicio no son suficientes para probar la culpabilidad ms all de una duda razonable entonces el acusado ser declarado No Culpable. El acusado es declarado Culpable cuando hay suficiente evidencia para probar su culpabilidad ms all de una duda razonable. En este caso, se podr apelar el veredicto. El proceso de investigacin cientfica se inicia porque previamente existe una justificacin terica que ha provocado una hiptesis sustantiva de investigacin que desea ser contrastadas con un rigor metodolgico (muestreo adecuado, planificacin de la potencia estadstica, eleccin del diseo). Hiptesis terica que se representa bajo la hiptesis alternativa. Inicialmente, en el proceso de decisin estadstica la hiptesis nula se asume como cierta (presuncin de inocencia del acusado) hasta que se demuestre su falsedad (su rechazo) ms all de una duda razonable (margen de error de Tipo I). En el proceso judicial y en el de decisin estadstica no es posible probar la verdad de forma absoluta o con total certeza. En el juicio el criterio de decisin es una duda razonable. Si hay una duda razonable sobre la culpabilidad del acusado entonces ser declarado no culpable. Pero si hay evidencia que sealan su culpabilidad ms all de una duda razonable entonces el acusado ser declarado culpable. En el proceso de decisin estadstica la hiptesis nula se mantiene como principio mientras no exista una duda razonable de su falsedad. Es decir, se asume como principio que la causa del Mtodos y diseos de investigacin M Dolores Fras Navarro. Curso 2008-2009.
_______________________________________________________________ Apuntes: La comprobacin emprica de las hiptesis. Fras Navarro, D. (2008). Mtodos y Diseos de Investigacin, 2008-09. Facultad de Psicologa. Universidad de Valencia. (http://www.uv.es/friasnav/ )
14 efecto detectado en los datos es la variabilidad aleatoria y no la causa que est siendo investigada por el investigador. El criterio para cambiar de decisin se fija con el nivel de alfa o probabilidad de Error de Tipo I. Por lo tanto, el ms all de una duda razonable viene marcado por la probabilidad de aceptar como verdadera la hiptesis alternativa cuando no lo sea (hiptesis nula realmente cierta) con un margen de error del 5% si se trabaja con alfa de 0.05. Es decir, obtener un resultado estadsticamente significativo indica que se ha encontrado suficiente evidencia para probar que la hiptesis nula no es verdadera ms all de una duda razonable (5% o 1%), proporcionando apoyo a la hiptesis alternativa. Un resultado estadsticamente no significativo puede estar provocado por la falta de potencia estadstica. Quizs el fiscal no encontr las mejores pruebas o las pruebas ms contundentes para declarar culpable al acusado. Por lo tanto, el acusado puede ser declarado No Culpable o Culpable; la hiptesis nula puede ser que se Mantenga o se Rechace. La hiptesis alternativa refleja que el acusado es culpable y supone rechazar el modelo de la hiptesis nula y como consecuencia aceptar la hiptesis alternativa. Y esto es una decisin que slo puede tomarse en funcin de la evidencia encontrada gracias al diseo de investigacin y la validez de los hallazgos. El jurado slo podr declarar culpable al acusado cuando haya suficiente evidencia o pruebas de calidad que apoyen su culpabilidad. Lamentablemente ni el sistema judicial ni la decisin estadstica son perfectos. Un jurado puede declarar Culpable a un inocente (ver tabla 3) o una decisin estadstica puede implicar rechazar la hiptesis nula cuando realmente es cierta. Se trata del error de Tipo I. Tambin puede ocurrir que el jurado no rechace la presuncin de inocencia porque no se aportaron suficientes pruebas de culpabilidad (no porque de verdad sea inocente). El veredicto de No Culpable, no equivale a inocente porque la inocencia no se prueba, slo se llega a la conclusin de que con las pruebas aportadas el acusado no puede ser declarado culpable. Quizs sea culpable, pero con la informacin disponible el veredicto es No culpable. Conviene tener en cuenta este aspecto porque la hiptesis nula tampoco se puede probar, slo se concluye que no se puede rechazar (o s se puede) pero nunca Mtodos y diseos de investigacin M Dolores Fras Navarro. Curso 2008-2009.
_______________________________________________________________ Apuntes: La comprobacin emprica de las hiptesis. Fras Navarro, D. (2008). Mtodos y Diseos de Investigacin, 2008-09. Facultad de Psicologa. Universidad de Valencia. (http://www.uv.es/friasnav/ )
15 se dir que se acepta la hiptesis nula. No se demuestra la verdad de la hiptesis nula. Otro problema de las decisiones judiciales es declarar no culpable a una persona realmente culpable. Una decisin estadstica puede implicar mantener la hiptesis nula cuando realmente es falsa. Se trata del error de Tipo II o beta. En general, el mximo de error de Tipo II est fijado en 0.20, es decir, es cuatro veces mayor que el error de Tipo I permitido. Podramos decir que es mucho ms grave declarar culpable a un inocente (error de Tipo I) que inocente a un culpable (error de Tipo II). En la Tabla 4 se resumen los elementos que permiten comparar el proceso de juicio y el proceso de decisin estadstica. El alumno debe completar la tabla de analoga. Tabla 4. Analoga entre el proceso de juicio y el de decisin estadstica PROCESO DE JUICIO PROCESO DE DECISIN ESTADSTICA Inicio Asuncin de inocencia del acusado Asuncin de que la hiptesis nula es cierta El objetivo del juicio El criterio para determinar la culpabilidad
Previo al proceso Durante el proceso Veredicto/Decisin
Decisin correcta Decisin incorrecta Calidad de la decisin Calidad de las pruebas aportadas
Mtodos y diseos de investigacin M Dolores Fras Navarro. Curso 2008-2009.
_______________________________________________________________ Apuntes: La comprobacin emprica de las hiptesis. Fras Navarro, D. (2008). Mtodos y Diseos de Investigacin, 2008-09. Facultad de Psicologa. Universidad de Valencia. (http://www.uv.es/friasnav/ )
16 -------------------------------------------------------------------------------------------------- Recortar las siguientes instrucciones y pegarlas en el portafolio. Despus completar la prctica. --------------------------------------------------------------------------------------
Trabajo de portafolio: 1.- El alumno deber realizar una reflexin sobre el proceso de decisin estadstica: en qu consiste, sus pasos y si interpretacin. 2.- Posteriormente completar la tabla de analoga y razonar sus decisiones (tabla 4). 3.- A continuacin recoger las escenas de la pelcula Testigo de cargo que considere vlidas para ejemplificar cada uno de los elementos del proceso de decisin estadstica. Puedes transcribir los dilogos o describir las escenas junto con su momento paralelo en el proceso de decisin estadstica. 4.- Se completar un apartado final donde se indicarn las horas dedicadas al trabajo propuesto incluyendo el tiempo de visionado de la pelcula. Y se cumplimentar el siguiente cuestionario: RECORTAR Y PEGAR EN EL PORTAFOLIO.
---------------------------------------------RECORTAR Y PEGAR------------------------------ HORAS DEDICADAS AL TRABAJO DE PORTAFOLIO DE LA PELCULA TESTIGO DE CARGO (incluido el tiempo de los visionados de la pelcula) _________HORAS Dificultad de la tarea propuesta en el portafolio Nada 1 2 3 4 5 6 7 8 9 Mucho 10 Satisfaccin con el trabajo realizado Nada 1 2 3 4 5 6 7 8 9 Mucho 10 Comprensin de los conceptos metodolgicos Nada 1 2 3 4 5 6 7 8 9 Mucho 10 Calidad de la pelcula elegida como ejemplo de la analoga Mala 1 2 3 4 5 6 7 8 9 Buena 10 Calidad de los apuntes tericos que acompaan a la prctica Escasa 1 2 3 4 5 6 7 8 9 Buena 10 Crees que vale la pena incluir esta prctica para comprender el proceso de decisin estadstica? Tacha la respuesta correcta segn tu opinin personal S NO LO TENGO CLARO NO Mtodos y diseos de investigacin M Dolores Fras Navarro. Curso 2008-2009.
_______________________________________________________________ Apuntes: La comprobacin emprica de las hiptesis. Fras Navarro, D. (2008). Mtodos y Diseos de Investigacin, 2008-09. Facultad de Psicologa. Universidad de Valencia. (http://www.uv.es/friasnav/ )
17
------------------------------------------------------------------------------------------------------ 5. El alumno sealar qu conceptos le han quedado ms claros con el ejemplo de la analoga. Es muy importante que el alumno seale qu conceptos conoca de forma errnea y definirlos errneamente tal y como pensaba antes y a continuacin cmo los entiende ahora. Es importante que anote el recurso de la analoga que le ha permitido avanzar en su comprensin. 7. Finalmente se realizar una valoracin personal de la experiencia y se apuntarn nuevas tareas o ejemplos para mejorar la comprensin del proceso de decisin estadstica. ___________________________________________