Anda di halaman 1dari 26

Una-puno ingeniería de minas estadística general

Contenido

Introducción ....................................................................................................... 4

Objetivos ............................................................................................................ 5

Pruebas no paramétrica ...................................................................................... 5

Clasificación de las pruebas no paramétricas ................................................. 5

Ejemplificación de las principales pruebas no paramétricas .......................... 5

Prueba de Chi-cuadrado (una muestra) .......................................................... 6

b. Prueba U de Mann-Whitney (2 muestras independientes) ......................... 6

c. Prueba de Wilcoxon (2 muestras relacionadas) ......................................... 6

d. Prueba de Kruskal-Wallis (k muestras independientes)............................. 7

e. Prueba de Friedman (k muestras relacionadas) .......................................... 7

métodos estadísticos no paramétricos ............................................................ 7

Prueba u de mann whitney ............................................................................. 8

Media y deviación estándar de la distribución muestreal para la prueba u de

mann whitney ...................................................................................................... 8

Valor z para normalizar la prueba u de mann whitney .................................. 8

prueba de independencia chi-cuadrada .......................................................... 8

Frecuencia teórica (o esperada según la lógica de Chi-Cuadrada .................. 9

Cálculo de residuos ........................................................................................ 9

Residuo ......................................................................................................... 10

1
Una-puno ingeniería de minas estadística general

Residuos Estandarizados .............................................................................. 10

Coeficiente Chi-Cuadrada de toda la tabla (Ejemplo Tabla 2x2) ................ 10

TABLA 1: (𝒓 × 𝒔) para la fórmula general del índice X2 ......................... 10

Fórmula suma de frecuencias columna genérica (j) ..................................... 11

Fórmula suma de frecuencias fila genérica (i) ............................................. 11

Sumatorio de todas las celdas ...................................................................... 11

Frecuencia esperada de una celda cualquiera ............................................... 11

Coeficiente Chi-Cuadrada de la tabla .......................................................... 11

Interpretación de Chi-Cuadrada en tablas bivariables ................................. 11

Distintas distribuciones Chi-Cuadrada para distintos grados de libertad ..... 12

Número de grados de libertad de una tabla bidimensional .......................... 12

Prueba de la distribución Chi-Cuadrada con los correspondientes grados de

libertad .............................................................................................................. 12

El valor crítico y nivel de significación de X2 ............................................. 13

Tabla Chi-Cuadrada. Distribución de X2..................................................... 14

prueba de independencia chi-cuadrada ........................................................ 14

Prueba de independencia .............................................................................. 19

Resumen ................................................................................................... 19

Correlación de rangos de spearman ............................................................. 19

Anova un factor y Kruskal-Wallis ............................................................... 21

2
Una-puno ingeniería de minas estadística general

Fórmulas básicas .......................................................................................... 22

Anova de un factor ....................................................................................... 24

Cálculo de la suma de cuadrados ................................................................. 24

Kruskal-Wallis ............................................................................................. 25

3
Una-puno ingeniería de minas estadística general

Introducción

En el ámbito de las Ciencias Sociales es habitual el uso de pruebas no


paramétricas puesto que existen muchas variables que no siguen las condiciones de
parametricidad. Dichas condiciones se refieren al uso de variables cuantitativas
continuas, distribución normal de las muestras, varianzas similares y tamaño de las
muestras, mayor a 30 casos. Estos criterios se recogen ampliamente en
Rubio y Berlanga (2012). En caso de que no se cumplan estos requisitos, y
sobre todo cuando la normalidad de las distribuciones de la variable en estudio
esté en duda y el tamaño de la muestra sea menor a 30 casos, el empleo de las
pruebas no paramétricas o de distribución libre está indicado.
Las pruebas no paramétricas reúnen las siguientes características:
1) son más fáciles de aplicar;
2) son aplicables a los datos jerarquizados;
3) se pueden usar cuando dos series de observaciones provienen de distintas
poblaciones;
4) son la única alternativa cuando el tamaño de muestra es pequeño
5) son útiles a un nivel de significancia previamente especificado.

4
Una-puno ingeniería de minas estadística general

Objetivos

 Conocer fórmulas de estadística


 Aplicar esas fórmulas en la minería
 Entender en qué casos puedo utilizarlo

Pruebas no paramétrica

Clasificación de las pruebas no paramétricas

La revisión de los principales autores que, en nuestro contexto, tratan la


clasificación de las pruebas no paramétricas pone de manifiesto una falta de
consenso a la hora de agrupar dichas pruebas. Ferrán (2002) las agrupa en
contrastes para una muestra y el resto en no paramétricas. Visauta (2007)
engloba todas las pruebas en no paramétricas, mientras que otros autores las
clasifican por tipo de muestra. También se aprecia como cada autor recoge un
número diferente de pruebas no paramétricas, así como el uso de terminología
también diferente para nombrarlas.
La intención de este artículo ha sido recoger por primera vez las aportaciones
de cada uno de estos autores para ofrecer una clasificación completa de las
pruebas no paramétricas (17 en total). En su clasificación se han asumido
dimensiones relacionadas con el número de muestras y la relación o
independencia entre esas muestras tal y como muestran las tablas 1 y 3. No se han
incluido las correlaciones no paramétricas a pesar de que determinados autores
las incluyen dentro de pruebas no paramétricas (Pérez Juste et al., 2009), con el
objetivo de recopilar solamente los contrastes no paramétricos.

Ejemplificación de las principales pruebas no paramétricas

Para mostrar las principales pruebas no paramétricas en SPSS tomamos como


ejemplo un estudio orientado a conocer la actitud del profesorado universitario

5
Una-puno ingeniería de minas estadística general

hacia las TIC en la docencia, a través de una escala tipo Likert. Cada prueba será
ejemplificada con un objetivo de investigación adecuado a la prueba, las hipótesis
estadísticas correspondientes y la interpretación de los resultados obtenidos en
SPSS.

Prueba de Chi-cuadrado (una muestra)

Objetivo: Conocer si hay relación entre el sexo y los años de experiencia


docente.
Ho: el sexo es independiente de los años de experiencia.
H1: el sexo y los años de experiencia están relacionados.
- 106 -
Resultados
Tabla 4. Output de la prueba Chi-cuadrado
No se rechaza la Ho, lo que significa que no hay relación entre el sexo y los
años de experiencia docente (sig.0, 361> 0,05).
b. Prueba U de Mann-Whitney (2 muestras independientes)

Objetivo: conocer la influencia de la experiencia docente (<5 años o >5 años)


en la utilidad que el profesorado atribuye a las TIC en la enseñanza.
Ho: la experiencia docente no influye en la utilidad que el profesorado atribuye
a las TIC en la enseñanza.
H1: la experiencia docente influye en la utilidad que el profesorado atribuye a
las TIC en la enseñanza.

Figura 2. Cuadro de diálogo de la prueba U de Mann-Whitney


Resultados
Tabla 5. Output de la prueba U de Mann-Whitney
Se acepta la H1, que significa que la experiencia docente influye en la utilidad
que el profesorado atribuye a las TIC en la enseñanza (sig. 0,005<0,05). El
profesorado que tiene menos de 5 años de experiencia las considera más útiles.
- 108 -
c. Prueba de Wilcoxon (2 muestras relacionadas)

Objetivo: conocer si los docentes han variado su opinión sobre la utilidad de


las TIC en la enseñanza después de la implantación del EEES.
Ho: no hay diferencias en la opinión de los docentes sobre la utilidad de las
TIC en la enseñanza entre antes y después de la implantación del EEES.
H1: sí hay diferencias en la opinión de los docentes sobre la utilidad de las TIC
en la enseñanza entre antes y después de la implantación del EEES.
Figura 3. Cuadro de diálogo de la prueba de Wilcoxon
- 109 -
Resultados
Tabla 6. Output de la prueba de Wilcoxon

6
Una-puno ingeniería de minas estadística general

Se acepta la H1, por lo que concluimos que hay diferencias en la valoración


que los docentes hacen de la utilidad de las TIC en la enseñanza entre antes y
después de la implantación del EEES (sig.0, 001<0,05). El profesorado
consideraba más útiles las TIC en la enseñanza antes de la implantación del EEES
(23,91).
d. Prueba de Kruskal-Wallis (k muestras independientes)

Objetivo: conocer si el área de estudio (4 áreas) a la que pertenece el


profesorado influye en la utilidad que le atribuye a las TIC en la enseñanza.
Ho: el área de estudio a la que pertenece el profesorado no influye en la
utilidad que le atribuye a las TIC en la enseñanza.
H1: el área de estudio a la que pertenece el profesorado influye en la utilidad
que le atribuye a las
TIC en la enseñanza.
- 110 -
- 111 -
e. Prueba de Friedman (k muestras relacionadas)

Objetivo: conocer si hay diferencias en la valoración que hace el profesorado


sobre la utilidad de las TIC en la enseñanza, en la gestión y en el aprendizaje del
alumnado.
Ho: no hay diferencias de valoración entre la utilidad de las TIC en la
enseñanza, en la gestión y en el aprendizaje del alumnado.
H1: sí hay diferencias de valoración entre la utilidad de las TIC en la
enseñanza, en la gestión y en el aprendizaje del alumnado.
Figura 5. Cuadro de diálogo de la prueba Friedman
- 112 -

Resultados
Tabla 8. Output de la prueba Friedman
No se rechaza la Ho y se concluye que el profesorado considera igual de útiles
las TIC en la docencia, en el aprendizaje y en la gestión (sig.0, 417>0,05).

métodos estadísticos no paramétricos

•Las técnicas estadísticas de estimación de parámetros, intervalos de confianza


y prueba de hipótesis son, en conjunto, denominadas ESTADÍSTICA
PARAMÉTRICA y son aplicadas básicamente a variables continuas. Estas técnicas
se basan en especificar una forma de distribución de la variable aleatoria y de los
estadísticos derivados de los datos.
•En ESTADÍSTICA PARAMÉTRICA se asume que la población de la cual la
muestra es extraída es NORMAL o aproximadamente normal. Esta propiedad es
necesaria para que la prueba de hipótesis sea válida.

7
Una-puno ingeniería de minas estadística general

•Sin embargo, en un gran número de casos no se puede determinar la


distribución original ni la distribución de los estadísticos por lo que en realidad
no tenemos parámetros a estimar. Tenemos solo distribuciones que comparar.
Esto se llama ESTADISTICA NO-PARAMÉTRICA.
Prueba u de mann whitney

𝑛1 (𝑛1 + 1)
𝑈1 = 𝑛1 ∗ 𝑛2 + − ∑ 𝑅1
2

𝑛2 (𝑛2 + 1)
𝑈2 = 𝑛1 ∗ 𝑛2 + − ∑ 𝑅2
2

Media y deviación estándar de la distribución muestreal para la prueba u de

mann whitney

𝒏𝟏 ∗ 𝒏𝟏
𝝁=
𝟐

𝝈 = √𝒏𝟏 ∗ 𝒏𝟐 ( 𝒏𝟏 + 𝒏𝟐 + 𝟏 ) ⁄𝟐

Valor z para normalizar la prueba u de mann whitney

𝑼𝒊 − 𝝁
𝜡=
𝝈

𝒓𝒄
𝟐
( 𝑶𝒊 − 𝑬𝒊 )𝟐
𝝌 = ∑
𝑬𝒊
𝒊=𝟏

prueba de independencia chi-cuadrada

La prueba de Chi-Cuadrada (X2) es un test que afecta a la distribución de


frecuencias de los diferentes grupos que componen una población y que son
generados por un cruce de variables.
Con la prueba de Chi-Cuadrada se pretende conocer en términos
probabilísticos si el conjunto de las frecuencias relativas (proporciones) de todos

8
Una-puno ingeniería de minas estadística general

los grupos generados en una población (por el cruce de variables) se distribuye


forma a aleatoria (al azar), sin diferencias «significativas» (significación
estadística) entre ellas (en conjunto). Igual que en todas las pruebas estadísticas,
se contrasta la distribución real de los datos (a partir de un estadístico) con una
distribución teórica, en este caso, la Chi-Cuadrada, en donde definimos un punto
crítico a partir del cual las diferencias se consideran «significativas» entre las
proporciones del conjunto de los grupos poblacionales (condensadas en el
estadístico Chi-Cuadrada). Por tanto, por un lado, tenemos el estadístico (Chi-
Cuadrada) asociado a una tabla de contingencia, y por otro, una distribución
teórica de este estadístico.
La prueba de Chi-Cuadrada sólo tiene sentido cuando se trabaja con datos
muestrales extraídos de forma aleatoria, esto es, en distribuciones (empíricas) de
probabilidad.

Con la prueba de Chi-Cuadrada la especificidad (empírica/teórica) concreta de


las categorías desaparece. Para Chi-Cuadrada es irrelevante si la prueba la
hacemos sobre variables de edad, nivel de estudios, definiciones ideológicas, etc.
Chi-Cuadrada vale lo mismo para categorías sociológicas, médicas,
criminológicas, biológicas, etc. Chi-Cuadrada no distingue la especificidad de las
categorías consideradas. Se trata de un índice que resume toda la distribución
teniendo en cuenta sólo el número de categorías y las frecuencias que se dan en
éstas.

Frecuencia teórica (o esperada según la lógica de Chi-Cuadrada

Se podría decir que las frecuencias esperadas en cada una de las casillas de
una tabla de contingencia son aquellas que cabe esperar en el caso de que no exista
relación entre las variables, esto es, independencia estadística o probabilística
entre las variables. Dos variables son independientes estadísticamente si la
probabilidad de que nos aparezca una categoría de una variable no depende de
la distribución de probabilidad de la otra variable.

Cálculo de residuos

Los residuos son las diferencias entre las frecuencias observadas y las
esperadas en cada celda. Los residuos son «errores» del muestreo aleatorio.

9
Una-puno ingeniería de minas estadística general

Residuo

Para poder comparar las «distancias» entre las frecuencias observadas y las
esperadas dentro de cada celda, se ha de estandarizar estas distancias.
Residuos Estandarizados

X2 de cada celda

Coeficiente Chi-Cuadrada de toda la tabla (Ejemplo Tabla 2x2)

TABLA 1: (𝒓 × 𝒔) para la fórmula general del índice X2

Tabla 1

N1
N2
N3

Ni

Nr
N1 N2 N3 … Nj … NS N

10
Una-puno ingeniería de minas estadística general

Fórmula suma de frecuencias columna genérica (j)

Fórmula suma de frecuencias fila genérica (i)

Sumatorio de todas las celdas

Frecuencia esperada de una celda cualquiera

Coeficiente Chi-Cuadrada de la tabla

Interpretación de Chi-Cuadrada en tablas bivariables

 Si X2 toma valores entre 0 e ∞ → Índice o Coeficiente de relación.


 Si X2 = 0: No hay relación entre las variables.
 X2 de una tabla concreta no vale para comparar otras tablas distintas. Para
ello existen otros coeficientes de contingencia: V de Cramer, Coeficiente de
contingencia o (𝜑)
La prueba o test de Chi-Cuadrada es un contraste de proporciones múltiples.
La distribución teórica asociada a esta prueba es la distribución X2. Se trata de

11
Una-puno ingeniería de minas estadística general

una distribución continua de probabilidad, una distribución muestral de la


varianza derivada de la distribución normal. Al igual que la distribución de
Student, depende de un parámetro: grados de libertad. Por tanto, existe una
distribución distinta para cada número de grados de libertad. La media de la
distribución Chi-Cuadrada es igual a sus grados de libertad, su varianza es dos
veces sus grados de libertad, y sus valores oscilan entre X2.
Distintas distribuciones Chi-Cuadrada para distintos grados de libertad

La distribución Chi-Cuadrada se va acercando a la distribución normal a


medida que aumentan sus grados de libertad.
Número de grados de libertad de una tabla bidimensional

Prueba de la distribución Chi-Cuadrada con los correspondientes grados de

libertad

Como todas las distribuciones de probabilidad, la distribución Chi-Cuadrada

describe un área bajo la curva que es igual a 1, esto es, donde encontramos el

100% de los casos. Cualquier valor de deja a su izquierda un porcentaje de casos

que asignaremos a la proporción, y a su derecha el resto de casos que asignaremos

a la proporción p. entre un cero y un valor cualquiera de X2 encontraremos el 100

12
Una-puno ingeniería de minas estadística general

q% de los casos. Y entre el valor X2 e ∞ encontramos en resto de 100 p% y sabemos

que p + q = 1

El valor crítico y nivel de significación de X2

La p de la Tabla Chi-Cuadrada, distribución de X2 (ver Anexo1) nos indica el

valor crítico de X2 a partir del cual todo valor mayor entre en la zona de rechazo

de la hipótesis nula (Ho), que considera las variables cruzadas en la tabla son

independientes estadísticamente, es decir, no hay relación entre ellas. Por tanto,

la p es el nivel de significación que usamos para la prueba de la distribución Chi-

Cuadra.

13
Una-puno ingeniería de minas estadística general

Tabla Chi-Cuadrada. Distribución de X2

prueba de independencia chi-cuadrada

Otra aplicación importante de la distribución chi-cuadrada es el empleo de


datos muestrales para robar la independencia de dos variables. Para ilustrar la
prueba de independencia se considerará la prueba de independencia realizada por
la Alber’s Brewery de Tucson, Arizona. Alber’s produce y distribuye tres tipos de
cerveza: ligera, clara y oscura. Al analizar los segmentos de mercado de las tres
cervezas, el grupo de investigación de mercado de la empresa se preguntó si las
preferencias de los consumidores por estos tipos de cerveza diferían entre hombres
y mujeres. En caso de que las preferencias fueran independientes del género del
consumidor, iniciarían una campaña publicitaria para todas las cervezas de
Alber’s. Pero, si las preferencias por los distintos tipos de cerveza dependían del
género del consumidor, la empresa ajustaría sus promociones a los mercados.

Para determinar si la preferencia por un tipo de cerveza (ligera, clara u oscura)


era independiente del género del consumidor (hombre o mujer) se usó una prueba
de independencia. Las hipótesis para esta prueba de independencia fueron:

H0: La preferencia por un tipo de cerveza es independiente del género del


consumidor
Ha: La preferencia por un tipo de cerveza no es independiente del género del
consumidor.

Para describir la situación a estudio se usa la tabla. Después de identificar la


población como todos los consumidores de cerveza, hombres y mujeres, se toma
una muestra y a cada individuo.

14
Una-puno ingeniería de minas estadística general

Tabla 2: tabla de contingencia de cerveza preferiday género del


consumidor

Ligera Clara Oscura


celda celda celda
HOMBRE
(1,1) (1,2) (1,3)
GÉNERO
celda celda celda
MUJER
(2,1) (2,2) (2,3)

Tabla 3: resultados muestrales del tipo de cerveza que prefieren hombres y


mujeres (frecuencias observadas)

Ligera Clara Oscura Total


HOMBRE 20 40 20 80
MUJER 30 30 10 70
GÉNERO
TOTAL 50 70 30 150

Se le pide que indique cuál de las tres cervezas de Alber’s prefiere. Cada
individuo de la muestra pertenecerá a una de las seis celdas de la tabla. Así, por
ejemplo, se puede tener un individuo que sea hombre y que prefiera la cerveza
clara (celda (1,2)), o una mujer que prefiera la cerveza ligera (celda (2,1)), o una
mujer que prefiera la cerveza oscura (celda (2,3)), etc. Dado que en la tabla se han
enumerado todas las posibles combinaciones de cerveza preferida y género.
Como en la prueba de independencia se usa el formato de las tablas de
contingencia, a esta prueba también se le suele llamar prueba de tabla de
contingencia. Suponga que toma una muestra aleatoria simple de 150
consumidores de cerveza. Cada individuo de la muestra prueba los tres tipos de
cerveza y después se le pide que indique cuál prefiere o cuál es su primera elección.
En la tabulación cruzada de la tabla 2 se presentan las respuestas obtenidas en el
estudio. Como se ve, los datos para la prueba de independencia se obtienen
contando las cantidades o frecuencias correspondientes a cada celda o categoría.
De las 150 personas que formaban la muestra, 20 hombres prefirieron la cerveza
ligera, 40 hombres prefirieron la cerveza clara, 20 hombres prefirieron la cerveza
oscura, etcétera.
Los datos de la tabla 2 son las frecuencias observadas para cada una de las seis
clases o categorías. Si determina las frecuencias esperadas bajo la suposición de
independencia entre cerveza preferida y género del consumidor, se puede emplear
la distribución chi-cuadrada para establecer si existe diferencia significativa entre
las frecuencias observadas y las esperadas.
Las frecuencias esperadas para las celdas de la tabla de contingencia se basan
en la idea siguiente. Primero se supone que la hipótesis nula es verdadera, es decir,
que la cerveza preferida es independiente del género del consumidor. Después se
observa que, en toda la muestra de 150 consumidores de cerveza, 50 prefirieron la
cerveza ligera, 70 prefirieron la cerveza clara, y 30 prefirieron la cerveza oscura.
En términos de proporciones se concluye que ⁵⁰⁄₁₅₀ _ 1⁄₃ de los consumidores
prefirió la cerveza ligera, ⁷⁰⁄₁₅₀ _ ⁷⁄₁₅ prefirieron la cerveza clara y 3⁰⁄₁₅₀ _ 1⁄₅

15
Una-puno ingeniería de minas estadística general

prefirió la cerveza oscura. Si la suposición de independencia es correcta, estas


proporciones serán las que se observen tanto entre los hombres como entre las
mujeres. Por consiguiente, bajo la suposición de independencia, es de esperarse
que, en la muestra de 80 consumidores del sexo masculino, (1⁄₃)80 _ 26.67
prefieran la cerveza ligera, (⁷⁄₁₅)80 _37.33 prefieran la cerveza clara y (1⁄₅)80 _16
prefieran la cerveza oscura. Aplicando las proporciones correspondientes a los 70
consumidores del sexo femenino, se obtienen las frecuencias esperadas que se
muestran en la tabla 4.

Tabla 4: frecuencias esperadas si la preferencia por uno de los tipos de


cerveza es independiente del género del consumidor

Ligera Clara Oscura Total


HOMBRE 26.67 37.33 16.00 80
MUJER 23.33 32.67 14.00 70
GÉNERO
TOTAL 50.00 70.00 30.00 150

Sea eij la frecuencia esperada en el renglón i columna j de la tabla de


contingencia. Mediante dicha notación, ahora se reconsidera el cálculo de la
frecuencia esperada correspondiente a los hombres (renglón i = 1) que prefieren
la cerveza clara (columna j = 2); es decir, la frecuencia esperada e12. Siguiendo el
argumento anterior para el cálculo de las frecuencias esperadas, se ve que
e12 =(⁷/₁₅)80=37.33
Expresión que se formula de una manera ligeramente diferente como
e12= (⁷/₁₅)80 = (⁷⁰/₁₅₀)80 = (80) (70) /150 = 37.33

Observe que, en esta expresión, 80 es el número total de hombres (total del


renglón 1), 70 es la cantidad total de individuos que prefieren la cerveza clara
(total de la columna 2) y 150 es el tamaño
total, de la muestra. De lo que se ve que

(𝑇𝑜𝑡𝑎𝑙 𝑑𝑒𝑙 𝑟𝑒𝑛𝑔𝑙ó𝑛 𝑖)(𝑇𝑜 𝑡𝑎𝑙 𝑑𝑒 𝑙𝑎 𝑐𝑜𝑙𝑢𝑚𝑛𝑎 𝑗)


𝑒12 = 𝑇𝑎𝑚𝑎ñ𝑜 𝑑𝑒 𝑙𝑎 𝑚𝑢𝑒𝑠𝑡𝑟𝑎

Al aplicar esta fórmula para los consumidores hombres que prefieren cerveza
oscura, se encuentra que la frecuencia esperada es e13 = (80) (30) /150=16.00,
como se muestra en la tabla 4. Use la ecuación para verificar las otras frecuencias
esperadas que se presentan en la tabla 4.

El procedimiento de prueba para comparar las frecuencias esperadas de la


tabla 4 con las frecuencias observadas de la tabla 3 es semejante a los cálculos
para la prueba de bondad de ajuste de la sección. En concreto, el valor x2 que se
basa en frecuencias observadas y esperadas se calcula como se indica a
continuación.

Estadístico de prueba para independencia

16
Una-puno ingeniería de minas estadística general

( 𝑓𝑖𝑗 _ 𝑒𝑖𝑗)2
𝑿𝟐 = ∑ ∑
𝑒𝑖𝑗
𝒊 𝒋

Donde
fij = frecuencia observada en la categoría del renglón i columna j de la tabla de
Contingencia.
eij = frecuencia esperada en la categoría del renglón i columna j de la tabla de
Contingencia, basada en la suposición de independencia.

Nota: Si una tabla de contingencia tiene n renglones y m columnas, el estadístico de prueba


tiene una distribución chi-cuadrada con (n - 1) (m - 1) grados de libertad, siempre y cuando en
todas las categorías las frecuencias esperadas sean cinco o más.

Tabla 5: cálculo del estadístico de prueba chi-cuadrada para


determinar si la preferencia por un tipo de cerveza es
independiente del género del consumidor
Cuadrad
o de la
Cuadrad diferencia
Frecuenci Frecuenci Diferenci
Cervez o de la entre
Género a observada a esperada a
a Preferida diferencia frecuencia
(fij) (eij) (fij - eij)
(fij - eij)2 esperada
(fij - eij)2
/(eij)
Hombr
Ligera 20 26.67 -6.67 44.44 1.67
e
Hombr
Clara 40 37.33 2.67 7.11 0.19
e
Hombr
Oscura 20 16.00 4.00 16.00 1.00
e
Mujer Ligera 30 23.33 6.67 44.44 1.90
Mujer Clara 30 32.67 -2.67 7.11 0.22
Mujer Oscura 10 14.00 -4.00 16.00 1.14
TOTAL 150 X2 = 6.12

La doble sumatoria que aparece en la ecuación indica que el cálculo debe


hacerse con todas
las celdas que aparecen en la tabla de contingencia.
En las frecuencias esperadas que aparecen en la tabla 4, se ve que en cada
categoría la frecuencia
esperada es de 5 o más. Por tanto, se puede proceder a calcular el estadístico
de prueba chi-cuadrada.
En la tabla 5 se presentan los cálculos necesarios para obtener el estadístico de
prueba chi-cuadrada que se utiliza para determinar si la preferencia por una
cerveza es independiente del género del consumidor. Como se observa, el valor del
estadístico de prueba es
El número de grados de libertad para la distribución chi-cuadrada adecuada se
obtiene multiplicando el número de renglones menos 1 por el número de columnas
menos 1. Como se tienen dos renglones y tres columnas, los grados de libertad son
(2 * 1) (3 * 1) = 2. Como ocurre en la prueba de bondad de ajuste, en la prueba de
independencia se rechaza H0 si las diferencias entre frecuencias observadas y
esperadas dan un valor grande del estadístico de prueba. De manera que la prueba
de independencia es también una prueba de la cola superior. La tabla de la

17
Una-puno ingeniería de minas estadística general

distribución chi-cuadrada, proporciona la información siguiente para 2 grados de


libertad.

El estadístico de prueba, X2=6.12 se encuentra entre 5.991 y 7.378. Por tanto,


el área correspondiente en la cola superior o valor-p está entre 0.05 y 0.025.
Empleando los procedimientos de Minitab o de Excel que se presentan en el
apéndice F, se obtiene que, valor-p = 0.0469. Como
El valor-p α=0.05, se rechaza la hipótesis nula y se concluye que la preferencia
por una cerveza
no es independiente del género del consumidor.
Para simplificar los cálculos que se requieren en una prueba de independencia
se usan paquetes
de software como Minitab o Excel. La información a suministrar en estos
procedimientos es la tabla de contingencia con las frecuencias observadas como
se muestran en la tabla 3. El software calcula automáticamente las frecuencias
esperadas, el valor del estadístico de prueba X2 y el valor-p. Se presentan los
procedimientos de Minitab y de Excel para esta prueba de independencia. En la
figura 1 aparecen los resultados que da Minitab para la prueba de la Alber’s
Brewery.
Mediante una comparación informal de las frecuencias observadas y esperadas
se obtiene una idea de la dependencia entre cerveza preferida y género. Al observar
las tablas 3 y 4 resalta que en los consumidores de sexo masculino las frecuencias
observadas en la preferencia por cervezas clara y oscura son más altas que las
frecuencias esperadas, mientras que en las mujeres la frecuencia observada en la
preferencia por cerveza ligera es mayor que la frecuencia esperada. Dichas
observaciones permiten comprender las diferentes preferencias por cerveza entre
los hombres y las mujeres.

FIGURA 1: RESULTADOS DE MINITAB PARA LA PRUEBA DE


INDEPENDENCIA DE LA
ALBER’S BREWERY

18
Una-puno ingeniería de minas estadística general

A continuación, se resumen los pasos para una prueba de tabla de contingencia


para independencia.

Prueba de independencia

Resumen

1. Establecer las hipótesis nula y alternativa.


H0: La variable de las columnas es independiente de la variable de los
renglones
Ha: La variable de las columnas no es independiente de la variable de los
renglones
2. Seleccionar una muestra aleatoria y anotar en cada celda de la tabla de
contingencias las frecuencias observadas.
3. Emplear la ecuación para calcular las frecuencias esperadas de cada celda.
4. Utilizar la ecuación para calcular el valor del estadístico de prueba.
5. Regla de rechazo:

Donde α es el nivel de significancia, y los n renglones y las m columnas dan los


(n - 1) (m - 1) grados de libertad.

Las pruebas chi-cuadrada requiere una frecuencia esperada de cinco en cada


categoría. Si en una categoría la frecuencia esperada es menor que cinco, es
conveniente combinar dos categorías adyacentes para tener una frecuencia
esperada de cinco o más en cada categoría.

Correlación de rangos de spearman

El coeficiente de correlación es una medida de la relación lineal entre dos


variables para las cuales se cuenta con datos de intervalo o de razón. En esta
sección se estudia una medida de la relación entre dos variables en el caso de datos
ordinales. El coeficiente de correlación por rangos de Spearman rs se usa en estos
casos.

19
Una-puno ingeniería de minas estadística general

A continuación, se ilustra el uso del coeficiente de correlación por rangos de


Spearman mediante
Un ejemplo. Una empresa desea determinar si las personas que, en el momento
de ser contratadas,
Generaron expectativas de muy buenos vendedores, en realidad han tenido los
mejores registros de ventas. Para esto, el gerente de personal revisa
cuidadosamente las entrevistas de trabajo, los antecedentes académicos y las
cartas de recomendación de 10 de los vendedores de la empresa. Después de esta
revisión, ordena a estas 10 personas de acuerdo con su potencial de éxito, y les da
un rango con base en la información disponible al momento de contratarlos. A
continuación, obtiene una lista del número de unidades vendidas por cada una de
estas personas en el transcurso de los primeros dos años y los reordena con un
rango de acuerdo con su desempeño real en ventas. En la tabla 6 se dan los datos
relevantes y los dos rangos. La cuestión estadística es si los rangos, de acuerdo
con su potencial de ventas al momento de la contratación, coinciden con los rangos
de acuerdo con las ventas realizadas durante los dos primeros años.

Con los datos de la tabla 19.13 se calcula el coeficiente de correlación de rangos


de Spearman. En la tabla 6 se resumen estos cálculos. Es claro que el coeficiente
de correlación por rangos 0.73 es positivo. El coeficiente de correlación por
rangos de Spearman varía de -1.0 a +1.0 y se interpreta igual que un coeficiente
de correlación muestral, en que el valor positivo cercano a 1.0 indica una fuerte
relación entre los rangos: si un rango crece la otra crece. Las correlaciones por
rangos cercanas a -1.0 indican una fuerte relación, pero negativa entre los rangos:
cuando un rango crece el otro disminuye. El valor rs = 0.73 indica una correlación
positiva entre el desempeño potencial y real. Los individuos con un rango alto de
potencial tienden a un alto desempeño.

TABLA 6: CÁLCULO DEL COEFICIENTE DE CORRELACIÓN POR


RANGOS DE
SPEARMAN ENTRE EL POTENCIAL DE VENTAS Y EL
DESEMPEÑO EN
VENTAS

20
Una-puno ingeniería de minas estadística general

Prueba de significancia de la correlación de rangos

Hasta aquí se ha visto cómo usar los resultados muestrales para calcular el
coeficiente de correlación por rangos. Como ocurre con muchos otros
procedimientos estadísticos, se desea emplear los resultados muestrales para hacer
inferencias acerca de la correlación por rangos poblacional pS. Para hacer una
inferencia acerca de la correlación por rangos poblacionales, se debe probar la
hipótesis siguiente.

Bajo la hipótesis nula de que no existe correlación entre los rangos (pS =0), los
rangos son independientes y la distribución muestral de rS es la siguiente.

El coeficiente de correlación por rangos muestrales entre el potencial de ventas


y el desempeño en ventas es rS = 0.73. Con este valor se puede probar si hay una
correlación por rangos significativa. De acuerdo con la ec. se tiene 𝑢𝑟𝑠 = 0 y de
acuerdo con la ecuación se tiene que
Si usa como estadístico de prueba la variable aleatoria normal estándar z, tiene

En las tablas de probabilidad normal estándar, se encuentra que para z =


2.20, el valor-p = 2(1-0.9861) =0. 0278.Dado que el valor-p ≤ α = 0.05 se
rechaza la hipótesis nula de que la correlación de los rangos sea cero. Por tanto,
se puede concluir que hay una correlación de rangos significativa entre el
potencial de ventas y el desempeño en ventas.
Anova un factor y Kruskal-Wallis

El análisis de la varianza (Anova) se debe al estadístico-genético Sir Ronald


Aylmer Fisher (1890-1962), autor del libro "Statistics Methods for Research
Workers" publicado en 1925 y pionero de la aplicación de métodos estadísticos
en el diseño de experimentos, introduciendo el concepto de aleatorización.
El Anova se puede utilizar en las situaciones en las que nos interesa analizar
una respuesta cuantitativa, llamada habitualmente variable dependiente, medida
bajo ciertas condiciones experimentales identificadas por una o más variables
categóricas (por ejemplo tratamiento, sexo), llamadas variables independientes.
Cuando hay una sola variable que proporciona condiciones experimentales
distintas, el análisis recibe el nombre de Anova de un factor.
Entre las pruebas de comparación múltiples a posteriori, que se utilizan a
continuación de las técnicas del Anova, se encuentra la prueba HSD de Tukey.

21
Una-puno ingeniería de minas estadística general

John Tukey es, asimismo, conocido por introducir la transformación rápida de


Fourier, aunque trabajó en muchas áreas incluyendo sobre todo la filosofía de la
estadística.
Cuando el análisis de la varianza no es aplicable debido a incumplimientos de
las suposiciones del modelo, es necesario aplicar la prueba de Kruskal-Wallis
para el contraste de k medianas. Esta prueba es una ampliación de la prueba de
Mann-Whitney-Wilcoxon para dos medianas.
La prueba de Kruskal-Wallis fue propuesta por William Henry Kruskal (1919-
) y W. Allen Wallis (1912- 1998) en el artículo "Use of rands in one-criterion
variance analysis" publicado en el “Journal of American Statistics Association”
en 1952.

Fórmulas básicas

En el análisis de la varianza, la variación en la respuesta se divide en la


variación entre los diferentes niveles del factor (los diferentes tratamientos) y la
variación entre individuos dentro de cada nivel.
Suponiendo que las medias de los grupos son iguales, la variación entre
grupos es comparable a la variación entre individuos. Si la primera es mucho
mayor que la segunda, puede indicar que las medias en realidad no son iguales.
El objetivo principal del Anova es contrastar si existen diferencias entre las
diferentes medias de los niveles de las variables (factores). Cuando sólo hay dos
medias, el Anova es equivalente a la prueba t- Student para el contraste de dos
medias.
La variación observada en la respuesta se asume que es debida al efecto de las
variables categóricas, aunque también se asume que existe cierto error aleatorio
independiente que explica la variación residual. Se asume también que dicho
error aleatorio sigue una distribución normal con media 0 y varianza constante.
Estas asunciones son análogas a las exigidas para la prueba t-Student para
contrastar la igualdad de dos medias, donde se asumía normalidad de la
respuesta en cada grupo e igualdad de varianzas (contrastada mediante la F-
Snedecor).
Para estudiar la validez del modelo es necesario confirmar estas hipótesis
mediante el estudio de los residuos (valores predichos - valores observados):

22
Una-puno ingeniería de minas estadística general

normalidad, tendencias, etc. y la realización de un contraste de homocedasticidad


(homogeneidad de varianzas entre los grupos).
Para el estudio de la normalidad de los errores, se puede recurrir al estudio
de la normalidad de cada grupo (al igual que en la prueba t-Student) pero no es
recomendable, debido a que puede requerir un gran número de pruebas. La
solución utilizada habitualmente es el estudio del gráfico de dispersión entre los
residuos y los valores predichos. Este gráfico permite estudiar la simetría, si
existen patrones de comportamiento, la independencia entre observaciones y
tendencias en general. Si se observa algún comportamiento de los mencionados,
el modelo no es válido y se debe cambiar de modelo, de técnica estadística o
transformar las variables.
Uno de los posibles contrastes para la homocedasticidad es la prueba de
Barlett propuesta por Barlett en 1937. Esta prueba presupone que los datos
provienen de variables con distribución normal. Otra alternativa menos sensible
a la falta de normalidad y por este motivo recomendada por diversos autores es
la prueba de leven propuesta por Leven en 1960. En general, el Anova es un
procedimiento muy robusto que ofrece buenas aproximaciones en el caso que las
premisas del modelo no se cumplan rigurosamente.
Muchas veces interesa saber qué medias difieren entre sí después de realizar
el Anova. Para realizar contrastes a posterior es necesario ajustar el error alfa, y
para este objetivo existen diferentes métodos, siendo la corrección de Tukey
propuesta por el matemático John Tukey (1915-2000) la más habitual de todas
ellas.
Los contrastes de comparaciones múltiples (o comparaciones a posteriori)
proporcionan información detallada sobre las diferencias entre las medias dos a
dos. Para este objetivo una primera intuición nos llevaría a realizar las
correspondientes pruebas t-Student (o pruebas de Mann-Whitney-Wilcoxon para
medianas) entre todas las posibles parejas de grupos. El problema reside en la
repetición de múltiples contrastes. Si se tienen 5 medias, se necesitaría realizar
10 comparaciones 2 a 2 y cada una de ellas tendría un error alfa o de tipo I
(probabilidad de rechazar la hipótesis nula cuando en realidad es
3 cierta) del 5%. Se puede comprobar que al realizar 10 contrastes al 5%, la
probabilidad de rechazar al menos una de las hipótesis nulas es
aproximadamente del 40%. De manera que con un 40% de probabilidades se
llegaría a alguna conclusión falsa.
Existen diversos métodos para ajustar este tipo de error y conseguir que
efectivamente el error conjunto no sea superior al 5%. La primera aproximación
es debida a Fisher, quien propuso que sólo se han de comparar las diferencias
entre medias 2 a 2 si el precedente Anova ha resultado significativo. Estas
comparaciones a posteriori se realizan sin corrección alguna. Este método es
conocido cómo LSD (“Least Significant Difference”). El método de Bonferroni es
extremadamente conservador pero no depende de la muestra, sólo del número de
comparaciones. Consiste en substituir el error alfa por a/nc siendo nc el número
de comparaciones. En el método de Sidak se sustituye a por 1 - (1 - a) 1/nc,
siendo uno de los más utilizados cuando sólo nos interesa contrastar si algunas
de las diferencias son significativas. Existen otros métodos para controlar el

23
Una-puno ingeniería de minas estadística general

error de cada comparación debidos a Scheffé (1953) y el método HSD (“Honestly


Signifficant Difference”) de Tukey (1953). Cuando todas las diferencias que se
quieren estudiar son contra un mismo grupo control, es habitual realizar el ajuste
de Dunnett (1955). También existen métodos de comparación de grupos de
medias que permiten detectar grupos homogéneos de medias cómo el ajuste de
Duncan y el de SNK (“Student-Newman-Keuls”), que son adecuados cuando los
grupos son balanceados y el interés reside en obtener una comparación global.
En general, el método más conveniente es: después de realizar un Anova
realizar el ajuste de Tukey y si se quiere contrastar todos los grupos con un
control realizar el de Dunnett.
Cuando una comparación a posteriori no es significativa, la conclusión es: no
ha sido posible rechazar la hipótesis nula, no que sea cierta. Por este motivo, es
posible encontrar un modelo Anova significativo y que al mismo tiempo no haya
diferencias entre medias dos a dos. Muchas veces esta situación es debida a
tamaños de muestra reducidos.
En el caso de que no se cumplan las suposiciones del análisis de la varianza,
es necesario aplicar la prueba de Kruskal-Wallis para el contraste de k
medianas, que generaliza a la prueba de Mann- Whitney-Wilcoxon para dos
medianas. Cuando se compara medianas a través de la prueba de Kruskal-Wallis,
las comparaciones 2 a 2 no suelen estar implementadas en los paquetes
estadísticos, aunque se puede utilizar el método de Dunn por su sencillez de
aplicación.
Anova de un factor

La prueba Anova nos permite comparar las medias de r grupos, siendo r


mayor o igual a 2. El modelo Anova presupone que las varianzas de los grupos
son iguales y que los residuos o errores son aleatorios, independientes e
idénticamente distribuidos siguiendo una ley normal con media 0 y desviación
constante. La hipótesis nula de la prueba Anova de un factor es:
H0: Las medias de los k grupos son todas iguales
H1: Al menos una de las medias es diferente
Esta prueba se basa en la comparación de las sumas de cuadrados medias
debidas a la variabilidad entre grupos y la debida a la variabilidad entra grupos
(dentro de los grupos). Ambas sumas son estimaciones independientes de la
variabilidad global, de manera que, si el cociente entre la primera y la segunda
es grande, se tendrá mayor probabilidad de rechazar la hipótesis nula. Este
cociente sigue una distribución F con r - 1 y n - r grados de libertad.
Cálculo de la suma de cuadrados

Las sumas de cuadrados son un paso previo para el cálculo del Anova. Si se
denotan por r al número de grupos, por ni el número de individuos en cada grupo
j = 1,…,r, x.j la media de cada grupo y x... la media global. La suma de
cuadrados entre grupos SCE, la suma de cuadrados dentro de grupos SDE y la
suma de cuadrados total SCT se calculan del siguiente modo:

24
Una-puno ingeniería de minas estadística general

𝒮𝒞ℬℒ = ∑ 𝑐1 (𝑋𝑖 − 𝑋)2


𝑖=1

Kruskal-Wallis

La prueba de Kruskal-Wallis es el método más adecuado para comparar


poblaciones cuyas distribuciones no son normales. Incluso cuando las
poblaciones son normales, este contraste funciona muy bien.
También es adecuado cuando las desviaciones típicas de los diferentes grupos
no son iguales entre sí, sin embargo, el Anova de un factor es muy robusto y sólo
se ve afectado cuando las desviaciones típicas difieren en gran magnitud.
La hipótesis nula de la prueba de Kruskal-Wallis es:
H0: Las k medianas son todas iguales
H1: Al menos una de las medianas es diferente

2
12 Ri
𝒦= ∑ ni − 3(n + 1)
𝑛(𝑛 + 1)

25
Una-puno ingeniería de minas estadística general

Conclusiones

 Haber aprendido correctamente las formulas

 Y saber cómo estas fórmulas nos ayudan en la minería a determinar

ciertas cosas

 Saber en dónde aplicarlas

26