Conceptos básicos
Estadística:
Se trata de un conjunto de métodos, técnicas o herramientas que el investigador
utiliza para analizar, organizar, interpretar y transmitir unos datos en el conjunto de
un proceso de investigación y que le apoyan en el proceso de toma de decisiones.
a) De acuerdo con el objetivo del análisis, nos permite hablar de Estadística
Descriptiva frente a Estadística Inferencial.
Estadística Descriptiva: tiene como función primordial la descripción de la
muestra, es decir, recoger, ordenar y analizar los datos.
Estadística Inferencial: tiene como cometido hacer inferencias a partir de
una muestra sobre una población.
b) Según el número de variables que atiende (o implica) el análisis dará lugar
a la estadística Univariada, Bivariada y Multivariada.
Estadística Univariada: incluye todas las técnicas que hacen referencia a
la descripción e inferencia de una sola variable.(En las técnicas de análisis
inferenciales, el número de variables viene determinado por el número de
variables dependientes implicadas en el análisis concreto realizado)
Estadística Bivariada: incluye todas las técnicas que hacen referencia a la
descripción e inferencia entre dos variable, sobre la base de modelos
correlacionales.
Estadística Multivariada: la utilizamos cuando tenemos tres o más
variables.
c) De acuerdo con las asunciones metodológicas que se realizan para la
comprobación de las hipótesis, nos permite hablar de Estadística Paramétrica
frente a la No-Paramétrica. La Paramétrica es más exigente, desde el punto de
vista metodológico que la No-Paramétrica.
Estadística Paramétrica: las escalas deben ser de intervalo o de razón y
deben de cumplirse los supuestos paramétricos: normalidad, linealidad y
homocedasticidad (la dispersión de las muestras es equivalente).
Estadística No-Paramétrica: la aplicamos cuando utilizamos escalas
nominales u ordinales o no sabemos si se cumplen los otros supuestos.
Población:
Es el conjunto de todos los individuos, definidos por una característica común, en
los que se desea estudiar el fenómeno.
Muestra:
Es el subconjunto de la población, representativo de la misma, en la que se lleva a
cabo efectivamente el estudio descriptivo. Para ello, la muestra debe ser
seleccionada según un proceso adecuado de muestreo.
Estadísticos:
Son valores numéricos obtenidos con base a las mediciones llevadas a cabo en una
muestra. Permiten describir en forma simplificada al conjunto de datos obtenidos en
la muestra. Se representan con letras latinas.
Parámetros:
Son las propiedades descriptivas de la población. Se simboliza con letras griegas.
Variable:
Aquella característica o fenómeno que puede en la realidad adoptar diversos
valores o modalidades.
Por sus propiedades matemáticas hablaremos de: variables cualitativas,
cuantitativas o cuasi-cuantitativas.
Variables cualitativas: son aquellas que sólo pueden expresarse por ausencia
o presencia de cierta cualidad, pero que no es cuantificable. También se
denominan atributos o variables categóricas. Según la cantidad de
modalidades o expresiones diferentes que tenga una variable cualitativa se
suele subdividir en:
- Dicotómicas: cuando sólo hay dos modalidades.
- Politómicas: cuando hay más de dos variables.
Variables cuantitativas: son aquellas que se pueden medir, cuantificar. Hay
dos tipos:
Discretas: cuando no admiten todos los valores numéricamente
posibles, habitualmente sólo pueden utilizarse adecuadamente
números enteros.
Continuas: las que, al menos en teoría, pueden aceptar todos los
valores numéricos posibles (cualquier valor intermedio entre dos
valores cualesquiera).
Variables cuasi-cuantitativas: en estas variables los numerales que se
atribuyen a sus modalidades parten de relaciones de igualdad-desigualdad y
de orden, es decir, se establece un orden de mayor a menor o de menor a
mayor.
Diagrama de barras:
Es un gráfico formado por un conjunto de barras que se dibujan sobre el eje de
abscisas, mientras que en el de ordenadas se representan las frecuencias. Cada
una de las barras representa una categoría y deben estar separadas entre sí por
espacios en blanco, para no dar sensación de continuidad. La anchura de las barras
la elegimos arbitrariamente, dependiendo del número de categorías y el tamaño
final que deseamos para el gráfico.
Histograma:
Consiste en una serie de rectángulos que tienen sus bases sobre el eje horizontal, y
dichos rectángulos se presentan juntos para dar sensación de continuidad. En el eje
vertical pondremos las frecuencias, proporciones o porcentajes siempre
especificándolo.
Escala de medida:
Hace referencia a la regla o conjunto de reglas que permite realizar la medida.
Tipos:
Escala nominal: los numerales indican la igualdad o desigualdades entre los
sujetos o hechos. Miden las variables cualitativas
Escala ordinal: además de expresar relaciones de igualdad/desigualdad,
también se consideran relaciones de orden (mayor que-menor que). Miden
las variables cuasi-cuantitativas.
Escala de intervalo: valores cuantitativos con unidad constante y cero
arbitrario.
Escala de razón: valores cuantitativos con unidad constante y cero absoluto.
Medidas de tabulación:
Frecuencias: número de veces que aparece cada categoría.
Porcentajes: tanto por ciento de cada categoría con respecto al total (N)
Forma de la distribución:
Simetría:
Una distribución es simétrica cuando las dos partes de un histograma son imágenes
la una de la otra (es decir, si doblamos el papel por el eje de la mediana, coinciden
punto por punto).
Asimetría:
Una distribución es asimétrica cuando las dos partes, a pesar de tener la misma
superficie, no son imagen una de otra. Puede ser:
Asimetría positiva: se produce cuando hay una gran proporción de
puntuaciones bajas y una menor proporción de puntuaciones altas, de tal modo
que las puntuaciones se concentran en la parte izquierda de la distribución,
dispersándose más por la parte derecha.
Asimetría negativa: se produce cuando tenemos muchas puntuaciones altas y
pocas bajas, por lo que habrá más concentración a la izquierda de la
representación gráfica.
Curtosis o apuntamiento:
Se refiere a la elevación o aplastamiento de la curva (en relación a la “curva
normal”), es decir, la proporción de agrupación de las frecuencias en los valores de
la variable más cercanos a la media. Sólo se refiere a distribuciones unimodales y
simétricas. Tipos:
Leptocúrtica: la distribución es relativamente alta y estrecha.
Platicúrtica: es relativamente ancha y baja, es decir, que los valores extremos
(máximo y mínimo) estén alejados de la media.
Mesocúrticas: las frecuencias más altas corresponden a valores cercanos a la
media, y van disminuyendo gradualmente a medida que se alejan de esta, es
decir, estaría entre las distribuciones leptocúrticas y platicúrticas, en un punto
medio.