A veces, las categoras de las distribuciones de frecuencias son tantas que es
necesario resumidas. Por ejemplo, examinaremos detenidamente la
distribucin de la 10.5. Esta distribucin podra compendiarse en la tabla 10.6.
Qu otros elementos contiene una distribucin de frecuencias? Las distribuciones de frecuencias pueden completarse agregando los porcentajes de casos en cada categora, los porcentajes validos y los porcentajes acumulados (porcentaje de lo que se va acumulando en cada categora, desde la ms baja hasta la ms alta). La tabla 10.7 muestra un ejemplo con las frecuencias y porcentajes en s, los porcentajes vlidos y los acumulados. El porcentaje acumulado constituye lo que aumenta en cada categora de manera porcentual y progresiva (en orden descendente de aparicin de las categoras), tomando en cuenta los porcentajes vlidos. En la categora s se ha obtenido la cooperacin, se ha acumulado 74.6%. En la categora no se ha obtenido la cooperacin, se acumula 78.7% (74.6% de la categora anterior y 4.1% de la categora en cuestin). En la ltima categora siempre se acumula el total (100%).
Las columnas porcentaje y porcentaje vlido son iguales (mismas cifras o valores) cuando no hay valores perdidos; pero si tenemos valores perdidos, la columna porcentaje vlido presenta los clculos sobre el total menos tales valores. En la tabla 10.8 se muestra un ejemplo con valores perdidos en el caso de un estudio exploratorio sobre los motivos de los nios celayenses para elegir su personaje televisivo favorito). Al elaborar el reporte de resultados, una distribucin se presenta con los elementos ms informativos para el lector y la descripcin de los resultados o un comentario, tal como se muestra en la tabla 10.9.
COMENTARIO. Prcticamente tres cuartas partes de las organizaciones s han obtenido la cooperacin del personal. Llama la atencin que poco ms de una quinta parte no quiso comprometerse con su respuesta. Las organizaciones
que no han logrado la cooperacin del personal mencionaron como factores ausentismo, rechazo al cambio y conformismo.
Ejemplo a) Distribucin de Frecuencias con Datos sin Agrupar Colectivo: 20 familias. N = 20 Variable X: ingresos anuales expresados en miles de euros. Valores observados: 18, 20, 22, 19, 18, 20, 18, 19, 21, 20 20, 21, 18, 20, 21, 19, 20, 21, 18, 20
De qu otra manera pueden presentarse las distribuciones de frecuencias? Las distribuciones de frecuencias, especialmente cuando utilizamos los porcentajes, pueden presentarse en forma de histogramas o grficas de otro tipo (por ejemplo: de pastel). Algunos ejemplos se muestran en la figura 10.4. Las distribuciones de frecuencias tambin se pueden Graficar como polgonos de frecuencias Los polgonos de frecuencias relacionan las puntuaciones con sus respectivas frecuencias. Es ms bien propio de un nivel de medicin por intervalos o razn. Los polgonos se construyen sobre los puntos medios de los intervalos. Por ejemplo, si los intervalos fueran 20-24, 25-29, 30-34, 35-39, y siguientes; los puntos medios seran 22, 27, 32, 37, etc. SPSS o Minitab realizan esta labor en forma automtica. Un ejemplo de un polgono de frecuencias se muestra en la figura 10.5.
Los polgonos de frecuencias representan curvas tiles para describir los datos. Nos indican hacia dnde se concentran los casos (personas, organizaciones, segmentos de contenido, mediciones de polucin, etc.) en la escala de la variable; ms adelante se hablar de ello.
Variable: innovacin Con respecto a la innovacin en la empresa, que es la percepcin del apoyo a las iniciativas tendientes a introducir mejoras en la manera como se realiza el trabajo, a nivel organizacional y departamental, la mayora de los individuos tienden a estar en altos niveles de la escala.
Cules son las medidas de tendencia central? Las medidas de tendencia central son puntos en una distribucin obtenida, los valores medios o centrales de sta, y nos ayudan a ubicarla dentro de la escala de medicin. Las principales medidas de tendencia central son tres: moda, mediana y media. El nivel de medicin de la variable determina cul es la medida de tendencia central apropiada para interpretar. La moda es la categora o puntuacin que ocurre con mayor frecuencia. En la tabla 10.7, la moda es 1 (s se ha obtenido la cooperacin). Se utiliza con cualquier nivel de medicin. La mediana es el valor que divide la distribucin por la mitad. Esto es, la mitad de los casos caen por debajo de la mediana y la otra mitad se ubica por encima de sta. La mediana refleja la posicin intermedia de la distribucin. Por ejemplo, si los datos obtenidos fueran: 24 31 35 35 38 43 45 50 57 La mediana es 38, porque deja cuatro casos por encima (43, 45, 50 y 57) y cuatro casos por debajo (35, 35, 31 y 24). Parte a la distribucin en dos mitades. En general, para descubrir el caso o la puntuacin que constituye la mediana de una distribucin, simplemente se aplica la frmula:
(N +1)/2
Si tenemos nueve casos, (9+1)/2 entonces buscamos el quinto valor y ste es la mediana. Note que la mediana es el valor observado que se localiza a la mitad de la distribucin, no el valor de cinco. La frmula no nos proporciona directamente el valor de la mediana, sino el nmero de caso en donde est la mediana.
La mediana es una medida de tendencia central propia de los niveles de medicin ordinal, por intervalos y de razn. No tiene sentido con variables nominales, porque en este nivel no hay jerarquas ni nocin de encima o debajo. Asimismo, la mediana es particularmente til cuando hay valores extremos en la distribucin. No es sensible a stos. Si tuviramos los siguientes datos: 24 31 35 35 38 43 45 50 248
La mediana seguira siendo 38.
Para la interpretacin de la media y la mediana, se incluye un comentario al respecto en el siguiente:
EJEMPLO Qu edad tiene? Si teme contestar no se preocupe, los perfiles de edad difieren de un pas a otro. Con base en proyecciones sobre la poblacin en 2009, la poblacin mundial para finales de 2010 ser de aproximadamente 6 867 millones de habitantes (Knol, 2009). La mediana de edad a nivel mundial es en 2009 de 28.1 aos, lo que significa que la mitad de los habitantes del globo terrestre sobrepasa esta edad y el otro medio es ms joven. Cabe sealar que la mediana vara de un lugar a otro, ya que en los pases ms desarrollados la edad mediana de la poblacin esto es, la edad que divide a la poblacin en dos partes iguales ha ido en ascenso constante desde 1950 hasta llegar, en el 2009, a 38.8 aos. En los pases ms pobres del orbe es de 19.3. Por continente tenemos las siguientes medianas: frica = 19.2 aos (no ha variado desde 1950), Asia = 27.7, Europa = 39.2 (creciendo 10 aos, desde 1950), Latinoamrica y el Caribe = 26.4 (avanzamos 6.4 aos en casi 60 aos), Canad y Estados Unidos de Amrica = 36.4, y Oceana = 32.3.8 Se estima que para la mitad de este siglo la edad mediana mundial habr aumentado a aproximadamente 36 aos. Actualmente, el pas con la poblacin ms joven es Yemen, con una edad mediana de 15 aos, y el ms viejo es Japn, con una edad mediana de 41 aos (Di Santo, 2009). Buena noticia para el actual ciudadano global medio, porque parece ser que se encuentra en la situacin de envejecer ms lentamente
La media es la medida de tendencia central ms utilizada y puede definirse como el promedio aritmtico de una distribucin. Se simboliza como X, y es la suma de todos los valores dividida entre el nmero de casos. Es una medida solamente aplicable a mediciones por intervalos o de razn. Carece de sentido para variables medidas en un nivel nominal u ordinal. Es una medida sensible a valores extremos. Si tuviramos las siguientes puntuaciones: 8 7 6 4 3 2 6 9 8 El promedio sera igual a 5.88. Pero bastara una puntuacin extrema para alterarla de manera notoria: 8 7 6 4 3 2 6 9 20 (promedio igual a 7.22).
Cules son las medidas de la variabilidad? Las medidas de la variabilidad indican la dispersin de los datos en la escala de medicin y responden a la pregunta: dnde estn diseminadas las puntuaciones o los valores obtenidos? Las medidas de tendencia central son
valores en una distribucin y las medidas de la variabilidad son intervalos que designan distancias o un nmero de unidades en la escala de medicin. Las medidas de la variabilidad ms utilizadas son rango, desviacin estndar y varianza.
El rango, tambin llamado recorrido, es la diferencia entre la puntuacin mayor y la puntuacin menor, e indica el nmero de unidades en la escala de medicin que se necesitan para incluir los valores mximo y mnimo. Se calcula as: XM Xm (puntuacin mayor, menos puntuacin menor). Si tenemos los siguientes valores: 17 18 20 20 24 28 28 30 33
El rango ser: 33 17 = 16. Cuanto ms grande sea el rango, mayor ser la dispersin de los datos de una distribucin. La desviacin estndar o tpica es el promedio de desviacin de las puntuaciones con respecto a la media. Esta medida se expresa en las unidades originales de medicin de la distribucin. Se interpreta en relacin con la media. Cuanto mayor sea la dispersin de los datos alrededor de la media, mayor ser la desviacin estndar. Se simboliza minscula , o bien mediante la abreviatura DE. Supongamos que un investigador obtuvo para su muestra una media (promedio) de ingreso familiar anual de $6 000 y una desviacin estndar de $1 000. La interpretacin es que los ingresos familiares de la muestra se desvan, en promedio, mil unidades monetarias respecto a la media. La desviacin estndar slo se utiliza en variables medidas por intervalos o de razn.
La varianza La varianza es la desviacin estndar elevada al cuadrado y se simboliza s2. Es un concepto estadstico muy importante, ya que muchas de las pruebas cuantitativas se fundamentan en l. Diversos mtodos estadsticos parten de la descomposicin de la varianza. Sin embargo, con fines descriptivos se utiliza preferentemente la desviacin estndar.
Cmo se interpretan las medidas de tendencia central y de la variabilidad? Cabe destacar que al describir nuestros datos, respecto a cada variable del estudio, interpretamos las medidas de tendencia central y de la variabilidad en conjunto, no aisladamente. Consideramos todos los valores. Para interpretarlos, lo primero que hacemos es tomar en cuenta el rango potencial de la escala. Supongamos que aplicamos una escala de actitudes del tipo Likert para medir la actitud hacia el presidente de una nacin (digamos que la escala tuviera 18 tems y se promediaran sus valores). El rango potencial es de uno a cinco (vea la fi gura 10.7).
Si obtuviramos los siguientes resultados: Variable: actitud hacia el presidente Moda: 4.0 Mediana: 3.9 Media (X): 4.2 Desviacin estndar: 0.7 Puntuacin ms alta observada (mximo): 5.0 Puntuacin ms baja observada (mnimo): 2.0 Rango: 3
Podramos hacer la siguiente interpretacin descriptiva: la actitud hacia el presidente es favorable. La categora que ms se repiti fue 4 (favorable). Cincuenta por ciento de los individuos est por encima del valor 3.9 y el restante 50% se sita por debajo de este valor (mediana). En promedio, los participantes se ubican en 4.2 (favorable). Asimismo, se desvan de 4.2, en promedio, 0.7 unidades de la escala. Ninguna persona calific al presidente de manera muy desfavorable (no hay 1). Las puntuaciones tienden a ubicarse en valores medios o elevados. En cambio, si los resultados fueran:
Variable: actitud hacia el presidente Moda: 1 Mediana: 1.5 Media (X): 1.3 Desviacin estndar: 0.4 Varianza: 0.16 Mximo: 3.0 Mnimo: 1.0 Rango: 2.0
La interpretacin es que la actitud hacia el presidente es muy desfavorable. En la fi gura 10.8 vemos grficamente la comparacin de resultados. La variabilidad tambin es menor en el caso de la actitud muy desfavorable (los datos se encuentran menos dispersos).
Otro ejemplo de interpretacin de los resultados de una medicin respecto a una variable sera el que ahora se presenta.
EJEMPLO Hernndez Sampieri y Corts (1982) aplicaron una prueba de motivacin intrnseca sobre la ejecucin de una tarea a 60 participantes de un experimento. La escala contena 17 tems (con cinco opciones cada uno, uno a cinco) y los resultados fueron los siguientes: N: 60 Rango: 41 Mnimo: 40 Mximo: 81 Media: 66.883 Mediana: 67.833 Moda: 61 DE: 9.11 Varianza: 83.02 Curtosis: 0.587 Asimetra: 0.775 EE: 1.176 Sumatoria: 4 013 Qu podramos decir sobre la motivacin intrnseca de los participantes? El nivel de motivacin intrnseca exhibido por los participantes tiende a ser elevado, como lo indican los resultados. El rango real de la escala iba de 17 a 85. El rango resultante para esta investigacin vari de 40 a 81. Por tanto, es evidente que los individuos se inclinaron hacia valores elevados en la medida de motivacin intrnseca. Adems, la media de los participantes es de 66.9 y la mediana de 67.8, lo cual confirma la tendencia de la muestra hacia valores altos de la escala. A pesar de que la dispersin de las puntuaciones de los sujetos es considerable (la desviacin estndar es igual a 9.1 y el rango es de 41), esta dispersin se manifiesta en el rea ms elevada de la escala. Vemoslo grficamente.
En resumen, la tarea result intrnsecamente motivante para la mayora de los participantes; slo que para algunos result muy motivante; para otros, relativamente motivante, y para los dems, medianamente motivante. Esto es, que la tendencia general es hacia valores superiores. Ahora bien, qu significa un alto nivel de motivacin intrnseca exhibido con respecto a una tarea? Implica que la tarea fue percibida como atractiva, interesante, divertida y categorizada como una experiencia agradable. Asimismo, involucra que los individuos, al ejecutarla, derivaron de ella sentimientos de satisfaccin, goce y
realizacin personal. Por lo general, quien se encuentra intrnsecamente motivado hacia una labor, disfrutar la ejecucin de sta, ya que obtendr de la labor per se recompensas internas, como sentimientos de logro y autorrealizacin. Adems de ser absorbido por el desarrollo de la tarea y, al tener un buen desempeo, la opinin de s mismo mejorar o se ver reforzada.
Hay alguna otra estadstica descriptiva? S, la asimetra y la curtosis. Los polgonos de frecuencia suelen representarse como curvas (fi gura 10.9) para que puedan analizarse en trminos de probabilidad y visualizar su grado de dispersin. De hecho, en realidad son curvas. Los dos elementos mencionados son esenciales para estas curvas o polgonos de frecuencias. La asimetra es una estadstica necesaria para conocer cunto se parece nuestra distribucin a una distribucin terica llamada curva normal (la cual se representa tambin en la fi gura 10.9) y constituye un indicador del lado de la curva donde se agrupan las frecuencias. Si es cero (asimetra = 0), la curva o distribucin es simtrica. Cuando es positiva, quiere decir que hay ms valores agrupados hacia la izquierda de la curva (por debajo de la media). Cuando es negativa, significa que los valores tienden a agruparse hacia la derecha de la curva (por encima de la media). La curtosis es un indicador de lo plana o picuda que es una curva. Cuando es cero (curtosis = 0), significa que puede tratarse de una curva normal. Si es positiva, quiere decir que la curva, la distribucin o el polgono es ms picuda(o) o elevada(o). Si la curtosis es negativa, indica que es ms plana la curva. La asimetra y la curtosis requieren mnimo de un nivel de medicin por intervalos. En la figura 10.9 se muestran ejemplos de curvas con su interpretacin.
Cmo se traducen las estadsticas descriptivas al ingls? Algunos programas y paquetes estadsticos computacionales pueden realizar el clculo de las estadsticas descriptivas, cuyos resultados aparecen junto al nombre respectivo de estas, muchas veces en ingls. A continuacin se indican las diferentes estadsticas y su equivalente en ingls.
Nota final Debe recordarse que en una investigacin se obtiene una distribucin de frecuencias y se calculan las estadsticas descriptivas para cada variable, las que se necesiten de acuerdo con los propsitos de la investigacin y los niveles de medicin.
En la tabla, el nmero de casos es distinto en las diferentes variables, porque SPSS elimina de toda la variable a los casos que no hayan respondido a un tem o ms reactivos. La variable con mayor promedio es la motivacin intrnseca y la ms baja es recompensas. Posteriormente, obtuvo las tablas y distribuciones de frecuencias de todas sus 12 variables. De las cuales solamente incluimos la variable desempeo por cuestiones de espacio.
Puntuaciones z Las puntuaciones z son transformaciones que se pueden hacer a los valores o las puntuaciones obtenidas, con el propsito de analizar su distancia respecto a la medida, en unidades de desviacin estndar. Una puntuacin z nos indica la direccin y el grado en que un valor individual obtenido se aleja de la media, en una escala de unidades de desviacin estndar.