Anda di halaman 1dari 50

Universidad Nacional Autónoma de Nicaragua

UNAN – Managua
Facultad Regional Multidisplinaria de Estelí
FAREM – Estelí
Recinto Universitario Leonel Rugama Rugama
Departamento de Ciencias de la Educación y Humanidades

ESTADISTICA APLICADA A LAS CIENCIAS SOCIALES


UNIVERSIDAD NACIONAL AUTONOMA DE NICARAGUA
ESTADISTICA APLICADA A LAS CCSS
LICENCIATURA EN TRABAJO SOCIAL
LIC. JULISSA GUTIERREZ

2
UNIVERSIDAD NACIONAL AUTONOMA DE NICARAGUA
ESTADISTICA APLICADA A LAS CCSS
LICENCIATURA EN TRABAJO SOCIAL
LIC. JULISSA GUTIERREZ

“Algún día el conocimiento estadístico será tan necesario para ser un buen y
eficiente ciudadano, como lo es saber leer” H.G. Wells

INTRODUCCIÓN

Casi todos los días utilizamos los conceptos estadísticos en las diversas facetas de
nuestra vida. Por ejemplo, al comenzar el día uno abre la llave de la ducha para
probar la temperatura del agua y decidir si añade más agua caliente o más agua fría
y, si la temperatura es idónea empieza a bañarse. Como segundo ejemplo,
supongamos que se está en una tienda de comestible decidieron qué pizza
congelada se va a comprar. Una de las empresas productoras de pizzas cuenta con
un mostrador donde se ofrecen pequeñas pruebas de su producto. Después de
probarlo, uno decide si lo compra o no. En ambos ejemplos, se toma una decisión
y se elige el curso de acción basándose en una muestra.

Las empresas enfrentan problemas similares. Una compañía debe asegurarse de


que la cantidad promedio de cereal en el paquete de 25,5 gramos cumpla con las
especificaciones de la etiqueta. Para hacerlo, selecciona muestras periódicas del
área de producción y pesa el contenido.

Dentro del ámbito empresarial se ha vuelto una regla emplear la estadística y pensar
tomándola en cuenta. Mientras más grandes sean las unidades empresariales,
estas cuentan no solo con sus propios departamentos de recopilación de datos
estadísticos, sino también se convierten en consumidores de estadísticas
recopiladas por otras personas. Asimismo, para la elaboración de documentos de
prensa comercial y de gobierno se expresan en lenguaje estadístico, ya que solo de
esta forma se logra conducir de manera ordenada e inteligente estos asuntos.

A nivel nacional, un candidato a la presidencia quiere saber qué porcentaje de


electores en cierta cuidad, lo apoyará en la siguiente elección. Existen diferentes
formas de saber esto: puede hacer que su equipo llame por teléfono a todas las

3
UNIVERSIDAD NACIONAL AUTONOMA DE NICARAGUA
ESTADISTICA APLICADA A LAS CCSS
LICENCIATURA EN TRABAJO SOCIAL
LIC. JULISSA GUTIERREZ

personas registradas en el padrón y les pregunte por quién votarán. Puede salir él
mismo a la calle, detener a diez personas adultas y preguntarles por quién van a
votar. Puede seleccionar una muestra aleatoria de 1000 electores de la provincia,
hablar con ellos y, basándose en esta selección, realizar un cálculo de porcentaje
de personas que votarán por él en la elección. En este curso le mostraremos por
qué motivo la tercera opción es la mejor.

Puede observarse entonces que la estadística actualmente constituye una parte


integral de la vida cotidiana; se encuentra inmersa en ámbitos tan variados como la
política, la medicina, la educación, los negocios y las áreas legales, además,
constituye un recurso para describir información, una herramienta de análisis y un
medio para alcanzar conclusiones de ayuda para tomar decisiones por lo que se
considera que las actividades humanas actualmente se miden y son guiadas por la
estadística.

ESTADÍSTICA

¿Cómo definimos la palabra “estadística”? Es un término que encontramos


frecuentemente en nuestro lenguaje diario. En realidad, tiene dos significados. En
el uso más común, la estadística se refiere a información numérica. Como ejemplo
de lo anterior tenemos el salario inicial promedio de los egresados de una
licenciatura, el número promedio de automóviles Toyota vendidos mensualmente
en el año pasado en cierto concesionario, el porcentaje de estudiantes de cierta
carrera que terminarán su educación a nivel de licenciatura, el número de muertes
por alcoholismo durante el último año, la variación en el Promedio Industrial Dow
Jones del día de ayer a hoy, o el número de jonrones realizados por el equipo de
los Cachorros de Chicago durante la temporada del 2000. En los ejemplos
anteriores una “estadística” es un número o porcentaje. Oros ejemplos son:

 La oficina de Censos calcula que la población de EUA será de 335 050 000
en el año 2025.
 La extensión promedio de los ciclos empresariales desde 1945 es de 61.

4
UNIVERSIDAD NACIONAL AUTONOMA DE NICARAGUA
ESTADISTICA APLICADA A LAS CCSS
LICENCIATURA EN TRABAJO SOCIAL
LIC. JULISSA GUTIERREZ

 El auto típico de EEUU recorre 11 099 millas por año. El autobús típico viaja
9 353 millas por año, y el camión típico, 13 942 millas por año. En Canadá
las cifras correspondientes son 10 371 millas para automóviles, 19 823
millas para autobuses, y 7 001 millas para camiones.

Los anteriores son ejemplos de estadísticas. A una colección de información


numérica se le conoce como estadísticas (en plural).

La estadística tiene un significado mucho más amplio que la mera recopilación y


publicación.

Estadística: Es la ciencia que se ocupa de recolectar, organizar, presentar,


analizar e interpretar datos que contribuya a una toma de decisiones más
efectiva.

Una primera razón para estudiar estadística, es que en todos lados encontramos
información numérica. Si se revisan periódicos, revistas, publicaciones de interés
general, revistas femeninas o revistas de deporte, se verá bombardeado con
información numérica. Presentamos algunos ejemplos:

 La empresa General Electric reportó que en 1999 sus ganancias fueron de


$111 630 000 (dólares), mayores que los $100 469 000 que obtuvo en 1998.
 Los egresados de post grado del programa de Maestría en Administración de
Empresas en la Universidad de Notre Dame, contaron con un sueldo inicial
promedio de $54 000 dólares y 91% de ellos consiguieron trabajo a los tres
meses de la graduación.
 En EUA se consume mayor cantidad de café que en cualquier otro país; en
promedio, 1,75 tazas diarias por persona.

¿Cómo podemos determinar si las conclusiones presentadas son razonables?


¿Acaso las muestras fueron suficientemente grandes? ¿Cómo se seleccionaron las
unidades de la muestra? Para poder ser una persona capacitada a fin de entender

5
UNIVERSIDAD NACIONAL AUTONOMA DE NICARAGUA
ESTADISTICA APLICADA A LAS CCSS
LICENCIATURA EN TRABAJO SOCIAL
LIC. JULISSA GUTIERREZ

esta información, se necesita saber realizar el análisis de la información. La


comprensión de los conceptos de estadística será de gran ayuda.

Una segunda razón por la cual tomar un curso de estadística es que las técnicas
estadísticas se utilizan para tomar decisiones que afectan nuestra vida diaria. He
aquí algunos ejemplos:

 Las compañías de seguros utilizan análisis estadístico para establecer las


tarifas de los seguros de casas, automóvil, vida y salud. Existen tablas que
indican la probabilidad de que, por ejemplo, una persona de 25 años viva un
año más, cinco años más, etcétera.
 Los investigadores médicos estudian las tasas de curación de enfermedades,
basándose en el uso de diferentes medicamentos y distintas formas de
tratamiento. Por ejemplo, ¿cuál es el efecto de tratar cierto tipo de daño a la
rodilla con cirugía o con terapia física?
 La agencia de Protección al Medio Ambiente (en EUA) está interesada en la
calidad del agua en el Lago Erie. Periódicamente toman muestras del líquido
para establecer el nivel de contaminación y mantener el nivel de calidad.

La tercera razón para tomar un curso de estadística es que el conocimiento de los


métodos estadísticos ayuda a entender por qué se toman ciertas decisiones, y
aporta una mejor comprensión respecto a la forma en la que nos afectan las
decisiones.

Sin importar el tipo de trabajo que se elija, el estudiante tendrá que enfrentarse con
la toma de decisiones, para lo cual una comprensión del análisis de datos será de
gran ayuda. Para poder tomar una decisión basada en la información, se necesita:

1. Determinar si la información existente es adecuada o si se requiere


información adicional.
2. Reunir la información adicional, si es necesario, de tal forma que no haya
resultados idóneos.

6
UNIVERSIDAD NACIONAL AUTONOMA DE NICARAGUA
ESTADISTICA APLICADA A LAS CCSS
LICENCIATURA EN TRABAJO SOCIAL
LIC. JULISSA GUTIERREZ

3. Resumir la información de modo útil e informativo.


4. Analizar la información disponible.
5. Sacar las conclusiones y realizar las inferencias necesarias, al tiempo que se
evalúa el riesgo de llegar a una conclusión incorrecta.

ESTADÍSTICA DESCRIPTIVA vs ESTADISICA INFERENCIAL

 Estadística Descriptiva
Generalmente, el estudio de la estadística se divide en dos categorías:
estadística descriptiva y estadística inferencial. La definición de estadística
presentada anteriormente menciona la “organización, presentación,
análisis… de datos”. Esta área de la ciencia estadística se conoce
comúnmente como estadística descriptiva.

Estadística Descriptiva: Conjunto de métodos para organizar, resumir y


presentar los datos de manera informativa.

Los conjuntos de datos no organizados son de poco valor. Sin embargo, hay
técnicas estadísticas para organizar este tipo de información de manera
significativa. Algunos datos pueden organizarse en una distribución de
frecuencias. Suelen utilizarse diversos tipos de gráficas para describir los
datos.
Por ejemplo, al analizar a sus compañeros de clase tal vez encuentre que
35% de ellos usa relojes Casio. Si así fuera, el “35%” es un estadístico
descriptivo. No se intenta sugerir que 35% de los estudiantes de su país, ni
siquiera de su universidad, utilizan relojes Casio, solo se registra el dato que
se encontró. Como se observa, la estadística descriptiva, simplemente
resume y describe los datos recolectados. A continuación, se presentan otros

7
UNIVERSIDAD NACIONAL AUTONOMA DE NICARAGUA
ESTADISTICA APLICADA A LAS CCSS
LICENCIATURA EN TRABAJO SOCIAL
LIC. JULISSA GUTIERREZ

ejemplos en los cuales se expresan diversos datos encontrados mediante la


estadística descriptiva.

Ejemplos:

 Durante el 2000, los miembros del Congreso recibieron un total de 80


millones de mensajes por correo electrónico, más del doble de la
cantidad recibida durante 1998.
 Más de 8 millones de personas viven en la ciudad e Nueva York.
Loving Country (Texas), tiene 67 residentes y una densidad de
población de una persona por 10 millas cuadradas.
 Más de 1800 plantas y animales están en la lista de especies en
peligro de extinción del Departamento de Interior del gobierno de
Estados Unidos.
 Durante enero de 2001, 80.6% de los vuelos de Continental Airlines
arribó a tiempo

 Estadística Inferencial

Otra área estadística es la estadística inferencial, también denominada inferencia


estadística o estadística inductiva. El principal objetivo de la estadística inferencial
es encontrar algo sobre una población basándose en una muestra tomada de esa
población. Se va más allá de una simple descripción de los datos y se hace
inferencia con respecto al fenómeno o a los fenómenos de los que se obtuvieron las
muestras.

Estadística Inferencial: Conjunto de métodos utilizados para saber algo acerca de


una población, basándose en la información obtenida de una muestra.

Observe las palabras “población” y “muestra” en la definición de la estadística


inferencial.

8
UNIVERSIDAD NACIONAL AUTONOMA DE NICARAGUA
ESTADISTICA APLICADA A LAS CCSS
LICENCIATURA EN TRABAJO SOCIAL
LIC. JULISSA GUTIERREZ

TÉRMINOS IMPORTANTES EN LA INFERENCIA ESTADÍSTICA

Una población, también denominada universo, puede constar de individuos.

Ejemplo: Los estudiantes matriculados en la Universidad Nacional Autónoma de


Nicaragua. Una población también puede incluir objetos, como las llantas XB 70
producidas durante una semana en la compañía Cooper Tire and Rubber, en
Findlay Ohio, o todas las truchas que se encuentran en un estanque. Una población
también puede estar formada por un grupo de medidas, como podrían ser los pesos
de todos los jugadores de la línea defensiva del equipo de futbol americano de la
Universidad Estatal de Pensilvania o las estaturas de los jugadores de basquetbol
de la selección de EUA. Por tanto, una población en el sentido estadístico no
siempre se refiere a personas.

Población: Conjunto de todos los posibles individuos, objetos o medidas de interés.

Ahora bien, generalmente el investigador no tiene al alcance todos los elementos


de la población, es por esta razón que generalmente se toma una muestra de la
población con el objeto de inferir algo acerca de la misma, está un número más
pequeño (un subconjunto) de los objetos, personas o medidas que se encuentran
en la totalidad de la población. Asimismo, se dice que la muestra es representativa
si sus integrantes tienden a tener las mismas características que la población de la
cual fueron seleccionadas. Cuando una muestra es tan grande que incluye a todos
los integrantes de la población, se denomina censo completo.

Muestra: Una porción, o parte de la población de interés.

Ejemplos:

1. Población de libros de una biblioteca ; muestra, población de libros en la


sección de historia.
2. Población de niños en edad en edad escolar; muestra; población de niños
en primer grado de primaria.

9
UNIVERSIDAD NACIONAL AUTONOMA DE NICARAGUA
ESTADISTICA APLICADA A LAS CCSS
LICENCIATURA EN TRABAJO SOCIAL
LIC. JULISSA GUTIERREZ

3. Personas hospitalizadas en el año 2014, muestra personas hospitalizadas


por accidente en el año 2014.
4. Población de árboles de un bosque; muestra, la población de abedules de
una zona delimitada dentro de ese bosque.
5. Población de ganado vacuno en una granja; muestra, fracción de vacas
que pesan ms de 700 kilos.
6. Población de gatos de una ciudad; muestra, gatos vacunados dentro de
la misma ciudad.

Asimismo, para medir la muestra se utilizan los estadísticos. El estadístico de la


muestra puede ser una medida de carácter típico o tendencia central, como la
media, mediana, moda o proporción, o puede ser una medida de extensión o
dispersión, como el rango o la desviación estándar.

Estadístico: Medida característica de la muestra.

Para la población, se utilizan también el parámetro. Este es una característica


numérica de la población. Si se realiza un censo completo de la población, se puede
medir el parámetro. Sin embargo, como ya se mencionó, es muy difícil en la mayoría
de las investigaciones en la práctica, acceder a toda la población para un estudio.

El objetivo de calcular el estadístico de la muestra es estimar el valor del parámetro


correspondiente a la población. Entre los parámetros típicos se encuentran la media,
mediana, proporción y desviación estándar de la población.

Parámetro: Medida característica numérica de la población.

Ejemplos:

 La compañía Market Facts con base en Chicago pidió a una muestra


de 1960 consumidores que probaron un platillo de pescado congelado
producido por la empresa Morton y denominado Fish Delight De los

10
UNIVERSIDAD NACIONAL AUTONOMA DE NICARAGUA
ESTADISTICA APLICADA A LAS CCSS
LICENCIATURA EN TRABAJO SOCIAL
LIC. JULISSA GUTIERREZ

consumidores consultados, 1176 dijeron que comprarían el platillo si


se pusiera a la venta.
 Una investigación de Bielsen/NetRating estima que 162.8 millones de
estadounidenses (58% de la población) tiene acceso a sitios web en
su domicilio.
 A partir de un estudio de 340 mujeres divididas en cuatro grupos según
su ocupación, los investigadores de la Universidad de Pittsburgh
encontraron que las empleadas de oficina tienen el mayor riesgo de
padecimientos cardiovasculares.
 De 1400 directivos corporativos de finanza encuestados, 38% dijo que
el “reconocimiento frecuente de los logros” er4a el mejor modo de
motivar a sus empleados.
 En una encuesta realizada a alumnos de último año de preparatoria
que aspiraban a matricularse en una universidad 33% dijo que “la
reputación académica” era la característica más importante al elegir
una universidad.
a. Identifique la población de estudio.
b. ¿Cuál es el tamaño de la muestra?

c. ¿Qué informaría Market Facts a Motton Foods respecto a la


aceptación del Fish Delight?
d. ¿Se trata de un ejemplo de estadística descriptiva o de estadística
inferencial? Justifique su respuesta.

LA IMPORTANCIA DEL MUESTREO

Gran parte de los trabajos de estadística se realizan con muestras. Las muestras
son necesarias debido a que con frecuencia las poblaciones son demasiado
grandes para ser estudiadas en su totalidad. Es muy costoso y demanda mucho
tiempo examinar la población total, por tanto debe seleccionarse una parte de la

11
UNIVERSIDAD NACIONAL AUTONOMA DE NICARAGUA
ESTADISTICA APLICADA A LAS CCSS
LICENCIATURA EN TRABAJO SOCIAL
LIC. JULISSA GUTIERREZ

población, calcular el estadístico de la muestra y utilizarlo para estimar el parámetro


correspondiente de la población.

La exactitud de toda estimación es de enorme importancia. Esta exactitud depende


de gran parte de la forma como se seleccionó la muestra y del cuidado que se tenga
para garantizar que la muestra proporcione una imagen lo más parecido posible de
la población. Sin embargo, con mucha frecuencia se comprueba que la muestra no
es del todo representativa y generará un error de muestreo. Este error, es la
diferencia entre el estadístico de la muestra utilizado para estimar el parámetro en
la población y el valor real pero desconocido del parámetro.

Error de muestreo: Diferencia entre el parámetro desconocido y el estadístico


obtenido en la muestra.

TIPOS DE VARIABLES

Existen dos tipos básicos de datos: los obtenidos a partir de una población
cualitativa y los que resultan de una población cuantitativa.

Cuando la característica o variable en estudio es no numérica, se le denomina


variable cualitativa o atributo.

Ejemplos:

1. Sexo de los recién nacidos en un hospital local


2. Color de ojos de una persona
3. Actitud hacia el estudio de la estadística
4. Color favorito de la vestimenta de las personas
5. Condición económica de un grupo de trabajo social

12
UNIVERSIDAD NACIONAL AUTONOMA DE NICARAGUA
ESTADISTICA APLICADA A LAS CCSS
LICENCIATURA EN TRABAJO SOCIAL
LIC. JULISSA GUTIERREZ

Las variables cualitativas a como la palabra lo expresa mide características de


cualidades por tanto estas a su vez se clasifican en ordinales y nominales

Las variables ordinales se denominan a aquellas que admiten un orden especifico


en el nivel de medición, mientas que las variables nominales no admiten un orden
especifico.

Ejemplos de variables ordinales

1. Jerarquía de los empleados de una empresa


2. Nivel de satisfacción de los usuarios de un servicio de telefonía móvil
3. Nivel académico de un grupo de estudiantes

En el caso de las variables de ordinales, generalmente se acostumbra a utilizar


ciertas escalas de medición dentro de ellas la más conocida es la escala LIKER que
categoriza a las variables de acuerdo a un orden especifico según apropiación del
investigador

Ejemplo de variables nominales:

1. Sexo
2. Color favorito
3. Nivel académico

Cuando la variable estudiada se puede expresar numéricamente se denomina


variable cuantitativa.

Ejemplos:

1. Estatura de los estudiantes de la carrera de primer año de trabajo social


2. Edad

13
UNIVERSIDAD NACIONAL AUTONOMA DE NICARAGUA
ESTADISTICA APLICADA A LAS CCSS
LICENCIATURA EN TRABAJO SOCIAL
LIC. JULISSA GUTIERREZ

3. Temperatura axial que se registra de una persona cada intervalo de tiempo


4. Salario devengado mensualmente por un grupo de personas
5. Calificación obtenida por un grupo de estudiantes de trabajo social

A su vez las variables cuantitativas pueden ser discretas o continuas. Las variables
discretas pueden asumir sólo ciertos valores y generalmente existen “brechas” o
“huecos” entre ellos. Por lo común, las variables discretas son resultado de un
conteo.

Ejemplos:

1. Número de acciones vendidas cada día en la bosa


2. Número de hijos de 50 familias
3. Censo anual en Nicaragua
4. Número de calzado de un grupo de personas
5. Número de estudiantes admitidos en la universidad anualmente

Las observaciones de una variable continua pueden tomar cualquier valor dentro
de un intervalo determinado. Las variables continuas resultan generalmente de
medir algo.

Ejemplos:

1. Pago en servicios básicos que realiza una persona mensualmente


2. Promedio obtenido por un grupo de estudiantes
3. Estatura de una persona
4. Peso promedio
5. Promedio de temperaturas registradas en los últimos dos meses en la ciudad
de Estelí

NIVELES DE MEDICIÓN

14
UNIVERSIDAD NACIONAL AUTONOMA DE NICARAGUA
ESTADISTICA APLICADA A LAS CCSS
LICENCIATURA EN TRABAJO SOCIAL
LIC. JULISSA GUTIERREZ

El siguiente esquema muestra los distintos niveles de medición que se explicaron


anteriormente

NIVELES DE
LOS DATOS

NOMINAL ORDINAL INTERVALO RAZÓN

ORDENA LOS LAS DIFERENCIAS EL CERO Y EL


SÓLO CLASIFICA ENTRE LOS COCIENTE ENTRE
DATOS POR LAS VALORES TIENE VALORES TIENEN
LOS DATOS
JERARQUÍAS SIGNIFICADO SIGNIFICADO

PARA INVESTIGAR: Consulta bibliografía pertinente acerca de datos


por intervalo y razón y describe algunos ejemplos relacionados a las
ciencias sociales

Otros conceptos que se deben tener en cuenta son los siguientes:

Unidad de Observación: Es la unidad que está sujeta a medición, conocida


también como unidad elemental.

Parámetro: Es una medida resumen que describe una característica de la población

Estadístico o estadígrafo: Son también medidas de resumen que describen una


característica de la muestra y para calcular su valor se requiere de los elementos
de la muestra únicamente.

TABLAS DE FRECUENCIAS

15
UNIVERSIDAD NACIONAL AUTONOMA DE NICARAGUA
ESTADISTICA APLICADA A LAS CCSS
LICENCIATURA EN TRABAJO SOCIAL
LIC. JULISSA GUTIERREZ

Como resultado del estudio estadístico se posee una serie de estadillos o


cuestionarios, uno por cada individuo considerado en el que se recogen todas las
medidas realizadas a cada individuo.

La distribución de frecuencias o tabla de frecuencias es una ordenación en forma


de tabla de los datos estadísticos, asignando a cada dato su frecuencia
correspondiente.

TIPOS DE FRECUENCIAS

Frecuencia absoluta

La frecuencia absoluta es el número de veces que aparece un determinado valor en


un estudio estadístico.

Se representa por fi.

La suma de las frecuencias absolutas es igual al número total de datos, que se


representa por N.

Para indicar resumidamente estas sumas se utiliza la letra griega Σ (sigma


mayúscula) que se lee suma o sumatoria.

Frecuencia relativa

La frecuencia relativa es el cociente entre la frecuencia absoluta de un determinado


valor y el número total de datos.

Se puede expresar en tantos por ciento y se representa por ni.

La suma de las frecuencias relativas es igual a 1.

Frecuencia acumulada

16
UNIVERSIDAD NACIONAL AUTONOMA DE NICARAGUA
ESTADISTICA APLICADA A LAS CCSS
LICENCIATURA EN TRABAJO SOCIAL
LIC. JULISSA GUTIERREZ

La frecuencia acumulada es la suma de las frecuencias absolutas de todos los


valores inferiores o iguales al valor considerado.

Se representa por Fi.

Frecuencia relativa acumulada

La frecuencia relativa acumulada es el cociente entre la frecuencia acumulada de


un determinado valor y el número total de datos. Se puede expresar en tantos por
ciento.

Ejemplo:

Durante el mes de julio, en una ciudad se han registrado las siguientes temperaturas
máximas:

32, 31, 28, 29, 33, 32, 31, 30, 31, 31, 27, 28, 29, 30, 32, 31, 31, 30, 30, 29, 29, 30,
30, 31, 30, 31, 34, 33, 33, 29, 29.

En la primera columna de la tabla colocamos la variable ordenada de menor a


mayor, en la segunda hacemos el recuento y en la tercera anotamos la frecuencia
absoluta.

17
UNIVERSIDAD NACIONAL AUTONOMA DE NICARAGUA
ESTADISTICA APLICADA A LAS CCSS
LICENCIATURA EN TRABAJO SOCIAL
LIC. JULISSA GUTIERREZ

xi Recuento fi Fi ni Ni

27 I 1 1 0.032 0.032

28 II 2 3 0.065 0.097

29 6 9 0.194 0.290

30 7 16 0.226 0.516

31 8 24 0.258 0.774

32 III 3 27 0.097 0.871

33 III 3 30 0.097 0.968

34 I 1 31 0.032 1

TOTAL 31 1

Este tipo de tablas de frecuencias se utiliza con variables discretas.

La tabla siguiente es un ejemplo de uno de estos estadillos, en él se han anotado


seis características de árboles de un vivero después de un año de haber sido
plantadas, la tabla recoge las medidas correspondientes a los diez primeros.

18
UNIVERSIDAD NACIONAL AUTONOMA DE NICARAGUA
ESTADISTICA APLICADA A LAS CCSS
LICENCIATURA EN TRABAJO SOCIAL
LIC. JULISSA GUTIERREZ

Árbol nº Replantado Grado de Nº de ramas Diámetro Altura


afección primarias (cm) (cm)

1 N MG 1 3,9 160,4

2 S NA 0 4,3 203,7

3 N M 2 3,9 160,5

4 N G 1 2,5 146,3

5 N M 3 3,9 123,0

6 S NA 4 4,2 184,4

7 N L 2 4,5 153,0

8 N L 1 5,3 186,0

9 S MG 0 2,5 169,8

10 S M 2 2,9 168,8

Códigos: S: Si NA: No afectado

N: No L: Leve

M: Medio

G: Grave

MG: Muy
Grave

El primer paso para sintetizar la información es tabular los datos. Consideraremos


distintos tipos de agrupaciones de datos:

19
UNIVERSIDAD NACIONAL AUTONOMA DE NICARAGUA
ESTADISTICA APLICADA A LAS CCSS
LICENCIATURA EN TRABAJO SOCIAL
LIC. JULISSA GUTIERREZ

Tablas de frecuencias de datos en agrupamiento discreto:

Realizamos este tipo de agrupamiento cuando el número de posibles respuestas a


la variable en estudio es reducido. Las variables cualitativas se prestan muy bien a
este sistema de agrupamiento

Para construir una tabla de frecuencias de agrupamiento discreto se anotan en una


columna cada uno de los distintos valores que tome la variable y en la columna
siguiente su frecuencia o número de veces que se repite.

La tabla de frecuencia de la variable Replantado es:

Replantado Frecuencia

S 4

N 6

Total: 10

La tabla de frecuencia de la variable X = Grado de afección es:

Grado de frecuencia frecuencia


afección relativa

xi fi
ni

NA 2 0.2

L 2 0.2

M 3 0.3

20
UNIVERSIDAD NACIONAL AUTONOMA DE NICARAGUA
ESTADISTICA APLICADA A LAS CCSS
LICENCIATURA EN TRABAJO SOCIAL
LIC. JULISSA GUTIERREZ

G 1 0.1

MG 2 0.2

Total 10 1.0

La frecuencia relativa es la frecuencia absoluta dividida entre el número de


observaciones, indica la proporción de datos que muestran un determinado valor de
la variable. Se puede expresar también en %.

La tabla de frecuencia de la variable X=Número de ramas primarias es.

Nº ramas frecuencia frecuencia Frecuencia Frecuencia


primarias relativa acumulada acumulada
relativa

Fi
xi fi Ni
ni

0 2 0.2 2 0.2

1 3 0.3 5 0.5

2 3 0.3 8 0.8

3 1 0.1 9 0.9

4 1 0.1 10 1.0

Total 10 1.0

La frecuencia acumulada es el número de datos que presentan un valor menor o


igual que uno dado de la variable. La frecuencia acumulada relativa es la proporción
de datos menores o iguales a uno dado.

21
UNIVERSIDAD NACIONAL AUTONOMA DE NICARAGUA
ESTADISTICA APLICADA A LAS CCSS
LICENCIATURA EN TRABAJO SOCIAL
LIC. JULISSA GUTIERREZ

Distribución de frecuencias agrupadas

La distribución de frecuencias agrupadas o tabla con datos agrupados se emplea si


las variables toman un número grande de valores o la variable es continua.

Se agrupan los valores en intervalos que tengan la misma amplitud denominados


clases. A cada clase se le asigna su frecuencia correspondiente.

Límites de la clase

Cada clase está delimitada por el límite inferior de la clase y el límite superior de la
clase.

Amplitud de la clase

La amplitud de la clase es la diferencia entre el límite superior e inferior de la clase.

Marca de clase

La marca de clase es el punto medio de cada intervalo y es el valor que representa


a todo el intervalo para el cálculo de algunos parámetros.

Construcción de una tabla de datos agrupados

3, 15, 24, 28, 33, 35, 38, 42, 43, 38, 36, 34, 29, 25, 17, 7, 34, 36, 39, 44, 31, 26, 20,
11, 13, 22, 27, 47, 39, 37, 34, 32, 35, 28, 38, 41, 48, 15, 32, 13.

1º Se localizan los valores menor y mayor de la distribución. En este caso son 3 y


48.

2º Se restan y se busca un número entero un poco mayor que la diferencia y que


sea divisible por el número de intervalos queramos establecer.

Es conveniente que el número de intervalos oscile entre 6 y 15.

En este caso, 48 - 3 = 45, incrementamos el número hasta 50 : 5 = 10 intervalos.

Se forman los intervalos teniendo presente que el límite inferior de una clase
pertenece al intervalo, pero el límite superior no pertenece intervalo, se cuenta en
el siguiente intervalo.

Intervalos ci fi Fi ni Ni

[0, 5) 2.5 1 1 0.025 0.025

22
UNIVERSIDAD NACIONAL AUTONOMA DE NICARAGUA
ESTADISTICA APLICADA A LAS CCSS
LICENCIATURA EN TRABAJO SOCIAL
LIC. JULISSA GUTIERREZ

[5, 10) 7.5 1 2 0.025 0.050

[10, 15) 12.5 3 5 0.075 0.125

[15, 20) 17.5 3 8 0.075 0.200

[20, 25) 22.5 3 11 0.075 0.275

[25, 30) 27.5 6 17 0.150 0.425

[30, 35) 32.5 7 24 0.175 0.600

[35, 40) 37.5 10 34 0.250 0.850

[40, 45) 42.5 4 38 0.100 0.950

[45, 50) 47.5 2 40 0.050 1

40 1

Tablas de frecuencias de datos agrupados en clases:

Cuando tenemos una variable continua, o cuando, siendo discreta, el número de


valores diferentes es muy grande, se agrupan los datos en clases o intervalos.

El número de intervalos o clases I a considerar es una cuestión importante y no hay


un criterio fijo para establecerlo. La fórmula de Sturges es una de las que se pueden
utilizar para determinarlo, según ella, I es el exponente de la primera potencia de
dos cuyo resultado supera al número de datos, con un mínimo de 4 clases.

Para el ejemplo que estamos comentando, con 10 datos, como 24>10, se toma I=4.

Para determinar la amplitud de cada clase se divide el rango o diferencia entre el


mayor y el menor de los valores observados entre el número de clases I.

Para la variable diámetro, la amplitud es:

R 5.3  2.5 2.8


a    0.7
I 4 4

23
UNIVERSIDAD NACIONAL AUTONOMA DE NICARAGUA
ESTADISTICA APLICADA A LAS CCSS
LICENCIATURA EN TRABAJO SOCIAL
LIC. JULISSA GUTIERREZ

Si el cociente no es exacto se puede redondear por exceso, aunque eso hará que
la última clase termine en un valor superior al máximo observado.

Para evitar dudas, se consideran todos los intervalos cerrados por la derecha y
abiertos por la izquierda, salvo el primero que se considera cerrado por ambos
extremos.

Cada clase o intervalo se identifica con una cifra llamada marca de clase, que es la
media entre ambos extremos.

La tabla de frecuencias de la variable diámetro es:

Clases Marcas Frecuenci frecuenci frecuencia frecuencia


a a relativa acumulad acumulada
de clase
a relativa
fi
xi
Ni Fi
ni

[2.5 ; 3.2] 2.85 3 0.3 3 0.3

(3.2 ; 3.9] 3.55 3 0.3 6 0.6

(3.9 ; 4.6] 4.25 3 0.3 9 0.9

(4.6 ; 5.3] 4.95 1 0.1 10 1.0

REPRESENTACIONES GRÁFICAS:

Diagramas de sectores o de tarta:

Son aplicables a cualquier tipo de variables, pero se utilizan sobre todo para las
categóricas. Se construyen dividiendo un círculo en tantos sectores como
categorías se vayan a representar. Cada sector abarca un ángulo proporcional a la

24
UNIVERSIDAD NACIONAL AUTONOMA DE NICARAGUA
ESTADISTICA APLICADA A LAS CCSS
LICENCIATURA EN TRABAJO SOCIAL
LIC. JULISSA GUTIERREZ

frecuencia que se desea representar. El diagrama de sectores de la variable


Replantado es:

Diagrama de sectores

S
40%

N
60%

Diagramas de barras:

Son representaciones aplicables a tablas de frecuencias de datos en agrupamiento


discreto, se pueden aplicar tanto a datos cualitativos como cuantitativos discretos.
Consisten en un sistema de ejes cartesianos sobre cuyo eje de abcisas se llevan
los valores de la variable y sobre el de ordenadas la frecuencia absoluta o relativa,
acumulada o no. Por cada valor de la variable se levantará una línea o barra (aunque
puede ser un rectángulo) de altura equivalente a la frecuencia que se desea
representar.

Se muestran diagramas de barras de la variable Grado de afección y de la variable


Nº de ramas:

25
UNIVERSIDAD NACIONAL AUTONOMA DE NICARAGUA
ESTADISTICA APLICADA A LAS CCSS
LICENCIATURA EN TRABAJO SOCIAL
LIC. JULISSA GUTIERREZ

diagrama de barras Diagrama de barras

3.5 1.2

Frecuencia acumulada relativa


frecuencia absoluta

3 1
2.5
0.8
2
0.6
1.5
0.4
1
0.5 0.2
0 0
NA L M G MG 0 1 2 3 4

Grado de afección Nº de ramas primarias

Los diagramas de barras, al representar sobre el eje de abcisas los valores de la


variable, y ser el eje numérico, tienen mejor aplicación en variables como mínimo
ordinales, pues en las variables nominales no hay una ordenación de los valores y
se pueden representar en cualquier orden.

Histograma

Aplicables a tablas de frecuencias de datos agrupados en clases. Consiste en llevar


sobre un eje horizontal segmentos consecutivos que representen las amplitudes de
cada clase, posteriormente se traza sobre cada clase un rectángulo cuyo área sea
proporcional a la frecuencia que se desea representar. Si todas las clases tienen
igual amplitud, los rectángulos tienen no solo el área proporcional a la frecuencia,
su altura también lo es. Las alturas de los rectángulos representan frecuencia por
cada unidad de amplitud, que también se llama densidad de frecuencia. Si se traza
un eje vertical, la escala sobre este es la frecuencia por unidad de amplitud.

A continuación se muestran histogramas de la variable Diámetro.

26
UNIVERSIDAD NACIONAL AUTONOMA DE NICARAGUA
ESTADISTICA APLICADA A LAS CCSS
LICENCIATURA EN TRABAJO SOCIAL
LIC. JULISSA GUTIERREZ

Histograma de frecuencias Histograma de frecuencias acumuladas


relativas
Frecuencia por unidad de amplitud

Frecuencia relativa acumulada por


2.5 1

2 0.8

unidad de amplitud
1.5 0.6

1 0.4

0.5 0.2
0 0
2.85 3.55 4.25 4.95 2.85 3.55 4.25 4.95

Marcas de clase Marcas de clase

En estos dos histogramas se ha tomado la unidad de longitud igual a la amplitud y,


como todas las amplitudes son iguales, la cifra que indica el área de cada rectángulo
coincide con la que indica la altura y ambas con la frecuencia que se representa.

Polígonos de frecuencias:

Aplicables a variables numéricas, aunque también se pueden trazar sobre


cualitativas ordinales, se construyen uniendo los extremos de los diagramas de
barras o los centros de las bases superiores de los rectángulos del histograma
mediante líneas rectas. Si se desea cerrar la línea poligonal por sus dos extremos,
se podría inventar un valor o intervalo por delante del primero y otro mayor que el
último, cuyas frecuencias serán cero. En el caso de datos agrupados también es
frecuente unir el origen de la primera clase con el centro de su base superior y el
centro de la base superior del último rectángulo con el extremo de su base inferior.

27
UNIVERSIDAD NACIONAL AUTONOMA DE NICARAGUA
ESTADISTICA APLICADA A LAS CCSS
LICENCIATURA EN TRABAJO SOCIAL
LIC. JULISSA GUTIERREZ

Polígono de frecuencias

frecuencia absoluta 3
2.5
2
1.5
1
0.5
0
0 1 2 3 4
Nº de ramas primarias

Existen otros tipos de gráficos, como los pictogramas que utilizan símbolos gráficos
para representar las frecuencias, ya sea repitiendo un mismo símbolo varias veces
para indicar las mayores o menores frecuencias, o aumentando o disminuyendo el
tamaño del símbolo según la frecuencia que se represente.

Tipos de gráficas

Los datos recogidos en una tabla de frecuencias se pueden representar


gráficamente como has visto anteriormente, y así es más fácil interpretarla.

Ejemplo: Observa la siguiente tabla de valores:

Colores preferidos Frecuencia

Azul 15

Verde 13

Rojo 20

Amarillo 10

Blanco 20

Negro 2

28
UNIVERSIDAD NACIONAL AUTONOMA DE NICARAGUA
ESTADISTICA APLICADA A LAS CCSS
LICENCIATURA EN TRABAJO SOCIAL
LIC. JULISSA GUTIERREZ

Cuando se estudia una variable estadística cualitativa se pueden utilizar los


siguientes gráficos:

Diagrama de barras.

Diagrama de sectores.

Polígono de frecuencias.

29
UNIVERSIDAD NACIONAL AUTONOMA DE NICARAGUA
ESTADISTICA APLICADA A LAS CCSS
LICENCIATURA EN TRABAJO SOCIAL
LIC. JULISSA GUTIERREZ

Para representar variables cuantitativas, podemos emplear el histograma y el


polígono de frecuencias.

Veamos la siguiente tabla de frecuencias:

Años que van a cumplir Frecuencia


los alumnos

13 3

14 7

15 8

16 12

17 10

Vamos a hacer la representación gráfica:

Histograma.

Polígono de frecuencias.

30
UNIVERSIDAD NACIONAL AUTONOMA DE NICARAGUA
ESTADISTICA APLICADA A LAS CCSS
LICENCIATURA EN TRABAJO SOCIAL
LIC. JULISSA GUTIERREZ

MEDIDAS DE POSICIÓN:

Otra vía de resumir la información es expresar algunas cifras que de algún modo
resuman lo más característico de los datos, podemos calcular medidas de posición
y de dispersión. Entre las primeras se verán:

Moda: es la categoría (para variables cualitativas) o valor que más se repite


(variables cuantitativas). Cuando tengamos datos de tipo continuo solo tendrá
sentido la moda después de haber sido agrupados en clases.

La moda de la variable Replantado es N, pues su frecuencia es la mayor entre las


dos categorías posibles. La moda de la variable Grado de afección es M, en tanto
que para la variable Nº de ramas primarias hay dos valores con máxima frecuencia,
son 1 y 2 ramas.

La moda puede no ser única, y hablamos de distribuciones de frecuencias


bimodales, trimodales, etc.

Ejemplo:

1. Un pediatra obtuvo la siguiente tabla sobre los meses de edad de 50 niños


de su consulta en el momento de andar por primera vez:

31
UNIVERSIDAD NACIONAL AUTONOMA DE NICARAGUA
ESTADISTICA APLICADA A LAS CCSS
LICENCIATURA EN TRABAJO SOCIAL
LIC. JULISSA GUTIERREZ

Meses Niños

9 1

10 4

11 9

12 16

13 11

14 8

15 1

Calcular la moda.

Mo = 12

Para el caso cuando los datos se presentan en forma agrupada se utiliza la relación:

∆1
𝑀𝑜 = 𝐿𝑅𝑖 +
∆1 + ∆2

Donde:

𝑀𝑜: Moda

𝐿𝑅𝑖 Limite real inferior del intervalo modal

∆1 = 𝑓𝑖 − 𝑓𝑖−1 : variación de la frecuencia absoluta con respecto a l frecuencia


absoluta anterior.

∆2 = 𝑓𝑖 − 𝑓𝑖+1: variación de la frecuencia absoluta con respecto a l frecuencia


absoluta siguiente.

32
UNIVERSIDAD NACIONAL AUTONOMA DE NICARAGUA
ESTADISTICA APLICADA A LAS CCSS
LICENCIATURA EN TRABAJO SOCIAL
LIC. JULISSA GUTIERREZ

2. Calcular la moda de una distribución estadística que viene dada por la


siguiente tabla:

Intervalo fi

[60, 63) 5

[63, 66) 18

[66, 69) 42

[69, 72) 27

[72, 75) 8

Total 100

3. Calcular la moda de una distribución estadística viene dada por la siguiente


tabla:

Intervalo fi

[10, 15) 3

[15, 20) 5

[20, 25) 7

[25, 30) 4

33
UNIVERSIDAD NACIONAL AUTONOMA DE NICARAGUA
ESTADISTICA APLICADA A LAS CCSS
LICENCIATURA EN TRABAJO SOCIAL
LIC. JULISSA GUTIERREZ

[30, 35) 2

La Mediana: Es el valor que ocupa el lugar central de todos los datos cuando éstos
están ordenados de menor a mayor.

La mediana se representa por Me.

La mediana se puede hallar sólo para variables cuantitativas.

Cálculo de la mediana:

1. Ordenamos los datos de menor a mayor.

2. Si la serie tiene un número impar de medidas la mediana es la puntuación


central de la misma.

2, 3, 4, 4, 5, 5, 5, 6, 6

Me = 5

3. Si la serie tiene un número par de puntuaciones la mediana es la media entre las


dos puntuaciones centrales.

7, 8, 9, 10, 11, 12

Me = 9.5

4. Hallar la mediana de la siguiente serie de números:

3, 5, 2, 6, 5, 9, 5, 2, 8.

2, 2, 3, 5, 5, 5, 6, 8, 9.

Me = 5

3, 5, 2, 6, 5, 9, 5, 2, 8, 6.

2, 2, 3, 5, 5, 5, 6, 6, 8, 9.

34
UNIVERSIDAD NACIONAL AUTONOMA DE NICARAGUA
ESTADISTICA APLICADA A LAS CCSS
LICENCIATURA EN TRABAJO SOCIAL
LIC. JULISSA GUTIERREZ

10, 13, 4, 7, 8, 11 10, 16, 18, 12, 3, 6, 9, 9, 4, 13, 20, 7, 5, 10, 17, 10, 16, 14, 8, 18

3, 4, 4, 5, 6, 7, 7, 8, 8, 9, 9, 10, 10, 10, 10, 11, 12, 13, 13, 14, 16, 16, 17, 18, 18, 20

2. Tabular y calcular mediana de la siguiente serie de números: 5, 3, 6, 5, 4, 5, 2,


8, 6, 5, 4, 8, 3, 4, 5, 4, 8, 2, 5, 4.

xi fi Fi

2 2 2

3 2 4

4 5 9

5 6 15

6 2 17

8 3 20

20

20/2 = 10

Me = 5

Cálculo de la mediana para datos agrupados

La mediana se encuentra en el intervalo donde la frecuencia acumulada llega hasta


la mitad de la suma de las frecuencias absolutas.

Es decir tenemos que buscar el intervalo en el que se encuentre .

Li es el límite inferior de la clase donde se encuentra la mediana.

es la semisuma de las frecuencias absolutas.

35
UNIVERSIDAD NACIONAL AUTONOMA DE NICARAGUA
ESTADISTICA APLICADA A LAS CCSS
LICENCIATURA EN TRABAJO SOCIAL
LIC. JULISSA GUTIERREZ

Fi-1 es la frecuencia acumulada anterior a la clase mediana.

ai es la amplitud de la clase.

La mediana es independiente de las amplitudes de los intervalos.

Ejemplo:

1. Calcular la mediana de una distribución estadística que viene dada por la


siguiente tabla:

Intervalo fi Fi

[60, 63) 5 5

[63, 66) 18 23

[66, 69) 42 65

[69, 72) 27 92

[72, 75) 8 100

N: 100

100/2 = 50

Clase de la mediana: [66, 69)

Intervalo fi Fi

[10, 15) 3 3

[15, 20) 5 8

36
UNIVERSIDAD NACIONAL AUTONOMA DE NICARAGUA
ESTADISTICA APLICADA A LAS CCSS
LICENCIATURA EN TRABAJO SOCIAL
LIC. JULISSA GUTIERREZ

[20, 25) 7 15 2. Hallar la


mediana de
la distribución [25, 30) 4 19 estadística que viene dada
por la siguiente tabla: [30, 35) 2 21

N: 21

Media: La media aritmética es el valor obtenido al sumar todos los datos y dividir el
resultado entre el número total de datos.

es el símbolo de la media aritmética.

Ejemplo:

1. Los pesos de seis amigos son: 84, 91, 72, 68, 87 y 78 kg. Hallar el peso
medio.

Media aritmética para datos agrupados

37
UNIVERSIDAD NACIONAL AUTONOMA DE NICARAGUA
ESTADISTICA APLICADA A LAS CCSS
LICENCIATURA EN TRABAJO SOCIAL
LIC. JULISSA GUTIERREZ

Si los datos vienen agrupados en una tabla de frecuencias, la expresión de


la media es:

Ejercicio de media aritmética

En un test realizado a un grupo de 42 personas se han obtenido las puntuaciones


que muestra la tabla. Calcula la puntuación media.

Intervalo xi fi xi · fi

[10, 20) 15 1 15

[20, 30) 25 8 200

[30,40) 35 10 350

[40, 50) 45 9 405

[50, 60 55 8 440

[60,70) 65 4 260

[70, 80) 75 2 150

N: 42 1 820

Otras medidas de posición:

La media, mediana y moda son medidas que indican el centro de la distribución,


vamos a ver algunas más, que no indican el centro:

38
UNIVERSIDAD NACIONAL AUTONOMA DE NICARAGUA
ESTADISTICA APLICADA A LAS CCSS
LICENCIATURA EN TRABAJO SOCIAL
LIC. JULISSA GUTIERREZ

CUARTILES:

Los cuartiles son los tres valores de la variable que dividen a un conjunto de datos
ordenados en cuatro partes iguales.

Q1, Q2 y Q3 determinan los valores correspondientes al 25%, al 50% y al 75% de


los datos.

Q2 coincide con la mediana.

Cálculo de los cuartiles

1. Ordenamos los datos de menor a mayor.

2. Buscamos el lugar que ocupa cada cuartil mediante la

expresión .

Si se tienen una serie de valores X1, X2, X3 ... Xn, se localiza mediante las
siguientes fórmulas:

- El primer cuartil:

Cuando n es par:

𝑵𝑲
𝑸𝒌 =
𝟒

Cuando n es impar:

(𝑵 + 𝟏)𝑲
𝑸𝒌 =
𝟒

DECILES:

Los deciles son ciertos números que dividen la sucesión de datos ordenados en
diez partes porcentualmente iguales. Son los nueve valores que dividen al conjunto
de datos ordenados en diez partes iguales, son también un caso particular de los

39
UNIVERSIDAD NACIONAL AUTONOMA DE NICARAGUA
ESTADISTICA APLICADA A LAS CCSS
LICENCIATURA EN TRABAJO SOCIAL
LIC. JULISSA GUTIERREZ

percentiles. Los deciles se denotan D1, D2,..., D9, que se leen primer decil, segundo
decil, etc.

Los deciles, al igual que los cuartiles, son ampliamente utilizados para fijar el
aprovechamiento académico.

Cálculo de los deciles

En primer lugar buscamos la clase donde se encuentra

Si se tienen una serie de valores X1, X2, X3 ... Xn, se localiza mediante las
siguientes fórmulas:

𝑵𝑲
𝑫𝒌 = Cuando n es par:
𝟏𝟎

(𝑵+𝟏)𝑲
𝑫𝒌 = Cuando n es impar:
𝟏𝟎

Siendo K el número del decil

PERCENTILES:

Los percentiles son, tal vez, las medidas más utilizadas para propósitos de ubicación
o clasificación de las personas cuando atienden características tales como peso,
estatura, etc.

Los percentiles son ciertos números que dividen la sucesión de datos ordenados en
cien partes porcentualmente iguales. Estos son los 99 valores que dividen en cien
partes iguales el conjunto de datos ordenados. Los percentiles (P1, P2,... P99),
leídos primer percentil,..., percentil 99.

Cálculo de los percentiles

En primer lugar buscamos la clase donde se encuentra

40
UNIVERSIDAD NACIONAL AUTONOMA DE NICARAGUA
ESTADISTICA APLICADA A LAS CCSS
LICENCIATURA EN TRABAJO SOCIAL
LIC. JULISSA GUTIERREZ

Si se tienen una serie de valores X1, X2, X3 ... Xn, se localiza mediante las
siguientes fórmulas:

𝑵𝑲
Para los percentiles, cuando n es par: 𝑷𝒌 = 𝟏𝟎𝟎

(𝑵+𝟏)𝑲
𝑷𝒌 = Cuando n es impar:
𝟏𝟎𝟎

Siendo K, el número del percentil.

Es fácil ver que el primer cuartil coincide con el percentil 25; el segundo cuartil con
el percentil 50 y el tercer cuartil con el percentil 75.

Ejemplo:

La siguiente serie de datos representan los dias que necesitaron 10 docentes


para planificar sus planes de clase para ll año de Trabajo Social.

6, 4, 7, 8, 10, 11, 9, 12, 15, 3. Calcula P30, D9, y Q2

Primeramente ordenamos los datos:

3, 4, 6, 7, 8, 9, 10, 11, 12, 15.

(𝟏𝟎)(𝟑𝟎)
𝑷𝟑𝟎 = =𝟑
𝟏𝟎𝟎

(𝟏𝟎)(𝟗)
𝑫𝟗 = =𝟗
𝟏𝟎

(𝟏𝟎)(𝟐)
𝑸𝟐 = =𝟓
𝟒

En toda medida de posición siempre debe de haber una interpretación , en el caso


del percentil 30 se interpreta como que el 30 por ciento de los datos son menores
o iguales a tres días que necesitan los docentes para planificar sus clases.

41
UNIVERSIDAD NACIONAL AUTONOMA DE NICARAGUA
ESTADISTICA APLICADA A LAS CCSS
LICENCIATURA EN TRABAJO SOCIAL
LIC. JULISSA GUTIERREZ

En el caso del decil nueve el 90% necesita nueve o menos días, mientras que en el
cuartil dos el 25% necesita cinco o menos días.

Medidas de dispersión:

Para mejorar la información sobre el conjunto de datos no basta saber en torno a


qué valores está la mayoría de los datos, también es conveniente saber si el
conjunto de medidas son todas muy parecidas entre sí o si son muy diferentes, esto
se consigue con las medidas de dispersión o variabilidad.

Rango: es la medida de variabilidad más simple, es el mayor valor menos el más


pequeño, conforme más próximos sean los valores observados, menor será el
rango.

R= max(xi) – min(xi)

Rango intercuartílico: El rango está influenciado por la presencia de algún error de


medida, que suele traducirse en valores excesivamente grandes o pequeños, por
eso se prefiere como medida de variabilidad, la diferencia entre los cuartiles tercero
y primero, también llamado Rango intercuartílico:

RI = Q3-Q1

Desviación media es la media de las diferencias o desviaciones de cada dato hasta


la media, tomadas en valor absoluto, pues de lo contrario la suma se anula:

N k
 xi  x  xi  x ni
i 1 i 1
dm  dm 
N si los datos están agrupados: N

Varianza: es la media de los cuadrados de las diferencias o desviaciones de cada


dato hasta la media:

42
UNIVERSIDAD NACIONAL AUTONOMA DE NICARAGUA
ESTADISTICA APLICADA A LAS CCSS
LICENCIATURA EN TRABAJO SOCIAL
LIC. JULISSA GUTIERREZ

N N
  xi  x   xi2
i 1 i 1
s2    x2
N N

k k
  xi  x  ni  xi2 ni
i 1 i 1
s2    x2
si los datos están agrupados en clases, la fórmula es: N N

Para la variable Nº de ramas primarias, el cálculo de la varianza es:

s 2

 0  1.6    0  1.6   1  1.6  
2 2 2
  4  1.6 
2

14.4
 1.44
10 10

Tratándolos como datos y frecuencias:

s2 
 0  1.6 2  2  1  1.6 2  3   2  1.6 2  3   3  1.6 2  1   4  1.6 2  1  1.44
10

y por la fórmula reducida:

 0   2  1  3   2   3   3  1   4   1
2 2 2 2 2
40
s 2
  1.6 2   2.56  4  2.56  1.44
10 10

La varianza se expresa en unidades al cuadrado y no es comparable con los datos,


por eso se define

Desviación típica, es la raíz cuadrada positiva de la varianza,

s  s2

La desviación típica de la variable Nº de ramas primarias es : s  1.44  1.2

43
UNIVERSIDAD NACIONAL AUTONOMA DE NICARAGUA
ESTADISTICA APLICADA A LAS CCSS
LICENCIATURA EN TRABAJO SOCIAL
LIC. JULISSA GUTIERREZ

La varianza mide la dispersión de los datos respecto de la media de los propios


datos. Si lo que tenemos es una muestra, y se desea estimar la varianza de toda
la población con los datos de la muestra, se utiliza la

N
  xi  x  N s2
i 1
s2  
Cuasivarianza: N 1 N 1

k
  xi  x  ni N s2
i 1
s2  
para datos agrupados en clases, la fórmula es: N 1 N 1

De modo similar a la desviación típica, se define:

Cuasi desviación típica: s  s


2

Para estimar la varianza de toda la población respecto a la variable Nº de ramas


primarias, se usa la cuasivarianza de esa variable calculada con los datos de la
muestra:

10  1.44 14.4
s2   1.6
9 9

y la cuasidesviación típica: s  s  1.6  1.265


2

Para comparar variabilidad entre magnitudes diferentes o entre diferentes muestras,


se utiliza el coeficiente de variación, que es la desviación típica expresada en
medias:

s
CV 
x

El coeficiente de variación de la variable Nº ramas primarias es:

44
UNIVERSIDAD NACIONAL AUTONOMA DE NICARAGUA
ESTADISTICA APLICADA A LAS CCSS
LICENCIATURA EN TRABAJO SOCIAL
LIC. JULISSA GUTIERREZ

1.4
CV   0.875
1.6

En ocasiones, al tomar las medidas de un experimento, o cuando se transcriben los


datos para procesarlos, se comenten errores y aparecen datos mucho más grandes
o mucho menores que el resto, son los denominados Outliers, y es importante
poder detectarlos y comprobar si se trata o no de un error. Tanto la media como la
varianza son muy sensibles a la presencia de Outliers y por eso interesa detectarlos.
La detección de Outliers se puede hacer a partir de la media y desviación típica ya
calculadas, se puede demostrar que datos cuya desviación respecto de la media
sea superior en valor absoluto a tres desviaciones típicas son raros, por eso se
suelen considerar outliers aquellos datos que cumplan:

xi  x  3s

No obstante, la presencia de los posibles outliers ha intervenido en el cálculo de la


media y de la desviación típica, por lo que sería recomendable utilizar otras medidas
de posición y dispersión para localizarlos, por eso se consideran outliers aquellas
medidas que sean menores que el primer cuartil menos 1.5 veces el rango
intercuartílico, o mayores que el tercer cuartil más 1.5 veces RI:

xi es un outlier por defecto, si: Q1  xi  1.5RI

xi es un outlier por exceso, si: xi  Q3  1.5RI

Si la distancia llega a superar las 3 veces RI, entonces el outlier se considera grave,
en caso contrario, lo consideraremos leve.

45
UNIVERSIDAD NACIONAL AUTONOMA DE NICARAGUA
ESTADISTICA APLICADA A LAS CCSS
LICENCIATURA EN TRABAJO SOCIAL
LIC. JULISSA GUTIERREZ

Medidas de asimetría y de forma:

Además de dar información sobre la tendencia central de los datos y sobre cómo se
reparten respecto del centro, en ocasiones interesa conocer si los datos se reparten
de un modo simétrico a ambos lados de la media o no.

El coeficiente de asimetría mide esta propiedad, y se calcula como:

N
  xi  x 
3
N
  xi  x 
3
i 1
N 1 i 1
g1  
s3 s 3 N , o , si los datos están agrupados:

k
  xi  x 
3
ni k
  xi  x 
3
i 1 ni
N 1 i 1
g1  
s3 s3 N

Si g<0, existe asimetría hacia la izquierda. Si g>0, la asimetría es hacia la derecha.


Si g=0, la distribución de datos es simétrica.

El coeficiente de curtosis o apuntamiento mide si las frecuencias de los datos


centrales son mucho mayores que las de los datos extremos, o si, por el contrario,
todos los datos se repiten un número más o menos igual de veces. Se calcula como:

N
  xi  x 
4
N k
  xi  x    xi  x 
4 4
i 1 ni
N 1 i 1 1 i 1
k  k
s4 s4 N , y , si los datos están agrupados: s4 N

Cuando los datos proceden de una distribución Normal, tomando la fórmula de la


densidad de una distribución normal se puede demostrar que el anterior coeficiente
k toma el valor 3. Por este motivo, el coeficiente de apuntamiento que se usa
habitualmente es:

46
UNIVERSIDAD NACIONAL AUTONOMA DE NICARAGUA
ESTADISTICA APLICADA A LAS CCSS
LICENCIATURA EN TRABAJO SOCIAL
LIC. JULISSA GUTIERREZ

k
  xi  x 
4
ni
1 i 1
g2  k  3  3
s4 N y compara el apuntamiento de los datos con el que
tendría una distribución normal teórica con igual media y varianza que la de nuestros
datos.

Si g2<0 decimos que los datos son poco apuntados (distribución platicúrtica,
apuntamiento menor que el de una normal), si g2  0 diremos que los datos tienen
un apuntamiento semejante al de una normal (distribución mesocúrtica), si g2>0
diremos que nuestros datos tienen una distribución leptocúrtica o más apuntados
que la normal.

Análisis exploratorio de datos:

Se conoce con este nombre a un conjunto de técnicas que mezclan gráficos y


medidas numéricas, y facilitan mucho la visión rápida de la distribución de los datos.

Diagrama de tallo y hojas:

Se construye considerando, por una parte la cifra de menor valor significativo de


todos los datos. Habitualmente esta cifra es la de las unidades, pero puede ser las
decenas, si todas las cifras terminan en cero, o las décimas o centésimas, etc., si
los datos poseen decimales. Con estas cifras se forman lo que se denomina “hojas”.
Por otra parte se considera el resto de dígitos que forma la cifra de los datos, es lo
que se denomina “tallo”.

Para construir el diagrama se tabulan los datos en varias filas. Cada fila está
encabezada por un tallo, y detrás de él se escriben ordenados e igualmente
espaciados los dígitos que forman las hojas correspondientes a cada tallo. Para la
variable Diámetro:

47
UNIVERSIDAD NACIONAL AUTONOMA DE NICARAGUA
ESTADISTICA APLICADA A LAS CCSS
LICENCIATURA EN TRABAJO SOCIAL
LIC. JULISSA GUTIERREZ

Diámetro, datos 2.5 2.5 2.9 3.9 3.9 3.9 4.2 4.3 4.5 5.3
ordenados

De cada dato, Tallo 2 2 2 3 3 3 4 4 4 5

Hoja 5 5 9 9 9 9 2 3 5 3

Diagrama de tallo y hojas:

Tallo Hojas

2 5 5 9

3 9 9 9

4 2 3 5

5 3

Si lo vemos como en sentido horizontal, se muestra como un diagrama de barras y


se aprecia la forma de la distribución de frecuencias, y la simetría.

Para completar la información se suele añadir una columna delante del tallo en la
que se cuentan las frecuencias de cada tallo acumulándolas de arriba hacia abajo
y viceversa, en el tallo donde se encuentre el dato mediano se escribe solamente la
frecuencia de ese tallo, encerrada entre paréntesis. Si se desea se pueden marcar
las filas donde estén los cuartiles colocando un asterisco a continuación de la
frecuencia. Para los datos anteriores:

48
UNIVERSIDAD NACIONAL AUTONOMA DE NICARAGUA
ESTADISTICA APLICADA A LAS CCSS
LICENCIATURA EN TRABAJO SOCIAL
LIC. JULISSA GUTIERREZ

frecuencia Tallo Hojas


s

3* 2 5 5 9

(3) 3 9 9 9

4* 4 2 3 5

1 5 3

Diagrama de cajón y pata:

Es un gráfico en el que se incide más en la simetría y en la presencia de outliers,


consiste en dibujar un eje horizontal (también se podría hacer vertical) en el que se
lleva una escala correspondiente a los datos, más arriba se dibuja un segmento
vertical sobre la mediana y dos más, uno sobre cada cuartil posteriormente se
cierran ambos segmentos por segmentos horizontales, con esto se forma la caja.
La posición relativa del segmento mediano respecto de los lados de la caja ya nos
informa sobre la simetría de los datos.

A continuación y desde el centro de cada uno de los lados de la caja se lleva un


segmento horizontal que termina en el los valores observados menor y mayor que
no son outliers, si los hay, o en los valores menor y mayor de los observados. Si hay
outliers se marcan con símbolos especiales, por ejemplo, * para los leves y # para
los graves.

49
UNIVERSIDAD NACIONAL AUTONOMA DE NICARAGUA
ESTADISTICA APLICADA A LAS CCSS
LICENCIATURA EN TRABAJO SOCIAL
LIC. JULISSA GUTIERREZ

El diagrama de cajón y pata para la variable diámetro es:

Diagrama de caja

Q1 me Q3

0 1 2 3 4 5 6

En este caso no hay outliers, y por eso la pata empieza con el menor dato y termina
con el mayor. Se puede ver que los datos se extienden desde algo más de 2 hasta
algo más de 5, que la distribución presenta una cola o asimetría hacia la derecha y
que no hay outliers; además se aprecia la ubicación y valor de la mediana y cuartiles.
Respecto del 50% de los datos centrales, como puede verse en la caja, la asimetría
es hacia la izquierda.

50

Anda mungkin juga menyukai