presentación 3
programa 4
contenido módulos
mapa conceptual 5
macroobjetivos 6
agenda 6
material 7
material básico
material complementario
glosario 8
módulos *
m1 | 11
m2 | 25
m3 | 43
m4 | 57
evaluación 75
Como docente de esta asigantura, deseo que usted, quien emprende hoy el
estudio de la Estadística, logre a través de ella apreciar la importante ayuda que
las técnicas estadísticas pueden prestar a su futuro quehacer profesional en la
tarea más importante: la toma de decisión a partir del análisis de datos.
p r o g rama
Se nutre de
En el ámbito de la
Seguridad
DATOS
Ciudadana
Surgen de Surgen de
Se realiza Se realiza
ANÁLISIS ANALISIS
DESCRIPTIVO INFERENCIAL
Se nutre de
Consiste en
PROBABILIDAD
ORDENAR
ORGANIZAR
Llevado a cabo a través de
PRESENTAR DATOS
A través de A través de
agenda
Estimado alumno:
Sabemos que cada uno de nosotros tiene su propio ritmo para aprender y
que, acorde a las ocupaciones y actividades, los tiempos dedicados al estudio
serán diferentes para cada uno. No obstante, es nuestra intención presentarle
sugerencias relativas al porcentaje que se le ha asignado a cada módulo, según
la importancia y complejidad de los temas, y el tiempo estimativo que puede
insumir cada módulo del total de la asignatura.
Esto le permitirá a usted realizar una mejor distribución de sus tiempos de estudio
por módulos y por asignaturas, lo cual se expresará seguramente en el logro de
sus objetivos.
MÓDULOS
SEMANA I II III IV
1
2
3
4
5
6 1º evaluación
7
8
9
10
11
12
13
14
15 2º evaluación
m a terial
Cuartiles: Los percentiles 25%, 50% y 75% se llaman primer cuartil, segundo
cuartil (mediana) y tercer cuartil, respectivamente. Se pueden usar los cuartiles
para dividir al conjunto de datos en cuatro partes, cada una de las cuales contiene
aproximadamente el 25% de los datos.
Estadístico: Valor numérico que se usa como medida resumida de una muestra
de datos (por ejemplo, la media de la muestra, la varianza de la muestra y la
desviación estándar de la muestra).
Percentil: Un valor tal que, cuando menos, p por ciento de los elementos son
menores que o iguales a ese valor, y al menos (100 - p) por ciento de los elementos
tienen valor mayor que o igual a ese valor. El 50° percentil es la mediana.
Punto medio de clase: Punto en cada clase que está a la mitad entre los límites inferior
y superior de un intervalo de clase en una tabla de distribución de frecuencias.
Regla empírica: Regla que establece los porcentajes de elementos que están
dentro de una, dos y tres desviaciones estándar de distancia del promedio, para
distribuciones con forma de campana.
Resumen de cinco datos: Técnica del AED que consiste en analizar los valores
mínimo y máximo y los cuartiles en un conjunto de datos.
Tabulación cruzada: Resumen tabular de datos para dos variables. Las clases
de una variable se representan en los renglones; las clases de la otra variable,
en las columnas.
Valor atípico: Valor dentro de los que asume una variable, que se aleja más
allá de la mayoría de los valores y cae fuera de los límites establecidos en un
diagrama de caja y brazos.
m1
m1 microobjetivos
• Identificar las etapas del método estadístico en una investigación por medio
de una correcta definición de la población y de las unidades estadísticas, con
el objeto de plantear correctamente las variables y elaborar el instrumento
de recolección de datos que resulte más adecuado.
• Identificar las distintas fuentes de datos a las que se puede recurrir, con el
propósito de tener en cuenta puntualmente las situaciones reales vinculadas
a la seguridad ciudadana.
m1 contenidos
Todos los días se nos expone a una gran cantidad y una amplia variedad
de información numérica relativa a distintos fenómenos, tales como datos
sobre accidentes en las distintas rutas nacionales y provinciales, número de
sobrevivientes en una catástrofe, incremento porcentual de la incidencia de
determinados sectores en la economía, resultados de encuestas de opinión,
tasas de desempleo, inventarios, aceptabilidad de un nuevo producto alimenticio,
incremento de las demandas judiciales, etc., etc. Todas las situaciones o ejemplos
planteados precedentemente presentan diferente naturaleza y complejidad, pero
cada uno de ellos involucra la necesidad de poseer conocimientos en estadística
para poder analizarlos, comprenderlos y resolverlos, ya que se necesita de la
predicción y de la toma de decisiones.
Podemos decir entonces que:
En general, podemos establecer (sin que esto pretenda ser una única definición)
que la Estadística es:
2. Población y muestra:
2.1. Población
2.2. Muestra
Todo el proceso de reunir, organizar e interpretar datos es motivado por el deseo
de conocer algo acerca de la población. En ocasiones la población bajo estudio
está compuesta por una cantidad infinita de unidades elementales, lo que hace
imposible o muy costoso trabajar con la totalidad de ellas. Entonces, la solución
será trabajar con una parte de ella, ya que así reduciremos costos y tiempo.
La muestra es una parte de la población o universo, y se la utiliza para sacar
3.1. Variable
4.1. Datos cualitativos: son aquellos datos que, ante una determinada pregunta,
arrojan respuestas categóricas. Las unidades elementales pueden ser clasificadas
solo como poseedoras o no poseedoras de cierta cualidad o propiedad.
Algunos ejemplos de datos cualitativos podrían ser los siguientes: sexo de las
personas que trabajan en una ONG; tipo de vehículo involucrado en accidentes
carreteros; tipo de lesión sufrida en los accidentes de tránsito; etc.
Ej.: cantidad de personas que trabajan en una organización sin fines de lucro;
cantidad de muertes en accidentes de tránsito en el mundo; etc.
• Datos cuantitativos continuos: son datos que, ante una pregunta, dan
una respuesta numérica que surge de un proceso de medición.
5. Niveles de medición
ESCALA EJEMPLO
Nominal Religiones
Tipo de emprendimiento
Sexo
Ordinal Ocupaciones
Clases sociales
Preferencias
Intervalos Opiniones
Números índices
Distancia
Razón Costo
Cabe aclarar que acabamos de presentar dos maneras de clasificar las variables,
por su naturaleza y por su medición. Es importante destacar que ambas
clasificaciones no se contraponen, ya que si usted presta atención, las variables
cualitativas (por naturaleza) se corresponden con las variables de escala nominal
u ordinal (según la medición), en tanto que las variables cuantitativas (según la
naturaleza) se corresponden con las variables en la escala de intervalo o de
razón (según la medición).
6. Fuentes de datos
m1 actividades
m1 | actividad 1
Los avisos que solicitan personal capacitado son variados: se buscan operadores
de PC, asistentes para el área de recursos humanos, colaboradores en el
área de marketing, asistentes con conocimientos de finanzas, de sistemas de
computación, etc., etc., etc. Hoy, usted está decidido a enviar su currículum.
Se encuentra ansioso por comenzar a poner en práctica todo lo que día a día
está aprendiendo en el cursado de la Licenciatura en Gestión de la Seguridad
Ciudadana, en la Universidad Blas Pascal.
Tiene los temores lógicos de cualquier estudiante que decide comenzar a indagar
en el mundo del conocimiento. Pero no se preocupa por ello, dado que sabe
que es absolutamente normal que así sea.
Ya hace unos días que usted se encuentra en plena actividad. Pero por primera
vez, uno de los profesionales de su área lo convoca y le dice:
A 1
C 1
m1 | actividad 1 | AA
asistente académico 1
m1 | actividad 1 | CC
clave de corrección 1
m1 | actividad 2
[ ] 1 Sí ¿Cuál?:…………………….
[ ] 2 No
[ ] 1 Sí
[ ] 2 No
[ ] 3 No contesta
[ ] 1 Peatón
[ ] 2 Conductor de auto
[ ] 3 Acompañante en un vehículo
[ ] 4 Conductor de motocicleta/bicicleta
[ ] 5 Acompañante en motocicleta/bicicleta
[ ] 6 Otro ¿Cuál?...........................................................
6.- ¿Tiene Ud. parientes, amigos, conocidos, etc. que murieron en algún accidente
de tránsito?
[ ] 1 Sí
[ ] 2 No
[ ] 3 Ns/Nc
[ ] 1 Muy de acuerdo
[ ] 2 Algo de acuerdo
[ ] 3 Ni de acuerdo ni en desacuerdo
[ ] 4 Algo en desacuerdo
[ ] 5 Muy en desacuerdo
[ ] 1 Sí
[ ] 2 No ¿Por qué?................................................................................................
................
A 1
C 1
m1 | actividad 2 | AA
asistente académico 1
Las pautas para realizar el abordaje del caso son similares a las realizadas en el
asistente académico 1 de la actividad 1.
Creemos conveniente que usted tenga presente que cada pregunta genera una
característica a analizar, y que a su vez cada una de ellas conducirá a que se
realice el análisis de datos correspondiente.
m1 | actividad 2 | CC
clave de corrección 1
m1 | actividad 3
Ayer por la tarde, usted decide encontrarse con otros compañeros de la carrera
con quienes se había estado contactando vía correo electrónico, para discutir
respecto de los temas vistos en el módulo e intercambiar opiniones sobre la
resolución de una de las actividades de las materias. Eugenia, una compañera
que en la actualidad se encuentra haciendo una pasantía en una empresa
dedicada a la fabricación de aparatos DVD, les comenta lo siguiente:
C 1
m1 | actividad 3 | AA
asistente académico 1
En esta actividad es preciso que usted elabore una opinión fundada, dando
respuesta a la inquietud de su compañera. Para ello se torna fundamental tener
muy claros los conceptos de población y muestra que se abordaron en este
módulo. Analice si en esta situación es correcto o no trabajar con una población,
y piense cuál sería una muestra adecuada para que la misma sea representativa
de la población en estudio.
m1 | actividad 3 | CC
clave de corrección 1
m1 glosario
m2 microobjetivos
m2 contenidos
a) Forma literal
b) Tablas estadísticas
c) Gráficos estadísticos
d) Medidas resumen
a. Presentación literal
De todas las formas de presentación de datos esta es la menos usada, por lo que
se prefiere dejarla para la instancia de las conclusiones en una investigación o
estudio en particular.
b. Tablas estadísticas
Las tablas constituyen arreglos de los datos, en filas y columnas. Las clasificaciones
que se incluyan en una tabla deberán ser arregladas de una manera ordenada,
a fin de poder reemplazarlas por el usuario de la información y poder hacer
análisis y comparaciones. Por lo tanto, para el armado de una tabla, previamente
se debería adoptar un criterio de clasificación de los datos. Estos criterios
pueden ser sobre cualquiera de las siguientes bases: cronológica; geográfica;
cualitativa o cuantitativa.
Tablas de uso general: son aquellas que suelen ser consultadas por
varios usuarios, tales como las publicadas por las distintas instituciones u
organismos (por ejemplo: las tablas de índices de precios que publica el
INDEC; tablas con la talla y el peso de varones y mujeres que son usadas
en medicina o en deporte; etc.).
c. Gráficos estadísticos
A menudo oímos la expresión “una imagen vale más que mil palabras”; ésta tiene
total cabida en lo que a gráficos estadísticos respecta. No obstante, hay que
tener en cuenta que un gráfico ofrece al lector sólo una idea aproximada de la
información, es por ello que debemos ser conscientes de que los valores exactos
se encuentran en las cantidades tabuladas y en la base de datos, fuente original
de toda gráfica.
2. Distribuciones unidimensionales
Veamos un ejemplo:
Valores de la variable:
Simbólicamente: Fj = f1 + f2 +... + fj
Simbólicamente: Hj = h1 + h2 +...+ hj
3; 5; 5; 3; 3; 5; 8; 7; 5; 3; 5; 6; 6; 6; 7; 8; 7; 8; 6; 6
• Establecer los límites de las fronteras que dividen a cada una de las clases,
logrando de esta manera evitar superposiciones en la asignación de los valores
a cada intervalo.
Los primeros límites son los más adecuados cuando se arman tablas por
intervalos con variables cuantitativas continuas.
en auto
20%
caminando
50%
en transporte
escolar
30%
caminando 50%
en transporte escolar 30%
en auto 20%
en auto 20%
medio utilizado
en transporte
30%
escolar
EDUBP | LICENCIATURA EN GESTION DE LA SEGURIDAD | estadística - pag. 31
caminando 50%
caminando
50%
en transporte
escolar
30%
en auto 20%
medio utilizado
en transporte
30%
escolar
caminando 50%
Masculino Femenino
Institución privada 65% 45%
Institución pública 35% 55%
70%
60%
% de personas
50% 65%
40%
45% 55%
30%
20% 35%
10%
0%
Institución privada Institución pública Masculino
Organización patrocinante Femenino
6
5
4
3
2
1
0
0 100 200 300 400 500 600 700 800 900
Cantidad de carnet
3.4. Histograma
Gráfico 5 (para
Gráfico
insertar
5 (paraeninsertar
contenidos
en contenidos
del módulodel
2)módulo 2)
Distribución
Distribución
de los empleados
de los empleados
de la empresa
de la XX
empresa
segúnXX según
el salario el salario 0 0 0 0
40 40
35 35
0 - 200
0 - 200 100 100 0 0
cant. de empleados
cant. de empleados
30 30
200 - 400
200 - 400 300 300 5 5
25 25 400 - 600
400 - 600 500 500 10 10
20 20 600 - 800
600 - 800 700 700 18 18
15 15 800 - 1000
800 - 1000 900 900 37 37
10 10 1000 - 1200
1000 - 12001100 1100 30 30
5 5 1200 - 1400
1200 - 14001300 1300 0 0
0 0 1500 1500 0 0
100 300
100 500
300 700
500 900
700 1100
900 1300
1100 1300
Salarios Salarios
Gráfico 6 (para
Gráfico
insertar
6 (paraeninsertar
contenidos
en contenidos
del módulodel
2)módulo 2)EDUBP | LICENCIATURA EN GESTION DE LA SEGURIDAD | estadística - pag. 33
Distribución
Distribución
de los empleados
de los empleados
de la empresa
de la XX
empresa
segúnXX según
los salarios
los salarios
cant. d 15 el salario 37 0 800 - 1000 900
40 30 1000 - 1200 1100
10 100 0 - 200
35 1200 - 1400
0 300 2001300
cant. de empleados
5 - 400
30
0
25
0 500 4001500
- 600
100 300 500 700 900 1100 1300
20 Salarios 600 - 800 700
15 800 - 1000 900
10 1000 - 1200 1100
5 1200 - 1400 1300
6 (para insertar en contenidos del módulo 2) 1500
0
100 300 Una
500 alternativa
700 como
900 gráfico
1100 equivalente
1300 al histograma es el polígono de
Salarios
frecuencias, que es también un gráfico de superficie que se construye
Distribución de los empleados de la empresa XX según
considerando las marcas de clase o puntos medios de los intervalos. El polígono
los salarios
40 de frecuencias que le corresponde a los datos que se graficaron con el histograma
Gráfico 6 (para insertar en contenidosanterior
del módulo
sería2)el que a continuación se muestra.
30
empleados
Cant.de
20
400 5 5
Salarios
600 15 10
10 800 33 18
1000 70 0 37
0 1200 100 200 30 0
0 100 300 500 700 900 1100 1300 1500
400 5
Salarios
600 15
800 33
1000 70
3.5. Ojiva 1200 100
80
empleados
60
umulada los empleados de la empresa XX
según los salarios 40
20 3
0 7
0 200 400 600 800 1000 1200 1400 11
Salarios 15
19
0 0 23
300 (100) - 300 100 0 0 27
700 300 - 700 500 13 13 31
1100 700 - 1100 900 11 24 35
400 600 800 1000 1200 1400
Salarios 1500 1100 - 1500 1300 7 31
1900 1500 - 1900 1700 5 36
2300 1900 - 2300 2100 2 38
2700 2300 - 2700 2500 1 39
3100 2700 - 3100 2900 1 40
3500 3100 - 3500 3300 0
Serie de tiempo
250
350
200
300
150
250
100
200 26 22
50
150 28
0
100 2000 2001 2002 2003 2004
26 22
50 año
28
0
2000 2001 2002 2003 2004
año
Si bien los gráficos estadísticos son de gran utilidad, éstos deben emplearse
con cuidado, tratando de evitar que el lector que desconoce del tema llegue a
conclusiones erróneas.
Algunos de los métodos más comunes para confundir a los lectores inexpertos
son:
Es importante que usted advierta lo difícil que resulta establecer una regla
objetiva respecto del tamaño adecuado del diagrama de una curva.
d) Suprimir el origen
Cuando los valores representados por un gráfico son elevados y varían poco
entre sí, se suele perder un espacio por debajo de la curva; para ello, quienes los
construyen deciden omitir el cero, proporcionando de esta forma una impresión
visual que es totalmente contraria a los hechos.
m2 material
m2 actividades
m2 | actividad 1
A graficar la información…
A esta altura, a usted le resulta muy sencilla la tarea. Sabe que lo visto y aprendido
en este módulo le será de gran ayuda.
A 1
C 1
m2 | actividad 1 | AA
asistente académico 1
m2 | actividad 1 | CC
clave de corrección 1
Hoy llega a su lugar de trabajo, como todas las mañanas, y encuentra sobre su
escritorio la siguiente nota de su superior:
Estadísticas
¡Suerte!
A 1
C 1
m2 | actividad 2 | AA
asistente académico 1
m2 | actividad 2 | CC
clave de corrección 1
m2 | actividad 3
Ya han pasado unos meses desde que trabaja en su nuevo empleo. No obstante,
el hecho de estar siempre tan ocupado le ha hecho perder la idea del tiempo
transcurrido.
Las situaciones sobre las que debe presentar la información por medio de tablas
estadísticas son dos. A saber:
Caso 1:
La cantidad de personas que asistieron a una charla en los distintos Centros
de Participación Comunal (CPC), organizada por el municipio durante el mes
pasado, sobre temas de seguridad vial, fue la siguiente:
Caso 2:
A continuación se muestran los montos mensuales de los gastos que las perso-
nas consultadas destinan a seguridad, ya sea en instalación de alarmas, en enre-
jado de ventanas, en seguros de hogar, en cursos de defensa personal, etc. La
información surgió a partir de trabajo de campo realizado para la tesis de grado
de un grupo de estudiantes de comunicación social.
A 1
C 1
m2 | actividad 3 | AA
asistente académico 1
Para resolver la actividad planteada, recuerde que esta dependerá del tipo de
datos, a fin de decidir agruparlos en una tabla de frecuencia para datos puntua-
les o en una para datos por intervalos; a su vez, de esto dependerá el tipo de
gráficos a utilizar.
clave de corrección 1
Caso 1:
La variable objeto de estudio es: la cantidad de personas que asistieron a las
charlas. Se trata de una variable cuantitativa discreta, por lo tanto para hacer
su presentación deberá realizarla a través de una tabla de frecuencias de datos
puntuales como la siguiente:
Caso 2:
La variable objeto de estudio es: el monto de dinero (en $) destinado por
las personas para seguridad. Se trata de una variable cuantitativa continua
discretizada (es decir presentada con valores enteros), por lo tanto para hacer su
presentación deberá realizarla a través de una tabla de frecuencias por intervalos,
como la siguiente.
Observe que en este caso se construyó una tabla con 7 intervalos; recuerde
que esta es una decisión de quien arma la tabla, por lo que Ud. podría decidir
construir otra tabla con más o menos intervalos.
Recuerde también que puede calcular en ambos tipos de tablas las frecuencias
acumuladas. Ud. sabe cómo.
Punto medio de clase: Punto en cada clase que está a la mitad entre los límites
inferior y superior de un intervalo de clase en una tabla de distribución de
frecuencias.
Tabulación cruzada: Resumen tabular de datos para dos variables. Las clases
de una variable se representan en los renglones; las clases de la otra variable,
en las columnas.
m3 microobjetivos
m3 contenidos
Estadística: Módulo 3
Contenidos
Estadística Descriptiva
1.- Medidas
Para comenzar, es preciso que usted tenga presente que las características que
describen un conjunto de datos reciben el nombre de propiedades de los
datos. Ahora bien, si los datos se obtuvieron de una población, estas medidas
reciben el nombre de parámetros; si surgen de una muestra, las medidas se
denominan estadísticos o estadígrafos. Entre las propiedades de los datos,
podemos mencionar las siguientes: POSICIÓN, DISPERSIÓN y FORMA.
A continuación, trabajaremos sobre las distintas medidas que conforman cada
grupo.
Población Muestra
� �
(la media será un parámetro) (la media será un estadístico)
Serie simple
� xi � xi
EDUBP | LICENCIATURA EN GESTION DE LA SEGURIDAD | estadística - pag. 43
M(x) = µ = M(x) = x =
N n
Distribución de frecuencias
Algunas de las medidas de posición en las que centraremos nuestro estudio
serán: la media aritmética, el modo o moda, la mediana y los cuartiles.
Población Muestra
� �
(la media será un parámetro) (la media será un estadístico)
Serie simple
M(x) = µ =
� xi M(x) = x =
� xi
N n
Distribución de frecuencias
M(y) = µ =
� yi � fi M(y) = y=
� yi � fi
N n
Es importante que usted advierta que la media aritmética tiene la ventaja de ser
un concepto familiar para la mayoría de las personas; y que cada conjunto de
datos tiene una y sólo una media. Esta medida de posición tiene en cuenta para
su cálculo todas las observaciones de la variable, debiéndose prestar atención a
la presencia de valores extremos que puede llegar a asumir la variable, ya que
éstos posiblemente distorsionen el valor de la media.
Si vinculamos la media con las escalas de medición a que hacíamos referencia
en el módulo 2, diremos que esta medida se utiliza cuando estamos en
presencia de escalas de intervalo y de razón (es decir cuando tenemos variables
cuantitativas).
3; 5; 5; 3; 3; 5; 8; 7; 5; 3; 5; 6; 6; 6; 7; 8; 7; 8; 6; 6
Si a esta información la trabajamos como serie simple, se deberán sumar uno a uno
los valores de la variable y luego dividir esa suma por el total de alumnos,
obteniéndose una media aritmética de 5,6 alumnos. Es decir, que a los 20 exámenes
itinerantes asistieron en promedio 5,6 alumnos.
Si en cambio posee una variable que fue presentada a través de una tabla de
frecuencias por intervalos, deberá realizar el mismo procedimiento que realizó
para la tabla de datos puntuales, solo que es importante que tenga presente aquí
que deberá tomar la marca de clase o punto medio de cada intervalo para hacer
los productos parciales.
EDUBP | LICENCIATURA EN GESTION DE LA SEGURIDAD | estadística - pag.44
Le sugiero calcular la media aritmética para el ejemplo que tenía en el módulo 2
en una tabla por intervalos.
obteniéndose una media aritmética de 5,6 alumnos. Es decir, que a los 20 exámenes
itinerantes asistieron en promedio 5,6 alumnos.
Si en cambio posee una variable que fue presentada a través de una tabla de
frecuencias por intervalos, deberá realizar el mismo procedimiento que realizó
para la tabla de datos puntuales, solo que es importante que tenga presente aquí
que deberá tomar la marca de clase o punto medio de cada intervalo para hacer
los productos parciales.
Le sugiero calcular la media aritmética para el ejemplo que tenía en el módulo 2
en una tabla por intervalos.
2.2. Mediana
Serie simple
1.- Ordenar los datos de menor a mayor o viceversa.
2.- Estudiar el número de observaciones; si el número es impar la mediana estará
correspondiendo con la (n+1) / 2 observación ordenada.
2.3. Modo
Los cuartiles y percentiles son medidas útiles para obtener una posición “no
central”. Se utilizan a menudo para resumir o describir un conjunto de datos.
2.4.1. Cuarteles
Los cuartiles son los valores de la variable que dividen la serie de datos
ordenada en cuatro partes iguales, conteniendo cada parte la misma cantidad de
observaciones.
3; 3; 4; 5; 6; 7; 10; 12; 14; 15; 16; 20; 20; 20; 21; 22; 23; 23; 25
Q1 = 6 alumnos
Q2 = 15 alumnos
Q3 = 21 alumnos
2.4.2. Percentil
Son valores de la variable que dividen la serie de datos ordenada en cien partes
iguales. Sus fórmulas de cálculo se obtienen de manera similar a las de los
cuartiles, con la salvedad de que en vez de dividir por cuatro, se dividirá por cien.
3. Medidas de dispersión
2.4.2. Percentil
Son valores de la variable que dividen la serie de datos ordenada en cien partes
iguales. Sus fórmulas de cálculo se obtienen de manera similar a las de los
cuartiles, con la salvedad de que en vez de dividir por cuatro, se dividirá por cien.
3. Medidas de dispersión
Las medidas de dispersión en las que nos detendremos serán las siguientes: el
rango o recorrido, la varianza, la desviación estándar y el coeficiente de
variación.
3.1. Rango
El rango o recorrido de una variable puede ser definido como la diferencia entre
el valor máximo que puede asumir la variable y el valor mínimo de la misma. Lo
representaremos con la letra R.
Recuerde que en el módulo 2 ya se había calculado el rango o recorrido cuando
se construyó una tabla de frecuencias por intervalos.
3.2. Varianza
Población Muestra
* Serie simple
�2=
�� xi � � �
2
s2 =
�
� xi � X �
2
N n �1
* Distribución de frecuencias
�2=
�� yi � � � � fi
2
s2 =
� � 2
� yi � y � fi
N n �1
DS ( x)
CV (x) =
X
4. Medidas de forma
a) leptocúrtica
b) platicúrtica
EDUBP | LICENCIATURA EN GESTION DE LA SEGURIDAD | estadística - pag.48
c) mesocúrtica
La forma es la manera en la cual están distribuidos los datos según la
puntiagudez y la asimetría de una distribución.
a) leptocúrtica
b) platicúrtica
c) mesocúrtica
4.2. Asimetría
Si:
X ���Me Es simétrica
Ca =
�
3 X � Me �
DS � x �
Cuanto más lejano de cero sea el valor del coeficiente, ya sea positivo o negativo
su signo, significará mayor asimetría.
m3 actividades
m3 | actividad 1
Usted no tiene dudas, sabe perfectamente qué indicadores puede generar con
los datos que posee, y que satisfarán plenamente a su superior, permitiéndole
allanar su camino en la toma de decisiones.
Una vez finalizada la conversación, usted se ocupa de buscar los datos de los dos
casos para los que confeccionó las tablas estadísticas, y se pone a trabajar.
A 1
C 1
asistente académico 1
B.- Introducción:
C.- Metodología:
D.- Hallazgos:
clave de corrección 1
Estadística: Módulo 3
Actividad
Estadística: 1: Buscando
Módulo 3 resumir la información…
Actividad
Caso 1 1: Buscando resumir la información…
Clave de Corrección 1
Clave de Corrección
La variable 1
objeto de estudio es: cantidad de asistentes a las charlas organizadas
Caso 1
por el municipio. Se trata de una variable cuantitativa discreta, escala de
Caso La
1 variable objeto de estudio es: cantidad de asistentes a las charlas organizadas por e
medición: razón; por lo que las medidas apropiadas serán todas las de posición,
La Se trata de una variablees:
cuantitativa discreta, escala
a lasdecharlas
medición: razón; por
porloelque
munl
de variable objeto
dispersión
apropiadasy dedeforma.
serán
estudio
todas
cantidad de
las de posición,
asistentes organizadas
Se trata de una variable cuantitativa discreta,deescala
dispersión y de forma.
de medición: razón; por lo que las me
apropiadas serán todas las de posición, de dispersión y de forma.
Para encontrar el valor
Para encontrar de las
el valor demismas se requieren
las mismas de los
se requieren siguientes
de los cálculos:
siguientes cálculos:
Para encontrar el valor de las mismas se requieren de los siguientes cálculos:
yi fi yi � fi � 2
yi � y � fi�
yi
200
fi
2
yi � fi � 2
�
400 yi � y 13379.21
� fi
200 250 2 2 400 500 13379.21
2021.21
250 265 2 3 500 795 845.71
2021.21
265 300 3 4 795 1200 845.71
1326.42
300 350 4 3 1200 1050 1326.42
13957.81
350 Totales 3 14 1050 3945 13957.81
31530.36
Totales 14 3945 31530.36
3
�n � 1� = 11,25 valores que ocupan dichos puestos.
En este caso el Q3 está ubicado entre el décimo primero y el dé
3
�n � 1� =4 11,25 En este caso el Q3 está ubicado entre el décimo primero y el décimo
4 = 11,25 segundo
En este lugar,
caso el pero ubicado
Q3 está más cerca del el
entre décimo
décimoprimer lugar, por lo ta
primero
valor
segundo que
lugar, ocupa
pero el
más décimo
cerca primer
del lugar
décimo es tercer
primer
y el décimo segundo lugar, pero más cerca del décimo cuartil.
lugar, por lo tanto e
valor que ocupa el décimo primer lugar es tercer
primer lugar, por lo tanto el valor que ocupa el décimo cuartil.
primer lugar es tercer cuartil.
Forma:
Forma:
Forma:
X
X ���Me por lo tanto la distribución es asimétrica izquierda.
���Me por lo tanto la distribución es asimétrica izquierda.
Aplicando el coeficiente de asimetría:
��
Aplicando el coeficiente de asimetría:
3 X � Me
Ca = 3 X � Me
�� = 3 ��281
281..79
79 �� 282
282..50
50)) = - 0,045
Ca = DS ��x �� = 3 47 = - 0,045
DS x 47..46
46
Para el segundo caso Ud. deberá hacer también el cálculo de las distintas
medidas; preste atención
Para el segundo en deberá
caso Ud. los mismos
haceryatambién
que deberá considerar
el cálculo la marca
de las de medidas;
distintas
Para como
clase el segundo
valorescaso
de yiUd. deberá hacer también el cálculo de las distintas medidas;
atención en los mismos ya que deberá considerar la marca de clase como valores de yi
atención en los mismos ya que deberá considerar la marca de clase como valores de yi
Una vez encontradas todas las medidas, está en condiciones de realizar el
informe solicitado por el cliente de la consultora.
m3 | actividad 2
Ha comenzado una nueva jornada de trabajo. Como cada día, lo primero que
hace al llegar a su oficina es leer el correo electrónico, y hoy se encuentra con el
siguiente mensaje que le enviara su jefe.
Alumno Puntaje
S.S 35
A.J y M.N 45
L.A 40
R.M; L.R. y A. V. 55
B.C.; B.J. y A.M. 65
Z.T. y F.C. 50
L. O., M. R. y S.S. 60
R.D. 68
R.A; T. P. y C.C. 70
B.M. y C.A. 73
R.S. 95
L.E. y L.S. 82
B.B. 80
¡Usted está listo para comenzar! A esta altura del curso usted ya conoce bastante
acerca del cálculo de medidas resumen.
A 1
C 1
m3 | actividad 2 | AA
asistente académico 1
En el caso del cálculo de los cuartiles se le aconseja que trabaje con la serie
simple, es decir con los puntajes individuales de cada alumno.
Por supuesto que, si Ud. Desea, puede completar la información de las medidas
descriptivas con la graficación de la información. Ud. ya sabe de esto…
Intervalo
Si
� modal:
Intervalo
Intervalo
Si nos fijamos
i �60fi a 60
ymodal:
en los
70 apuntos.
60162570 puntos.
y =nos fijamos en= losavalores
modal: 70 individuales,
valores puntos.
puntos existen
= 65individuales, valores
existen que se
valores querepiten más más
se repiten veces, son: son:
veces,
55 puntos, 60 n
puntos, 65 25
puntos y 70 puntos. Esto indica que se trata de una distribución
55 puntos, 60 puntos, 65 puntos y 70 puntos. Esto indica que se trata de una distribución
multimodal.
Si nos fijamos en los valores individuales, existen valores que se repiten más
multimodal.
Intervalo
veces, son:modal: 60 a 70 puntos.
Si nos fijamos en los valores individuales, existen valores que se repiten más veces, son:
55 � �� �
55 puntos,
puntos,260
�2 yi�� yi
s =distribución
2 multimodal. y �60
puntos,
�y fipuntos,
2
�=fi
65
520065puntos
puntos
5200
y 70 puntos.
y 70 EstoEsto
puntos. indica que que
indica se trata de una
se trata dedistribución
una
s = multimodal.
n � 1n � 1 =
24 24
= 216,67 puntos²
= 216,67 puntos²
s = s 216 �
,�67yipuntos�2
� y � fi 2
2
5200
= 14,72 puntos
s =2 = 216,67 puntos == 14,72 =puntos
216,67 puntos²
n �1 24
ParaPara
el cálculo de los
decuarteles, comocomo
se cuenta con la información del puntaje de cada alumno,
s = el
ordenamos
cálculo
216 los2cuarteles,
puntos
,67puntajes:
esos = 14,72 puntosse cuenta con la información del puntaje de cada alum
ordenamos esos puntajes:
35; 40;
35;45;
40;45;
45;50;
45;50;
50;55;
50;55;
55;55;
55;60;
55;60;
60;60;
60;65;
60;65;
65;65;
65;68;
65;70;
68;70;
70;70;
70;73;
70;73;
73;80;
73;82;
80;82;
82;95
82; 95
Para el
Para el cálculo
cálculo de
de los
los cuarteles,
cuarteles,como
comosesecuenta
cuenta con
conla la
información deldel
información puntaje de cada alum
puntaje
Los de
cuartiles
ordenamos
Loscada serán:
esos
alumno,
cuartiles puntajes:
ordenamos esos puntajes:
serán:
Q1: 35;
52,5
35;
Q1:40;puntos
40;
52,545; 45;
45; 50;
puntos
45; 50; 50;
50;55; Se
55;55; promedian
55;55;
Se60;
55; 60;60; los
60;
promedian
60; valores
65;
60;los65;
65; del65;
65;
valores
65; lugar
68;
del70;6to.
70;y6to.
lugar
68; 70; 7mo.
70;
70; 73; 73;
73; 80;
y 7mo.
70; 73; 82; 82; 95
Q2: 80;
65 puntos
Q2:82;
65 82;
puntos
95 Corresponde al valor del lugar 13ro.
Corresponde al valor del lugar 13ro.
Q3: 71,5
Los puntos
cuartiles
Q3: 71,5 serán:
puntos Se promedian
Se promedianlos valores del lugar
los valores 19no.19no.
del lugar y 20mo.
y 20mo.
Los cuartiles serán:
En cuanto
Q1: a lapuntos
52,5
En cuanto forma, comocomo
a la forma, la media es promedian
Se
la mediaigual que la
es igual mediana,
los
que valores la
deldistribución
la mediana, lugar 6to. yes simétrica.
7mo.
la distribución es simétrica.
Q2: 65 puntos Corresponde al valor del lugar 13ro.
Q1:
Q3: 52,5
71,5 puntos
puntos Se promedian los valores
Se promedian del lugar
los valores del 6to.
lugary 19no.
7mo. y 20mo.
Q2: 65 puntos Corresponde al valor del lugar 13ro.
Q3: 71,5 puntos
En cuanto Se promedian
a la forma, como la media eslos valores
igual que ladel lugar 19no.
mediana, y 20mo. es simétrica.
la distribución
Cuartiles: Los percentiles 25%, 50% y 75% se llaman primer cuartil, segundo
cuartil (mediana) y tercer cuartil, respectivamente. Se pueden usar los cuartiles
para dividir al conjunto de datos en cuatro partes, cada una de las cuales contiene
aproximadamente el 25% de los datos.
Estadístico: Valor numérico que se usa como medida resumida de una muestra
de datos (por ejemplo, la media de la muestra, la varianza de la muestra y la
desviación estándar de la muestra).
Percentil: Un valor tal que, cuando menos, p por ciento de los elementos son
menores que o iguales a ese valor, y al menos (100 - p) por ciento de los elementos
tienen valor mayor que o igual a ese valor. El 50° percentil es la mediana.
m4 microobjetivos
m4 contenidos
Asociación de variables
Esta gráfica es una de las técnicas más sencillas del análisis exploratorio;
10.6 de8.1
proporciona el orden 10.2 de
clasificación 10.0 9.4
los elementos del conjunto de datos y
la forma de la distribución.
9.6 7.8 9.3 8.2 11.0
10.8 de
El siguiente conjunto 9.6 datos7.5corresponde
8.2 9.9
a la relación precio-utilidad de
25 empresas que7.7 realizan
9.6 acciones
10.6 de10.1Responsabilidad
8.4 Social en el territorio
nacional.
8.3 9.6 10.1 10.4 10.6
10.6 8.1 10.2 10.0 9.4
9.6 7.8 9.3 8.2 11.0
Para producir la gráfica se hace una lista vertical de los tallos (los primer
10.8 9.6 7.5 8.2 9.9
7.7 9.6 este
10.6 caso10.1
la parte8.4
entera de los elementos de los datos) como sigue:
8.3 9.6 10.1 10.4 10.6
Para producir la 7gráfica se hace una lista vertical de los tallos (los primeros dígitos,
o bien en este caso
8 la parte entera de los elementos de los datos) como sigue:
7
9
8 10
9
11
10
11
Después se dibuja una línea vertical a la derecha de los tallos y se listan la
Después se dibuja una línea vertical a la derecha de los tallos y se listan las hojas
dígito
(el siguiente dígito o eno este
en este
caso caso la parte
la parte decimal
decimal de cada
de cada valor,valor,
para para
cada cada
tallo) tallo) a la
a la derecha deen la el
línea, enen
orden el que
orden en queen
aparecen aparecen en el
el conjunto deconjunto de datos
datos original.
original.
7 8 5 7
8 1 2 2 4 3
9 4 6 3 6 9 6 6
10 6 2 0 8 6 1 1 4 6
11 0
7 8 5 7
8 1 2 2 4 3
9 4 6 3 6 9 6 6
10 6 2 0 8 6 1 1 4 6
11 0
7 5 7 8
8 1 2 2 3 4
9 3 4 6 6 6 6 9
10 0 1 1 2 4 6 6 6 8
11 0
Si se gira la página en 90º en sentido contrario a las agujas del reloj, se obtiene
una figura que se asemeja al histograma, haciendo la salvedad de que aquí
con este diagrama de tallo y hoja se mantienen todos los valores originales –tal
como se expresó– y esto se convierte en una de las ventajas que presenta este
diagrama en la exploración de los datos.
Con este además es posible tener una idea de la forma que adoptan los datos,
detectar el valor de la variable mínimo, máximo y más frecuente. En nuestro
ejemplo, la relación precio-utilidad que más se presenta es 9,6 ya que 4 empresas
tienen dicha relación.
- Valor mínimo
- Primer cuartil
- Mediana
- Tercer cuartil
- Valor máximo
La manera más fácil de elaborar este resumen de datos es poner los mismos
en orden ascendente. Veamos un ejemplo. Supongamos que contamos con la
información relativa a la cantidad de lluvia anual caída en una región geográfica
determinada de nuestro país; los valores corresponden a 17 mediciones, esto
servirá de utilidad al gobierno para tomar medidas al respecto.
320; 510; 510; 525; 550; 570; 570; 600; 600; 610; 612; 614; 615; 630; 632; 633; 640
Vamos a construir este diagrama con los datos del milimetraje de lluvia medido
en 17 oportunidades en una región geográfica.
La siguiente figura muestra el diagrama de caja y brazos para los datos de los
mm. de lluvia.
200 250 300 350 400 450 500 550 600 650 700
milímetros de lluvia
Figura
Figura 1 1
- Cuando un conjunto
Tanto elderesumen
datos esde simétrico, la mediacomo
cinco números y la mediana son iguales
el diagrama de caja y brazos
y, además la longitud del brazo o bigote izquierdo será igual a la del derecho,
unmediana
y la línea de la análisis dividirá
de la forma en en
la caja quepartes
se distribuye
iguales.el conjunto de datos. A saber
- Cuando un conjunto de datos presenta una asimetría hacia la izquierda, la
media será más pequeña que la mediana, justamente las pocas observaciones
- Cuando un conjunto de datos es simétrico, la media y la mediana so
pequeñas desplazan a la media hacia la izquierda; la concentración de
longituda del
los valores se observa brazo o bigote
la derecha de la izquierdo
gráfica yaserá
queigual a lade
el 75% dellas
derecho, y
observaciones se encuentra entre el primer cuartil y el extremo derecho del
dividirá la caja en partes iguales.
brazo (valor máximo).
- - Cuando
Un análisis similar, un conjunto
pero inverso, de datosen
se presenta presenta una asimetría
un conjunto de datoshacia
con la izquier
sesgo o asimetríapequeña
derecha.que la mediana, justamente las pocas observaciones peq
2.4. Regla empírica media hacia la izquierda; la concentración de los valores se obser
10,3 13,0 13,0 8,0 11,1 11,6 10,0 12,5 9,3 10,5
11,1 6,7 11,2 11,8 10,2 15,1 12,9 9,3 11,5 7,6
9,6 11,0 7,3 8,7 11,1 12,5 9,2 10,4 10,7 10,1
9,0 8,4 5,3 10,6 9,9 6,5 10,0 12,7 11,6 8,9
14,5 10,3 12,5 9,5 9,8 7,5 12,8 10,5 7,8 8,6
Si nos fijamos en los datos presentados, es posible advertir que 32 de los montos
(aproximadamente el 64%) se encuentran entre µ ± σ (es decir, entre los 8,24 y
los 12,33 miles de $), en tanto que 47 montos (alrededor del 94%) se hallan a µ
± 2σ (es decir, entre 6,19 y 14,37 miles de $).
de agroquímicos
70 Diagrama de dispersión para la empresa
65
de agroquímicos
60 70
Ventas (en miles de $)
55 65
50 60
Ventas (en miles de $)
45 55
40 50
35 45
30
40
0 1 2 3 4 5 6
35
cant.de anuncios
30
0 1 2 3 4 5 6
Figura
Figura3 3
cant.de anuncios
Al observar la nube de puntos o diagrama de dispersión, se aprecia una relación
en sentido positivo entre laslados
Al observar variables.
nube de puntos Figura
Vamos 3
a calcular
o diagrama dea dispersión,
continuaciónseuna
aprecia una
medida descriptiva que refleje lo que se observa en el gráfico.
positivo entre las dos variables. Vamos a calcular a continuación una med
refleje lo Al
3.1. Covarianza queobservar la nube
se observa en elde puntos o diagrama de dispersión, se apre
gráfico.
positivo entre las dos variables. Vamos a calcular a continuación
En el caso de que se desee lograr una medida de variabilidad conjunta de dos
refleje lo que se observa en el gráfico.
variables cuantitativas, la covarianza es una medida que nos permite analizar
si existe relación
3.1.entre las variables que se desean estudiar. Es una medida
Covarianza
(absoluta) de asociación entre dos variables.
En el caso de que se desee lograr una medida de variabilidad conjunt
de una 3.1. Covarianza
La covarianza cuantitativas,
muestra de pares es
la covarianza de una
datos se calcula
medida que nosdepermite
la siguiente
analizar si exis
manera:
variablesEn
queelsecaso de estudiar.
desean que se desee
Es unalograr
medida una medida de
(absoluta) deasociación
variabilidad
e
Sumatoria del producto cuantitativas, la covarianza
de las diferencias entre es
losuna medida
valores de que
una nos permite analiz
variable
respecto de su media yvariables
la diferencia de desean
los valores
quemuestra
se de la otra variable respecto
La covarianza de una de estudiar.
pares de Es una
datos medida
se calcula(absoluta) de asom
de la siguiente
de su media, dividido por el tamaño de la muestra menos uno.
La covarianza
EDUBP | LICENCIATURA de una
EN GESTION DEmuestra de pares
LA SEGURIDAD de datos
| estadística se calcula
- pag. 63 de la s
tamaño de la muestra menos uno.
Cov � x; y � =
� �x � x ��Sumatoria
y � y � del producto de las diferencias entre los valores de
n �media
1 y la diferencia de los valores de la otra variable respecto
tamaño de la muestra menos uno.
para �calcular
aplicaremos la fórmula Cov
��
x�x y� y�� �
En la tabla de los datos, a cada cantidad de anuncios le corresponde un monto de v
x; y � = la covarianza a este conjunto de datos.
n �1
En la tabla de los datos, a cada cantidad de anuncios le corresponde un monto
Con los datos de las dos variables calculamos la media aritmética, tanto para la cantid
de ventas; aplicaremos la fórmula para calcular la covarianza a este conjunto de
anuncios comerciales en los micros de agro como de las ventas del producto. Dichas m
datos.
En la tabla de los datos, a cada cantidad de anuncios le corres
resultan ser:
Con los datos de las dosaplicaremos
variables calculamos la media
la fórmula para aritmética,
calcular tanto para
la covarianza la conjunto
a este
cantidad de anuncios comerciales en los micros de agro como de las ventas del
producto. Dichas medias resultan ser:
Media aritmética de la cantidad de anuncios: x = 3
Con los datos de las dos variables calculamos la media aritmétic
Media aritmética de la cantidad de anuncios: =3
Mediaaritmética
Media aritméticadel
delmonto
monto deventas
anuncios
de ventas== y =
= 51
comerciales (miles
en(miles
51 de
de $)
los micros
$) de agro como de las ventas
resultan ser:
La tabla que sigue muestra los cálculos necesarios para determinar la
La tabla que sigue muestra los cálculos necesarios para determinar la covarianza.
covarianza.
Media aritmética de la cantidad de anuncios: x = 3
x y xi - M(x) yi - M(y) (xi - M(x)) (yi - M(y))
Media aritmética del monto de ventas = y = 51 (miles de $)
1 41 -2 -10 20
2 50 -1 -1 1
4 54 1 3 3
5 57La tabla que sigue
2 muestra6 los cálculos necesarios
12 para determina
2 46 -1 -5 5
4 59 x 1 y 8 xi - M(x) 8 yi - M(y) (xi - M(x))
5 63 2 12 24
1 38 1 -2 41 -13 -2 26 -10 20
3 54 2 0 50 3 -1 0 -1 1
3 48 4 0 54 -3 1 0 3 3
5 57 2 99 6 12
2 46 -1 -5 5
4 Tabla 2 59 1 8 8
Tabla 2 5 63 2 12 24
Aplicando la fórmula de la covarianza,
1 esta resulta
38 ser: -2 -13 26
3 54 0 3 0
Cov (x; y) = 11 3 48 0 -3 0
Aplicando la fórmula de la covarianza, esta resulta ser: 99
Nota: cabe acotar que si en lugar de trabajar con una muestra de pares de datos
se trabaja con la población, es decir con el total de parejas de datos para las
variables de=interés,
Cov (x; y) 11 en la fórmula de laTabla 2
covarianza la suma de los productos se
debe dividir por N (tamaño de la población), en lugar de n-1.
En los gráficos que siguen se presentan tres diagramas de dispersión hipotéticos que muest
la asociación entre dos variables y la covarianza resultante en cada caso. El prim
corresponde a una covarianza positiva, el segundo a una covarianza negativa y el último a u
En los gráficos que siguen se presentan tres diagramas de dispersión hipotéticos
covarianza igual alacero.
que muestran asociación entre dos variables y la covarianza resultante en
cada caso. El primero corresponde a una covarianza positiva, el segundo a una
covarianza negativa y el último a una covarianza igual a cero.
50000 30
y
40000
20
30000
10
20000
160
y
10000 0
10 20 30 40 50 60 70 80 0 10 20 30
140
x x
160
y
120
140
100
120
80
100
60
10 20 30 40 50 60 70 80
80
x
60
10 20
Figura
30
4
40 50 60 70 80
Figura 4 Figura 4
3.2. Coeficiente de correlación
Según lo expresado acerca de la covarianzam parecería
3.2. Coeficiente de correlación
covarianza indica una fuerte relación lineal positiva y, por
3.2. Coeficiente de correlación
Según lo expresado acerca de de la covarianzam
la covarianzaparecería
indica unaque un valor
fuerte grande
relación lineal negativa
Según lo indica
y positivo de la covarianza expresado acercarelación
una fuerte de la covarianzam
lineal positivaparecería
y, por que
el un valo
otro lado, un valor negativo la
grande covarianza se presenta el problema de la magnitud en
covarianza indicade la fuerte
una covarianza indica
relación una
lineal fuertey,relación
positiva por el otro lado,
lineal negativa entre las variables.ya que esta es una
Sin embargo, enmedida absolutasedepresenta
la covarianza variabilidad conju
de la covarianza
el problema de la magnitud en que estánindicaexpresadas
una fuerte las
relación linealya
variables, negativa
que esta entre las va
que estén medidas las variables a relacionar. Este incon
es una medida absoluta de variabilidad
la covarianza conjunta
se presenta y se ve afectada
el problema por la unidad
de la magnitud en que están e
en que estén medidas las variables medida relativa de
a relacionar. variación
Este conjuntaseque
inconveniente se llama coefici
subsana
ya que
calculando una medida esta es
relativa de una medida
variación absolutaque
conjunta de se
variabilidad conjunta y se ve a
llama coeficiente
de correlación: que estén medidas las variables a relacionar. Este inconveniente se
Cov � x; y �
r =de variación conjunta que se llama coeficiente de corre
medida relativa
sx � s y
El coeficiente de correlación (r) permite medir la intensidad en la asociación
� �
Cov x; y de –1 a 1. Valores de r próximos a –1 ó a 1
r =su valor varía
lineal de las variables;
s x � s y Ellineal
indican un alto grado de relación coeficiente
entre lasdevariables,
correlación (r) permite
en tanto medir la inten
que valores
cercanos a 0 están indicando ausencia variables;desu valor varía
relación linealde –1 alas1.variables,
entre Valores delo r próximo
cual no significa que no existe algún otro tipo de relación no lineal.
relación lineal entre las variables, en tanto que valores ce
El coeficiente de correlación (r) permite medir la intensidad en la
EDUBP | LICENCIATURA EN deGESTION
relaciónDElineal entre las| estadística
LA SEGURIDAD variables,- pag.
lo cual
65 no signifi
variables; su valor varía de –1 a 1. Valores de r próximos a –1 ó a 1
relación no lineal.
relación lineal entre las variables, en tanto que valores cercanos a 0 e
de relación lineal entre las variables, lo cual no significa que no e
Entonces, con el coeficiente de correlación se puede analizar no sólo el sentido
en que se relacionan las variables, lo que viene dado por el signo positivo o
Ya habíamos visualizado a través del diagrama de dispersión qu
negativo del coeficiente, sino que también podemos medir el grado en que se
vinculan las variables, yaoque
directa entre
cuanto másla cercano
cantidadade anuncios
1 sea del accionar
el coeficiente, mejorsocial de l
y más fuerte es la asociación, y cuanto más cercano a 0, más débil resulta la
revistas mensuales y las ventas posteriores de los productos y se
relación entre las variables.
covarianza entre las variables habíamos llegado a un valor p
Veamos qué sucede con nuestro ejemplo.
existencia Calculemos
de una relaciónellineal
coeficiente de correlación
positiva entre dichas variab
para las variables que le interesaba al gerente de RRHH de la empresa que
emprende acciones de RSE. coeficiente de correlación.
Ya habíamos visualizado a través del diagrama de dispersión que existía una
relación positiva o directa entre la cantidad de anuncios del accionar social de
la firma que aparecían en Para
las poder aplicar
revistas la fórmula
mensuales y las del coeficiente
ventas de correlación
posteriores de e
los productos y servicios. previamente
Además, al las desviaciones
calcular estándar
la covarianza entrede
lascada una de las va
variables
habíamos llegado a un valor positivo, lo que confirmaba la existencia de una
módulos anteriores, cuando estudiamos las medidas de dispersi
relación lineal positiva entre dichas variables; calculemos entonces el coeficiente
de correlación. desviaciones estándar de una muestra.
11
r = = 0,93
1,4907 � 7,9303
Ante este resultado del coeficiente de correlación, se puede concluir que existe
Ante entre
una alta asociación positiva este resultado del coeficiente
las variables; de correlación,
en otras palabras, la mayorse puede
cantidad de anuncios que publica lapositiva
asociación firma dando
entre alas
conocer el accionar
variables; en otrasenpalabras,
RSE la ma
se asocia con mayores montos de ventas de los productos y servicios en los
publica
meses posteriores y el grado en la
quefirma dando a conocer
se relacionan las doselvariables
accionaresenfuerte.
RSE se asocia c
de los productos y servicios en los meses posteriores y el grado
Nota: si se está trabajando con los datos poblacionales, en la ecuación para
variables es fuerte.
calcular el coeficiente de correlación se deberán tomar los valores de los
parámetros, es decir la covarianza poblacional entre las dos variables, y se
la dividirá por el producto de las desviaciones estándar poblacionales de las
variables.
Nota: si se está trabajando con los datos poblacionales, en
Con respecto al coeficiente de correlación,
coeficiente es muy importante
de correlación lo siguiente:
se deberán tomar los valores de
m4 actividades
m4 | actividad 1
Un día como tantos otros, usted llega a su trabajo y consulta su correo electrónico.
Allí se encuentra con un mensaje del jefe del departamento de Estadística de la
consultora, quien le plantea lo siguiente:
Los datos que le fueran enviados hace unos días, fueron los siguientes:
A 1
C 1
m4 | actividad 1 | AA
asistente académico 1
Para esta actividad, considero que sería interesante para usted repasar todo lo
relativo al resumen de cinco números y al diagrama de caja y brazos vistos en
este módulo.
Estadísticos
unidades robadas
Mínimo 608
Máximo 31413
Percentiles 25 1861,00
50 4019,00
75 8356,50
Diagrama deEDUBP
caja y| brazos
LICENCIATURA EN GESTION DE LA SEGURIDAD | estadística - pag.68
unidades robadas
Mínimo 608
Máximo 31413
Percentiles 25 1861,00
50 4019,00
75 8356,50
unidades robadas
Estadísticos
unid.robadas corregidas
Mínimo 608
Máximo 14138
Percentiles 25 1861,00
50 4019,00
75 8356,50
unidades robadas
Como usted puede advertir, el análisis apropiado de los datos que realice será más
útil al productor agropecuario, y a usted le viene como anillo al dedo para poner
en práctica lo visto en la materia sobre la relación y asociación de variables.
A 1 C 1
asistente académico 1
Para resolver esta nueva situación donde se enfrenta con los requerimientos
de un productor agropecuario, le recomiendo revisar todo aquello relativo
a la asociación y correlación de dos variables. Calcule los coeficientes
correspondientes y realice la interpretación adecuada de estos.
Estadística - Módulo 4
El gráficoes
El gráfico de dispersión deeldispersión
siguiente:es el siguiente:
30
25
20
15
10
5
toneladas
0
500 520 540 560 580 600 620 640 660
milímetros de lluvia
Usted podrá advertir aquí la existencia de una relación directa entre las
Usted podrá advertir aquí la
milímetros deexistencia de una
lluvia caídos relacióncosechadas
y toneladas directa entrede
lascereal.
siguientes
variables: milímetros de lluvia caídos y toneladas cosechadas de cereal.
Para medir esa asociación calculamos ahora la covarianza.
Para medir esa asociación calculamos ahora la covarianza.
A partir de los datos se calcularon las medias aritméticas y las desviacione
A partir de los una de las
datos variables. Las
se calcularon lasmedidas
medias resumen sonylas
aritméticas lassiguientes:
desviaciones
estándar para cada una de las variables. Las medidas resumen son las
siguientes: - Para la variable milímetros:
Media aritmética: 599,76 mm.
Desviación
- Para la variable estándar: 37,24 mm.
milímetros:
Media aritmética: 599,76 mm.
- Para 37,24
Desviación estándar: las toneladas
mm. cosechadas:
Media aritmética: 21,91 tn.
Desviación estándar: 5,30 tn.
- Para las toneladas cosechadas:
Media aritmética:
La 21,91
tabla tn.
siguiente contiene los cálculos necesarios para el numerador
Desviación estándar: 5,30 tn.
covarianza.
La covarianza será:
La covarianza será:
5609,26
Cov (x;y) = = 169,77 La covarianza será:
33 5609,26
Cov (x;y) = = 169,77
El valor de la covarianza, al ser un valor positivo, 33 confirma la relación directa entre las toneladas de
cereal cosechadas y los milímetros de lluvia caídos.
El valor de la covarianza, al ser un valor positivo, confirma la relaci
El valor de la covarianza,cereal
al sercosechadas
un valor positivo, confirmadelalluvia
y los analizamos
milímetros relación directa
Ahora, con el cálculo del coeficiente de correlación lineal el gradocaídos.
de asociación lineal
entre las toneladas de cereal cosechadas y los milímetros de lluvia caídos.
entre las dos variables.
Ahora, con el cálculo del coeficiente de correlación lineal analizam
El valor Ahora, con el cálculo
del coeficiente, del coeficiente
entre
que resulta delas devariables.
dos
dividir lacorrelación
covarianzalineal analizamos
por el producto de el grado de
las desviaciones
asociación lineal entre las dos variables.
estándar de las variables es 0,86. Al ser un valor positivo, nos indica una correlación positiva o
directa, y al ser un valor cercano El avalor del indica
1 nos coeficiente,
un altoque resulta
grado de de dividir la lineal
asociación covarianza por
entre las
El
variables. valor del coeficiente, estándar
que de
resulta delas variables
dividir la es 0,86.
covarianza Al ser
por el un valor
producto positivo,
de nos i
las desviaciones estándardirecta,
de las yvariables
al ser un es valor
0,86. cercano
Al ser unavalor
1 nos indica nos
positivo, un alto grado
variables.
indica una correlación positiva o directa, y al ser un valor cercano a 1 nos indica
un alto grado de asociación lineal entre las variables.
En otra jornada laboral, usted llega a su oficina y se encuentra con una nota de
su jefe que dice: “Juan, en cuanto llegues pasá por mi despacho”.
A 1 C 1
m4 | actividad 3 | AA
asistente académico 1
Usted ya cuenta con los datos procesados para el análisis estadístico que le
correspondió hacer con anterioridad. Le sugiero que trabaje con la serie simple
de los datos, ya que ésta le permitirá aplicar la técnica de los cinco datos, el
diagrama de tallo y hoja y el de caja y brazos.
Le sugiero a su vez que vea la factibilidad de aplicar la regla empírica.
m4 | actividad 3 | AA
clave de corrección 1
35; 40; 45; 45; 50; 50; 55; 55; 55; 60; 60; 60; 65; 65; 65; 68; 70; 70; 70; 73; 73;
80; 82; 82; 95
24
30 40 50 60 70 80 90 100
puntaje
Si bien cuando se trabajaron los datos y se hicieron los cálculos de los estadísticos
(media, varianza Si y desviación
bien cuando estándar) a partirlos
se trabajaron dedatos
la tabla
y sedehicieron
frecuencias por
los cálculos de lo
intervalos la distribución
varianzaparecía ser simétrica,
y desviación es posible
estándar) constatar
a partir de que
la al trabajar
tabla de frecuenc
distribución
con los datos originales parecía ser de
sin la presentación simétrica,
una tablaesporposible
intervalosconstatar
y hacer elque al tr
originales
AED, la distribución sin la presentación
no es totalmente simétrica. de una tabla por intervalos y hacer el A
es totalmente simétrica.
La media aritmética a partir de los datos como serie simple, es 62,72 puntos,
por lo tanto no resultan media y mediana exactamente iguales, por lo que la
La media
distribución presenta aritméticaizquierda;
una asimetría a partir depor
loslodatos
tantocomo serie
no sería simple, es 62,72 p
apropiado
resultan
aplicar la regla empírica.
media y mediana exactamente iguales, por lo que la distr
asimetría izquierda; por lo tanto no sería apropiado aplicar la regla emp
Nota: recuerde que siempre que Ud. cuente con los valores individuales de
la variable, el cálculo de las medidas descriptivas será el valor exacto, ya que
cuando se trabaja a partir
Nota: de una
recuerde que tabla de que
siempre distribución de frecuencias
Ud. cuente por individu
con los valores
intervalos dependerá de la tabla que se confeccione el efecto sobre el cálculo
cálculo de las medidas descriptivas será el valor exacto, ya que cuand
de la media y deuna la varianza,
tabla depuesto que cuando
distribución se calculan dichas
de frecuencias medidas adependerá
por intervalos
confeccione
partir de la tabla de frecuencias,el lo
efecto
que sesobre el cálculo
considera de la media
en la fórmula y de son
de cálculo la varianza, p
calculan dichas medidas a partir de la tabla de frecuencias, lo qu
las marcas de clase.
fórmula de cálculo son las marcas de clase.
Regla empírica: Regla que establece los porcentajes de elementos que están
dentro de una, dos y tres desviaciones estándar de distancia del promedio, para
distribuciones con forma de campana.
Resumen de cinco datos: Técnica del AED que consiste en analizar los valores
mínimo y máximo y los cuartiles en un conjunto de datos.
Valor atípico: Valor dentro de los que asume una variable, que se aleja más
allá de la mayoría de los valores y cae fuera de los límites establecidos en un
diagrama de caja y brazos.
e v a l u ación