Anda di halaman 1dari 75

E - estadística

EDUBP | GESTION DE L A SEGURIDAD | p r i m e r c u a t r i m e s t r e


í ndice

 presentación 3

 programa 4
contenido módulos

 mapa conceptual 5

 macroobjetivos 6

 agenda 6

 material 7
material básico
material complementario

 glosario 8

 módulos *
m1 | 11
m2 | 25
m3 | 43
m4 | 57

* cada módulo contiene:


microobjetivos
contenidos
mapa conceptual
material
actividades
glosario

 evaluación 75

impresión total del documento 75 páginas !

EDUBP | LICENCIATURA EN GESTION DE LA SEGURIDAD | estadística - pag.2


presentación
Bienvenido a ESTADÍSTICA

¡Bienvenido a la asignatura Estadística


de la Licenciatura en Gestión de
Seguridad Ciudadana!
Estamos viviendo tiempos de grandes
cambios, en los que el común
denominador es la globalización de los
mercados, lo que da como resultado
una competencia sumamente agresiva.

En este contexto, nuestra capacidad en la toma de decisiones inteligentes por


medio de un eficaz manejo de los datos que nos rodean a diario, y la posibilidad
de realizar predicciones o estimaciones basadas en dicha información, juegan
un papel preponderante. En este sentido, aquellos cambios continuos y
vertiginosos exigen poner en juego ciertas destrezas basadas principalmente en
la recopilación, organización, presentación, interpretación y análisis de datos.
Es en este marco donde se inserta la Estadística. Frente a un conocimiento
imperfecto de las situaciones planteadas y a un grado considerable de
incertidumbre, esta disciplina –a través de los métodos y técnicas adecuados–
nos ayudará a tomar aquellas decisiones eficientes y oportunas. Si se tiene
conocimiento sobre los métodos y técnicas estadísticas adecuadas, se podría
decir que prácticamente no habrá conjunto de datos a los que no sea posible
convertir en información útil.
Si nos ponemos a pensar, la Estadística está presente en todos los lugares y en
todos los ámbitos. Tanto en las noticias de todos los días, como en los medios
(radio, televisión, prensa). Hay estadísticas en la economía, en la política, en el
ranking de los programas televisivos, en los deportes, en materia de seguridad,
etc. Hoy vivimos sumergidos en un mar de cifras sobre los más diversos temas:
desempleo, elecciones, nominaciones, paros de transporte, paros de docentes,
accidentes, resultados deportivos, divorcios, asistencia a eventos y recitales,
estadísticas de crímenes, etc., etc.

Es por ello que la Estadística resulta


una herramienta fundamental para
lograr que usted se convierta en
consumidor inteligente, capaz de
transmitir correctamente la información
y tomar decisiones críticas a través
del análisis de la información.

Creemos que si usted no tiene la oportunidad de conocer y aprender estas


matemáticas aplicadas, nos estaremos arriesgando a crear una sociedad

EDUBP | LICENCIATURA EN GESTION DE LA SEGURIDAD | estadística - pag. 3


polarizada, en la que sólo unos pocos tendrán el conocimiento específico que se
necesitará para controlar el desarrollo económico y científico. De ser así, se dará
lugar paulatinamente a una sociedad que no será coherente ni con los valores
éticos de un sistema democrático justo, ni con sus necesidades económicas.

Las actividades propuestas en esta materia podrán ser relacionadas y aplicadas


con las distintas áreas que conforman la currícula del plan de estudio.

Como docente de esta asigantura, deseo que usted, quien emprende hoy el
estudio de la Estadística, logre a través de ella apreciar la importante ayuda que
las técnicas estadísticas pueden prestar a su futuro quehacer profesional en la
tarea más importante: la toma de decisión a partir del análisis de datos.

p r o g rama

Módulo 1: INTRODUCCIÓN A LA ESTADÍSTICA

Concepto de estadística. Aplicación de la estadística en los distintos


campos de la investigación. Recolección de datos. Población y
muestra. Medición de las unidades elementales: datos cuantitativos y
datos cualitativos. Niveles o escalas de medición. Fuentes de datos.

Módulo 2: ORGANIZACIÓN Y PRESENTACIÓN DE DATOS ESTADÍSTICOS

Tablas estadísticas, construcción. Distribuciones unidimensionales. Series


simples y distribuciones de frecuencias. Tablas para datos cualitativos y
cuantitativos. Gráficos estadísticos: interpretación y análisis. Usos correctos e
incorrectos de los gráficos estadísticos.

Módulo 3: ESTADÍSTICA DESCRIPTIVA

Parámetros estadísticos. Medidas de posición: media aritmética, mediana, modo,


cuartiles. Cálculo e interpretación. Medidas de dispersión: varianza, desviación
estándar, coeficiente de variación. Cálculo e interpretación. Medidas de forma:
asimetría y puntiagudez. Distribuciones bidimensionales. Aplicaciones y estudio
de casos.

Módulo 4: ASOCIACIÓN DE VARIABLES

Características importantes de los datos. Análisis exploratorio de los datos.


Diagrama de tallo y hojas. Diagrama de caja. Regla empírica. Medidas de
asociación entre dos variables. Covarianza. Coeficiente de correlación.

EDUBP | LICENCIATURA EN GESTION DE LA SEGURIDAD | estadística - pag.4


m a p a c o n c eptual

herramienta de gran utilidad a la hora


de recolectar, procesar y generar
ESTADISTICA Se convierte en una
información útil para la toma de
decisiones

Se nutre de
En el ámbito de la

Seguridad
DATOS
Ciudadana

Surgen de Surgen de

POBLACIÓN Se realiza MUESTRA

Se realiza Se realiza

ANÁLISIS ANALISIS
DESCRIPTIVO INFERENCIAL
Se nutre de
Consiste en

PROBABILIDAD
ORDENAR
ORGANIZAR
Llevado a cabo a través de
PRESENTAR DATOS

A través de A través de

PRUEBA DE RELACION ENTRE


TABLAS GRÁFICOS MEDIDAS ESTIMACION VARIABLES.
HIPÓTESIS
ASOCIACIÓN Y
CORRELACIÓN
Saco conclusiones sobre

EDUBP | LICENCIATURA EN GESTION DE LA SEGURIDAD | estadística - pag. 5


m a c r o o b j etivos

• Conocer la terminología básica de la asignatura, para facilitar un manejo


sólido de los fundamentos teóricos y prácticos del análisis estadístico
descriptivo.

• Identificar los aspectos principales del análisis exploratorio de datos, a fin de


detectar la presencia de errores o de valores atípicos en la recolección de los
mismos.

• Comprender la asociación entre variables, con el objeto de medir la relación


y el grado de asociación entre dos variables cuantitativas que resulten de
interés en materia de seguridad ciudadana.

• Advertir la relevancia del uso de la computadora en la aplicación de


resúmenes de datos, a los fines de emplear los aplicativos tales como Excel
y Word a estadísticas de seguridad ciudadana.

• Incorporar conocimientos para el análisis de situaciones reales, con el objeto


de elaborar juicios propios e independientes, necesarios para la toma de
decisiones en el ámbito de la seguridad ciudadana.

agenda

Estimado alumno:

Sabemos que cada uno de nosotros tiene su propio ritmo para aprender y
que, acorde a las ocupaciones y actividades, los tiempos dedicados al estudio
serán diferentes para cada uno. No obstante, es nuestra intención presentarle
sugerencias relativas al porcentaje que se le ha asignado a cada módulo, según
la importancia y complejidad de los temas, y el tiempo estimativo que puede
insumir cada módulo del total de la asignatura.

Esto le permitirá a usted realizar una mejor distribución de sus tiempos de estudio
por módulos y por asignaturas, lo cual se expresará seguramente en el logro de
sus objetivos.

En este sentido, le proponemos la siguiente tabla con los módulos de la asignatura


y los tiempos estimados que insumirá cada uno. Usted podrá incorporarla en un
cuadro general para todas las asignaturas del cuatrimestre, para de esta forma
distribuir mejor los tiempos por año de cursado.

MÓDULO % DE TIEMPO ESTIMADO


I 20%
II 20%
III 30%
IV 30%
Total 100%

EDUBP | LICENCIATURA EN GESTION DE LA SEGURIDAD | estadística - pag.6


A continuación se presenta la distribución del tiempo en semanas. Tal como se
expresa en la próxima tabla, las evaluaciones parciales de esta asignatura están
previstas de la siguiente manera:

1° evaluación al finalizar el módulo II

2° evaluación al finalizar el módulo IV

MÓDULOS
SEMANA I II III IV
1
2
3
4
5
6 1º evaluación
7
8
9
10
11
12
13
14
15 2º evaluación

m a terial

Material de consulta obligatoria

• TRIOLA, Mario F.: Estadística Elemental. México. Editorial Pearson Educación.


2000, séptima edición.

• ANDERSON, David; SWEENEY, Dennis y WILLIAMS, Thomas: E s t a d í s t i c a


para Administración y Economía. México.International Thompson. 1999

Material de consulta complementaria

• HANKE y REITSCH: Estadística para Negocios. España. Editorial Irwin.


1995.

• BERENSON, LEVINE y KREHBIEL: Estadística para administración. México.


Editorial Prentice Hall. 2001.

• LEVIN, RUBIN, BALDERAS, DEL VALLE y GÓMEZ: Estadística para


Administración y Economía. México. Editorial Prentice Hall. 2004, séptima
edición.

EDUBP | LICENCIATURA EN GESTION DE LA SEGURIDAD | estadística - pag. 7


g l osario

Análisis exploratorio de datos (AED): Métodos simples para analizar datos,


que requieren de pocos cálculos y suposiciones principales.

Coeficiente de variación: Medida de la dispersión relativa de un conjunto de


datos. Se calcula dividiendo la desviación estándar entre la media y multiplicando
el cociente por 100.

Conjunto de datos: Todos los datos recopilados en determinado estudio.

Covarianza: Medida numérica de la asociación lineal entre dos variables.


Sus valores positivos indican una relación positiva; los negativos una relación
negativa.

Cuartiles: Los percentiles 25%, 50% y 75% se llaman primer cuartil, segundo
cuartil (mediana) y tercer cuartil, respectivamente. Se pueden usar los cuartiles
para dividir al conjunto de datos en cuatro partes, cada una de las cuales contiene
aproximadamente el 25% de los datos.

Datos: Información recopilada para cada variable o característica en estudio.

Datos agrupados: Datos disponibles en intervalos de clase, como los resumidos


por una distribución de frecuencias. Los valores individuales de los datos
originales no están registrados.

Datos cualitativos: Datos que surgen de variables cualitativas y asumen etiquetas


o nombres de determinada característica.

Datos cuantitativos: Datos que surgen de variables cuantitativas e indican


cuánto o cuántos de algo. Los datos cuantitativos siempre son numéricos.

Datos de una serie de tiempo: Datos reunidos en diversos periodos sucesivos.

Datos transversales: Datos reunidos en el mismo, o aproximadamente el mismo,


punto o momento de tiempo.

Desviación estándar: Medida de la dispersión de un conjunto de datos; se


calcula sacando la raíz cuadrada positiva de la varianza.

Diagrama de caja: Resumen gráfico de los datos. Se traza un rectángulo desde


el primer cuartil hasta el tercero, que indica la ubicación del 50% intermedio de los
datos. Luego unas líneas punteadas, llamadas bigotes, que van en los extremos de
la caja y muestran la ubicación de datos mayores que el tercer cuartil y menores
que el primero. También se muestran las ubicaciones de los valores atípicos.

Diagrama de dispersión: Método gráfico para mostrar la relación entre dos


variables cuantitativas. Una variable se representa sobre el eje horizontal y la
otra sobre el eje vertical.

Diagrama de pastel o torta: Forma gráfica de presentar resúmenes de datos


cualitativos, basada en la subdivisión de un círculo en sectores que corresponden
a la frecuencia relativa de cada clase.

Diagrama de tallo y hojas: Técnica de análisis exploratorio de datos que clasifica


y ordena simultáneamente los datos cuantitativos y proporciona una perspectiva
de la forma de la distribución.

Distribución acumulada de frecuencias: Resumen tabular de un conjunto


de datos cuantitativos que muestra la cantidad de artículos que tienen valores
menores que, o iguales, al límite superior de cada clase.

EDUBP | LICENCIATURA EN GESTION DE LA SEGURIDAD | estadística - pag.8


Distribución acumulada de frecuencias relativas: Resumen tabular de un
conjunto de datos cuantitativos donde se muestra la fracción o proporción de
los elementos cuyos valores son menores que, o iguales, al límite superior de
cada clase.

Distribución de frecuencias: Resumen tabular de un conjunto de datos donde


se muestra la frecuencia (o cantidad) de artículos en cada una de varias clases
que no se traslapan.

Distribución de frecuencias porcentuales: Resumen tabular de un conjunto de


datos donde se muestra el porcentaje de la cantidad total de elementos en cada
una de varias clases que no se traslapan.

Distribución de frecuencias relativas: Resumen tabular de un conjunto de


datos donde se ve la frecuencia relativa, esto es, la fracción o la proporción de la
cantidad total de elementos en cada una de varias clases que no se traslapan.

Elementos: Las entidades o unidades acerca de las que se reúnen datos.

Estadística: Arte y ciencia de reunir, analizar, presentar e interpretar datos.

Estadística descriptiva: Métodos tabulares, gráficos y numéricos para resumir


y describir conjuntos de datos.

Estadístico: Valor numérico que se usa como medida resumida de una muestra
de datos (por ejemplo, la media de la muestra, la varianza de la muestra y la
desviación estándar de la muestra).

Estadístico de muestra: Es una característica de la muestra, como la media


de la muestra, la desviación estándar muestral, la proporción muestral, etc.
El valor del estadístico de muestra se usa para estimar el valor del parámetro
poblacional.

Estimador puntual: Un valor numérico único que se usa como estimado de un


parámetro poblacional.

Gráfico de barras: Forma gráfica de representar la información de una distribución


de frecuencias, de frecuencias relativas o de frecuencias porcentuales de datos
cualitativos.

Histograma: Presentación gráfica de una distribución de frecuencias, de


frecuencias relativas o de frecuencias porcentuales de datos cuantitativos. Se
traza colocando los intervalos de clase sobre el eje horizontal y las frecuencias
sobre el eje vertical.

Inferencia estadística: El proceso de reunir datos obtenidos de una muestra


para hacer estimaciones o probar hipótesis acerca de las características de una
población.

Media: Medida de la localización central de un conjunto de datos. Se calcula


sumando todos los valores de los datos y dividiendo el resultado entre el número
de elementos.

Media ponderada: Media para un conjunto de datos, que se obtiene asignando


un factor de ponderación a cada valor de dato; este factor refleja la importancia
dentro del conjunto.

Mediana: Medida de la localización central. Es el valor que divide los datos en


dos grupos iguales, uno con valores mayores que o iguales a la mediana, y el
otro con valores menores que o iguales a ella.

EDUBP | LICENCIATURA EN GESTION DE LA SEGURIDAD | estadística - pag. 9


Medida estadística o estadístico de la muestra: Valor numérico que se usa
como medida resumida de una muestra (por ejemplo, la media de la muestra, la
varianza de la muestra y la desviación estándar de la muestra s).

Medidas de asociación: Herramientas estadísticas que permiten analizar e


interpretar la relación entre dos variables.

Moda o modo: Medida de la localización, definida como el valor de la variable


que ocurre con más frecuencia.

Muestra: Un subconjunto de la población.

Observación: Medición/es obtenida/s de un solo elemento.

Parámetro poblacional: Valor numérico que se usa como medida resumida de


una población de datos (por ejemplo, la media de la población, la varianza de la
población y la desviación estándar de la población).

Percentil: Un valor tal que, cuando menos, p por ciento de los elementos son
menores que o iguales a ese valor, y al menos (100 - p) por ciento de los elementos
tienen valor mayor que o igual a ese valor. El 50° percentil es la mediana.

Población: El conjunto de todos los elementos de interés en determinado


estudio.

Punto medio de clase: Punto en cada clase que está a la mitad entre los límites inferior
y superior de un intervalo de clase en una tabla de distribución de frecuencias.

Rango: Medida de dispersión, definida como el valor máximo menos el valor


mínimo.

Rango intercuartil (RIC): Medida de dispersión, definida como la diferencia


entre el tercer y el primer cuartil.

Regla empírica: Regla que establece los porcentajes de elementos que están
dentro de una, dos y tres desviaciones estándar de distancia del promedio, para
distribuciones con forma de campana.

Resumen de cinco datos: Técnica del AED que consiste en analizar los valores
mínimo y máximo y los cuartiles en un conjunto de datos.

Tabulación cruzada: Resumen tabular de datos para dos variables. Las clases
de una variable se representan en los renglones; las clases de la otra variable,
en las columnas.

Valor atípico: Valor dentro de los que asume una variable, que se aleja más
allá de la mayoría de los valores y cae fuera de los límites establecidos en un
diagrama de caja y brazos.

Valor z: Valor calculado dividiendo la desviación respecto al promedio con respecto


a la desviación estándar. Se llama también valor estandarizado, y representa la
cantidad de desviaciones estándar que hay entre el valor xi y el promedio.

Variable: Una característica de interés de los elementos.

Variable cualitativa: Una variable que asume categorías.

Variable cuantitativa: Una variable con valores cuantitativos.

Varianza: Medida de dispersión para un conjunto de datos, basada en las desviaciones


de los valores de los datos respecto a la media, elevadas al cuadrado.

EDUBP | LICENCIATURA EN GESTION DE LA SEGURIDAD | estadística - pag.10


m ó dulos

m1

m1 microobjetivos

• Conocer la importancia de la generalización de los resultados a una población


objeto de estudio, a partir de la distinción estadística entre el concepto de
población o universo y el concepto de muestra representativa, con el objeto
de extraer conclusiones útiles y aplicables –con carácter predictivo– a
situaciones relacionadas con la seguridad ciudadana.

• Comprender la distinción estadística entre el concepto de población o


universo y el de muestra representativa, a los fines de advertir la importancia
de generalizar los resultados a una población objeto de estudio.

• Reconocer la importancia de la generalización de los resultados, con el


objeto de extraer conclusiones útiles, aplicables y con carácter predictivo a
situaciones relacionadas con la seguridad ciudadana.

• Identificar las etapas del método estadístico en una investigación por medio
de una correcta definición de la población y de las unidades estadísticas, con
el objeto de plantear correctamente las variables y elaborar el instrumento
de recolección de datos que resulte más adecuado.

• Identificar las variables cuantitativas y cualitativas en estudios relacionados


con la seguridad ciudadana, a fin de realizar un adecuado procesamiento
de los conjuntos de datos, seleccionando las herramientas estadísticas
pertinentes para cada caso.

• Identificar las distintas fuentes de datos a las que se puede recurrir, con el
propósito de tener en cuenta puntualmente las situaciones reales vinculadas
a la seguridad ciudadana.

m1 contenidos

1. ¿Qué entendemos por Estadística?

Todos los días se nos expone a una gran cantidad y una amplia variedad
de información numérica relativa a distintos fenómenos, tales como datos
sobre accidentes en las distintas rutas nacionales y provinciales, número de
sobrevivientes en una catástrofe, incremento porcentual de la incidencia de
determinados sectores en la economía, resultados de encuestas de opinión,
tasas de desempleo, inventarios, aceptabilidad de un nuevo producto alimenticio,
incremento de las demandas judiciales, etc., etc. Todas las situaciones o ejemplos
planteados precedentemente presentan diferente naturaleza y complejidad, pero
cada uno de ellos involucra la necesidad de poseer conocimientos en estadística
para poder analizarlos, comprenderlos y resolverlos, ya que se necesita de la
predicción y de la toma de decisiones.
Podemos decir entonces que:

EDUBP | LICENCIATURA EN GESTION DE LA SEGURIDAD | estadística - pag. 11


La Estadística moderna abarca la recolección, presentación y caracterización de
información, tanto para el análisis de datos como para ayudar en el proceso de
toma de decisiones.

En general, podemos establecer (sin que esto pretenda ser una única definición)
que la Estadística es:

Un conjunto de métodos y técnicas cuyo objetivo es recolectar, clasificar,


ordenar, analizar y describir datos, con el fin de obtener información a
un costo mínimo y de realizar un uso óptimo de esa información para
hacer inferencias con respecto a una población, a efectos de extraer
conclusiones útiles para la toma de decisiones.

Resulta fácil comprender la importancia de tomar en cuenta aquellos


conocimientos estudiados en estadística; es más, en la actualidad existe bastante
consenso entre los profesionales de las distintas áreas, incluso en las áreas
sociales, en aceptar el papel crucial que juega el análisis estadístico en toda
investigación. Esta importancia se acentúa más aún en el mundo globalizado
en que nos toca vivir y actuar, con el uso generalizado de la computadora –que
facilita enormemente todo cálculo matemático– y por la existencia de bases de
datos para prácticamente cualquier fenómeno que se desee estudiar.

Muchos puestos clave en la vida profesional requieren del conocimiento básico


de la estadística, del análisis de datos, de informes y estudios basados en esta
área del saber. Es más, sin los procedimientos estadísticos, en nuestros días,
ninguna organización podría entender la inmensa cantidad de datos que genera
su propia actividad. Es posible adelantarse, entonces, en decir que el profesional
intuitivo tendrá cada vez menos lugar en la sociedad moderna.

El propósito del análisis estadístico que se perseguirá en este curso es resumir


e interpretar datos con la finalidad de obtener información útil que sirva para la
posterior toma de decisiones en las situaciones propias del futuro profesional de
esta carrera.

Presentaremos a continuación algunos conceptos clave para manejarnos en


esta disciplina.

2. Población y muestra:

2.1. Población

Se denomina población o universo al conjunto de artículos, individuos o cosas


sobre los cuales se desea realizar una investigación. En ocasiones se puede
medir o examinar cada elemento de la población, por lo que un censo se convierte
en un intento de medir todos los elementos de una población bajo interés, como
por ejemplo el Censo Nacional de Población, etc. Aquí le sugiero consultar la
siguiente página: www.indec.gov.ar

2.2. Muestra
Todo el proceso de reunir, organizar e interpretar datos es motivado por el deseo
de conocer algo acerca de la población. En ocasiones la población bajo estudio
está compuesta por una cantidad infinita de unidades elementales, lo que hace
imposible o muy costoso trabajar con la totalidad de ellas. Entonces, la solución
será trabajar con una parte de ella, ya que así reduciremos costos y tiempo.
La muestra es una parte de la población o universo, y se la utiliza para sacar

EDUBP | LICENCIATURA EN GESTION DE LA SEGURIDAD | estadística - pag.12


conclusiones acerca de toda la población bajo estudio, es por ello que es muy
importante que la muestra con la cual se trabaje sea representativa.

¿Qué significa una muestra representativa? Una muestra es representativa


cuando posee las características de la población que se estudia; no olvidemos
que la muestra nos sirve para sacar conclusiones con respecto a todos los
elementos de la población.

La estadística proporciona diversos métodos para seleccionar una muestra


representativa, éstos se llaman métodos de muestreo.

2.3. Unidad estadística o elemental o de observación

La unidad estadística, o unidad elemental o unidad de observación, es cada uno


de los elementos de la población o universo sobre el cual queremos hacer un
determinado análisis.

La unidad estadística puede estar constituida por un solo elemento de la


población o por un conjunto de ellos; por ejemplo:

- Si se encara un estudio sobre distintas características que abarcara a la totalidad


de las ONGs existentes en el país, cada una de las organizaciones es una unidad
estadística;
- En cambio, si se desea conocer el ingreso anual promedio per cápita de una
determinada zona marginal, la unidad estadística será cada uno de los habitantes
de dicha zona;
- Si la finalidad de una investigación es el ingreso promedio de las familias de un
determinado sector económico, la unidad estadística sería cada familia de dicho
sector.
- Si el objetivo de la investigación es conocer la edad promedio de los estudiantes
que cursan tecnicaturas en la UBP, la unidad estadística es cada uno de los
alumnos inscriptos en la universidad para cursas las mismas.

3. Variables y dato estadístico:

3.1. Variable

Una variable es una característica de interés a investigar sobre las unidades


elementales de las cuales se reúnen datos. (Si nos detenemos a realizar un
estudio sobre una determinada ONG, las variables que se podrían analizar, entre
otras, serían: tipo de actividad que realiza, cantidad de personas que prestan
servicios en la organización, etc.).

3.2. Dato estadístico

Es un conjunto de resultados que se presentan para cada variable en estudio,


y cuya principal característica es poder tomar diferentes valores o categorías
de una unidad elemental a otra. Los datos estadísticos pueden ser analizados,
relacionados e interpretados, y se obtienen contando o midiendo las unidades
elementales.

EDUBP | LICENCIATURA EN GESTION DE LA SEGURIDAD | estadística - pag. 13


4. Tipos de datos

4.1. Datos cualitativos: son aquellos datos que, ante una determinada pregunta,
arrojan respuestas categóricas. Las unidades elementales pueden ser clasificadas
solo como poseedoras o no poseedoras de cierta cualidad o propiedad.

Las observaciones cualitativas de las unidades elementales se llaman


atributos.

Algunos ejemplos de datos cualitativos podrían ser los siguientes: sexo de las
personas que trabajan en una ONG; tipo de vehículo involucrado en accidentes
carreteros; tipo de lesión sufrida en los accidentes de tránsito; etc.

4.2. Datos cuantitativos: en estos, las unidades elementales asumen cualquier


valor numérico.

Podemos clasificar los datos cuantitativos, a su vez, en:

• Datos cuantitativos discretos: son datos que, ante una pregunta


determinada, arrojan respuestas numéricas que surgen de un proceso
de conteo.

Ej.: cantidad de personas que trabajan en una organización sin fines de lucro;
cantidad de muertes en accidentes de tránsito en el mundo; etc.

• Datos cuantitativos continuos: son datos que, ante una pregunta, dan
una respuesta numérica que surge de un proceso de medición.

Ej.: peso y estatura de las personas lesionadas en determinado accidente de


trabajo; tiempo, gastos anuales de una entidad dedicada a la seguridad, etc.

5. Niveles de medición

Este tipo de clasificación trata de mostrar las distintas maneras de medir o


cuantificar las variables. La cuantificación permitirá sintetizar la información
y aplicar diversas técnicas estadísticas, con lo que se logrará un mayor
aprovechamiento de la información. Existen cuatro escalas básicas: la nominal,
la ordinal, la de intervalo y la de ratios o razón.

Escala nominal: es la que identifica distintas categorías de respuestas, sin que


exista un orden particular para las diferentes categorías, y en donde éstas son
mutuamente excluyentes.

Ejemplos de variables medidas en escala nominal son: sexo de los accidentados


en un choque de dos vehículos; lugar de procedencia de los estudiantes de la
Licenciatura Gestión de la Seguridad Ciudadana, etc.

Escala ordinal: en esta las diferentes categorías tienen un orden, en el cual


unas son mayores que otras y en donde los números que se asignan a las
distintas alternativas de respuesta implican un rango de orden. Las categorías
son mutuamente excluyentes y exhaustivas.

Ejemplos de variables medidas en escala ordinal son: calificación para un puesto de


trabajo; nivel socioeconómico de las personas que habitan una determinada zona;
nivel educativo de los colaboradores en las villas de emergencia de la ciudad, etc.

EDUBP | LICENCIATURA EN GESTION DE LA SEGURIDAD | estadística - pag.14


Escala de intervalo: tiene las mismas características que la ordinal, pero la
distancia entre valores es constante.

Ejemplo de variables medidas en escala de intervalo: las escalas de temperatura


centígrada y la Fahrenheit; ambas difieren en sus respectivos puntos cero como en
sus unidades de medida, pero ambas contienen el mismo tipo de información.
Escala de ratios o razón: en este tipo de escala el punto de partida no es
arbitrario ni tampoco ambiguo; el cociente de dos números es relevante. Por
ejemplo, cuando decimos tener “cero peso”, decimos en definitiva que la
ausencia de dinero es absoluta.

Ejemplos de variables medidas en escala de razón son: el ingreso familiar, la


edad de los alumnos de las carreras a distancia de la UBP, los gastos mensuales
en determinada campaña publicitaria, etc.

A continuación se presentan otros ejemplos de variables clasificadas según las


escalas de medición.

ESCALA EJEMPLO
Nominal Religiones
Tipo de emprendimiento
Sexo
Ordinal Ocupaciones
Clases sociales
Preferencias
Intervalos Opiniones
Números índices
Distancia
Razón Costo

Cabe aclarar que acabamos de presentar dos maneras de clasificar las variables,
por su naturaleza y por su medición. Es importante destacar que ambas
clasificaciones no se contraponen, ya que si usted presta atención, las variables
cualitativas (por naturaleza) se corresponden con las variables de escala nominal
u ordinal (según la medición), en tanto que las variables cuantitativas (según la
naturaleza) se corresponden con las variables en la escala de intervalo o de
razón (según la medición).

6. Fuentes de datos

6.1. Datos secundarios


Los datos secundarios contemplan información que, si bien podría llegar a ser
pertinente para la investigación, no fue recolectada para ese fin específico. Es
probable que alguien haya investigado con anterioridad el problema que se
desea investigar ahora, o bien se abordó alguna problemática similar; para
evitar “inventar lo inventado”, es importante conocer la información disponible
de fuentes secundarias. Los datos secundarios pueden clasificarse en internos
y en externos.

Datos secundarios internos: son aquellos que surgen de la propia empresa


u organización. Una fuente de datos secundarios de conocimiento popular y
de uso frecuente es la factura. De ella usualmente puede extraerse la siguiente
información:

EDUBP | LICENCIATURA EN GESTION DE LA SEGURIDAD | estadística - pag. 15


Nombre y domicilio del productor
Productos o servicios vendidos
Precio unitario y total de la operación
Condiciones de la venta
Bonificaciones realizadas
Vendedor que realizó la operación.

Muchas empresas u organizaciones poseen fuentes más sofisticadas. Ellas


desarrollan su propia base de datos que contiene información valiosa; en el
caso de una empresa de seguridad se podrá tener información sobre cantidad
de asegurados por zona, tipo de delito o siniestro más denunciado, cantidad
promedio de horas/hombre destinadas a los barrios privados, etc.
Los datos secundarios internos generalmente son los más accesibles y los
menos costosos al afrontar una investigación. El principal inconveniente que
suele presentarse cuando se resuelve utilizar este tipo de datos es que no suelen
estar disponibles cuando se los necesita, o bien en caso de estar disponibles se
han registrado de manera incorrecta o poco confiable, o de manera incompleta.

Datos secundarios externos: son aquellos obtenidos de fuentes ajenas a


la propia organización. Podrán surgir, por ejemplo, de las publicaciones que
realiza periódicamente el gobierno (nacional, provincial o municipal) y que pone
a disposición de los usuarios generalmente sin cargo alguno, o bien podrá
surgir de organizaciones comerciales e industriales que venden sus servicios a
los usuarios. Si bien los datos externos son abundantes, la principal dificultad
que se presenta cuando se pretende trabajar con ellos es lograr identificarlos
y poder acceder a ellos. La creciente demanda de información ha generado
una gran cantidad de empresas que recolectan y venden datos especializados,
diseñados para satisfacer las necesidades de información que comparten varias
organizaciones.
A continuación, y solo a manera de ejemplo, se mencionan dos páginas web, una
de ellas correspondiente al INDEC (Instituto Nacional de Estadísticas y Censos
www.indec.mecon.ar), y la otra perteneciente a la Asociación Civil Luchemos por
la Vida (www.luchemos.org.ar ).

Cabe señalar, que el Instituto Nacional de Estadística y Censos –INDEC– es


el organismo público, de carácter técnico, que unifica la orientación y ejerce
la dirección superior de todas las actividades estadísticas oficiales que se
realizan en el territorio de la República Argentina. Tiene la responsabilidad
directa en el diseño metodológico, organización y dirección de los operativos
nacionales de relevamiento, y se ocupa de la realización de censos y encuestas,
de la elaboración de indicadores básicos de orden social y económico y de la
producción de otras estadísticas básicas.

EDUBP | LICENCIATURA EN GESTION DE LA SEGURIDAD | estadística - pag.16


m1 material

Material de consulta obligatoria

• TRIOLA, Mario F.: Estadística Elemental. México. Editorial Pearson Educación.


2000, séptima edición.

• ANDERSON, David; SWEENEY, Dennis y WILLIAMS, Thomas: Estadística


para Administración y Economía. México. Internacional Thompson. 1999,

Material de consulta complementaria

• HANKE y REITSCH: Estadística para Negocios. España. Editorial Irwin.


1995.

• BERENSON, LEVINE y KREHBIEL: Estadística para administración. México.


Editorial Prentice Hall. 2001.

m1 actividades

m1 | actividad 1

“La búsqueda ha comenzado…”

En un fin de semana como en tantos otros de estos últimos meses, usted se


encuentra en su casa leyendo la sección Clasificados de uno de los periódicos
de mayor difusión. Usted sabe muy bien que no será tarea sencilla dar justo con
el empleo que desea encontrar.

Los avisos que solicitan personal capacitado son variados: se buscan operadores
de PC, asistentes para el área de recursos humanos, colaboradores en el
área de marketing, asistentes con conocimientos de finanzas, de sistemas de
computación, etc., etc., etc. Hoy, usted está decidido a enviar su currículum.
Se encuentra ansioso por comenzar a poner en práctica todo lo que día a día
está aprendiendo en el cursado de la Licenciatura en Gestión de la Seguridad
Ciudadana, en la Universidad Blas Pascal.

Tiene los temores lógicos de cualquier estudiante que decide comenzar a indagar
en el mundo del conocimiento. Pero no se preocupa por ello, dado que sabe
que es absolutamente normal que así sea.

Los días siguen su curso y no tiene novedades laborales…

Una tarde, mientras estaba reunido con un grupo de compañeros de estudio,


suena el teléfono... las palabras del otro lado de la línea suenan inesperadas: le
comunican desde la consultora Pérez y Asociados que han recibido su currículum
y que están sumamente interesados en concertar una entrevista con usted.

EDUBP | LICENCIATURA EN GESTION DE LA SEGURIDAD | estadística - pag. 17


Días después, la entrevista se desarrolla con normalidad, y luego de varias citas
le informan que usted ha sido la persona seleccionada para cubrir un nuevo
cargo dentro de la organización. Se trata de una consultora conformada por
profesionales de distintas áreas: comunicadores sociales, administradores,
abogados, contadores, economistas entre otros, que posee un departamento
de estadística y que se dedica a asesorar en distintos temas que demandan sus
clientes. Usted se encuentra más que feliz; seguramente podrá poner en práctica
lo que aprendió en esta materia.

Ya hace unos días que usted se encuentra en plena actividad. Pero por primera
vez, uno de los profesionales de su área lo convoca y le dice:

“Uno de los noticieros locales la semana pasada presentó los


resultados de una encuesta a los cordobeses. Se les pregunto
qué opinaban acerca de las nuevas medidas de seguridad vial
que piensa poner en marcha el gobierno provincial, luego de
la asunción del nuevo jefe de la policía. La encuesta arrojó que
el 68% de cordobeses considera que las nuevas medidas no
disminuirán los accidentes de tránsito. La encuesta se realizó
a una muestra de 250 personas de la capital cordobesa. El
departamento de Comunicación requiere de tu colaboración
para armar un informe sobre el tema. Según tus conocimientos
estadísticos, ¿podemos valernos de esta encuesta para inferir
respecto de lo que opina la población sobre el tema?”

Está frente a su primera tarea. ¡Suerte!

Luego de sobreponerse a la primera sensación de no saber por dónde


comenzar, recuerda que en el primer módulo de Estadística está
viendo conceptos relacionados con la tarea que se le encomendó.

¡Su tarea ha comenzado! Manos a la obra.

A 1
C 1

m1 | actividad 1 | AA

asistente académico 1

En la presente actividad se presenta el resultado de una encuesta.

Resultaría sumamente interesante que usted se pregunte si es correcto gene-


ralizar el resultado a la población. Para ello, es preciso interrogarse sobre los
siguientes puntos:

- ¿Es adecuado el método de recolección de datos elegido?


- ¿La investigación se basó en una muestra representativa?
- ¿Cuál fue la fuente de datos?

Le sugerimos que previamente defina, en esta situación real, cuál es la población


objeto de estudio, la muestra, la unidad estadística, la o las variables en estudio
y clasifíquela.

EDUBP | LICENCIATURA EN GESTION DE LA SEGURIDAD | estadística - pag.18


Seguramente (... y como usted mismo lo podrá corroborar en próximas activida-
des) del análisis correcto de los datos dependerá el éxito de seleccionar herra-
mientas y técnicas adecuadas. Sería conveniente entonces:

 Profundizar la lectura recurriendo a la bibliografía básica.

 Identificar en esta situación concreta los conceptos trabajados en este módulo


(población, muestra, variables, etc.).

m1 | actividad 1 | CC

clave de corrección 1

En la información que suministra el noticiero:

- no se realiza la delimitación en tiempo y en espacio de la población objeto de


estudio;
- no se aclara qué tipo de muestreo se aplica;
- no se conoce el tamaño de la población;
- si la opinión que se busca es la de los habitantes de toda la provincia, los
seleccionados fueron solamente de la ciudad capital;
- por lo anterior, no se está en condiciones se decir si se trata de una muestra
representativa.

Suponiendo entonces que el estudio trata de concluir acerca de la opinión de


toda la población de la provincia de Córdoba, la delimitación de la población y
muestra podría ser la siguiente:

Población: Todos los habitantes de ambos sexos, mayores de 18 años que


habitan la provincia de Córdoba, en el año en curso.
Unidad estadística: Cada uno de los habitantes de ambos sexos, mayores de 18
años de la provincia de Córdoba en el año en curso.
Muestra: 250 personas de Córdoba, seleccionadas por muestreo probabilístico,
segmentada la misma por sexo y por ciudad o región, en el mes de febrero del
corriente año.
Variable: Una característica de interés de los elementos.
Opinión sobre las medidas de seguridad: variable cualitativa, nivel de medición:
escala nominal.

m1 | actividad 2

“Antes de la recolección de datos…”

Tal como usted recordará, en la actividad 1 su “primera tarea” le permitió elaborar


algunas conclusiones a las que se arribó respecto de los datos publicados
sobre una encuesta realizada por un noticiero local. En una conversación con los
profesionales del Área Estadística donde está trabajando, surgió la necesidad de
implementar, desde la consultora, una encuesta respecto de la seguridad vial,
a los efectos de sondear la opinión solamente de los habitantes de la ciudad
capital.

EDUBP | LICENCIATURA EN GESTION DE LA SEGURIDAD | estadística - pag. 19


El superior del área le dice:

“Hemos decidido trabajar con una muestra de 385 personas


seleccionadas aleatoriamente entre la semana del 16 al 20 de
abril del presente año en la ciudad de Córdoba. La encuesta
se piensa aplicar de manera telefónica a fin de contar con la
información de una manera rápida. Pensamos que algunas de
las preguntas que debería contener el instrumento a utilizar
serían, entre otras, las siguientes, y a usted le corresponde
analizar la pertinencia y el modo en que están formuladas”:

1.- Sexo: [ ] 1 Masculino [ ] 2 Femenino

2.- Edad: .....................

3.- ¿Maneja Ud. algún tipo de vehículo?

[ ] 1 Sí ¿Cuál?:…………………….
[ ] 2 No

4.- ¿Ha sido Ud. víctima de algún accidente de tránsito?

[ ] 1 Sí

[ ] 2 No

[ ] 3 No contesta

5.- ¿Qué rol tuvo en el accidente de tránsito?

[ ] 1 Peatón

[ ] 2 Conductor de auto

[ ] 3 Acompañante en un vehículo

[ ] 4 Conductor de motocicleta/bicicleta

[ ] 5 Acompañante en motocicleta/bicicleta

[ ] 6 Otro ¿Cuál?...........................................................

6.- ¿Tiene Ud. parientes, amigos, conocidos, etc. que murieron en algún accidente
de tránsito?

[ ] 1 Sí

[ ] 2 No

[ ] 3 Ns/Nc

EDUBP | LICENCIATURA EN GESTION DE LA SEGURIDAD | estadística - pag.20


7.- ¿Está de acuerdo con el nuevo plan de seguridad vial que se quiere
implementar?

[ ] 1 Muy de acuerdo

[ ] 2 Algo de acuerdo

[ ] 3 Ni de acuerdo ni en desacuerdo

[ ] 4 Algo en desacuerdo

[ ] 5 Muy en desacuerdo

8.- ¿Considera que estas medidas contribuirán a disminuir los accidentes de


tránsito?

[ ] 1 Sí

[ ] 2 No ¿Por qué?................................................................................................
................

[ ] 3 Ns/Nc ¿Por qué?............................................................................................

A 1
C 1

m1 | actividad 2 | AA

asistente académico 1

Las pautas para realizar el abordaje del caso son similares a las realizadas en el
asistente académico 1 de la actividad 1.

Creemos conveniente que usted tenga presente que cada pregunta genera una
característica a analizar, y que a su vez cada una de ellas conducirá a que se
realice el análisis de datos correspondiente.

m1 | actividad 2 | CC

clave de corrección 1

Población: todas las personas que viven en la ciudad de Córdoba, Argentina,


entre el 16 y el 20 de abril del corriente año.

Muestra: 385 personas (recuerde que surgirán de la población que se ha definido


anteriormente).

Variables objeto de estudio y clasificación:


Cada pregunta de la encuesta genera una variable.

EDUBP | LICENCIATURA EN GESTION DE LA SEGURIDAD | estadística - pag. 21


1.- Sexo: cualitativa, escala de medición: nominal.
2.- Edad: cuantitativa continua, escala de medición: razón.
3.- Maneja algún tipo de vehículo: cualitativa, escala de medición: nominal.
4.- Ha sido víctima de algún accidente de tránsito: cualitativa, escala de medición:
nominal.
5.- Rol en al accidente de tránsito: cualitativa, escala de medición: nominal.
6.-Tiene parientes, amigos,…que murieron en accidentes de tránsito: cualitativa,
escala de medición: nominal.
7.- Acuerdo con el plan de seguridad vial: cualitativa, escala de medición:
ordinal.
8.- Considera que las medidas…: cualitativa, escala de medición: nominal.

m1 | actividad 3

“La consulta de una amiga…”

Ayer por la tarde, usted decide encontrarse con otros compañeros de la carrera
con quienes se había estado contactando vía correo electrónico, para discutir
respecto de los temas vistos en el módulo e intercambiar opiniones sobre la
resolución de una de las actividades de las materias. Eugenia, una compañera
que en la actualidad se encuentra haciendo una pasantía en una empresa
dedicada a la fabricación de aparatos DVD, les comenta lo siguiente:

“Los otros días escuché decir a mi jefe que el dueño de la fábrica


había recibido quejas por parte de tres clientes importantes, en
cuanto a que la vida útil de los reproductores de DVD que la firma
les había vendido era inferior al tiempo que el fabricante dice. El
dueño está muy preocupado al respecto, porque tiene en vista una
operación de envergadura con un cliente del exterior y ello le permitiría
dejar conforme al cliente y posicionarse en un nuevo mercado. En
consecuencia, su jefe está dispuesto a investigar sobre la vida útil
de los aparatos. Como la fábrica cuenta con un departamento de
control de calidad, le encargó a este la investigación. Consultado
por el dueño, el encargado del departamento le sugirió que se tome
una muestra representativa de los aparatos que se fabricaron en el
último mes y se analice la duración de los mismos, para lo cual es
necesario someter la muestra a un uso intensivo, a fin de evaluar la
vida útil promedio en horas”.

Eugenia agrega: “A mí me pareció correcta la propuesta del encargado del


departamento de control de calidad, en especial retomando lo que estamos
viendo en Estadística en la UBP respecto a población y muestra...; pero mi jefe
dice: ‘No me parece correcto que sólo se pruebe una muestra de aparatos del
último mes de producción; se deberían probar todos los aparatos fabricados en
el último mes’”.

Su compañera le pregunta: “¿A vos qué te parece? ¿Qué opinás?”.

Una vez planteada esta situación:


¿Qué opinión le merece cada una de estas alternativas? ¿Usted considera que
es correcto lo propuesto por el jefe de su compañera?

EDUBP | LICENCIATURA EN GESTION DE LA SEGURIDAD | estadística - pag.22


Tras el estudio de los contenidos propuestos para el presente módulo, usted
se encuentra en condiciones de fundamentar su respuesta en función de la
propuesta del encargado del departamento de control de calidad de la firma, y la
del jefe de su compañera A 1.

¿Qué le contesta a su compañera?

C 1

m1 | actividad 3 | AA

asistente académico 1

En esta actividad es preciso que usted elabore una opinión fundada, dando
respuesta a la inquietud de su compañera. Para ello se torna fundamental tener
muy claros los conceptos de población y muestra que se abordaron en este
módulo. Analice si en esta situación es correcto o no trabajar con una población,
y piense cuál sería una muestra adecuada para que la misma sea representativa
de la población en estudio.

m1 | actividad 3 | CC

clave de corrección 1

En esta situación el jefe de su compañera no emite una opinión correcta, no


sólo desde el punto de vista estadístico pues también resultaría antieconómico
para la empresa poner a prueba toda una producción de artículos, ya que en
procesos productivos probar toda una producción lleva a agotarla.

El departamento de Control de Calidad de la firma sugiere tomar una muestra


de aparatos, y a estos ponerlos a funcionar para estudiar su tiempo de duración.
Esta decisión es correcta, lo que sí hay que tener presente es que la muestra que
se elija sea representativa de la población, es decir, de la producción de aparatos
del último mes, para que los resultados a los que se arribe sean confiables y
útiles. Se deberá atender, por ejemplo, si existe más de un turno de producción,
ya que de tomarse una muestra ésta debería incluir unidades de los distintos
turnos de trabajo, ya que la falla en los aparatos podría encontrarse relacionada
con un turno en especial.

m1 glosario

Conjunto de datos: Todos los datos recopilados en determinado estudio.

Datos: Información recopilada para cada variable o característica en estudio.

Datos cualitativos: Datos que surgen de variables cualitativas y asumen etiquetas


o nombres de determinada característica.

Datos cuantitativos: Datos que surgen de variables cuantitativas e indican


cuánto o cuántos de algo. Los datos cuantitativos siempre son numéricos.

Datos de una serie de tiempo: Datos reunidos en diversos periodos sucesivos.

EDUBP | LICENCIATURA EN GESTION DE LA SEGURIDAD | estadística - pag. 23


Datos transversales: Datos reunidos en el mismo, o aproximadamente el mismo,
punto o momento de tiempo.

Elementos: Las entidades o unidades acerca de las que se reúnen datos.

Estadística: Arte y ciencia de reunir, analizar, presentar e interpretar datos.

Estadística descriptiva: Métodos tabulares, gráficos y numéricos para resumir


y describir conjuntos de datos.

Inferencia estadística: El proceso de reunir datos obtenidos de una muestra


para hacer estimaciones o probar hipótesis acerca de las características de una
población.

Muestra: Un subconjunto de la población.

Observación: Medición/es obtenida/s de un solo elemento.

Población: El conjunto de todos los elementos de interés en determinado


estudio.

Variable: Una característica de interés de los elementos.

Variable cualitativa: Una variable que asume categorías.

Variable cuantitativa: Una variable con valores cuantitativos.

EDUBP | LICENCIATURA EN GESTION DE LA SEGURIDAD | estadística - pag.24


m2

m2 microobjetivos

• Construir tablas de frecuencias y de gráficos estadísticos, con el objeto de


organizar y presentar adecuadamente los datos recopilados en el ámbito de
la seguridad ciudadana.

• Conocer las herramientas fundamentales para la organización y la


presentación de los datos, con el fin de cumplimentar prolijamente las tareas
correspondientes a su desempeño profesional, ya sea para elevar informes
a sus superiores o bien para aplicar a un trabajo de investigación.

• Interpretar adecuadamente los datos presentados a través de tablas y gráficos


en los medios de comunicación y en trabajos de campo realizados en el
ámbito de la seguridad ciudadana, a los fines de poder extraer conclusiones
válidas y útiles en función de la información recabada.

m2 contenidos

1. Presentación de datos recopilados

Es posible presentar los datos recopilados de distintas maneras:

a) Forma literal
b) Tablas estadísticas
c) Gráficos estadísticos
d) Medidas resumen

a. Presentación literal

Esta forma de presentar la información recopilada se utiliza cuando hay sólo


pocos datos.

De todas las formas de presentación de datos esta es la menos usada, por lo que
se prefiere dejarla para la instancia de las conclusiones en una investigación o
estudio en particular.

b. Tablas estadísticas

Esta es una de las formas más utilizadas para la presentación de datos.

Las tablas constituyen arreglos de los datos, en filas y columnas. Las clasificaciones
que se incluyan en una tabla deberán ser arregladas de una manera ordenada,
a fin de poder reemplazarlas por el usuario de la información y poder hacer
análisis y comparaciones. Por lo tanto, para el armado de una tabla, previamente
se debería adoptar un criterio de clasificación de los datos. Estos criterios
pueden ser sobre cualquiera de las siguientes bases: cronológica; geográfica;
cualitativa o cuantitativa.

EDUBP | LICENCIATURA EN GESTION DE LA SEGURIDAD | estadística - pag. 25


Stephen P. Shao, en Estadística para economistas y administradores de empresas
(1979), explica los criterios de clasificación de la siguiente manera:

- Cronológica: Se trata de arreglos en orden cronológico, ya sea comenzando


por el período más antiguo (lo usual) o por el período más reciente; este último
orden es preferido cuando desea ponerse el énfasis en los hechos más
cercanos.
- Geográfica: Las clasificaciones de este tipo pueden ser arregladas en orden
alfabético o según la importancia de ciertas áreas.
- Cuantitativa: Generalmente, los arreglos para este caso se hacen en orden
ascendente (de menor a mayor) aunque también pueden hacerse a la inversa,
dependiendo de la información que se quiera resaltar.
- Cualitativa: Este tipo de clasificación generalmente es arreglada teniendo en
cuenta el orden de importancia, aunque el orden alfabético es preferido por
ser de fácil referencia. También hay que aclarar que a veces el orden suele ser
establecido por tradición o costumbre.

En general, las tablas se pueden clasificar, según su finalidad, en tablas de uso


general y tablas de uso específico.

 Tablas de uso general: son aquellas que suelen ser consultadas por
varios usuarios, tales como las publicadas por las distintas instituciones u
organismos (por ejemplo: las tablas de índices de precios que publica el
INDEC; tablas con la talla y el peso de varones y mujeres que son usadas
en medicina o en deporte; etc.).

 Tablas de uso específico: son aquellas que se confeccionan al realizar un


trabajo de investigación. Se trata de las tablas de referencia de aquello
realizado en el estudio, y sólo son útiles para este.

c. Gráficos estadísticos

Constituyen una expresión visual de la información. Los gráficos son fácilmente


captados y entendidos por los usuarios. Los dibujos suelen ser más efectivos
para presentar grandes conjuntos de datos.

Los diagramas más sencillos en cuanto a su construcción están diseñados para


variables medidas en escala nominal u ordinal, ya que las clases son obvias y
resulta más fácil presentarlas en un gráfico.

A menudo oímos la expresión “una imagen vale más que mil palabras”; ésta tiene
total cabida en lo que a gráficos estadísticos respecta. No obstante, hay que
tener en cuenta que un gráfico ofrece al lector sólo una idea aproximada de la
información, es por ello que debemos ser conscientes de que los valores exactos
se encuentran en las cantidades tabuladas y en la base de datos, fuente original
de toda gráfica.

Por lo general, cuando se presentan los resultados de una determinada


investigación o estudio se suelen utilizar tablas y gráficos en forma conjunta.

2. Distribuciones unidimensionales

En Estadística es muy importante el concepto de distribución. Se entiende por


distribución a un conjunto, arreglo o grupo de valores numéricos.

EDUBP | LICENCIATURA EN GESTION DE LA SEGURIDAD | estadística - pag.26


Cuando se analizan una o más variables sobre un conjunto de unidades
elementales (ya sea que se trate de una población o de una muestra), se obtiene lo
que se conoce como distribución. Según sea la cantidad de características que se
analicen, serán distribuciones unidimensionales (una variable), bidimensionales
(dos variables) o multidimensionales (más de dos variables).

Por lo tanto, las distribuciones unidimensionales, que presentaremos ahora son


aquellas que se ocupan de analizar una variable por vez.

Pueden ser trabajadas de las siguientes maneras:

2.1. Serie simple

Es el conjunto de datos o valores de la variable indicados en el orden en que se


presentan, sin ningún tipo de arreglo adicional.

Veamos un ejemplo:

Variable: cantidad de alumnos que cursan en 5 tecnicaturas que brinda la UBP


en la modalidad a distancia.

Valores de la variable:

10 alumnos, 5 alumnos, 32 alumnos, 27 alumnos, 15 alumnos.

2.2. Distribución de frecuencias

Es una agrupación de datos, presentados de manera ordenada y clasificados


cuantitativamente. El ordenamiento constituye un arreglo en donde los valores
de la variable que se repiten se especifican conformando la distribución de
frecuencia.

La tabla que resume la distribución de frecuencias muestra cada valor diferente


que presenta la variable y la respectiva frecuencia que le corresponde a cada
valor.

Cuando trabajamos con distribuciones de frecuencias utilizamos algunos


conceptos, tales como:

- Valores de la variable: a diferencia de la serie simple, en las distribuciones de


frecuencias se escriben sólo los valores diferentes de la variable.

- Frecuencia: es el número de veces que se repite un determinado valor de la


variable.

2.3. Tipos de frecuencias

Frecuencia absoluta simple: es la cantidad de veces que se repite cada valor


de la variable y que simbolizamos como fi. La sumatoria de todas las frecuencias
absolutas simples es igual al tamaño de la muestra: ∑ fi = n

Frecuencia relativa simple: es la proporción que, en el total de las observaciones,


tiene cada frecuencia absoluta simple, y la simbolizamos como hi. Esta se
calcula: hi = fi / n

Es muy común expresar esta frecuencia en porcentaje.

EDUBP | LICENCIATURA EN GESTION DE LA SEGURIDAD | estadística - pag. 27


La sumatoria de todas las frecuencias relativas simples es igual a uno (1): ∑ hi = 1

Frecuencia absoluta acumulada: surge de ir sumando las frecuencias absolutas


simples.

Simbólicamente: Fj = f1 + f2 +... + fj

Frecuencia relativa acumulada: se obtiene al ir sumando las frecuencias


relativas simples.

Simbólicamente: Hj = h1 + h2 +...+ hj

Veamos a continuación un ejemplo de una tabla de distribución de frecuencias.

Los siguientes datos representan el número de alumnos que asistieron a 20


exámenes itinerantes de la UBP.

3; 5; 5; 3; 3; 5; 8; 7; 5; 3; 5; 6; 6; 6; 7; 8; 7; 8; 6; 6

A partir de estos datos, presentados a modo de serie simple, obtendremos la


distribución de frecuencias.

Valores de Frec. absol. Frec. relat. Frec. absol. Frec. relat.


la variable simple simple acumul. acumul.
yi Fi hi Fi Hi
3 4 0.20 4 0.20
5 5 0.25 9 0.45
6 5 0.25 14 0.70
7 3 0.15 17 0.85
8 3 0.15 20 1
20 1

2.4. Pasos sugeridos para la construcción de la tabla de frecuencias con


intervalos

• Seleccionar el número apropiado de clases de intervalos para cada tabla.

• Obtener la amplitud apropiada para cada clase o intervalo. Para ello es


preciso:

- Definir el rango o recorrido de la variable, al que simbolizamos como R.

Es importante que usted recuerde aquí que el recorrido o rango surge de la


diferencia entre el valor máximo que asume la variable y el valor mínimo de
ésta.

- Simbolizar la amplitud del intervalo con la letra C, que es igual a:

si C es un decimal se redondea en el entero superior más próximo. Este nuevo


valor que surgirá será simbolizado con la letra C’.

Al obtener un nuevo valor para la amplitud, se producirá un cambio en R; ese


nuevo recorrido se lo obtiene como R’ = C’. Nº de intervalos.

EDUBP | LICENCIATURA EN GESTION DE LA SEGURIDAD | estadística - pag.28


La diferencia que existe entre R’ y R será distribuida arbitrariamente entre el valor
máximo y el valor mínimo de la variable, ampliando de esta manera el recorrido
(nunca disminuyéndolo).

• Establecer los límites de las fronteras que dividen a cada una de las clases,
logrando de esta manera evitar superposiciones en la asignación de los valores
a cada intervalo.

Los límites pueden ser los siguientes:

[ ) significa cerrado por la izquierda y abierto por la derecha.


[ ] significa cerrado por la izquierda y cerrado por la derecha.

Los primeros límites son los más adecuados cuando se arman tablas por
intervalos con variables cuantitativas continuas.

Cuando se construye una tabla, es importante dejar indicado qué criterio se


utilizó para definir los límites de los intervalos.

Otros aspectos que son de importancia y que se deben tener en cuenta al


momento de la construcción de una tabla son:

 Simplificar la presentación de una tabla.


 Tratar un tema por tabla.
 Hacer un arreglo ordenado de las clasificaciones.
 Las clasificaciones cruzadas o de doble entrada deben posibilitar
un uso efectivo.
 Las comparaciones deben poder realizarse fácilmente.
 Enfatizar los valores o cifras que sean más importantes.
 Redondear detalles que no sean necesarios.
 Mejorar la apariencia general de la tabla.

A continuación se presenta un ejemplo de tabla de distribución de frecuencias


por intervalos.
La variable que se presenta en la tabla son los ingresos semanales de 50
empresas de seguridad privada en todo el territorio nacional.

Intervalos Punto medio Frec. Frec. Frec. Frec.


o marca de absol. abs. relat. relat.
clase simple acum. simple acum.
250 – 750 500 14 14 0,28 0,28
750 – 1250 1000 9 23 0,18 0,46
1250 – 1750 1500 5 28 0,10 0,56
1750 – 2250 2000 6 34 0,12 0,68
2250 – 2750 2500 7 41 0,14 0,82
2750 – 3250 3000 6 47 0,12 0,94
3250 - 3750 3500 3 50 0,06 1
50 1

EDUBP | LICENCIATURA EN GESTION DE LA SEGURIDAD | estadística - pag. 29


3. Gráficos estadísticos

A continuación se presenta un esquema que permite identificar el gráfico


adecuado según el tipo de variable que se presenta de manera gráfica.

EDUBP | LICENCIATURA EN GESTION DE LA SEGURIDAD | estadística - pag.30


3.1. Gráfico de torta

Este tipo de gráfico es empleado cuando se enfatizan los tamaños relativos de


los componentes de los datos. El círculo completo de 360º representa la totalidad
de las observaciones. El tamaño de cada parte de la torta es proporcional a la
frecuencia relativa de cada categoría.

Generalmente, se utiliza para representar datos de tipo cualitativo de escala


nominal.

El siguiente gráfico de torta se confeccionó a partir de la información publicada


en un artículo de la Revista “Crash test”, Nº 84 de marzo/07.

Gráfico 1 (para insertar en contenidos del módulo 2)

Proporción de usuarios por medio de traslado

en auto
20%

caminando
50%
en transporte
escolar
30%

Fuente: Publicaciòn de la Revista Crash test. Nº84. Marzo 200. pág.4

caminando 50%
en transporte escolar 30%
en auto 20%

Gráfico 2 (para insertar en contenidos del módulo 2)

¿Cómo se conducen sus hijos al colegio?

en auto 20%
medio utilizado

en transporte
30%
escolar
EDUBP | LICENCIATURA EN GESTION DE LA SEGURIDAD | estadística - pag. 31

caminando 50%
caminando
50%
en transporte
escolar
30%

3.2. Gráfico de barras


Fuente: Publicaciòn de la Revista Crash test. Nº84. Marzo 200. pág.4

Este tipo de gráfico se utiliza para datos cualitativos nominales u ordinales, en


donde secaminando
emplea una barra para representar
50% la frecuencia de cada categoría.
en transporte escolar 30%
Seguidamente
en autose muestran dos gráficos
20%de barras: uno de barras simples (con
la misma información que se presentó en el gráfico de torta) y otro de barras
múltiples.

Gráfico 2 (para insertar en contenidos del módulo 2)

¿Cómo se conducen sus hijos al colegio?

en auto 20%
medio utilizado

en transporte
30%
escolar

caminando 50%

0% 10% 20% 30% 40% 50% 60%


% de encuestados
Fuente: Publicaciòn de la Revista Crash test. Nº84. Marzo 200. pág.4

Masculino Femenino
Institución privada 65% 45%
Institución pública 35% 55%

Gráfico 3 (para insertar en contenidos del módulo 2)

Proporción de asistentes a una capacitación en


seguridad vial según la organización patrocinante y el
sexo

70%
60%
% de personas

50% 65%
40%
45% 55%
30%
20% 35%

10%
0%
Institución privada Institución pública Masculino
Organización patrocinante Femenino

EDUBP | LICENCIATURA EN GESTION DE LA SEGURIDAD | estadística - pag.32


3.3. Gráfico de bastones

Este gráfico es utilizado en el caso de estar trabajando con variables cuantitativas


discretas.

En la abscisa se representa la variable bajo estudio y en la ordenada las frecuencias


absolutas simples, o bien las frecuencias relativas simples. La altura de cada
bastón indica la cantidad de veces que se repite cada valor de la variable.
Gráfico 4 (para insertar en contenidos del módulo 2)

Cantidad de carnet de conducuir emitidos por un


grupo de municipios de todo el territorio provincial
durante el último año
8
7
Cant. de municipios

6
5
4
3
2
1
0
0 100 200 300 400 500 600 700 800 900

Cantidad de carnet

3.4. Histograma

El histograma se utiliza para datos con escala de intervalos o de razón. Las


clases se dibujarán a lo largo de la abscisa y la altura de cada rectángulo estará
dada por las frecuencias absolutas simples o relativas simples. Este gráfico debe
entenderse como de superficie, por lo que no debe existir distancia entre las
barras adyacentes.

A modo de ejemplo se muestra este diagrama a partir de información ficticia de


los salarios de una determinada empresa.

Gráfico 5 (para
Gráfico
insertar
5 (paraeninsertar
contenidos
en contenidos
del módulodel
2)módulo 2)

Distribución
Distribución
de los empleados
de los empleados
de la empresa
de la XX
empresa
segúnXX según
el salario el salario 0 0 0 0
40 40
35 35
0 - 200
0 - 200 100 100 0 0
cant. de empleados

cant. de empleados

30 30
200 - 400
200 - 400 300 300 5 5
25 25 400 - 600
400 - 600 500 500 10 10
20 20 600 - 800
600 - 800 700 700 18 18
15 15 800 - 1000
800 - 1000 900 900 37 37
10 10 1000 - 1200
1000 - 12001100 1100 30 30
5 5 1200 - 1400
1200 - 14001300 1300 0 0
0 0 1500 1500 0 0
100 300
100 500
300 700
500 900
700 1100
900 1300
1100 1300
Salarios Salarios

Gráfico 6 (para
Gráfico
insertar
6 (paraeninsertar
contenidos
en contenidos
del módulodel
2)módulo 2)EDUBP | LICENCIATURA EN GESTION DE LA SEGURIDAD | estadística - pag. 33

Distribución
Distribución
de los empleados
de los empleados
de la empresa
de la XX
empresa
segúnXX según
los salarios
los salarios
cant. d 15 el salario 37 0 800 - 1000 900
40 30 1000 - 1200 1100
10 100 0 - 200
35 1200 - 1400
0 300 2001300

cant. de empleados
5 - 400
30
0
25
0 500 4001500
- 600
100 300 500 700 900 1100 1300
20 Salarios 600 - 800 700
15 800 - 1000 900
10 1000 - 1200 1100
5 1200 - 1400 1300
6 (para insertar en contenidos del módulo 2) 1500
0
100 300 Una
500 alternativa
700 como
900 gráfico
1100 equivalente
1300 al histograma es el polígono de
Salarios
frecuencias, que es también un gráfico de superficie que se construye
Distribución de los empleados de la empresa XX según
considerando las marcas de clase o puntos medios de los intervalos. El polígono
los salarios
40 de frecuencias que le corresponde a los datos que se graficaron con el histograma
Gráfico 6 (para insertar en contenidosanterior
del módulo
sería2)el que a continuación se muestra.
30
empleados
Cant.de

20 Distribución de los empleados de la empresa XX según


los salarios
10 40
0
0
30 200 0 0
empleados

0 100 300 500 700 900 1100 1300 1500


Cant.de

20
400 5 5
Salarios
600 15 10
10 800 33 18
1000 70 0 37
0 1200 100 200 30 0
0 100 300 500 700 900 1100 1300 1500
400 5
Salarios
600 15
800 33
1000 70
3.5. Ojiva 1200 100

El gráfico de una distribución de frecuencias acumuladas se llama ojiva y se


emplea para determinar cuántas observaciones hay mayores o menores que un
valor determinado en una distribución.

Siguiendo con el ejemplo que sirvió para presentar el histograma y el polígono


de frecuencias, ahora se muestra la ojiva.
Gráfico 7 (para insertar en contenidos del módulo 2)

Distribución acumulada los empleados de la empresa XX


según los salarios
120
100
dos del módulo 2)
cant.acum.de

80
empleados

60
umulada los empleados de la empresa XX
según los salarios 40
20 3
0 7
0 200 400 600 800 1000 1200 1400 11
Salarios 15
19
0 0 23
300 (100) - 300 100 0 0 27
700 300 - 700 500 13 13 31
1100 700 - 1100 900 11 24 35
400 600 800 1000 1200 1400
Salarios 1500 1100 - 1500 1300 7 31
1900 1500 - 1900 1700 5 36
2300 1900 - 2300 2100 2 38
2700 2300 - 2700 2500 1 39
3100 2700 - 3100 2900 1 40
3500 3100 - 3500 3300 0

EDUBP | LICENCIATURA EN GESTION DE LA SEGURIDAD | estadística - pag.34


3.6. Otros gráficos

Serie de tiempo

En un gráfico de serie de tiempo se grafican los valores de una determinada


variable a través del tiempo. El eje horizontal indica los períodos de tiempo en
tanto que el eje vertical los valores que asume la variable bajo análisis en cada
uno de los períodos.

La siguiente gráfica es una serie de tiempo; la información corresponde a la


evolución de las temperaturas máximas diarias durante el mes de enero de 2004
en Río Negro. La información fue publicada en el artículo que apareció en el
periódico “Río Negro” del 18/01/04, en el artículo titulado “Un enero abrasador,
Gráfico 8 (para insertar en contenidos delrecordado”.
que será módulo 2)

áfico 8 (para insertar en contenidos del módulo 2) 2000


Evolución de los secuestros extorsivos en todo el país 2001
2002
550 517 2000 26
2003 5
500 de los secuestros extorsivos en todo el país
Evolución 2001 22
2004 4
450 2002 28
550 517 448 2003 517
400
cantidad registrada

500 2004 448


350
450
300 448
400
cantidad registrada

250
350
200
300
150
250
100
200 26 22
50
150 28
0
100 2000 2001 2002 2003 2004
26 22
50 año
28
0
2000 2001 2002 2003 2004
año

4. Uso correcto e incorrecto de los gráficos estadísticos

Si bien los gráficos estadísticos son de gran utilidad, éstos deben emplearse
con cuidado, tratando de evitar que el lector que desconoce del tema llegue a
conclusiones erróneas.

Algunos de los métodos más comunes para confundir a los lectores inexpertos
son:

a) Modificar la escala de los ejes de la gráfica.


b) Suprimir el origen.
c) Modificar la escala de los ejes de la gráfica.

Es importante que usted advierta lo difícil que resulta establecer una regla
objetiva respecto del tamaño adecuado del diagrama de una curva.

EDUBP | LICENCIATURA EN GESTION DE LA SEGURIDAD | estadística - pag. 35


Podemos lograr impresiones raras al prolongar o al contraer demasiado cualquier
escala de una gráfica. Aumentar o disminuir la pendiente se logrará encogiendo o
alargando el eje horizontal. Otra manera de lograr este mismo efecto es ampliando
o reduciendo el eje vertical. Por lo expuesto anteriormente, es conveniente que
el lector no sea tomado desprevenido y que realice un análisis cuidadoso de las
escalas utilizadas en ambos ejes.

d) Suprimir el origen

Cuando los valores representados por un gráfico son elevados y varían poco
entre sí, se suele perder un espacio por debajo de la curva; para ello, quienes los
construyen deciden omitir el cero, proporcionando de esta forma una impresión
visual que es totalmente contraria a los hechos.

La manera de indicar el cero y evitar que la curva se desplace demasiado hacia


arriba es realizar una división en la gráfica trazando una línea entera, o bien
trazando una muesca (esta aclaración es válida para cualquiera de los dos
ejes).

m2 material

Material de consulta obligatoria

• TRIOLA, Mario F.: Estadística Elemental. México. Editorial Pearson


Educación. 2000, séptima edición.

Material de consulta complementaria

• BERENSON, LEVINE y KREHBIEL: Estadística para administración.


México. Editorial Prentice Hall. 2001.

• HANKE y REITSCH: Estadística para Negocios. España. Editorial Irwin.


1995.

• ANDERSON, David; SWEENEY, Dennis y WILLIAMS, Thomas: Estadística


para Administración y Economía. México, International Thomson. 1999.

m2 actividades

m2 | actividad 1

A graficar la información…

Desde el área de Estadística de la consultora donde usted trabaja, se propuso


llevar adelante una encuesta a efectos de sondear la opinión de los habitantes
respecto de la seguridad vial. En esa oportunidad (actividad 2 del módulo 1) le
encargaron chequear las preguntas que se realizarían en dicha encuesta. Ahora,
la consultora ya cuenta con los datos recopilados a través del instrumento y
nuevamente lo convocan a usted para llevar adelante un nuevo proyecto.

EDUBP | LICENCIATURA EN GESTION DE LA SEGURIDAD | estadística - pag.36


Confiando en sus conocimientos sobre los gráficos estadísticos, le solicitan que
recomiende qué gráficos son los adecuados para presentar la información que
surge de cada variable.

A usted le llega la siguiente consigna:

“Nos urge presentar la información que surgió de la encuesta


telefónica de una manera eficaz y sencilla, con el objeto de que
esta pueda ser comprendida fácilmente por cualquier lector.
Dejo en sus manos la tarea”.

A esta altura, a usted le resulta muy sencilla la tarea. Sabe que lo visto y aprendido
en este módulo le será de gran ayuda.

¡¡¡A graficar se ha dicho!!!

A 1
C 1

m2 | actividad 1 | AA

asistente académico 1

Creemos conveniente que tenga presente, como lo hizo en la actividad del


módulo 1, que cada pregunta genera una característica o variable a analizar,
A su vez, cada una de ellas conducirá a que se realice el análisis de datos
correspondiente. Por lo tanto, será conveniente considerar la clasificación que
hizo de cada variable para poder elegir el gráfico correcto a realizar.

m2 | actividad 1 | CC

clave de corrección 1

Los gráficos pertinentes para cada variable son los siguientes:

1.- Sexo: gráfico de torta o de barras simples.

2.- Edad: histograma o polígono de frecuencias.

3.- Maneja algún tipo de vehículo: gráfico de torta o de barras simples.

4.- Ha sido víctima de algún accidente de tránsito: gráfico de torta o de barras


simples.

5.- Rol en al accidente de tránsito: gráfico de torta o de barras simples.

6.-Tiene parientes, amigos,…que murieron en accidentes de tránsito: gráfico


de torta o de barras simples.

7.- Acuerdo con el plan de seguridad vial: gráfico de torta o de barras


simples.

8.- Considera que las medidas…: gráfico de torta o de barras simples.

EDUBP | LICENCIATURA EN GESTION DE LA SEGURIDAD | estadística - pag. 37


m2 | actividad 2

“Buscando la presentación adecuada…”

Hoy llega a su lugar de trabajo, como todas las mañanas, y encuentra sobre su
escritorio la siguiente nota de su superior:

“Aquí le dejo información de la Asociación Luchemos por la Vida que he


bajado de Internet. Me parece oportuna para aprovecharla y graficarla
adecuadamente. Luego sería interesante que hagamos una comparativa con
la información que surgió de la encuesta telefónica que se recabó desde la
consultora. A continuación te presento lo que bajé de la web; vos analizá
la mejor manera de presentar gráficamente esto. En cuanto lo tengas listo
hablame por teléfono, voy a estar durante toda la mañana en mi oficina. Sr.
Rosales”.

Estadísticas

CIFRAS SOBRE ACCIDENTES DE TRÁNSITO EN ARGENTINA


(2002)

PORCENTAJES DE VÍCTIMAS FATALES (Muertos) EN ACCIDENTES DE


TRÁNSITO

SEGÚN DÍAS FERIADOS O HÁBILES


A) Sábados, domingos y feriados 32 %
B) Días hábiles 68 %

SEGÚN FRANJAS HORARIAS


De 0 a 6 hs. 7,9 %
De 6 a 12 hs. 28,6 %
De 12 a 18 hs. 35 %
De 18 a 24 hs. 28,5 %

SEGÚN ROLES DE LAS VÍCTIMAS DE LOS ACCIDENTES


Peatones 44 %
Conductores u ocupantes automotor 27 %
Ciclistas 13 %
Moto/Ciclomotoristas 15 %
Otros 1%

SEGÚN FRANJA ETARIA DE LAS VÍCTIMAS


De 0 a 20 años 13 %
De 20 a 40 años 31 %
De 40 a 60 años 23 %
Más de 60 años 33 %

SEGÚN SEXO DE LAS VÍCTIMAS


Varones Mujeres
Muertos 73 % 27 %
Heridos graves, leves y muertos 61 % 39 %

SEGÚN OCURRA EN ZONA RURAL O URBANA


Rural Urbana
Muertos 42 % 58 %
Heridos graves, leves y muertos 15 % 85 %

© Copyright 2003. Luchemos por la Vida - Asociación Civil

EDUBP | LICENCIATURA EN GESTION DE LA SEGURIDAD | estadística - pag.38


La tarea queda en sus manos. Usted cuenta con los conocimientos para llevarla
adelante.

¡Suerte!

A 1
C 1

m2 | actividad 2 | AA

asistente académico 1

Para resolver la actividad que se presenta, le sugerimos clasificar cada una de


las variables presentadas en las tablas de frecuencias publicadas en Internet.

En el caso de que usted lo considere necesario, es interesante que lea


detenidamente los contenidos propuestos para trabajar en el módulo 2 sobre la
construcción de gráficos para los distintos tipos de variables.

m2 | actividad 2 | CC

clave de corrección 1

Los gráficos que corresponde realizar para cada variable son:

Para la tabla 1.: gráfico de torta o de barras simples.

Para la tabla 2.: histograma o polígono de frecuencias.

Para la tabla 3.: gráfico de torta o de barras simples horizontales o verticales


.
Para la tabla 4.: histograma o polígono de frecuencias o bien ojiva.

Para la tabla 5.: gráfico de barras múltiples.

Para la tabla 6.: gráfico de barras múltiples.

m2 | actividad 3

Presentando la información mediante tablas estadísticas…

Ya han pasado unos meses desde que trabaja en su nuevo empleo. No obstante,
el hecho de estar siempre tan ocupado le ha hecho perder la idea del tiempo
transcurrido.

A esta altura, en la consultora están abocados de lleno con el tema de seguri-


dad ciudadana, ya que varios clientes han planteado cuestiones que, de alguna
manera, se relacionan con la misma.

EDUBP | LICENCIATURA EN GESTION DE LA SEGURIDAD | estadística - pag. 39


Esta semana, su jefe le ha pedido que presente, a través de tablas estadísticas,
la información que recibieron en la consultora por medio de dos fuentes dife-
rentes. Como verá, son temas que se encuentran en el ámbito de la seguridad
ciudadana; esto último lo incentiva en su labor, ya que advierte, cada vez más, la
variedad de espacios donde aplicar aquello que estudió en Estadística.

Las situaciones sobre las que debe presentar la información por medio de tablas
estadísticas son dos. A saber:

Caso 1:
La cantidad de personas que asistieron a una charla en los distintos Centros
de Participación Comunal (CPC), organizada por el municipio durante el mes
pasado, sobre temas de seguridad vial, fue la siguiente:

200 200 250 350 350 300 265


265 250 265 350 300 300 300

Caso 2:
A continuación se muestran los montos mensuales de los gastos que las perso-
nas consultadas destinan a seguridad, ya sea en instalación de alarmas, en enre-
jado de ventanas, en seguros de hogar, en cursos de defensa personal, etc. La
información surgió a partir de trabajo de campo realizado para la tesis de grado
de un grupo de estudiantes de comunicación social.

Cifras expresadas en pesos


300 550 850 1100 1500
300 560 850 1200 1600
350 600 850 1200 1650
350 600 900 1250 1800
450 685 950 1250 1900
450 700 1000 1300 2000
500 750 1000 1400 2500
500 750 1000 1500 3000

Habiendo transcurrido ya un tiempo desde que usted se encuentra trabajando


allí, advierte que la tarea encomendada le resulta de suma facilidad. Por ello, de
inmediato se pone a resolverla.

A 1
C 1

m2 | actividad 3 | AA

asistente académico 1

Para resolver la actividad planteada, recuerde que esta dependerá del tipo de
datos, a fin de decidir agruparlos en una tabla de frecuencia para datos puntua-
les o en una para datos por intervalos; a su vez, de esto dependerá el tipo de
gráficos a utilizar.

Le sugerimos que repase la construcción de las tablas de frecuencias, como así


también decida acerca de las frecuencias a calcular.

EDUBP | LICENCIATURA EN GESTION DE LA SEGURIDAD | estadística - pag.40


m2 | actividad 3 | CC

clave de corrección 1

Caso 1:
La variable objeto de estudio es: la cantidad de personas que asistieron a las
charlas. Se trata de una variable cuantitativa discreta, por lo tanto para hacer
su presentación deberá realizarla a través de una tabla de frecuencias de datos
puntuales como la siguiente:

Cantidad de Cantidad de % de encuentros


asistentes encuentros
200 2 14
250 2 14
265 3 21
300 4 30
350 3 21
Total 14 100

Caso 2:
La variable objeto de estudio es: el monto de dinero (en $) destinado por
las personas para seguridad. Se trata de una variable cuantitativa continua
discretizada (es decir presentada con valores enteros), por lo tanto para hacer su
presentación deberá realizarla a través de una tabla de frecuencias por intervalos,
como la siguiente.

Monto gastado por mes Cantidad de % de personas


(en $) personas
300 – 686 13 32.5
686 – 1072 11 27.5
1072 – 1458 7 17.5
1458 – 1844 5 12.5
1844 – 2230 2 5
2230 – 2616 1 2.5
2616 – 3002 1 2.5
40 100

Observe que en este caso se construyó una tabla con 7 intervalos; recuerde
que esta es una decisión de quien arma la tabla, por lo que Ud. podría decidir
construir otra tabla con más o menos intervalos.

Recuerde también que puede calcular en ambos tipos de tablas las frecuencias
acumuladas. Ud. sabe cómo.

Con la información tabulada en los dos casos también podría graficar


adecuadamente la información de cada variable, empleando el gráfico de
bastones para el primer caso y el histograma o polígono de frecuencias para el
segundo caso.

EDUBP | LICENCIATURA EN GESTION DE LA SEGURIDAD | estadística - pag. 41


m2 glosario

Datos cualitativos: Datos que surgen de variables cualitativas y asumen etiquetas


o nombres de determinada característica.

Datos cuantitativos: Datos que surgen de variables cuantitativas e indican


cuánto o cuántos de algo. Los datos cuantitativos siempre son numéricos.

Diagrama de pastel o torta: Forma gráfica de presentar resúmenes de datos


cualitativos, basada en la subdivisión de un círculo en sectores que corresponden
a la frecuencia relativa de cada clase.

Distribución acumulada de frecuencias: Resumen tabular de un conjunto


de datos cuantitativos que muestra la cantidad de artículos que tienen valores
menores que, o iguales, al límite superior de cada clase.

Distribución acumulada de frecuencias porcentuales: Resumen tabular de un


conjunto de datos cuantitativos donde se muestra el porcentaje de los elementos
que tienen valores menores que, o iguales, al límite superior de cada clase.

Distribución acumulada de frecuencias relativas: Resumen tabular de un


conjunto de datos cuantitativos donde se muestra la fracción o proporción de
los elementos cuyos valores son menores que, o iguales, al límite superior de
cada clase.

Distribución de frecuencias: Resumen tabular de un conjunto de datos donde


se muestra la frecuencia (o cantidad) de artículos en cada una de varias clases
que no se traslapan.

Distribución de frecuencias porcentuales: Resumen tabular de un conjunto de


datos donde se muestra el porcentaje de la cantidad total de elementos en cada
una de varias clases que no se traslapan.

Distribución de frecuencias relativas: Resumen tabular de un conjunto de


datos donde se ve la frecuencia relativa, esto es, la fracción o la proporción de la
cantidad total de elementos en cada una de varias clases que no se traslapan.

Gráfico de barras: Forma gráfica de representar la información de una distribución


de frecuencias, de frecuencias relativas o de frecuencias porcentuales de datos
cualitativos.

Histograma: Presentación gráfica de una distribución de frecuencias, de


frecuencias relativas o de frecuencias porcentuales de datos cuantitativos. Se
traza colocando los intervalos de clase sobre el eje horizontal y las frecuencias
sobre el eje vertical.

Punto medio de clase: Punto en cada clase que está a la mitad entre los límites
inferior y superior de un intervalo de clase en una tabla de distribución de
frecuencias.

Tabulación cruzada: Resumen tabular de datos para dos variables. Las clases
de una variable se representan en los renglones; las clases de la otra variable,
en las columnas.

EDUBP | LICENCIATURA EN GESTION DE LA SEGURIDAD | estadística - pag.42


m3

m3 microobjetivos

• Conocer y comprender las ventajas y desventajas que ofrece el cálculo de


las distintas medidas resumen (de posición, dispersión y forma), para des-
cribir e interpretar las distribuciones de datos numéricos que surgen en el
ámbito de la seguridad ciudadana.

• Aplicar las medidas resumen y utilizar el coeficiente de variación, para estable-


cer comparaciones entre conjuntos de datos referidos a los distintos aspec-
tos de la seguridad ciudadana y así poder elaborar conclusiones acerca de
la homogeneidad y la representatividad del promedio de los datos.

m3 contenidos
Estadística: Módulo 3
Contenidos

Estadística Descriptiva

1.- Medidas

Para comenzar, es preciso que usted tenga presente que las características que
describen un conjunto de datos reciben el nombre de propiedades de los
datos. Ahora bien, si los datos se obtuvieron de una población, estas medidas
reciben el nombre de parámetros; si surgen de una muestra, las medidas se
denominan estadísticos o estadígrafos. Entre las propiedades de los datos,
podemos mencionar las siguientes: POSICIÓN, DISPERSIÓN y FORMA.
A continuación, trabajaremos sobre las distintas medidas que conforman cada
grupo.

2.- Medidas de posición

Las medidas de posición o localización son valores que se calculan para un


grupo de datos y que se utilizan para describirlos.
Generalmente, lo que se pretende es que esas medidas sean representativas de
todos los valores del grupo, permitiéndonos localizar el punto medio o típico de
un conjunto de datos.
Algunas de las medidas de posición en las que centraremos nuestro estudio
serán: la media aritmética, el modo o moda, la mediana y los cuartiles.

2.1. Media aritmética

La media aritmética o promedio es la suma de los valores del conjunto de datos


dividida por el total de observaciones. Las fórmulas de cálculo para la media de
la población y para la media de una muestra son las siguientes:

Población Muestra
� �
(la media será un parámetro) (la media será un estadístico)

Serie simple

� xi � xi
EDUBP | LICENCIATURA EN GESTION DE LA SEGURIDAD | estadística - pag. 43
M(x) = µ = M(x) = x =
N n
Distribución de frecuencias
Algunas de las medidas de posición en las que centraremos nuestro estudio
serán: la media aritmética, el modo o moda, la mediana y los cuartiles.

2.1. Media aritmética

La media aritmética o promedio es la suma de los valores del conjunto de datos


dividida por el total de observaciones. Las fórmulas de cálculo para la media de
la población y para la media de una muestra son las siguientes:

Población Muestra
� �
(la media será un parámetro) (la media será un estadístico)

Serie simple

M(x) = µ =
� xi M(x) = x =
� xi
N n
Distribución de frecuencias

M(y) = µ =
� yi � fi M(y) = y=
� yi � fi
N n

Donde: N es el tamaño de la población.


n es el tamaño de la muestra.

Nota: en el caso de trabajar con distribuciones de frecuencias por intervalos, al


calcular la media aritmética se utiliza la marca de clase o punto medio de cada
intervalo.

Es importante que usted advierta que la media aritmética tiene la ventaja de ser
un concepto familiar para la mayoría de las personas; y que cada conjunto de
datos tiene una y sólo una media. Esta medida de posición tiene en cuenta para
su cálculo todas las observaciones de la variable, debiéndose prestar atención a
la presencia de valores extremos que puede llegar a asumir la variable, ya que
éstos posiblemente distorsionen el valor de la media.
Si vinculamos la media con las escalas de medición a que hacíamos referencia
en el módulo 2, diremos que esta medida se utiliza cuando estamos en
presencia de escalas de intervalo y de razón (es decir cuando tenemos variables
cuantitativas).

A través del siguiente ejemplo trabajaremos sobre el cálculo de la media


aritmética.
En el módulo 2 contábamos con la información sobre el número de alumnos que
asistieron a 20 exámenes itinerantes de la UBP.

3; 5; 5; 3; 3; 5; 8; 7; 5; 3; 5; 6; 6; 6; 7; 8; 7; 8; 6; 6

Si a esta información la trabajamos como serie simple, se deberán sumar uno a uno
los valores de la variable y luego dividir esa suma por el total de alumnos,
obteniéndose una media aritmética de 5,6 alumnos. Es decir, que a los 20 exámenes
itinerantes asistieron en promedio 5,6 alumnos.

Si a la misma información se la trabajara a través de la tabla de distribución de


frecuencias para datos puntuales, usted debería hacer el producto de cada valor
de la variable por su frecuencia absoluta simple, luego sumar esos productos
parciales y dividir dicha suma por el total de observaciones, y llegará al mismo
resultado.

Si en cambio posee una variable que fue presentada a través de una tabla de
frecuencias por intervalos, deberá realizar el mismo procedimiento que realizó
para la tabla de datos puntuales, solo que es importante que tenga presente aquí
que deberá tomar la marca de clase o punto medio de cada intervalo para hacer
los productos parciales.
EDUBP | LICENCIATURA EN GESTION DE LA SEGURIDAD | estadística - pag.44
Le sugiero calcular la media aritmética para el ejemplo que tenía en el módulo 2
en una tabla por intervalos.
obteniéndose una media aritmética de 5,6 alumnos. Es decir, que a los 20 exámenes
itinerantes asistieron en promedio 5,6 alumnos.

Si a la misma información se la trabajara a través de la tabla de distribución de


frecuencias para datos puntuales, usted debería hacer el producto de cada valor
de la variable por su frecuencia absoluta simple, luego sumar esos productos
parciales y dividir dicha suma por el total de observaciones, y llegará al mismo
resultado.

Si en cambio posee una variable que fue presentada a través de una tabla de
frecuencias por intervalos, deberá realizar el mismo procedimiento que realizó
para la tabla de datos puntuales, solo que es importante que tenga presente aquí
que deberá tomar la marca de clase o punto medio de cada intervalo para hacer
los productos parciales.
Le sugiero calcular la media aritmética para el ejemplo que tenía en el módulo 2
en una tabla por intervalos.

2.2. Mediana

La mediana es una medida de posición que aparece en el centro de una


sucesión ordenada de valores de la variable.
A continuación veremos el cálculo de la mediana trabajando con una serie
simple.

Serie simple
1.- Ordenar los datos de menor a mayor o viceversa.
2.- Estudiar el número de observaciones; si el número es impar la mediana estará
correspondiendo con la (n+1) / 2 observación ordenada.

Por ejemplo, supongamos que contamos con la cantidad de alumnos que


asistieron a 5 clases de consulta de la materia Estadística; los valores
observados fueron: 3, 4, 6, 7, 8.
Entonces: (n +1)/2 = (5 + 1)/2 = 3º observación; entonces la mediana = 6
alumnos.

Si el número de observaciones es par, la mediana surgirá del promedio de los


valores centrales de la variable.
Por ejemplo: supongamos que se agrega una clase más de consulta de la
materia, por lo que los valores observados son: 3, 4, 6, 7, 8, 10.
Entonces: (6 + 1)/2 = 3,5º
En este caso, la mediana se ubica entre la tercera y la cuarta posición, por lo que
la mediana será 6,5 alumnos.

Es importante advertir que la mediana es una medida de posición que no se ve


afectada por valores extremos de la variable, como sí sucede con la media
aritmética. El principal inconveniente de la mediana es que no puede calcularse
cuando trabajamos con datos cualitativos en escala nominal. En cambio, todo
conjunto de datos a escala ordinal, escala de intervalo o escala de razón tiene
mediana.

2.3. Modo

El modo o moda es el valor de la variable que se presenta con mayor frecuencia.


Se utiliza en datos medidos en cualquiera de las escalas, por lo que es posible
calcularla tanto para variables cualitativas como cuantitativas; en el caso de las
primeras se tratará de la categoría más frecuente de la variable y en el caso de
las variables numéricas será el valor que más se repite de la variable.

Mo (X) = X j ; f j : es la máxima frecuencia absoluta simple.

Supongamos que la cantidad de asistentes a las 10 charlas sobre


“Conduzcamos sin alcohol” organizados por una institución educativa, fueron las
siguientes:

10; 20; 25; 15; 20; 20; 35; 30; 50; 20

En este ejemplo el modo es 20 personas, ya que es el valor de la variable que


más se presenta.
EDUBP | LICENCIATURA EN GESTION DE LA SEGURIDAD | estadística - pag. 45

2.4. Cuartiles y percentiles


Mo (X) = X j ; f j : es la máxima frecuencia absoluta simple.

Supongamos que la cantidad de asistentes a las 10 charlas sobre


“Conduzcamos sin alcohol” organizados por una institución educativa, fueron las
siguientes:

10; 20; 25; 15; 20; 20; 35; 30; 50; 20

En este ejemplo el modo es 20 personas, ya que es el valor de la variable que


más se presenta.

2.4. Cuartiles y percentiles

Los cuartiles y percentiles son medidas útiles para obtener una posición “no
central”. Se utilizan a menudo para resumir o describir un conjunto de datos.

2.4.1. Cuarteles

Los cuartiles son los valores de la variable que dividen la serie de datos
ordenada en cuatro partes iguales, conteniendo cada parte la misma cantidad de
observaciones.

Los cuartiles son tres:


Q1: es aquel valor de la variable que deja por debajo al 25% de las
observaciones, y por encima se encuentra el 75% de los datos.
Q2: es aquel valor de la variable que deja por debajo y por encima de ese valor
al 50% de las observaciones. El segundo cuartil siempre coincide con la
mediana.
Q3: es aquel valor de la variable que deja por debajo del mismo al 75% de las
observaciones y por encima queda el 25% restante.

La posición de los cuartiles se calcula de la siguiente manera:

Lugar que ocupa el 1er. cuartil:


�n � 1�
4

Lugar que ocupa el 2do. cuartil: 2


�n � 1�
4

Lugar que ocupa el 3er. cuartil: 3


�n � 1�
4

Siguiendo con nuestro ejemplo, si tenemos la información de la cantidad de


alumnos asistentes a las clases de consulta de distintas materias de la
Licenciatura en Gestión de la Seguridad Ciudadana, calculemos los cuartiles.
En primer lugar debemos ordenar los datos.

3; 3; 4; 5; 6; 7; 10; 12; 14; 15; 16; 20; 20; 20; 21; 22; 23; 23; 25

En nuestro ejemplo, los cuartiles serán:

Q1 = 6 alumnos
Q2 = 15 alumnos
Q3 = 21 alumnos

2.4.2. Percentil

Son valores de la variable que dividen la serie de datos ordenada en cien partes
iguales. Sus fórmulas de cálculo se obtienen de manera similar a las de los
cuartiles, con la salvedad de que en vez de dividir por cuatro, se dividirá por cien.

En ambos casos los datos provienen de escalas ordinales, nominales o de razón.


Los percentiles 25, 50 y 75 coinciden respectivamente con los cuartiles 1, 2 y 3.
EDUBP | LICENCIATURA EN GESTION DE LA SEGURIDAD | estadística - pag.46

3. Medidas de dispersión

Si bien el cálculo de las medidas de posición para un conjunto de datos son de


Q2 = 15 alumnos
Q3 = 21 alumnos

2.4.2. Percentil

Son valores de la variable que dividen la serie de datos ordenada en cien partes
iguales. Sus fórmulas de cálculo se obtienen de manera similar a las de los
cuartiles, con la salvedad de que en vez de dividir por cuatro, se dividirá por cien.

En ambos casos los datos provienen de escalas ordinales, nominales o de razón.


Los percentiles 25, 50 y 75 coinciden respectivamente con los cuartiles 1, 2 y 3.

3. Medidas de dispersión

Si bien el cálculo de las medidas de posición para un conjunto de datos son de


vital importancia para resumir la información, no debemos dejar de lado la
relevancia que tiene saber el grado de dispersión o variabilidad que tiene ese
conjunto de datos. Esa variabilidad generalmente se toma respecto de alguna de
las medidas de tendencia central.

Las medidas de dispersión en las que nos detendremos serán las siguientes: el
rango o recorrido, la varianza, la desviación estándar y el coeficiente de
variación.

3.1. Rango

El rango o recorrido de una variable puede ser definido como la diferencia entre
el valor máximo que puede asumir la variable y el valor mínimo de la misma. Lo
representaremos con la letra R.
Recuerde que en el módulo 2 ya se había calculado el rango o recorrido cuando
se construyó una tabla de frecuencias por intervalos.

3.2. Varianza

La varianza se define como la media aritmética de los cuadrados de las


desviaciones de la variable con respecto a la media aritmética.

Podemos calcular la varianza poblacional y muestral de la siguiente manera:

Población Muestra
* Serie simple
�2=
�� xi � � �
2

s2 =

� xi � X �
2

N n �1
* Distribución de frecuencias
�2=
�� yi � � � � fi
2

s2 =
� � 2
� yi � y � fi
N n �1

Tal como usted lo habrá advertido, en el cálculo anterior para la varianza de la


muestra, se ha utilizado la media muestral y no la media poblacional en el cálculo
del desvío. En el denominador empleamos n-1, que representa los grados de
libertad. Éstos se refieren al número de elementos dentro del grupo de datos que
pueden variar libremente.
Si en lugar de dividir por n-1, hubiésemos dividido por n, el valor de s², que es una
estimación de la varianza poblacional �², tendería después de muchas pruebas a
un valor un poco más pequeño del que debería ser. Si en el cálculo del desvío se
hubiese utilizado el valor de la media poblacional en lugar de la media muestral,
el numerador hubiese sido más grande. Como la varianza de la muestra debe ser
un buen estimador de la varianza poblacional es que se divide por “n-1”, esto es
lo que se conoce como varianza muestral corregida.

Si calculamos la varianza para el ejemplo al que le calculamos la media, la


varianza sería 2,78 alumnos².

3.3. Desviación estándar

La desviación estándar será definida como la raíz cuadrada positiva de la


varianza. EDUBP | LICENCIATURA EN GESTION DE LA SEGURIDAD | estadística - pag. 47

Para la población: DS(x) = � = �2


estimación de la varianza poblacional �², tendería después de muchas pruebas a
un valor un poco más pequeño del que debería ser. Si en el cálculo del desvío se
hubiese utilizado el valor de la media poblacional en lugar de la media muestral,
el numerador hubiese sido más grande. Como la varianza de la muestra debe ser
un buen estimador de la varianza poblacional es que se divide por “n-1”, esto es
lo que se conoce como varianza muestral corregida.

Si calculamos la varianza para el ejemplo al que le calculamos la media, la


varianza sería 2,78 alumnos².

3.3. Desviación estándar

La desviación estándar será definida como la raíz cuadrada positiva de la


varianza.

Para la población: DS(x) = � = �2

Para la muestra: DS(x) = s = s2

Al calcular la varianza, la unidad de medida ha quedado expresada al cuadrado,


lo cual hace difícil su interpretación. La desviación estándar es una clase de
media de los desvíos algebraicos que da valores positivos; estos aumentan
cuando aumenta la variabilidad, y están expresados en la misma unidad de
medida que las observaciones originales.

Para el ejemplo que venimos siguiendo la desviación estándar sería: 1,67


alumnos.

La desviación estándar es de utilidad si necesitamos evaluar la representatividad


de la media de un conjunto de datos; una desviación estándar pequeña nos
estará indicando un alto grado de homogeneidad de la serie. Si tenemos dos o
más series comparables con medias aritméticas idénticas o casi idénticas
expresadas en igual unidad de medida, la distribución con menos desviación
estándar será la que tenga la media más representativa. Cuando entremos de
lleno a la inferencia estadística veremos el rol fundamental que tiene la
desviación estándar.

3.4. Coeficiente de variación

Cuando deseamos comparar la dispersión de dos o más series que tienen


medias diferentes entre sí o bien que se expresan en distinta unidad de medida,
las desviaciones estándar resultarán imposibles de comparar, por lo que
deberemos recurrir a una medida de variación relativa llamada coeficiente de
variación.
La fórmula de cálculo es la siguiente:

DS ( x)
CV (x) =
X

Mientras menor sea el coeficiente de variación, habrá mayor homogeneidad en


los datos, encontrándose éstos más concentrados en torno a la media
aritmética.

4. Medidas de forma

La forma es la manera en la cual están distribuidos los datos según la


puntiagudez y la asimetría de una distribución.

4.1. Puntiagudez o kurtosis:

La puntiagudez nos permitirá mostrar el grado de concentración en el área


alrededor de la moda (curva apuntada) o descentralizada con respecto a la
moda (curva achatada):

a) leptocúrtica
b) platicúrtica
EDUBP | LICENCIATURA EN GESTION DE LA SEGURIDAD | estadística - pag.48
c) mesocúrtica
La forma es la manera en la cual están distribuidos los datos según la
puntiagudez y la asimetría de una distribución.

4.1. Puntiagudez o kurtosis:

La puntiagudez nos permitirá mostrar el grado de concentración en el área


alrededor de la moda (curva apuntada) o descentralizada con respecto a la
moda (curva achatada):

a) leptocúrtica
b) platicúrtica
c) mesocúrtica

Los gráficos siguientes presentan las distintas kurtosis:

4.2. Asimetría

La asimetría nos permite mostrar la deformación horizontal de la distribución.


Para describir la propiedad de la asimetría compararemos la media y la mediana.

Si:

X ���Me � Es� positiva o asimétrica derecha

X ���Me Es simétrica

X ���Me Es negativa o asimétrica izquierda

La asimetría se puede determinar también a través de coeficientes, como el


siguiente:

Ca =

3 X � Me �
DS � x �

El coeficiente puede asumir:

- Un valor positivo, en cuyo caso la asimetría será derecha.


- Un valor negativo, en cuyo caso la asimetría será izquierda.
- Cero, en cuyo caso será simétrica.

Cuanto más lejano de cero sea el valor del coeficiente, ya sea positivo o negativo
su signo, significará mayor asimetría.

Ya nos encontramos finalizando el presente módulo. Con el objeto de poner en


práctica lo trabajado, le sugiero calcular el coeficiente de variación y analizar la
forma de la distribución (desde la asimetría) para los ejemplos planteados en el
módulo 2 con los que se construyeron las tablas de frecuencias.

EDUBP | LICENCIATURA EN GESTION DE LA SEGURIDAD | estadística - pag. 49


m3 material

Material de consulta obligatoria

• TRIOLA, Mario F.: Estadística Elemental. México. Editorial Pearson Edu-


cación. 2000, séptima edición.

Material de consulta complementaria

• HANKE y REITSCH: Estadística para Negocios. España. Editorial Irwin.


1995.

• ANDERSON, David; SWEENEY, Dennis y WILLIAMS, Thomas: Estadística


para Administración y Economía. México, International Thomson. 1999.

• BERENSON, LEVINE y KREHBIEL: Estadística para administración.


México. Editorial Prentice Hall. 2001.

• GARCÍA FERANDO, Manuel: Introducción a la estadística en sociología.


Madrid. Alianza Editorial. 1997, segunda edición.

m3 actividades

m3 | actividad 1

Buscando resumir la información…

Una tarde en su trabajo, como ocurre con frecuencia, suena el teléfono de su


oficina. Usted atiende en cuanto puede, y del otro lado de la línea escucha la voz
de su jefe que le comenta:

“Juan, seguramente recordarás que la semana pasada tuviste que presentar,


a través de tablas estadísticas, la información que te dejé sobre dos casos...
Bien, ahora me gustaría contar con un informe ampliado donde se incorporen
algunos números que resuman la información; estoy seguro de que eso me
permitiría reforzar las conclusiones. Desde ya, muchas gracias”.

Usted no tiene dudas, sabe perfectamente qué indicadores puede generar con
los datos que posee, y que satisfarán plenamente a su superior, permitiéndole
allanar su camino en la toma de decisiones.

Una vez finalizada la conversación, usted se ocupa de buscar los datos de los dos
casos para los que confeccionó las tablas estadísticas, y se pone a trabajar.

A 1
C 1

EDUBP | LICENCIATURA EN GESTION DE LA SEGURIDAD | estadística - pag.50


m3 | actividad 1 | AA

asistente académico 1

En el módulo 2, usted ha realizado la tabla de frecuencia (de datos puntuales y


la tabla de distribución de frecuencias por intervalos) para cada uno de los casos
planteados. Ahora le sugerimos:

1.- Retome las tablas de frecuencias confeccionadas en el módulo 2 en cada


uno de los casos.
2.- Los indicadores que se le requieren son los siguientes: la media aritmética, la
mediana, la moda o modo, la varianza, la desviación estándar, los cuartiles.

Lo que se solicita en la presente actividad es presentar un informe. Este último


puede tener la siguiente estructura:

A.- Resumen ejecutivo:

En él se realiza una presentación de los hechos y hallazgos relevantes derivados


de la investigación, que posibilitarán a quien lo reciba un acceso directo a la
información. Es importante señalar que no resulta pertinente incorporar términos
técnicos. Por lo general, a los directivos de la empresa les interesan poco los
aspectos técnicos.

B.- Introducción:

En esta etapa se realiza una descripción de la naturaleza y el alcance del estudio


planteado, así como de su importancia.

C.- Metodología:

Aquí se detallan las técnicas y herramientas estadísticas utilizadas, se individualiza


la población objeto de estudio, y se caracteriza y se define la muestra con la que
se trabajará (en caso de emplear sólo una parte de la población).

D.- Hallazgos:

En esta instancia se realizan los cálculos estadísticos, y se realizan comentarios


vinculados con los cálculos y los resultados.

E.- Discusión e interpretación:

En esta etapa se proporciona una interpretación de los hallazgos. No es pertinente


emplear lenguaje técnico.

F.- Conclusiones y recomendaciones:

Se trata de la misma información que aquella desarrollada en el resumen ejecutivo,


pero explicada con mayor detalle. Las conclusiones y recomendaciones que aquí
aparezcan deben ser respaldadas siempre por lo desarrollado en la etapa que
hemos llamado “Hallazgos”.

EDUBP | LICENCIATURA EN GESTION DE LA SEGURIDAD | estadística - pag. 51


m3 | actividad 1 | CC

clave de corrección 1
Estadística: Módulo 3
Actividad
Estadística: 1: Buscando
Módulo 3 resumir la información…
Actividad
Caso 1 1: Buscando resumir la información…
Clave de Corrección 1
Clave de Corrección
La variable 1
objeto de estudio es: cantidad de asistentes a las charlas organizadas
Caso 1
por el municipio. Se trata de una variable cuantitativa discreta, escala de
Caso La
1 variable objeto de estudio es: cantidad de asistentes a las charlas organizadas por e
medición: razón; por lo que las medidas apropiadas serán todas las de posición,
La Se trata de una variablees:
cuantitativa discreta, escala
a lasdecharlas
medición: razón; por
porloelque
munl
de variable objeto
dispersión
apropiadasy dedeforma.
serán
estudio
todas
cantidad de
las de posición,
asistentes organizadas
Se trata de una variable cuantitativa discreta,deescala
dispersión y de forma.
de medición: razón; por lo que las me
apropiadas serán todas las de posición, de dispersión y de forma.
Para encontrar el valor
Para encontrar de las
el valor demismas se requieren
las mismas de los
se requieren siguientes
de los cálculos:
siguientes cálculos:
Para encontrar el valor de las mismas se requieren de los siguientes cálculos:
yi fi yi � fi � 2
yi � y � fi�
yi
200
fi
2
yi � fi � 2

400 yi � y 13379.21
� fi
200 250 2 2 400 500 13379.21
2021.21
250 265 2 3 500 795 845.71
2021.21
265 300 3 4 795 1200 845.71
1326.42
300 350 4 3 1200 1050 1326.42
13957.81
350 Totales 3 14 1050 3945 13957.81
31530.36
Totales 14 3945 31530.36

� yi � fi = 3945 = 281,79 personas


y =yi � fi
y=
� n= 3945 =14281,79 personas
n 14
Mo = 300 personas
Mo = 300 personas
Mo =Me 300= personas
282,50 personas
Me = 282,50 personas
Me =Q1 = 250personas
282,50 personas
Q3 = 300
Q1 = 250 personas personas
Q3
Q1 == 300
250 personas
personas
Q3 =La300 posición de los cuartiles es:
personas
�n � 1de
La posición � =los cuartiles es:
3,75 En este caso el Q1 está ubicado en entre el tercer y el cuarto lu
�n posición
La � 1� 4 de los cuartiles es:
= 3,75 En este caso el Q1 está ubicado en entre el tercer y el cuarto lugar, p
4 más cerca del cuarto lugar, por lo tanto el valor que ocupa el cua
es el primer
más cerca cuartel.
del cuarto lugar, por lo tanto el valor que ocupa el cuarto lu
= 3,75 Eneleste
es primercaso el Q1 está ubicado en entre el tercer y el
cuartel.
2
�n � 1� = 7,5 cuarto lugar, pero más cerca del cuarto lugar, por lo tanto
La posición de la
�n � 1� 4 el valor que ocupa el mediana
cuarto lugar(Q2)es
seelencuentra entre el 7mo. y el 8
primer cuartel.
2 = 7,5 La posición de la mediana (Q2) se encuentra entre el 7mo. y el 8vo. lu
4 por lo tanto se promedian los dos valores que ocupan dichos pu
= 7,5 La posición de la mediana (Q2) se encuentra entre el
por
7mo. tanto
lo se promedian
y el 8vo. lugar, porloslo dos valores
tanto que ocupan
se promedian losdichos
dos puestos

3
�n � 1� = 11,25 valores que ocupan dichos puestos.
En este caso el Q3 está ubicado entre el décimo primero y el dé
3
�n � 1� =4 11,25 En este caso el Q3 está ubicado entre el décimo primero y el décimo
4 = 11,25 segundo
En este lugar,
caso el pero ubicado
Q3 está más cerca del el
entre décimo
décimoprimer lugar, por lo ta
primero
valor
segundo que
lugar, ocupa
pero el
más décimo
cerca primer
del lugar
décimo es tercer
primer
y el décimo segundo lugar, pero más cerca del décimo cuartil.
lugar, por lo tanto e
valor que ocupa el décimo primer lugar es tercer
primer lugar, por lo tanto el valor que ocupa el décimo cuartil.
primer lugar es tercer cuartil.

EDUBP | LICENCIATURA EN GESTION DE LA SEGURIDAD | estadística - pag.52


ss =
2 � �� ��
2
2
yi �� yy �� fifi = 31530
� yi 31530..36
36 = 2252,17 personas²
2
= nn ��11 = 14 = 2252,17 personas²
14
2
s=
s=
2252 17 personas
2252..17 personas 2 == 47,46 personas
47,46 personas

Forma:
Forma:
Forma:

X
X ���Me por lo tanto la distribución es asimétrica izquierda.
���Me por lo tanto la distribución es asimétrica izquierda.
Aplicando el coeficiente de asimetría:
��
Aplicando el coeficiente de asimetría:
3 X � Me
Ca = 3 X � Me
�� = 3 ��281
281..79
79 �� 282
282..50
50)) = - 0,045
Ca = DS ��x �� = 3 47 = - 0,045
DS x 47..46
46

Nota: para el cálculo de la mediana y de los cuartiles se trabajó la serie como


Nota: para el cálculo de la mediana y de los cuartiles se trabajó la serie como una serie simp
Nota:
una parasimple.
serie el cálculo de la mediana y de los cuartiles se trabajó la serie como una serie simp

Para el segundo caso Ud. deberá hacer también el cálculo de las distintas
medidas; preste atención
Para el segundo en deberá
caso Ud. los mismos
haceryatambién
que deberá considerar
el cálculo la marca
de las de medidas;
distintas
Para como
clase el segundo
valorescaso
de yiUd. deberá hacer también el cálculo de las distintas medidas;
atención en los mismos ya que deberá considerar la marca de clase como valores de yi
atención en los mismos ya que deberá considerar la marca de clase como valores de yi
Una vez encontradas todas las medidas, está en condiciones de realizar el
informe solicitado por el cliente de la consultora.

m3 | actividad 2

¿Cuánto saben de normas viales?

Ha comenzado una nueva jornada de trabajo. Como cada día, lo primero que
hace al llegar a su oficina es leer el correo electrónico, y hoy se encuentra con el
siguiente mensaje que le enviara su jefe.

Asunto: Más información


Fecha: Lun, 19 Mar 2006 14:33
De: jefatura@hotmail.com

Juan, te envío la información que encontré publicada en uno de los suplementos


de domingo; en un establecimiento escolar el director decidió evaluar los
conocimientos de un grupo de alumnos del último curso sobre normas viales.
Los puntajes se presentan en la siguiente tabla, publicada en el artículo que te comenté:

Puntaje Cantidad de alumnos


30 – 40 1
40 – 50 3
50 – 60 5
60 – 70 7
70 – 80 5
80 – 90 3
90 – 100 1
25

EDUBP | LICENCIATURA EN GESTION DE LA SEGURIDAD | estadística - pag. 53


Como me pareció importante contar con el puntaje que cada uno de los alumnos
obtuvo en esa evaluación, me contacté con la institución y la maestra del curso
me pasó dicha información. Obviamente, para preservar la identidad de los
alumnos se los identificó mediante las iniciales de apellido y nombre de cada
uno.

Aquí te transcribo esos datos.

Alumno Puntaje
S.S 35
A.J y M.N 45
L.A 40
R.M; L.R. y A. V. 55
B.C.; B.J. y A.M. 65
Z.T. y F.C. 50
L. O., M. R. y S.S. 60
R.D. 68
R.A; T. P. y C.C. 70
B.M. y C.A. 73
R.S. 95
L.E. y L.S. 82
B.B. 80

Me doy cuenta de que si bien esta información tal como me la envían es de


utilidad, sería interesante contar con algunos números que resumieran la
información (promedios, desvíos y todo otro indicador que creas conveniente
incorporar al informe). Desde ya, muchas gracias por tu colaboración.

¡Usted está listo para comenzar! A esta altura del curso usted ya conoce bastante
acerca del cálculo de medidas resumen.

¡Cuenta con las herramientas para hacer la tarea! ¡Adelante!

A 1
C 1

m3 | actividad 2 | AA

asistente académico 1

La información que le proporciona su jefe es una tabla de distribución de


frecuencias por intervalos.

A partir de ella podrá calcular la media, la mediana, establecer el intervalo modal,


calcular la desviación estándar, definir la asimetría de la distribución. La marca
de clase entra a tener un rol relevante aquí.

En el caso del cálculo de los cuartiles se le aconseja que trabaje con la serie
simple, es decir con los puntajes individuales de cada alumno.

Por supuesto que, si Ud. Desea, puede completar la información de las medidas
descriptivas con la graficación de la información. Ud. ya sabe de esto…

EDUBP | LICENCIATURA EN GESTION DE LA SEGURIDAD | estadística - pag.54


Estadística: Módulo
Estadística: 3 3
Módulo
Actividad 2: ¿Cuánto
Actividad saben
2: ¿Cuánto de normas
saben viales?
de normas viales? m3 | actividad 2 | CC
Clave de Corrección
Estadística:
Clave 1 31
Módulo
de Corrección clave de corrección 1

Actividad 2: ¿Cuánto saben de normas viales?


Trabajando con la distribución de frecuencias por intervalos, necesitará hacer los
Trabajando
Clave con
de
siguientes
Trabajando la distribución
Corrección
cálculos:
con 1 de frecuencias
la distribución por intervalos,
de frecuencias necesitará
por intervalos, hacerhacer
necesitará los siguientes
los siguientes
cálculos:
cálculos:
Puntaje
PuntajeMarcaMarca
de deCant.Cant.
de de yi � � � yifi �� fi �� � � �
2
claseclase
yi deyialumnos
Trabajando con la distribución fi
frecuencias por yi �yiy ��y fihacer 2
� fi los siguientes
alumnos fi intervalos, necesitará
cálculos: 30 – 40
30 – 40 35 35 1 1 35 35 900 900
40 – 50
40 – 50 45 45 3 3 135 135 1200 1200
� � � � � fi
50 – 60
Puntaje 55Marca
55 de 5 Cant.
5 de 275 275 500 5002
455yi455
� fi
50 – 60
60 – 70
60 – 70 65 clase
65 yi 7alumnos
7 fi yi0 � y0
70 – 80
30
70 – 40
80 75 35 75 5 1
5 375 375
35 500 900
500
80 – 90
40
80 – 50
90 85 45 85 3 3 255 135
255 1200 1200
90 – 100
50––100
90 60 95 95 55 1 5
1 95 275
95 900 500
900
60 – 70 65 25 257 1625 1625
455 5200 5200
0
70 – 80 75 5 375 500
� yi �
y= y= �
fi 80
yi �= fi1625– 90
90=– 1625
85
= 65 =puntos
100
3 255 1200
6595
puntos 1 95 900
n n 25 25 25 1625 5200

Intervalo
Si
� modal:
Intervalo
Intervalo
Si nos fijamos
i �60fi a 60
ymodal:
en los
70 apuntos.
60162570 puntos.
y =nos fijamos en= losavalores
modal: 70 individuales,
valores puntos.
puntos existen
= 65individuales, valores
existen que se
valores querepiten más más
se repiten veces, son: son:
veces,
55 puntos, 60 n
puntos, 65 25
puntos y 70 puntos. Esto indica que se trata de una distribución
55 puntos, 60 puntos, 65 puntos y 70 puntos. Esto indica que se trata de una distribución
multimodal.
Si nos fijamos en los valores individuales, existen valores que se repiten más
multimodal.
Intervalo
veces, son:modal: 60 a 70 puntos.
Si nos fijamos en los valores individuales, existen valores que se repiten más veces, son:
55 � �� �
55 puntos,
puntos,260
�2 yi�� yi
s =distribución
2 multimodal. y �60
puntos,
�y fipuntos,
2
�=fi
65
520065puntos
puntos
5200
y 70 puntos.
y 70 EstoEsto
puntos. indica que que
indica se trata de una
se trata dedistribución
una
s = multimodal.
n � 1n � 1 =
24 24
= 216,67 puntos²
= 216,67 puntos²

s = s 216 �
,�67yipuntos�2
� y � fi 2
2
5200
= 14,72 puntos
s =2 = 216,67 puntos == 14,72 =puntos
216,67 puntos²
n �1 24
ParaPara
el cálculo de los
decuarteles, comocomo
se cuenta con la información del puntaje de cada alumno,
s = el
ordenamos
cálculo
216 los2cuarteles,
puntos
,67puntajes:
esos = 14,72 puntosse cuenta con la información del puntaje de cada alum
ordenamos esos puntajes:
35; 40;
35;45;
40;45;
45;50;
45;50;
50;55;
50;55;
55;55;
55;60;
55;60;
60;60;
60;65;
60;65;
65;65;
65;68;
65;70;
68;70;
70;70;
70;73;
70;73;
73;80;
73;82;
80;82;
82;95
82; 95
Para el
Para el cálculo
cálculo de
de los
los cuarteles,
cuarteles,como
comosesecuenta
cuenta con
conla la
información deldel
información puntaje de cada alum
puntaje
Los de
cuartiles
ordenamos
Loscada serán:
esos
alumno,
cuartiles puntajes:
ordenamos esos puntajes:
serán:
Q1: 35;
52,5
35;
Q1:40;puntos
40;
52,545; 45;
45; 50;
puntos
45; 50; 50;
50;55; Se
55;55; promedian
55;55;
Se60;
55; 60;60; los
60;
promedian
60; valores
65;
60;los65;
65; del65;
65;
valores
65; lugar
68;
del70;6to.
70;y6to.
lugar
68; 70; 7mo.
70;
70; 73; 73;
73; 80;
y 7mo.
70; 73; 82; 82; 95
Q2: 80;
65 puntos
Q2:82;
65 82;
puntos
95 Corresponde al valor del lugar 13ro.
Corresponde al valor del lugar 13ro.
Q3: 71,5
Los puntos
cuartiles
Q3: 71,5 serán:
puntos Se promedian
Se promedianlos valores del lugar
los valores 19no.19no.
del lugar y 20mo.
y 20mo.
Los cuartiles serán:
En cuanto
Q1: a lapuntos
52,5
En cuanto forma, comocomo
a la forma, la media es promedian
Se
la mediaigual que la
es igual mediana,
los
que valores la
deldistribución
la mediana, lugar 6to. yes simétrica.
7mo.
la distribución es simétrica.
Q2: 65 puntos Corresponde al valor del lugar 13ro.
Q1:
Q3: 52,5
71,5 puntos
puntos Se promedian los valores
Se promedian del lugar
los valores del 6to.
lugary 19no.
7mo. y 20mo.
Q2: 65 puntos Corresponde al valor del lugar 13ro.
Q3: 71,5 puntos
En cuanto Se promedian
a la forma, como la media eslos valores
igual que ladel lugar 19no.
mediana, y 20mo. es simétrica.
la distribución

En cuanto a la forma, como la media es igual que la mediana, la distribución es


simétrica.

EDUBP | LICENCIATURA EN GESTION DE LA SEGURIDAD | estadística - pag. 55


m3 glosario

Coeficiente de variación: Medida de la dispersión relativa de un conjunto de


datos. Se calcula dividiendo la desviación estándar entre la media y multiplicando
el cociente por 100.

Cuartiles: Los percentiles 25%, 50% y 75% se llaman primer cuartil, segundo
cuartil (mediana) y tercer cuartil, respectivamente. Se pueden usar los cuartiles
para dividir al conjunto de datos en cuatro partes, cada una de las cuales contiene
aproximadamente el 25% de los datos.

Datos agrupados: Datos disponibles en intervalos de clase, como los resumidos


por una distribución de frecuencias. Los valores individuales de los datos
originales no están registrados.

Desviación estándar: Medida de la dispersión de un conjunto de datos; se


calcula sacando la raíz cuadrada positiva de la varianza.

Estadístico: Valor numérico que se usa como medida resumida de una muestra
de datos (por ejemplo, la media de la muestra, la varianza de la muestra y la
desviación estándar de la muestra).

Media: Medida de la localización central de un conjunto de datos. Se calcula


sumando todos los valores de los datos y dividiendo el resultado entre el número
de elementos.

Mediana: Medida de la localización central. Es el valor que divide los datos en


dos grupos iguales, uno con valores mayores que o iguales a la mediana, y el
otro con valores menores que o iguales a ella.

Medida estadística o estadístico de la muestra: Valor numérico que se usa


como medida resumida de una muestra (por ejemplo, la media de la muestra, la
varianza de la muestra y la desviación estándar de la muestra s).

Moda o modo: Medida de la localización, definida como el valor de la variable


que ocurre con más frecuencia.

Parámetro poblacional: Valor numérico que se usa como medida resumida de


una población de datos (por ejemplo, la media de la población, la varianza de la
población y la desviación estándar de la población).

Percentil: Un valor tal que, cuando menos, p por ciento de los elementos son
menores que o iguales a ese valor, y al menos (100 - p) por ciento de los elementos
tienen valor mayor que o igual a ese valor. El 50° percentil es la mediana.

Rango: Medida de dispersión, definida como el valor máximo menos el valor


mínimo.

Varianza: Medida de dispersión para un conjunto de datos, basada en las


desviaciones de los valores de los datos respecto a la media, elevadas al
cuadrado.

EDUBP | LICENCIATURA EN GESTION DE LA SEGURIDAD | estadística - pag.56


m4

m4 microobjetivos

• Advertir la importancia del análisis exploratorio de datos, a los fines de


complementar el análisis estadístico con medidas descriptivas.

• Incorporar, en el análisis de los datos, medidas que permitan conocer la


relación y el grado de asociación de dos variables cuantitativas de interés
surgidas a partir de cierta información relativa a distintas temáticas vinculadas
con la seguridad ciudadana.

• Comprender las potencialidades del análisis exploratorio de datos y del de


correlación, con el propósito de tomar decisiones en el ámbito de Gestión
de la Seguridad Ciudadana en que le toque actuar, y de reducir los riesgos de
un accionar incorrecto en temas que resulten importantes para la sociedad.

m4 contenidos

1. Características importantes de los datos

Asociación de variables

La estadística descriptiva nos proporciona herramientas para entender mejor un


conjunto de datos conociendo sus características. A continuación, le presentamos
tres características que son muy importantes a los fines de aumentar el
entendimiento sobre dichos conjuntos de datos.

1. La naturaleza o forma de distribución de datos; por ejemplo con forma de


campana, uniforme o asimétrica.
2. Un valor representativo para el conjunto de datos, por ejemplo el promedio.
3. Una medida de variación o dispersión del conjunto de datos, por ejemplo la
desviación estándar.

En los módulos anteriores, hemos visto cómo puede analizarse la forma


de la distribución organizando los datos en distribuciones de frecuencias y
construyendo gráficas. Por otra parte, trabajamos sobre cómo calcular medidas
representativas de los conjuntos de datos, promedios (media, mediana, modo)
y medidas que miden la dispersión de los valores de una variable en torno al
valor promedio. En este módulo usted tendrá la posibilidad de aprender sobre la
utilización de métodos para explorar conjuntos de datos y analizar la asociación
de dos variables.

2. Análisis exploratorio de datos

En ocasiones recolectamos datos sobre determinada variable con un objetivo


específico, por ejemplo, con el propósito de conocer nuevas medidas de
seguridad en determinada zona, o bien identificar la incidencia que ha tenido
una campaña publicitaria sobre el incremento de las ventas de un producto,

EDUBP | LICENCIATURA EN GESTION DE LA SEGURIDAD | estadística - pag. 57


No obstante, en otras ocasiones simplemente queremos explorar los datos para
ver qué nos dicen.

Al organizar y luego presentar los datos a través de distribuciones de frecuencias


y de histogramas, se pierde parte de la información. De esta forma perdemos el
dato puntual, ya que por ejemplo decimos: “En el intervalo 5000 a 10000 pesos de
ventas mensuales se encuentra el 5% de las empresas que se dedican a la venta
Con el AED
de bebidas alcohólicas en el se pone
último énfasis
año”, peroen las exploraciones
perdemos originales,delcon el obje
la individualización
dato. El espíritu del análisis exploratorio de datos (AED) es no limitarnos a mirar
forma en que se describen los datos y entender la naturaleza de los mismo
un histograma; debemos explorar... Muchas veces errores en la introducción de
los datos en unaAlgunos métodos
base puede utilizados
llevarnos en la exploración
a la construcción de los datos
de gráficas son los siguiente
incorrectas,
y si no se exploran más a fondo los datos, por ejemplo, con sólo observar un
histograma podría arribarse a conclusiones muy equivocadas.
2.1. Diagrama de tallo y hoja
Con el AED se pone énfasises
Esta gráfica enuna
las de
exploraciones
las técnicas originales, condel
más sencillas el objetivo de
análisis exploratorio;
simplificar la forma en que se describen los datos y entender la naturaleza de
los mismos.
de clasificación de los elementos del conjunto de datos y la forma de la dis

Algunos métodos utilizados en la exploración de los datos son los siguientes.


El siguiente conjunto de datos corresponde a la relación precio-utilidad d
realizan
2.1. Diagrama de tallo yacciones
hoja de Responsabilidad Social en el territorio nacional.

Esta gráfica es una de las técnicas más sencillas del análisis exploratorio;
10.6 de8.1
proporciona el orden 10.2 de
clasificación 10.0 9.4
los elementos del conjunto de datos y
la forma de la distribución.
9.6 7.8 9.3 8.2 11.0
10.8 de
El siguiente conjunto 9.6 datos7.5corresponde
8.2 9.9
a la relación precio-utilidad de
25 empresas que7.7 realizan
9.6 acciones
10.6 de10.1Responsabilidad
8.4 Social en el territorio
nacional.
8.3 9.6 10.1 10.4 10.6
10.6 8.1 10.2 10.0 9.4
9.6 7.8 9.3 8.2 11.0
Para producir la gráfica se hace una lista vertical de los tallos (los primer
10.8 9.6 7.5 8.2 9.9
7.7 9.6 este
10.6 caso10.1
la parte8.4
entera de los elementos de los datos) como sigue:
8.3 9.6 10.1 10.4 10.6

Para producir la 7gráfica se hace una lista vertical de los tallos (los primeros dígitos,
o bien en este caso
8 la parte entera de los elementos de los datos) como sigue:

7
9
8 10
9
11
10
11
Después se dibuja una línea vertical a la derecha de los tallos y se listan la
Después se dibuja una línea vertical a la derecha de los tallos y se listan las hojas
dígito
(el siguiente dígito o eno este
en este
caso caso la parte
la parte decimal
decimal de cada
de cada valor,valor,
para para
cada cada
tallo) tallo) a la
a la derecha deen la el
línea, enen
orden el que
orden en queen
aparecen aparecen en el
el conjunto deconjunto de datos
datos original.
original.
7 8 5 7
8 1 2 2 4 3
9 4 6 3 6 9 6 6
10 6 2 0 8 6 1 1 4 6
11 0

Luego se ordenan todas las hojas en cada renglón en orden de clasificació


EDUBP | LICENCIATURA EN GESTION DE LA SEGURIDAD | estadística - pag.58
7 5 7 8
8 1 2 2 3 4
9 3 4 6 6 6 6 9
en el orden en que aparecen en el conjunto de datos original.

7 8 5 7
8 1 2 2 4 3
9 4 6 3 6 9 6 6
10 6 2 0 8 6 1 1 4 6
11 0

Luego se ordenan todas


Luego se las hojas todas
ordenan en cada
lasrenglón
hojas enencada
orden de clasificación.
renglón en orden de clasificació

7 5 7 8
8 1 2 2 3 4
9 3 4 6 6 6 6 9
10 0 1 1 2 4 6 6 6 8
11 0

Cada renglón en la gráfica corresponde a un tallo con sus correspondientes hojas;


de esta manera a partir de este diagrama es posible reconstruir todos y cada uno de
los valores originales de la variable estudiada, entonces se mantienen los datos de
origen, no se pierde información como podría ocurrir con una tabla de frecuencias
en la que un determinado intervalo condensa varios valores de la variable.

Si se gira la página en 90º en sentido contrario a las agujas del reloj, se obtiene
una figura que se asemeja al histograma, haciendo la salvedad de que aquí
con este diagrama de tallo y hoja se mantienen todos los valores originales –tal
como se expresó– y esto se convierte en una de las ventajas que presenta este
diagrama en la exploración de los datos.

Con este además es posible tener una idea de la forma que adoptan los datos,
detectar el valor de la variable mínimo, máximo y más frecuente. En nuestro
ejemplo, la relación precio-utilidad que más se presenta es 9,6 ya que 4 empresas
tienen dicha relación.

2.2. Resumen de cinco números

En esta técnica descriptiva se utilizan cinco valores para describir un conjunto


de datos; ellos son:

- Valor mínimo
- Primer cuartil
- Mediana
- Tercer cuartil
- Valor máximo

La manera más fácil de elaborar este resumen de datos es poner los mismos
en orden ascendente. Veamos un ejemplo. Supongamos que contamos con la
información relativa a la cantidad de lluvia anual caída en una región geográfica
determinada de nuestro país; los valores corresponden a 17 mediciones, esto
servirá de utilidad al gobierno para tomar medidas al respecto.

525 570 610 550 612 630 633 510


570 600 614 600 320 615 632 640 510

Como expresamos, lo primero que debemos hacer es ordenar los datos:

320; 510; 510; 525; 550; 570; 570; 600; 600; 610; 612; 614; 615; 630; 632; 633; 640

1er. cuartil = 537,50 2do. cuartil= 600 3er. cuartil= 622,50


(Mediana)

Recordemos que los cuartiles y la mediana ya fueron estudiados en el módulo


relativo a las medidas descriptivas, por lo que le recomiendo repasar, de ser
necesario, dicho módulo.

EDUBP | LICENCIATURA EN GESTION DE LA SEGURIDAD | estadística - pag. 59


Para nuestro ejemplo, el resumen de cinco números es:

- Valor mínimo: 320 mm.


- Primer cuartil: 537,50 mm.
- Mediana: 600 mm.
- Tercer cuartil: 622,50 mm.
- Valor máximo: 640 mm.

Recordando la interpretación de los cuartiles, podemos ahora aplicarla en este


caso en particular, agregando en el análisis e interpretación los valores mínimo
y máximo de la variable.

2.3. Diagrama de caja

Este diagrama es útil para revelar la tendencia central, la dispersión, la forma de


la distribución de los datos y la presencia de valores distantes.

La base de la construcción de este diagrama es el cálculo de los tres cuartiles


(primero, segundo coincidente con la mediana y tercero). También se utiliza el
rango intercuartílico (diferencia entre el tercer y el primer cuartil).

Vamos a construir este diagrama con los datos del milimetraje de lluvia medido
en 17 oportunidades en una región geográfica.

Los pasos para trazar este diagrama son los siguientes:

1) Se traza un rectángulo (caja) con los extremos en el primer y el tercer cuartil.


Este rectángulo contiene el 50% central de las observaciones. En nuestro
caso esos extremos de la caja serán, 537,50 mm (1er. cuartil) y 622,50 mm.
(3er. cuartil). Esta caja contendrá el 50% central de los datos.
2) En el interior de la caja se traza una línea vertical en el lugar de la mediana.
En el ejemplo que venimos presentando es 600 mm. (2do. cuartil).
3) Se indican en el gráfico los límites. Los límites se encuentran a 1,5 veces
el rango intercuartílico por debajo del primer cuartil y 1,5 veces el rango
intercuartílico por encima del tercer cuartil. En nuestro ejemplo los límites
son: 410 mm. (límite inferior) y 750 mm. (límite superior).
4) Se trazan los brazos (o bigotes) mediante líneas punteadas (o bien línea
entera) que van desde los bordes de la caja (cuartil primero y tercero) hasta
el valor mínimo y máximo del conjunto de datos, respectivamente, dentro de
los límites calculados. En nuestro caso los brazos terminan en los valores de
410 mm. y 640 mm.
5) Finalmente se marca con un asterisco (*) la ubicación de los valores atípicos. En
el caso planteado se presenta un valor atípico, correspondiente a los 320 mm.

En el ejemplo presentado se observa un valor inusitado o atípico (la medición


de 320 mm.) que se aleja demasiado del milimetraje anual de la región en las
restantes mediciones; además se puede concluir que el 75% de las mediciones
de mm. caídos se presentan concentrados a la derecha de los 537,50 mm. (1er.
cuartil).

La siguiente figura muestra el diagrama de caja y brazos para los datos de los
mm. de lluvia.

EDUBP | LICENCIATURA EN GESTION DE LA SEGURIDAD | estadística - pag.60


puede concluir que el 75% de las mediciones de mm. caídos se presen
derecha de los 537,50 mm. (1er. cuartil).

La siguiente figura muestra el diagrama de caja y brazos para los datos d

200 250 300 350 400 450 500 550 600 650 700

milímetros de lluvia

Figura
Figura 1 1

En la construcción del diagrama de caja y brazos es posible la detección de


valores inusitados, es decir aquellos datos distantes, en el sentido de que
están muy alejadosEn de la mayor parte
la construcción delde los datos.
diagrama de Al explorar
caja unes
y brazos conjunto
posible de
la detección
datos es necesario considerar aquellos valores distantes ya que podrían revelar
es deciroaquellos
información importante, datos
bien podría distantes,
tratarse en el sentido
de errores de que están
en la medición o en muy
la alejado
carga de los datos,
loslodatos.
que implicaría queun
Al explorar seconjunto
está trabajando
de datosconesvalores erróneos
necesario considerar aqu
que por supuesto deberían corregirse o eliminarse. En general, deberíamos
eliminar aquellos ya que podrían
valores revelar
distantes que información
son errores importante, o biena podría
obvios, aunque menudo tratarse de
puede ocurrir queoesos
en lavalores atípicos
carga de sean lo
los datos, anomalías interesantes
que implicaría que seque
estádeban
trabajando con
investigarse más a fondo.
por supuesto deberían corregirse o eliminarse. En general, deberíam
Tanto el resumen valores
de cincodistantes
números que
comoson errores obvios,
el diagrama de cajaaunque
y brazosa son
menudo
útiles puede oc
para hacer un análisis de la forma en que se distribuye el conjunto de datos.
atípicos sean anomalías interesantes que deban investigarse más A a fond
saber:

- Cuando un conjunto
Tanto elderesumen
datos esde simétrico, la mediacomo
cinco números y la mediana son iguales
el diagrama de caja y brazos
y, además la longitud del brazo o bigote izquierdo será igual a la del derecho,
unmediana
y la línea de la análisis dividirá
de la forma en en
la caja quepartes
se distribuye
iguales.el conjunto de datos. A saber
- Cuando un conjunto de datos presenta una asimetría hacia la izquierda, la
media será más pequeña que la mediana, justamente las pocas observaciones
- Cuando un conjunto de datos es simétrico, la media y la mediana so
pequeñas desplazan a la media hacia la izquierda; la concentración de
longituda del
los valores se observa brazo o bigote
la derecha de la izquierdo
gráfica yaserá
queigual a lade
el 75% dellas
derecho, y
observaciones se encuentra entre el primer cuartil y el extremo derecho del
dividirá la caja en partes iguales.
brazo (valor máximo).
- - Cuando
Un análisis similar, un conjunto
pero inverso, de datosen
se presenta presenta una asimetría
un conjunto de datoshacia
con la izquier
sesgo o asimetríapequeña
derecha.que la mediana, justamente las pocas observaciones peq

2.4. Regla empírica media hacia la izquierda; la concentración de los valores se obser

En los conjuntos simétricos de datos, una parte considerable de ellos tiende a


concentrarse en torno del valor de la media. Ya se vio que podemos determinar
la asimetría de la distribución comparando tanto media y mediana (cuando se
estudió acerca de la forma de una distribución, en módulos anteriores), como del
AED mediante el diagrama de caja y brazos. Cuando no existe un sesgo extremo
y se observa una alta concentración de los datos en torno de las medidas de
tendencia central (media y mediana), es posible utilizar la llamada regla empírica
para examinar la propiedad de variabilidad de los datos y adquirir una idea más
clara de lo que mide la desviación estándar.

EDUBP | LICENCIATURA EN GESTION DE LA SEGURIDAD | estadística - pag. 61


La regla empírica establece que para un conjunto de datos simétrico o
prácticamente simétrico, aproximadamente dos de cada tres observaciones
(es decir el 68%) se encuentra adentro de una distancia de una desviación
estándar con respecto de la media, y entre el 90 y el 95% de las observaciones
se encuentran a una distancia de dos desviaciones estándar alrededor de la
media.

Por lo tanto, la desviación estándar, como medida del promedio de variación


alrededor de la media aritmética, nos ayuda a comprender la distribución de las
observaciones arriba o abajo de la media y detectar observaciones inusitadas
o poco usuales (valores atípicos), cuando analizamos un conjunto de datos
cuantitativos.

Supongamos que contamos con los montos de ventas de 50 empresas que


tienen en su misión trabajar en Responsabilidad Social Empresaria. Los 50
montos (expresados en miles de pesos) se presentan a continuación.

10,3 13,0 13,0 8,0 11,1 11,6 10,0 12,5 9,3 10,5
11,1 6,7 11,2 11,8 10,2 15,1 12,9 9,3 11,5 7,6
9,6 11,0 7,3 8,7 11,1 12,5 9,2 10,4 10,7 10,1
9,0 8,4 5,3 10,6 9,9 6,5 10,0 12,7 11,6 8,9
14,5 10,3 12,5 9,5 9,8 7,5 12,8 10,5 7,8 8,6

En este ejemplo, las 50 empresas constituyen la población de empresas que se


enrolan en la RSE en el último año. Por lo tanto los datos son poblacionales.

Si a este conjunto de montos de operaciones se les calcula las medidas


descriptivas, se llega a los siguientes valores:

Media (µ) = 10,28 miles de $


Mediana = 10,30 miles de $
Desviación estándar (σ) = 2,045 miles de $

Además es posible concluir, del análisis estadístico descriptivo, que la distribución


de los montos de las operaciones es prácticamente simétrica; entonces es
factible aplicar la regla empírica.

Si nos fijamos en los datos presentados, es posible advertir que 32 de los montos
(aproximadamente el 64%) se encuentran entre µ ± σ (es decir, entre los 8,24 y
los 12,33 miles de $), en tanto que 47 montos (alrededor del 94%) se hallan a µ
± 2σ (es decir, entre 6,19 y 14,37 miles de $).

3. Medidas de asociación entre dos variables

Con frecuencial, a quien toma decisiones le interesa la relación entre dos


variables. A continuación veremos dos herramientas estadísticas que permiten
analizar e interpretar la relación entre dos variables.

Supongamos que el gerente de RRHH de una empresa que tiene en su misión


trabajar en RSE desea investigar la relación entre la cantidad de anuncios donde
se da a conocer a la comunidad sobre el accionar de la firma en el tema –y que
aparecen en la revista de divulgación que mensualmente edita la empresa– y
las ventas de los productos y servicios de la empresa (en miles de pesos) en
los meses posteriores a la promoción de las acciones. Con tal fin selecciona
aleatoriamente 10 meses en los que se publicaron las acciones de RSE llevadas

EDUBP | LICENCIATURA EN GESTION DE LA SEGURIDAD | estadística - pag.62


a cabo en la sociedad. La tabla siguiente
Cantidad Ventas
presenta los datos de las dos variables
de interés (x = cantidad de anuncios;
de anuncios (en milesyde=$)monto de ventas en miles de $).
x y
Cantidad Ventas
1 41
de anuncios (en miles de $)
2 x 50 y
4 54
5 1 57 41
2 2 46 50
4 4 59 54
5 5 63 57
1 2 38 46
3 4 54 59
3 5 48 63
1 38
3 54
3 48
Tabla 1
Tabla 1
El primer paso para investigar si existe o noTabla 1 entre estas variables c
relación
El primer paso para investigar si existe o no relación entre estas variables
un diagrama
consiste en construir de dispersión,
un diagrama tal como
de dispersión, tal se muestra
como en la figura
se muestra siguiente.
en la figura
siguiente. El primer paso para investigar si existe o no relación entre estas va
un diagrama de dispersión, tal como se muestra en la figura siguien
Diagrama de dispersión para la empresa

de agroquímicos
70 Diagrama de dispersión para la empresa
65
de agroquímicos
60 70
Ventas (en miles de $)

55 65
50 60
Ventas (en miles de $)

45 55
40 50
35 45
30
40
0 1 2 3 4 5 6
35
cant.de anuncios
30
0 1 2 3 4 5 6
Figura
Figura3 3
cant.de anuncios
Al observar la nube de puntos o diagrama de dispersión, se aprecia una relación
en sentido positivo entre laslados
Al observar variables.
nube de puntos Figura
Vamos 3
a calcular
o diagrama dea dispersión,
continuaciónseuna
aprecia una
medida descriptiva que refleje lo que se observa en el gráfico.
positivo entre las dos variables. Vamos a calcular a continuación una med
refleje lo Al
3.1. Covarianza queobservar la nube
se observa en elde puntos o diagrama de dispersión, se apre
gráfico.
positivo entre las dos variables. Vamos a calcular a continuación
En el caso de que se desee lograr una medida de variabilidad conjunta de dos
refleje lo que se observa en el gráfico.
variables cuantitativas, la covarianza es una medida que nos permite analizar
si existe relación
3.1.entre las variables que se desean estudiar. Es una medida
Covarianza
(absoluta) de asociación entre dos variables.
En el caso de que se desee lograr una medida de variabilidad conjunt
de una 3.1. Covarianza
La covarianza cuantitativas,
muestra de pares es
la covarianza de una
datos se calcula
medida que nosdepermite
la siguiente
analizar si exis
manera:
variablesEn
queelsecaso de estudiar.
desean que se desee
Es unalograr
medida una medida de
(absoluta) deasociación
variabilidad
e
Sumatoria del producto cuantitativas, la covarianza
de las diferencias entre es
losuna medida
valores de que
una nos permite analiz
variable
respecto de su media yvariables
la diferencia de desean
los valores
quemuestra
se de la otra variable respecto
La covarianza de una de estudiar.
pares de Es una
datos medida
se calcula(absoluta) de asom
de la siguiente
de su media, dividido por el tamaño de la muestra menos uno.

La covarianza
EDUBP | LICENCIATURA de una
EN GESTION DEmuestra de pares
LA SEGURIDAD de datos
| estadística se calcula
- pag. 63 de la s
tamaño de la muestra menos uno.

Cov � x; y � =
� �x � x ��Sumatoria
y � y � del producto de las diferencias entre los valores de
n �media
1 y la diferencia de los valores de la otra variable respecto
tamaño de la muestra menos uno.

para �calcular
aplicaremos la fórmula Cov
��
x�x y� y�� �
En la tabla de los datos, a cada cantidad de anuncios le corresponde un monto de v
x; y � = la covarianza a este conjunto de datos.
n �1
En la tabla de los datos, a cada cantidad de anuncios le corresponde un monto
Con los datos de las dos variables calculamos la media aritmética, tanto para la cantid
de ventas; aplicaremos la fórmula para calcular la covarianza a este conjunto de
anuncios comerciales en los micros de agro como de las ventas del producto. Dichas m
datos.
En la tabla de los datos, a cada cantidad de anuncios le corres
resultan ser:
Con los datos de las dosaplicaremos
variables calculamos la media
la fórmula para aritmética,
calcular tanto para
la covarianza la conjunto
a este
cantidad de anuncios comerciales en los micros de agro como de las ventas del
producto. Dichas medias resultan ser:
Media aritmética de la cantidad de anuncios: x = 3
Con los datos de las dos variables calculamos la media aritmétic
Media aritmética de la cantidad de anuncios: =3
Mediaaritmética
Media aritméticadel
delmonto
monto deventas
anuncios
de ventas== y =
= 51
comerciales (miles
en(miles
51 de
de $)
los micros
$) de agro como de las ventas
resultan ser:
La tabla que sigue muestra los cálculos necesarios para determinar la
La tabla que sigue muestra los cálculos necesarios para determinar la covarianza.
covarianza.
Media aritmética de la cantidad de anuncios: x = 3
x y xi - M(x) yi - M(y) (xi - M(x)) (yi - M(y))
Media aritmética del monto de ventas = y = 51 (miles de $)
1 41 -2 -10 20
2 50 -1 -1 1
4 54 1 3 3
5 57La tabla que sigue
2 muestra6 los cálculos necesarios
12 para determina
2 46 -1 -5 5
4 59 x 1 y 8 xi - M(x) 8 yi - M(y) (xi - M(x))
5 63 2 12 24
1 38 1 -2 41 -13 -2 26 -10 20
3 54 2 0 50 3 -1 0 -1 1
3 48 4 0 54 -3 1 0 3 3
5 57 2 99 6 12
2 46 -1 -5 5
4 Tabla 2 59 1 8 8
Tabla 2 5 63 2 12 24
Aplicando la fórmula de la covarianza,
1 esta resulta
38 ser: -2 -13 26
3 54 0 3 0
Cov (x; y) = 11 3 48 0 -3 0
Aplicando la fórmula de la covarianza, esta resulta ser: 99
Nota: cabe acotar que si en lugar de trabajar con una muestra de pares de datos
se trabaja con la población, es decir con el total de parejas de datos para las
variables de=interés,
Cov (x; y) 11 en la fórmula de laTabla 2
covarianza la suma de los productos se
debe dividir por N (tamaño de la población), en lugar de n-1.

Analicemos el valor obtenido para la covarianza.


Aplicando la fórmula de la covarianza, esta resulta ser:
Nota: cabe acotar que si en lugar de trabajar con una muestra de pares de datos se traba
El valor distinto de cero indica que hay asociación lineal entre las variables. En
la población,
este es positivo
caso un valor decir conde el total de parejas
la covarianza de datosuna
está indicando para las variables
relación directa ode interés,
Cov (x; que
positiva, es decir que a medida y) = una
11 variable crece también lo hace la otra: a
medida que aumenta la cantidad de anuncios en las publicaciones de la empresa,
aumentan las ventas de los productos y servicios en los meses posteriores.

Para el caso de que la covarianza


Nota: cabeasuma
acotarunque
valor negativo,
si en lugar deello estaríacon
trabajar indicando
una muestra de p
una relación inversa o negativa entre las variables, es decir que a medida que
aumentan los valores delauna,
población, es decir
disminuyen con elde
los valores total de yparejas
la otra de datos para las
viceversa.

Cuando la covarianza es igual a cero, está indicando que las variables no se


encuentran asociadas linealmente.

EDUBP | LICENCIATURA EN GESTION DE LA SEGURIDAD | estadística - pag.64


Cuando la covarianza es igual a cero, está indicando que las variables no se encuent
asociadas linealmente.

En los gráficos que siguen se presentan tres diagramas de dispersión hipotéticos que muest
la asociación entre dos variables y la covarianza resultante en cada caso. El prim
corresponde a una covarianza positiva, el segundo a una covarianza negativa y el último a u
En los gráficos que siguen se presentan tres diagramas de dispersión hipotéticos
covarianza igual alacero.
que muestran asociación entre dos variables y la covarianza resultante en
cada caso. El primero corresponde a una covarianza positiva, el segundo a una
covarianza negativa y el último a una covarianza igual a cero.

50000 30

y
40000

20

30000

10

20000

160

y
10000 0
10 20 30 40 50 60 70 80 0 10 20 30

140
x x
160
y

120

140

100

120

80

100
60
10 20 30 40 50 60 70 80

80
x

60
10 20
Figura
30
4
40 50 60 70 80

Figura 4 Figura 4
3.2. Coeficiente de correlación
Según lo expresado acerca de la covarianzam parecería
3.2. Coeficiente de correlación
covarianza indica una fuerte relación lineal positiva y, por
3.2. Coeficiente de correlación
Según lo expresado acerca de de la covarianzam
la covarianzaparecería
indica unaque un valor
fuerte grande
relación lineal negativa
Según lo indica
y positivo de la covarianza expresado acercarelación
una fuerte de la covarianzam
lineal positivaparecería
y, por que
el un valo
otro lado, un valor negativo la
grande covarianza se presenta el problema de la magnitud en
covarianza indicade la fuerte
una covarianza indica
relación una
lineal fuertey,relación
positiva por el otro lado,
lineal negativa entre las variables.ya que esta es una
Sin embargo, enmedida absolutasedepresenta
la covarianza variabilidad conju
de la covarianza
el problema de la magnitud en que estánindicaexpresadas
una fuerte las
relación linealya
variables, negativa
que esta entre las va
que estén medidas las variables a relacionar. Este incon
es una medida absoluta de variabilidad
la covarianza conjunta
se presenta y se ve afectada
el problema por la unidad
de la magnitud en que están e
en que estén medidas las variables medida relativa de
a relacionar. variación
Este conjuntaseque
inconveniente se llama coefici
subsana
ya que
calculando una medida esta es
relativa de una medida
variación absolutaque
conjunta de se
variabilidad conjunta y se ve a
llama coeficiente
de correlación: que estén medidas las variables a relacionar. Este inconveniente se
Cov � x; y �
r =de variación conjunta que se llama coeficiente de corre
medida relativa
sx � s y
El coeficiente de correlación (r) permite medir la intensidad en la asociación
� �
Cov x; y de –1 a 1. Valores de r próximos a –1 ó a 1
r =su valor varía
lineal de las variables;
s x � s y Ellineal
indican un alto grado de relación coeficiente
entre lasdevariables,
correlación (r) permite
en tanto medir la inten
que valores
cercanos a 0 están indicando ausencia variables;desu valor varía
relación linealde –1 alas1.variables,
entre Valores delo r próximo
cual no significa que no existe algún otro tipo de relación no lineal.
relación lineal entre las variables, en tanto que valores ce
El coeficiente de correlación (r) permite medir la intensidad en la
EDUBP | LICENCIATURA EN deGESTION
relaciónDElineal entre las| estadística
LA SEGURIDAD variables,- pag.
lo cual
65 no signifi
variables; su valor varía de –1 a 1. Valores de r próximos a –1 ó a 1
relación no lineal.
relación lineal entre las variables, en tanto que valores cercanos a 0 e
de relación lineal entre las variables, lo cual no significa que no e
Entonces, con el coeficiente de correlación se puede analizar no sólo el sentido
en que se relacionan las variables, lo que viene dado por el signo positivo o
Ya habíamos visualizado a través del diagrama de dispersión qu
negativo del coeficiente, sino que también podemos medir el grado en que se
vinculan las variables, yaoque
directa entre
cuanto másla cercano
cantidadade anuncios
1 sea del accionar
el coeficiente, mejorsocial de l
y más fuerte es la asociación, y cuanto más cercano a 0, más débil resulta la
revistas mensuales y las ventas posteriores de los productos y se
relación entre las variables.
covarianza entre las variables habíamos llegado a un valor p
Veamos qué sucede con nuestro ejemplo.
existencia Calculemos
de una relaciónellineal
coeficiente de correlación
positiva entre dichas variab
para las variables que le interesaba al gerente de RRHH de la empresa que
emprende acciones de RSE. coeficiente de correlación.
Ya habíamos visualizado a través del diagrama de dispersión que existía una
relación positiva o directa entre la cantidad de anuncios del accionar social de
la firma que aparecían en Para
las poder aplicar
revistas la fórmula
mensuales y las del coeficiente
ventas de correlación
posteriores de e
los productos y servicios. previamente
Además, al las desviaciones
calcular estándar
la covarianza entrede
lascada una de las va
variables
habíamos llegado a un valor positivo, lo que confirmaba la existencia de una
módulos anteriores, cuando estudiamos las medidas de dispersi
relación lineal positiva entre dichas variables; calculemos entonces el coeficiente
de correlación. desviaciones estándar de una muestra.

Para poder aplicar la fórmula del coeficiente de correlación es necesario que


Lasdesviaciones
calculemos previamente las desviacionesestándar
estándardepara cada
cada unavariable son:
de las variables.
Recordemos que en módulos anteriores, cuando estudiamos las medidas de
Desviación estándar (x): s = 1,4907 anuncios
dispersión, aprendimos a calcular las desviaciones xestándar de una muestra.
Desviación estándar (y): s y = 7,9303 miles de $
Las desviaciones estándar para cada variable son:
Desviación estándar (x): = 1,4907 anuncios
Desviación estándar (y): = 7,9303 miles de $
Como ya vimos que la covarianza de las variables era igual a 11,
Como ya vimos que la covarianza de lasde
del coeficiente variables era igual
correlación, a 11,
por lo ahora podemos
tanto:
llegar al valor del coeficiente de correlación, por lo tanto:

11
r = = 0,93
1,4907 � 7,9303

Ante este resultado del coeficiente de correlación, se puede concluir que existe
Ante entre
una alta asociación positiva este resultado del coeficiente
las variables; de correlación,
en otras palabras, la mayorse puede
cantidad de anuncios que publica lapositiva
asociación firma dando
entre alas
conocer el accionar
variables; en otrasenpalabras,
RSE la ma
se asocia con mayores montos de ventas de los productos y servicios en los
publica
meses posteriores y el grado en la
quefirma dando a conocer
se relacionan las doselvariables
accionaresenfuerte.
RSE se asocia c
de los productos y servicios en los meses posteriores y el grado
Nota: si se está trabajando con los datos poblacionales, en la ecuación para
variables es fuerte.
calcular el coeficiente de correlación se deberán tomar los valores de los
parámetros, es decir la covarianza poblacional entre las dos variables, y se
la dividirá por el producto de las desviaciones estándar poblacionales de las
variables.
Nota: si se está trabajando con los datos poblacionales, en
Con respecto al coeficiente de correlación,
coeficiente es muy importante
de correlación lo siguiente:
se deberán tomar los valores de

- Se debe tener cuidadocovarianza poblacional


de evitar concluir entre las dos
que la correlación variables,
implica y se la divi
causalidad.
Cuando se concluyedesviaciones
que existe una correlación
estándar entre dos
poblacionales variables,
de las esto
variables.
significa que las dos variables están vinculadas linealmente de manera
positiva o negativa, pero esto no significa que una sea la causa de la otra.
- La conclusión de que no existe correlación lineal no implica que entre la dos
variables no existe otro tipo de relación que no sea la lineal. Este coeficiente
Con respecto al coeficiente de correlación, es muy importante lo s
mide la fuerza de una asociación lineal entre dos variables.
- Se debe tener cuidado de evitar concluir que la correlación i
concluye que existe una correlación entre dos variables, esto
EDUBP | LICENCIATURA EN GESTION DE LA SEGURIDAD | estadística - pag.66
m4 material

Material de consulta obligatoria

• TRIOLA, Mario F.: Estadística Elemental. México. Editorial Pearson


Educación. 2000, séptima edición.

• ANDERSON, David; SWEENEY, Dennis y WILLIAMS, Thomas: Estadística


para Administración y Economía. México. Internacional Thompson. 1999.

Material de consulta complementaria

• HANKE y REITSCH: Estadística para Negocios. España. Editorial Irwin.


1995.

• LEVIN, RUBIN, BALDERAS, DEL VALLE y GÓMEZ: Estadística para


Administración y Economía. México. Editorial Prentice Hall. 2004, séptima
edición.

• BERENSON, LEVINE y KREHBIEL: Estadística para administración.


México. Editorial Prentice Hall. 2001.

m4 actividades

m4 | actividad 1

Explorando los datos

Un día como tantos otros, usted llega a su trabajo y consulta su correo electrónico.
Allí se encuentra con un mensaje del jefe del departamento de Estadística de la
consultora, quien le plantea lo siguiente:

“El lunes pasado los encuestadores de mi departamento terminaron de


recopilar la información sobre un trabajo de campo que se encaró desde
la consultar a los fines de conocer la cantidad de robos de vehículos
denunciados a las seccionales de policía durante el año pasado. Esta mañana
envié a vuestro departamento los datos para que usted analice los mismos
y pueda producir un informe. En este momento, en nuestro departamento
la gente se encuentra abocada a otra investigación de mercado de gran
magnitud, encargada por otro de los clientes de la consultora. Es por ello
que les pido una colaboración especial. Ahora bien, este fin de semana,
revisando la información que le remití a vuestro superior, constaté un error
de tipeo en uno de esos valores, ya que donde dice 31413, debió decir
13413. La tarea encomendada sigue siendo la misma, sólo que es ahora
una inquietud mía saber si usted, a través del análisis de los datos, hubiera
detectado el error”.

Los datos que le fueran enviados hace unos días, fueron los siguientes:

EDUBP | LICENCIATURA EN GESTION DE LA SEGURIDAD | estadística - pag. 67


8305 4019 6452 1872 31413 1356 2127 2459 2818 739
8879 1850 4341 8408 608 10498 3653 1374 14138 7478 5794

Hoy tiene un gran desafío. Podrá demostrar a su superior y al del departamento


de Estadística cómo el empleo de un análisis exploratorio de datos resulta
sumamente útil a la hora de detectar posibles errores, como sucede en este
caso. Procese la información y genere el informe correspondiente, dando cuenta
de las implicancias del AED a la hora de analizar los datos y previo a la toma de
decisión.

A 1
C 1

m4 | actividad 1 | AA

asistente académico 1

Esta situación lo enfrenta con la necesidad de aplicar el análisis exploratorio


de datos (AED). Le sugiero realizarlo tanto para el primer conjunto de datos, es
decir el que le envió el encargado del departamento de Estadística en primer
lugar, como para el conjunto de datos con la corrección que le indicó luego.
Esto le permitirá comparar el efecto del error en el tipeo de uno de los valores
de la variable y hacer un informe completo. Además, podrá demostrar así la
importancia del análisis exploratorio como herramienta estadística.

Para esta actividad, considero que sería interesante para usted repasar todo lo
relativo al resumen de cinco números y al diagrama de caja y brazos vistos en
este módulo.

Le recuerdo que se encuentra abierta la posibilidad de completar el AED con


el análisis estadístico descriptivo que usted ya conoce y utilizó en los módulos
anteriores.

En función de lo que se presenta hasta aquí, usted se encuentra en condiciones


de elaborar conclusiones. ¡¡Adelante!!
Estadística: Módulo 4

Actividad 1: Explorando los datos


m4 | actividad 1 | AA
Clave de Corrección 1
clave de corrección 1

a) Con los datos originales:

El resumen de los cinco números es el siguiente:

Estadísticos

unidades robadas
Mínimo 608
Máximo 31413
Percentiles 25 1861,00
50 4019,00
75 8356,50

Diagrama deEDUBP
caja y| brazos
LICENCIATURA EN GESTION DE LA SEGURIDAD | estadística - pag.68
unidades robadas
Mínimo 608
Máximo 31413
Percentiles 25 1861,00
50 4019,00
75 8356,50

Diagrama de caja y brazos

0 10000 20000 30000 40000

unidades robadas

b) Con los datos corregidos:

El resumen de los cinco números es el siguiente:

Estadísticos

unid.robadas corregidas
Mínimo 608
Máximo 14138
Percentiles 25 1861,00
50 4019,00
75 8356,50

Diagrama de caja y brazos

0 2000 4000 6000 8000 10000 12000 14000 16000

unidades robadas

EDUBP | LICENCIATURA EN GESTION DE LA SEGURIDAD | estadística - pag. 69


m4 | actividad 2

Asesorar en otra área… todo un desafío…

Nuevamente, usted se enfrenta con la posibilidad de aplicar sus conocimientos


en Estadística. Esto no deja de causarle entusiasmo, ya que nunca imaginó que
esta disciplina le resultara de tanta utilidad en temas tan variados, como por
ejemplo el que se menciona a continuación.
El encargado del área de Estadística, ha quedado sumamente conforme con
su desempeño en el análisis de datos y la presentación de aquel informe con
la aplicación de las técnicas de AED ¿Recuerda la actividad anterior? Luego de
esta experiencia, se requiere nuevamente de su colaboración.

Un productor agropecuario, cliente de la consultora, hoy se encuentra afectado


seriamente por las inundaciones. Por esta razón, le encargó a la consultora un
análisis de relación entre los milímetros de lluvia caída en el año, en la región
geográfica donde tiene su explotación, y las toneladas cosechadas de cereal. El
cliente se encuentra interesado en averiguar si existe una vinculación entre estas
variables, dado que los avances en la ciencia meteorológica posibilitan adelantarse
y conocer los cambios climáticos. Asimismo, quiere confirmar la existencia de
asociación entre la cantidad de lluvia caída y las toneladas producidas. Por último,
el productor desea conocer qué tan fuerte es esa relación, para poder estimar las
futuras cosechas en función de los datos climáticos y decidir sobre la rotación de
cultivos o alternancia con la actividad pecuaria, de ser necesario.

La información con la que cuenta es la siguiente:

Milímetros Toneladas Frecuencia


525 12 2
570 18 1
610 20 4
550 15 1
612 21 3
630 25 4
633 27 1
632 26 1
640 28 2
510 11 1
510 10 1
570 20 2
600 28 4
614 22 2
600 18 1
648 29 1
615 24 3
Las mediciones corresponden a los milímetros de lluvia caídos en un determinado
año para un conjunto de establecimientos semejantes de la región geográfica en
la que se encuentra el cliente al que asesora la consultora, y a las cantidades
cosechadas de cereal (en toneladas).

Como usted puede advertir, el análisis apropiado de los datos que realice será más
útil al productor agropecuario, y a usted le viene como anillo al dedo para poner
en práctica lo visto en la materia sobre la relación y asociación de variables.

No lo dude. ¡Manos a la obra!

A 1 C 1

EDUBP | LICENCIATURA EN GESTION DE LA SEGURIDAD | estadística - pag.70


m4 | actividad 2 | AA

asistente académico 1

Para resolver esta nueva situación donde se enfrenta con los requerimientos
de un productor agropecuario, le recomiendo revisar todo aquello relativo
a la asociación y correlación de dos variables. Calcule los coeficientes
correspondientes y realice la interpretación adecuada de estos.
Estadística - Módulo 4

Actividad 2: Asesorar en otra área… todo un desafío…


m4 | actividad 2 | AA
Clave de Corrección 1
clave de corrección 1

Lo primero queLo se primero


deberíaque se es
hacer debería hacer de
un gráfico es dispersión,
un gráfico dea dispersión, a fin de detectar
fin de detectar
dosdos
si existe entre las variables alguna
variables relación.
alguna relación.

El gráficoes
El gráfico de dispersión deeldispersión
siguiente:es el siguiente:

30

25

20

15

10

5
toneladas

0
500 520 540 560 580 600 620 640 660

milímetros de lluvia

Usted podrá advertir aquí la existencia de una relación directa entre las
Usted podrá advertir aquí la
milímetros deexistencia de una
lluvia caídos relacióncosechadas
y toneladas directa entrede
lascereal.
siguientes
variables: milímetros de lluvia caídos y toneladas cosechadas de cereal.
Para medir esa asociación calculamos ahora la covarianza.
Para medir esa asociación calculamos ahora la covarianza.
A partir de los datos se calcularon las medias aritméticas y las desviacione
A partir de los una de las
datos variables. Las
se calcularon lasmedidas
medias resumen sonylas
aritméticas lassiguientes:
desviaciones
estándar para cada una de las variables. Las medidas resumen son las
siguientes: - Para la variable milímetros:
Media aritmética: 599,76 mm.
Desviación
- Para la variable estándar: 37,24 mm.
milímetros:
Media aritmética: 599,76 mm.
- Para 37,24
Desviación estándar: las toneladas
mm. cosechadas:
Media aritmética: 21,91 tn.
Desviación estándar: 5,30 tn.
- Para las toneladas cosechadas:
Media aritmética:
La 21,91
tabla tn.
siguiente contiene los cálculos necesarios para el numerador
Desviación estándar: 5,30 tn.
covarianza.

La tabla siguiente contiene los cálculos necesarios para el numerador de la


fórmula de la covarianza.

EDUBP | LICENCIATURA EN GESTION DE LA SEGURIDAD | estadística - pag. 71


milím. Tn.
x y ( x - 599,76 ) ( y - 21,91 ) ( x - 599,76 ) (y - 21,91 )
milím. Tn.
525 12 -74,76 x
-9,91 y ( x -740,87
599,76 ) ( y - 21,91 ) (x-5
525 12 -74,76 -9,91 740,87
570 18 -29,76 525
-3,91 12 -74,76
116,36 -9,91
610 20 10,24 525
-1,91 12 -74,76
-19,56 -9,91
610 20 10,24 570
-1,91 18 -29,76
-19,56 -3,91
610 20 10,24 610
-1,91 20 10,24
-19,56 -1,91
610 20 10,24 610
-1,91 20 10,24
-19,56 -1,91
550 15 -49,76 610
-6,91 20 10,24
343,84 -1,91
612 21 12,24 610
-0,91 20 10,24
-11,14 -1,91
612 21 12,24 550
-0,91 15 -49,76
-11,14 -6,91
612 21 12,24 612
-0,91 21 12,24
-11,14 -0,91
630 25 30,24 612
3,09 21 12,24
93,44 -0,91
630 25 30,24 612
3,09 21 12,24
93,44 -0,91
630 25 30,24 630
3,09 25 30,24
93,44 3,09
630 25 30,24 630
3,09 25 30,24
93,44 3,09
633 27 33,24 630
5,09 25 30,24
169,19 3,09
632 26 32,24 630
4,09 25 30,24
131,86 3,09
640 28 40,24 633
6,09 27 33,24
245,06 5,09
640 28 40,24 632
6,09 26 32,24
245,06 4,09
510 11 -89,76 640
-10,91 28 40,24
979,28 6,09
510 10 -89,76 640
-11,91 28 40,24
1069,04 6,09
570 20 -29,76 510
-1,91 11 -89,76
56,84 -10,91
570 20 -29,76 510
-1,91 10 -89,76
56,84 -11,91
600 28 0,24 570
6,09 20 -29,76
1,46 -1,91
600 28 0,24 570
6,09 20 -29,76
1,46 -1,91
600 28 0,24 600
6,09 28 0,24
1,46 6,09
600 28 0,24 600
6,09 28 0,24
1,46 6,09
614 22 14,24 600
0,09 28 0,24
1,28 6,09
614 22 14,24 600
0,09 28 0,24
1,28 6,09
600 18 0,24 614
-3,91 22 14,24
-0,94 0,09
648 29 48,24 614
7,09 22 14,24
342,02 0,09
615 24 15,24 600
2,09 18 0,24
31,85 -3,91
615 24 15,24 648
2,09 29 48,24
31,85 7,09
615 24 15,24 615
2,09 24 15,24
31,85 2,09
615 24 15,24 2,09
615 24 15,24
5602,29 2,09

La covarianza será:
La covarianza será:
5609,26
Cov (x;y) = = 169,77 La covarianza será:
33 5609,26
Cov (x;y) = = 169,77
El valor de la covarianza, al ser un valor positivo, 33 confirma la relación directa entre las toneladas de
cereal cosechadas y los milímetros de lluvia caídos.
El valor de la covarianza, al ser un valor positivo, confirma la relaci
El valor de la covarianza,cereal
al sercosechadas
un valor positivo, confirmadelalluvia
y los analizamos
milímetros relación directa
Ahora, con el cálculo del coeficiente de correlación lineal el gradocaídos.
de asociación lineal
entre las toneladas de cereal cosechadas y los milímetros de lluvia caídos.
entre las dos variables.
Ahora, con el cálculo del coeficiente de correlación lineal analizam
El valor Ahora, con el cálculo
del coeficiente, del coeficiente
entre
que resulta delas devariables.
dos
dividir lacorrelación
covarianzalineal analizamos
por el producto de el grado de
las desviaciones
asociación lineal entre las dos variables.
estándar de las variables es 0,86. Al ser un valor positivo, nos indica una correlación positiva o
directa, y al ser un valor cercano El avalor del indica
1 nos coeficiente,
un altoque resulta
grado de de dividir la lineal
asociación covarianza por
entre las
El
variables. valor del coeficiente, estándar
que de
resulta delas variables
dividir la es 0,86.
covarianza Al ser
por el un valor
producto positivo,
de nos i
las desviaciones estándardirecta,
de las yvariables
al ser un es valor
0,86. cercano
Al ser unavalor
1 nos indica nos
positivo, un alto grado
variables.
indica una correlación positiva o directa, y al ser un valor cercano a 1 nos indica
un alto grado de asociación lineal entre las variables.

EDUBP | LICENCIATURA EN GESTION DE LA SEGURIDAD | estadística - pag.72


m4 | actividad 3

Completando el análisis estadístico…

En otra jornada laboral, usted llega a su oficina y se encuentra con una nota de
su jefe que dice: “Juan, en cuanto llegues pasá por mi despacho”.

Usted no pierde tiempo, deja sus cosas sobre su mesa y se dirige a lo de su


jefe. Mientras camina, piensa: “Ojalá que se trate de una tarea tan interesante
como las que he venido realizando”.

Afortunadamente, este nuevo desafío es interesante y sencillo para usted, que


tiene los conocimientos estadísticos necesarios para resolverla; eso lo pone
cada vez más contento y entusiasta con el estudio.

Le solicitan tomar la información que le pasaron a su jefe desde una institución


educativa. ¿La recuerda? Se trata de la actividad 2 del módulo 3: ¿Cuánto
saben de normas viales? Consistía en el puntaje obtenido por un grupo de
alumnos en relación con los conocimientos que ellos tenían sobre la seguridad
vial.
Lo que debe hacer ahora es completar el análisis estadístico realizado
anteriormente con la aplicación de las técnicas de AED.

Usted se compromete a efectuarlo de inmediato.


No pierde un minuto y busca lo que había procesado en la actividad anterior.

Nuevamente, mucha suerte. Seguramente su informe será satisfactorio para su


superior.

A 1 C 1

m4 | actividad 3 | AA

asistente académico 1

Usted ya cuenta con los datos procesados para el análisis estadístico que le
correspondió hacer con anterioridad. Le sugiero que trabaje con la serie simple
de los datos, ya que ésta le permitirá aplicar la técnica de los cinco datos, el
diagrama de tallo y hoja y el de caja y brazos.
Le sugiero a su vez que vea la factibilidad de aplicar la regla empírica.

m4 | actividad 3 | AA

clave de corrección 1

La serie simple de datos ordenada es la siguiente:

35; 40; 45; 45; 50; 50; 55; 55; 55; 60; 60; 60; 65; 65; 65; 68; 70; 70; 70; 73; 73;
80; 82; 82; 95

El resumen de cinco datos será el siguiente:

EDUBP | LICENCIATURA EN GESTION DE LA SEGURIDAD | estadística - pag. 73


Valor mínimo 35 puntos
Valor máximo 95 puntos
1er. cuartil 52,5 puntos
2do. cuartil 65 puntos
3er. cuartil 71,5 puntos

Diagrama de tallo y hoja

24

30 40 50 60 70 80 90 100

puntaje

Si bien cuando se trabajaron los datos y se hicieron los cálculos de los estadísticos
(media, varianza Si y desviación
bien cuando estándar) a partirlos
se trabajaron dedatos
la tabla
y sedehicieron
frecuencias por
los cálculos de lo
intervalos la distribución
varianzaparecía ser simétrica,
y desviación es posible
estándar) constatar
a partir de que
la al trabajar
tabla de frecuenc
distribución
con los datos originales parecía ser de
sin la presentación simétrica,
una tablaesporposible
intervalosconstatar
y hacer elque al tr
originales
AED, la distribución sin la presentación
no es totalmente simétrica. de una tabla por intervalos y hacer el A
es totalmente simétrica.
La media aritmética a partir de los datos como serie simple, es 62,72 puntos,
por lo tanto no resultan media y mediana exactamente iguales, por lo que la
La media
distribución presenta aritméticaizquierda;
una asimetría a partir depor
loslodatos
tantocomo serie
no sería simple, es 62,72 p
apropiado
resultan
aplicar la regla empírica.
media y mediana exactamente iguales, por lo que la distr
asimetría izquierda; por lo tanto no sería apropiado aplicar la regla emp
Nota: recuerde que siempre que Ud. cuente con los valores individuales de
la variable, el cálculo de las medidas descriptivas será el valor exacto, ya que
cuando se trabaja a partir
Nota: de una
recuerde que tabla de que
siempre distribución de frecuencias
Ud. cuente por individu
con los valores
intervalos dependerá de la tabla que se confeccione el efecto sobre el cálculo
cálculo de las medidas descriptivas será el valor exacto, ya que cuand
de la media y deuna la varianza,
tabla depuesto que cuando
distribución se calculan dichas
de frecuencias medidas adependerá
por intervalos
confeccione
partir de la tabla de frecuencias,el lo
efecto
que sesobre el cálculo
considera de la media
en la fórmula y de son
de cálculo la varianza, p
calculan dichas medidas a partir de la tabla de frecuencias, lo qu
las marcas de clase.
fórmula de cálculo son las marcas de clase.

EDUBP | LICENCIATURA EN GESTION DE LA SEGURIDAD | estadística - pag.74


m4 glosario

Análisis exploratorio de datos (AED): Métodos simples para analizar datos,


que requieren de pocos cálculos y suposiciones principales.

Covarianza: Medida numérica de la asociación lineal entre dos variables.


Sus valores positivos indican una relación positiva; los negativos una relación
negativa.

Diagrama de caja: Resumen gráfico de los datos. Se traza un rectángulo desde


el primer cuartil hasta el tercero, que indica la ubicación del 50% intermedio
de los datos. Luego unas líneas punteadas, llamadas bigotes, que van en los
extremos de la caja y muestran la ubicación de datos mayores que el tercer
cuartil y menores que el primero. También se muestran las ubicaciones de los
valores atípicos.

Diagrama de dispersión: Método gráfico para mostrar la relación entre dos


variables cuantitativas. Una variable se representa sobre el eje horizontal y la
otra sobre el eje vertical.

Diagrama de tallo y hojas: Técnica de análisis exploratorio de datos que clasifica


y ordena simultáneamente los datos cuantitativos y proporciona una perspectiva
de la forma de la distribución.

Medidas de asociación: Herramientas estadísticas que permiten analizar e


interpretar la relación entre dos variables.

Rango intercuartil (RIC): Medida de dispersión, definida como la diferencia


entre el tercer y el primer cuartil.

Regla empírica: Regla que establece los porcentajes de elementos que están
dentro de una, dos y tres desviaciones estándar de distancia del promedio, para
distribuciones con forma de campana.

Resumen de cinco datos: Técnica del AED que consiste en analizar los valores
mínimo y máximo y los cuartiles en un conjunto de datos.

Valor atípico: Valor dentro de los que asume una variable, que se aleja más
allá de la mayoría de los valores y cae fuera de los límites establecidos en un
diagrama de caja y brazos.

e v a l u ación

La versión impresa no incluye las auto-evaluaciones parciales. Las mismas se


encuentran disponibles desde su CD-ROM de materias.

EDUBP | LICENCIATURA EN GESTION DE LA SEGURIDAD | estadística - pag. 75

Anda mungkin juga menyukai