Anda di halaman 1dari 64

Estadstica

Responsable:
Lic. Jessica L. Oliva Gastulo

Chiclayo, Marzo 2014

ASPECTOS BSICOS DE LA ESTADSTICA Y


ORGANIZACIN DE DATOS
ETIMOLOGA DE LA PALABRA ESTADSTICA
La nocin de estadstica procedi primitivamente del vocablo estado, porque ha sido ocupacin
tradicional de todos los gobiernos de la civilizacin llevar registros de las poblaciones que dominaban
o gobernaban, entre eso registros se pueden mencionar: los nacimientos, las defunciones, los censos
poblacionales, cosechas, impuestos y muchas otras clases de cosas y actividades que eran y son de
importancia para un gobernante. Contar y medir estos hechos generan muchas clases de datos
numricos. Esta se ha convertido en un instrumento cotidiano de todos los tipos de profesionales que
se ponen en contacto con datos cuantitativos o extraen conclusiones de ellos. Tales tcnicos requieren
con urgencia familiarizarse con los principios bsicos de los mtodos estadsticos para poder evaluar
los informes numricos y otro gran cmulo de informacin para as evitar malos usos comunes de la
estadstica como lo es la generalizacin e inferencia que es bsica en el razonamiento estadstico. Los
estudiantes de diversas reas del conocimiento deberan tener un conocimiento prctico de los mtodos
estadsticos.
Son heterogneos los vocablos que se citan como antecedentes del trmino estadstica. Sin intentar ser
exhaustivos, pero si indagando para describir los de mayor mencin, se pueden nombrar los siguientes:
STATUS (latn), que significa situacin, posicin, estado.
STATERA (griego), que quiere decir balanza, ya que la estadstica mide o pesa hechos.
STAAT (alemn), que se refiere a estado como expresin de unidad poltica superior.
LA ESTADSTICA: Segn Allen (1996), Chao (1996), Yule y Kendal (1986) y Rivas Gonzlez
(1993) la estadstica es una ciencia (otros investigadores la consideran como un conjunto de mtodos)
que se encarga de la recoleccin, clasificacin, presentacin, organizacin, anlisis e interpretacin de
un conjunto de fenmenos, (naturales, econmicos, polticos o sociales) de manera metdica y
numrica, que permitan extraer conclusiones de un hecho, en un momento determinado y as poder
tomar decisiones valederas. De acuerdo con la definicin anterior la estadstica se encarga de la
recoleccin, clasificacin, anlisis e interpretacin de un conjunto de datos en una investigacin
determinada.
Segn, algunos investigadores la estadstica, es una rama de las matemticas que se ocupa de reunir,
organizar y analizar datos numricos y que ayuda a resolver problemas como el diseo de experimentos
y la toma de decisiones. Tambin, se puede decir que es una rama de las matemticas que utilizando un
conjunto de mtodos y tcnicas se encarga de la recoleccin, organizar, presentacin, analizar e
interpretacin de datos naturales, econmicos, polticas, sociales, etc., para presentar los resultados
obtenidos y sacar conclusiones vlidas basadas en dicho anlisis y as poder tomar una decisin. La
funcin principal de la estadstica es elaborar principios y mtodos que ayuden a tomar decisiones
frente a la incertidumbre. En realidad, muchos autores definen la estadstica actualmente como un
mtodo de toma de decisiones frente a la incertidumbre. La estadstica puede presentar conclusiones
referentes nicamente al grupo estudiado, o puede generalizarlas para grupos mayores.

Estadstica - Lic. Jessica Oliva G.

Pgina | 2

El gran nmero de informacin estadstica que se ofrece al pblico, por una razn u otra, escapa al
entendimiento, y una incertidumbre colectiva radica en que porcin de la estadstica es buena y cual
es mala. Indudablemente, no se puede aceptar toda la informacin sin emitir crtica. Algunas veces,
conclusiones totalmente errneas se basan en datos fehacientes. Por ejemplo, en alguna ocasin cierto
alcalde afirm que la ciudad x era la ms sana de la nacin, ya que su ndice de mortalidad era el ms
bajo del pas. Aunque concordamos con su afirmacin de que ser sano significa no estar muerto, existen
otros factores que no se tomaron en consideracin: cmo la ciudad no tena hospital, sus habitantes
tenan que ser hospitalizados en otra ciudad y si el enfermo mora el fallecimiento se registraban en el
lugar donde ciertamente ocurri la muerte y no en la ciudad de origen del difunto. Los siguientes son
algunos de los otros casos errnea basada en datos estadsticos, en otra informacin que eran fidedigna:
la estadstica seala que hubo menos accidentes de aviacin en 1920 que 1990, por lo tanto, era ms
seguro volar en 1920 que 1990, anlisis estadstico errneo aunque la estadstica es verdad. Como
existen ms accidentes de automviles en el da que en la noche es ms seguro conducir de noche, otro
error al realizar tal afirmacin, como se puede observar no siempre con las estadsticas se pueden hacer
afirmaciones tomando en cuenta algunos datos estadsticos valederos, si antes no se analizan otras
variables relacionadas con las estadsticas.
Hay que hacer una explicacin antes de comenzar un estudio formal aplicando las tcnicas estadstica;
se pondr en claro que los procedimientos estadsticos acertado de un problema implican mucho ms
que hacer algunas observaciones en la elaboracin, realizar algunas operaciones y llegar a cierto tipo
de conclusiones. Existen muchas incgnitas en la elaboracin de un estudio estadstico tales como: la
forma en que se recolectan los datos y como se planifica una investigacin o es un estudio en su
totalidad, es de importancia primordial. Como en cualquiera otra ciencia, en la estadstica hay que tener
la precaucin adecuada en todo la fase de cualquiera investigacin, desde la concepcin y
planteamiento del problema, que algunas veces es el trabajo ms dificultoso, hasta la planificacin y
el diseo, pasando por las etapas de recoleccin, organizacin, tabulacin, anlisis e interpretacin de
los datos, si no se toman en cuenta estas etapas no se podr llegar a una conclusin til o valedera. En
trminos generales, ni siquiera un prolongado y elegante manejo matemtico o estadstico de los datos,
aun con el equipo de computacin ms costoso y sofisticado del mundo, pueden salvar los estudios o
experimentos mal diseado. En realidad, los estadsticos profesionales insisten en que hasta los estudios
de muestreo ms simple deben llevarse a cabo con estricto apego a reglas bien definidas; de tal forma
que, no existe una justificacin para llamar estadstico a un estudio que no se ajuste a estas normas.
Cuando coloquialmente se habla de estadstica, se suele pensar en una relacin de datos numricos
presentados de forma ordenada y sistemtica. Esta idea es la consecuencia del concepto popular que
existe sobre el trmino y que cada vez est ms extendido debido a la influencia de nuestro entorno, ya
que hoy da es casi imposible que cualquier medio de difusin, peridico, radio, televisin, etc., no nos
tope diariamente con cualquier tipo de informacin estadstica sobre accidentes de trfico, ndices de
crecimiento de poblacin, turismo, tendencias polticas, etc. La palabra estadstica ha sido
frecuentemente referida a la informacin cuantitativa o numrica. Tambin ha sido referida
ampliamente a los mtodos que tratan con la informacin. Sin embargo, esto debera aclararse y llamar
a la informacin datos estadsticos y a los mtodos utilizados para su recoleccin, tcnicas estadsticas.
Cuando un lector tiene pocos hechos numricos, puede utilizar la informacin numrica en su mxima
extensin sin perder mucho tiempo o pensar demasiado en analizar los hechos.
Estadstica - Lic. Jessica Oliva G.

Pgina | 3

Ejemplo: Luis tiene 25 aos y Luisa tiene 18.


Un lector puede fcilmente interpretar la informacin anterior de muchas maneras diferentes. Por
ejemplo, Luis es un hombre joven de 25 aos de edad, pero es 5 aos mayor que Luisa; sin embargo,
cuando un lector tiene un gran volumen de hechos numricos, puede encontrar que la informacin le
es de poco valor, puesto que no puede interpretar la duda al mismo tiempo. Ejemplo, Luis tiene 25aos,
Luisa tiene18 aos, Mara tiene 16 aos, Jaime tiene 26 aos, Pedro tiene 19 aos, y as sucesivamente
hasta llegar al estudio de 1000 alumnos seleccionados en un momento determinado.
El gran volumen de informacin numrica origina la necesidad de mtodos sistemticos, los cuales
pueden ser utilizados para organizar, presentar, analizar e interpretar la informacin efectivamente. De
esta manera pueden extraerse conclusiones vlidas y tomarse decisiones razonables mediante el uso de
los mtodos. Los mtodos estadsticos son desarrollados primeramente para llenar esta necesidad.
Slo cuando nos introducimos en un mundo ms especfico como es el campo de la investigacin de
las Ciencias Sociales, Administracin, Contadura, Medicina, Biologa, Psicologa, etctera,
empezamos a percibir que la Estadstica no slo es algo ms, sino que se convierte en la nica
herramienta que, hoy por hoy, permite dar luz y obtener resultados, y por tanto beneficios, en cualquier
tipo de estudio, cuyos movimientos y relaciones, por su variabilidad intrnseca, no puedan ser abordadas
desde la perspectiva de las leyes deterministas. Podramos, desde un punto de vista ms amplio, definir
la estadstica como la ciencia que estudia cmo debe emplearse la informacin y cmo dar una gua de
accin en situaciones prcticas que entraan incertidumbre.
La Estadstica se ocupa de los mtodos y procedimientos para recoger, clasificar, resumir, hallar
regularidades y analizar los datos, siempre y cuando la variabilidad e incertidumbre sea una causa
intrnseca de los mismos; as como de realizar inferencias a partir de ellos, con la finalidad de ayudar a
la toma de decisiones y en su caso formular predicciones. La estadstica puede ser definida como un
mtodo de investigacin de los fenmenos que se producen masivamente. Intenta establecer el enlace,
formacin o estructura de una serie, as como su desarrollo temporal o la relacin entre varios de estos
fenmenos; por consiguiente, su objetivo es el anlisis e interpretacin de los datos numricos. La
estadstica es una ciencia auxiliar moderna que facilita el estudio de datos masivos, para as sacar
conclusiones valederas y efectuar predicciones razonables de ellos; permitiendo una visin de conjunto
clara y de ms fcil apreciacin, as como describirlos y compararlos.
La Estadstica tambin es definida como parte de la matemtica que se ocupa del estudio, anlisis y
clasificacin de los datos recogidos en una experiencia, cuando los resultados de esta no son explicables
por una ley natural conocida, es decir, cuando del hecho estudiado no se tiene un conocimiento cierto,
o cuando el mismo fenmeno es aleatorio. Otras definiciones que se le da a la estadstica que es una
tcnica especial apta para el estudio cuantitativo de los fenmenos de masa o colectivos entendiendo
por tales aquellos fenmenos de masa, naturales, econmicos, sociales, etc., cuya medicin requiere
una masa de observaciones de otros fenmenos ms simples llamados individuales o particulares. En
una forma prctica, la estadstica proporciona los mtodos cientficos para la recopilacin,

Estadstica - Lic. Jessica Oliva G.

Pgina | 4

organizacin, resumen, representacin y anlisis de datos o hechos, que se presten a una evaluacin
numrica; tales como: fenmenos sociales, econmicos, polticos, culturales, etc.
Ya que solo a travs del empleo de los mtodos estadsticos es posible el ordenamiento, clasificacin,
presentacin y estudio preciso de datos, hechos y ocurrencia masivas; que estn sujetas a la explicacin
de dicha ciencia, la cual permite un mejor entendimiento del estudio que se est realizando.
Se puede por tanto clasificar la Estadstica en descriptiva, cuando los resultados del anlisis no
pretenden ir ms all del conjunto de datos, e Inferencial cuando el objetivo del estudio es derivar las
conclusiones obtenidas a un conjunto de datos ms amplio.
RAMAS DE LA ESTADSTICA
ESTADSTICA DESCRIPTIVA: Describe, analiza y representa un grupo de datos utilizando
mtodos numricos y grficos que resumen y presentan la informacin contenida en ellos. Se puede
definirse como aquel mtodo que contiene la recoleccin, organizacin, presentacin y resumen de
una serie de datos. El mencionado resumen puede ser tabular, grfico o numrico. El anlisis que se
realiza se limita en s mismo a los datos recolectados y no se puede realizar inferencia alguna o
generalizacin alguna, acerca de la poblacin de donde provienen esos datos estadsticos.
Una de las ramas de la Estadstica ms accesible a la mayora de la poblacin es la Descriptiva. Esta
se dedica nica y exclusivamente al ordenamiento y tratamiento mecnico de la informacin para su
presentacin por medio de tablas y de representaciones grficas, as como de la obtencin de algunos
parmetros tiles para la explicacin de la informacin.
La Estadstica Descriptiva es la parte de la estadstica que conocemos desde los cursos de educacin
secundaria, que se ensea en los siguientes niveles y que, por lo general, no pasa a ser un anlisis ms
profundo de la informacin. Es un primer acercamiento a la informacin y, por esa misma razn, es la
manera de presentar la informacin ante cualquier lector, ya sea especialista o no. Sin embargo, lo
anterior no quiere decir que carezca de metodologa o algo similar, sino que, al contrario, por ser un
medio accesible a la mayora de la poblacin humana, resulta de suma importancia considerar para as
evitar malentendidos, tergiversaciones o errores.
La Estadstica Descriptiva analiza, estudia y describe a la totalidad de los individuos de una poblacin,
su finalidad es obtener informacin, analizarla, elaborarla y simplificarla lo necesario para que pueda
ser interpretada cmoda y rpidamente y, por tanto, pueda utilizarse eficazmente para el fin que se
desee.
El proceso que sigue la Estadstica Descriptiva para el estudio de una cierta poblacin consta de los
siguientes pasos:

Seleccin de caracteres dignos de ser estudiados.

Mediante encuesta o medicin, obtencin del valor de cada individuo en los caracteres
seleccionados.

Elaboracin de tablas de frecuencias, mediante la adecuada clasificacin de los individuos dentro


de cada carcter.

Estadstica - Lic. Jessica Oliva G.

Pgina | 5

Representacin grfica de los resultados (elaboracin de grficos estadsticos).

Obtencin de parmetros estadsticos, nmeros que sintetizan los aspectos ms relevantes de una
distribucin estadstica.

Por ejemplo: si un investigador aplica un test de aptitud a un grupo de graduados de un instituto superior
recientemente contratados por una empresa; entre lo que puede hacer con las puntuaciones que resultan
del test valindose de la estadstica descriptiva, estn los aspectos siguientes: arreglar las puntuaciones
o clasificarlas de manera que con solo dar un vistazo a los datos se pueda obtener una imagen general
de los mismos, construir tablas, grficas y cuadros estadsticos para visualizar el comportamiento de
los datos o bien convertir las puntuaciones brutas en rangos o en percentiles para realizar
comparaciones, etc.
ESTADSTICA INFERENCIAL: Es aquella rama de la estadstica que apoyndose en el clculo de
probabilidades y a partir de datos mustrales, efecta estimaciones, decisiones, predicciones u otras
generalizaciones sobre un conjunto mayor de datos. Puede definirse como aquella rama de la estadstica
que hace posible la estimacin de una caracterstica de una poblacin o la toma de una decisin referente
a una poblacin, fundamentndose slo en los resultados de la muestra.
La Estadstica Inferencial, por otro lado, se refiere a la rama de la estadstica que trata de los procesos
inferenciales, la que a su vez vislumbra la teora de estimacin y prueba de hiptesis. Uno de los
primordiales aspectos de la inferencia estadstica es el proceso que radica en utilizar estadsticos
mustrales para adquirir conclusiones sobre los verdaderos parmetros de la poblacin.
Los requerimientos de los mtodos de la inferencia estadstica se originan de la necesidad del muestreo.
Al tornarse muy grande una poblacin, comnmente resulta demasiado costoso, prolongado en el tiempo
y complicado obtener informacin de la poblacin completa. Las decisiones con respecto a las
caractersticas de la poblacin se deben basar en la informacin contenida en una muestra de esa
poblacin. La teora de la probabilidad suministra l vnculo, determinando la probabilidad de que los
resultados provenientes de la muestra reflejen los resultados que se obtendran de la poblacin.
Se pueden observar con albor estas ideas en el ejemplo de una encuesta poltica. Si el encuestador desea
estimar el porcentaje de votos que un candidato obtendr en una eleccin especfica, no entrevistara a
cada uno de los millares (o inclusive millones) de votantes. Ms bien, seleccionara una muestra de los
votantes. Tomando como base el resultado de la muestra, obtendra conclusiones acerca de la poblacin
total de votantes. A estas conclusiones se les asociara un planteamiento de probabilidad que especfica
la esperanza o la confianza que se tiene de que los resultados de la muestra reflejen la verdadera conducta
de los votantes de toda la poblacin.
La fidelidad de cualquier estimacin tiene una importancia enorme. Esta precisin depende en gran parte
de la forma de tomar la muestra y de la atencin que se ponga en que esta muestra suministre una imagen
fiable de la poblacin, pero casi nunca la muestra representa la poblacin en toda su plenitud, y de ello
resultar un error muestral.
La Estadstica Inferencial complementa a la descriptiva y a travs de ella se puede inferir el
comportamiento de un grupo grande (poblacin) a partir del estudio de una pequea parte de esa
(muestra). La estadstica inferencial nos permite, entre otras cosas, analizar el comportamiento de los
Estadstica - Lic. Jessica Oliva G.

Pgina | 6

mercados a partir de las tendencias de la oferta y de la demanda, y permite tambin visualizar el futuro
comportamiento de una empresa, permitiendo el anlisis de la eficiencia de las empresas. Tambin se
entiende por estadstica inferencial aquella que trata de los procesos inferenciales, la que a su vez
comprende la teora de estimacin y prueba de hiptesis. Esta, tambin provee conclusiones o inferencia,
en base a los datos simplificados y analizados; detectando las interrelaciones que puedan unirlos, las
leyes que los rigen y eliminando las influencias al azar; llegando ms all de las verificaciones fsicas
posibles. Basndose, en la muestra estudiada saca conclusiones, o sea, hace inferencia o induccin, en
cuanto al universo o poblacin, de donde se obtuvo dicha muestra. Para su estudio son necesarios
conocimientos ms profundos de la teora de probabilidades y anlisis matemticos, ya que parte de los
conocimientos resultantes en el proceso descriptivos, para deducir nuevos hechos o relaciones del
conjunto observado con otros conjuntos. Un ejemplo, en el cual se aplica la estadstica inferencial es en
la prediccin de los resultados de unas elecciones antes de que haya concluido el recuento de votos.
FINALIDAD DE LA ESTADSTICA
La estadstica es una ciencia o mtodo cientfico que en la actualidad es considerada como un poderoso
auxiliar en las investigaciones cientficas, que le permite a sta aprovechar el material cuantitativo. No
existen ciencias cuyos fenmenos no puedan ser tratados estadsticamente; por tal razn, la estadstica
la denominan algunos investigadores (Rivas Gonzlez) como el lenguaje cientfico. La misma es
indispensable en la formacin de cualquier profesional universitario o tcnico medio, ya que, por medio
de esta se pueden realizar diagnsticos de cualquiera investigacin que se desee realizar. Esta es
indispensable para realizar cualquier trabajo de investigacin que requiera una recoleccin de
informacin. Ella permite resumir los resultados de una investigacin en una forma significativa y
cmoda. La misma permite deducir conclusiones generales y as afirmar hasta donde se puede ampliar
una generalizacin de una investigacin determinada. De la misma forma permite predecir qu suceder
algo tomando en cuenta ciertas condiciones que se han analizado con datos anteriores.
En las ciencias sociales, administrativas, polticas, medicas, en educacin y en otras ciencias permite
analizar algunos de los factores casuales en sucesos complejos y que de alguna manera confundiran a
un investigador determinado. De acuerdo a lo antes planteado los mtodos estadsticos son por lo tanto
los compaeros constantes de los que realizan investigacin. La estadstica y su aplicacin, ha avanzado
de tal forma en los ltimos aos, que hoy da se ha hecho imprescindible en todas las investigaciones
cientficas sea cual fuere el carcter de esta ltima.
LA ESTADSTICA EN NUESTROS DAS
Hoy en da, la estadstica se ha convertido en un mtodo efectivo para describir con exactitud los valores
de datos econmicos, polticos, sociales, psicolgicos, biolgicos o fsicos, y sirve como herramienta
para relacionar y analizar dichos datos. El trabajo del experto estadstico no consiste ya slo en reunir
y tabular los datos, sino sobre todo en el proceso de interpretacin de esa informacin. El desarrollo
de la teora de la probabilidad ha aumentado el alcance de las aplicaciones de la estadstica. La
Probabilidad, es una rama de las matemticas que se ocupa de medir o determinar cuantitativamente la
posibilidad de que ocurra un determinado suceso. La probabilidad est basada en el estudio de la
combinatoria y es fundamento necesario de la estadstica. Numerosas colecciones de datos se pueden
aproximar con gran exactitud, utilizando determinadas distribuciones probabilsticas; los resultados de
stas se pueden utilizar para analizar datos estadsticos. La probabilidad es til para comprobar la
Estadstica - Lic. Jessica Oliva G.

Pgina | 7

fiabilidad de las inferencias estadsticas y para predecir el tipo y la cantidad de datos necesarios en un
determinado estudio estadstico. En la actualidad la estadstica ha alcanzado tal grado de
perfeccionamiento y especializacin, que podra decirse, que no existe disciplina cientfica en la cual
no se apliquen los mtodos estadsticos como herramienta indispensable para iniciar cualquiera
investigacin de envergadura.
Todo lo que hasta apartadamente tiene que ver con la recoleccin, procesamiento, anlisis e
interpretacin de datos numricos pertenece al dominio de la estadstica, comprende, por ejemplo, el
clculo del aumento, en promedio, de las utilidades de una importante compaa de ventas de artculos
por Internet los ltimos tres aos; la recoleccin y presentacin anual de la deuda a corto plazo de tres
compaas de electricidad, as como un porcentaje de su deuda a largo plazo; la evaluacin de la eficacia
de dos diferentes programas de computacin, destinado reducir el nmero de accidentes personales en
una empresa, el tiempo perdido en trabajo de alto riesgo; y el anlisis de las variaciones que ocurren de
cuando en cuando en serie de datos econmicos, ventas al menudeo, precios al consumidor y al
mayoristas, y distribucin de dinero, precios de productos comunes, productividad del sector agrcola,
etctera.
La palabra estadstica, por s sola se utiliza en varias formas. En un contexto, significa un conjunto de
datos como los que se pueden encontrar en las pginas financieras de los diarios o en los compendios
estadsticos. Pero, en otro mbito, se refiere a la totalidad de los mtodos que se aplican en la
recoleccin, organizacin, presentacin, anlisis e interpretacin de cualquier tipo de datos. En este
ltimo sentido, la estadstica es una rama de las matemticas aplicadas, y es este campo de las
matemticas el que constituye el tema central de este curso.
Una de las manifestaciones ms comentado en los ltimos aos del pasado siglo y del presente milenio,
ha sido el desarrollo de mtodos y conceptos estadsticos. Durante muchos aos, a la estadstica le
concernan principalmente la recoleccin de datos y su presentacin en tablas y grfica; hoy da ha
evolucionado hasta el punto en que su impacto se percibe en casi todas las reas de trabajo del ser
humano. Esto es debido a que la estadstica posmoderna est relacionada directamente con el problema
de la toma decisiones en condiciones de incertidumbre. Sin necesidad de entrar en detalles, existen
elementos de incertidumbre en casi todo lo que el ser humano realiza actualmente.
La caracterstica ms trascendental del reciente avance de la estadstica ha sido el cambio de los
mtodos meramente descriptivo por otros que sirven para hacer generalizaciones o, dicho lo otra
manera, un cambio de la estadstica descriptiva a la deductiva o inferencia estadstica. Por estadstica
descriptiva se entiende a cualquier tratamiento de datos que este diseado para ser resumido o describir
algunas de sus propiedades ms importantes sin intentar deducir nada que escape al alcance de los
datos. Por ejemplo, si un gobierno informa, con base a un censo, que la poblacin del pas fue de 27
millones de habitantes, esto pertenece al campo de estadstica descriptiva. Este sera tambin el caso si
calculamos el crecimiento % correspondiente de una dcada a la siguiente. Sin embargo; ste no sera
el caso si empleramos tales datos para percibir la poblacin del pas en tres aos ms o el crecimiento
porcentual en una dcada.

Estadstica - Lic. Jessica Oliva G.

Pgina | 8

La Estadstica Descriptiva es una rama importante de la estadstica y se siguen empleando ampliamente


en el rea comercial y en otras reas de la actividad administrativa. Sin embargo, en la mayor parte de
los casos, la informacin estadstica surge de muestras, de observaciones realizadas slo en algunos
elementos de un conjunto grande, o de la observacin de acontecimientos pasados. El tiempo, el costo
o la imposibilidad de hacer lo contrario suele requerir un procedimiento de este tipo, aunque nuestro
inters real yace en todo el conjunto de elementos de los cuales provino la muestra y los
acontecimientos futuros, no en el pasado. Las generalizaciones de cualquier tipo escapan al contenido
de la estadstica descriptiva; se nos induce al uso de la diferencia estadstica para resolver muchos
problemas de operaciones cotidianas y para la elaboracin de planes a corto y largo plazo. Por Ejemplo
los mtodos de la inferencia estadstica son necesarios para decidir si un lote grande de acumuladores
de nueve voltios para equipos de sonido cumplen en promedio con la vida til garantizada por el
fabricante; para determinar la dosis mnima eficaz y la mxima seguridad de un nuevo medicamento
anti-inflamatorio en el tratamiento de inflamaciones locales dolorosa, o bien para estimar la demanda
de nuevas cauchos para vehculos rsticos en la poca de lluvia.
No obstante, siempre que se haga una inferencia estadstica (una generalizacin que escape a los lmites
de nuestras observaciones) se debe proceder con mucha precaucin. De hecho, hay que considerar
concienzudamente si resulta posible hacer algunas generalizaciones vlidas del todo y, si lo es, hasta
donde se puede generalizar. Sin embargo, algunas veces aunque se actu cautelosamente al generalizar,
se puede errar por completo en las generalizaciones y encontrarse con algunas dificultades. En realidad,
uno de los problemas bsicos de la inferencia estadstica es el de la apreciacin de los riesgos que
representa hacer generalizaciones equivocadas y quizs hacer algo incorrecto, tomando como base los
datos analizados de una muestra. El hecho de que aqu se solicite que se preste atencin a los errores
estadsticos puede parecer una manera negativa de dar comienzo a un estudio pero, en realidad, la
constante advertencia de que existe la posibilidad de hacer conclusiones y acciones equivocadas, y el
deseo de controlarla, permiten dirigir correctamente el curso de la investigacin en estadstica. La
realidad es dura e inflexible y se debe enfrentar en sus propios trminos. Se vive hoy, en un mundo
lleno de incgnitas y no existe manera de eliminar por completo los riesgos de tomar decisiones
equivocadas. Siendo ste el caso, el verdadero problema no consiste ahora en cmo eliminarlos, sino
como vivir con ellos de manera inteligente. Cuanto ms pronto se comprenda esto, ms seguros se
estar y tanto mejo se entender por qu la estadstica es una disciplina que vale la pena estudiarla.
Una de las razones principales para estudiar estadstica es que se consagra en forma directa al problema
universal de cmo tomar decisiones inteligentes en condiciones de incertidumbre o bien, en forma ms
breve, al problema de la toma de decisiones con incertidumbre lo cual es muy comn para aquel
profesional de la contadura o administracin comercial.
EL PAPEL DE LA ESTADSTICA EN LA CIENCIA
La importancia de la estadstica en la ingeniera, la ciencia y la administracin ha sido subrayada por
la participacin de la industria en el aumento de la calidad. Muchas compaas se han dado cuenta de
que la baja calidad de un producto (ya sea en la forma de defectos de fabricacin, en una baja
confiabilidad en su rendimiento, o en ambos), tiene un efecto muy pronunciado en la productividad
global de la compaa, en el mercado y la posicin competitiva y, finalmente, en la rentabilidad de la
empresa. Mejorar estos aspectos de la calidad puede eliminar el desperdicio; disminuir la cantidad de
material de desecho, la necesidad de volver a maquilar piezas, los requerimientos para inspeccin y
Estadstica - Lic. Jessica Oliva G.

Pgina | 9

prueba y las prdidas de garanta; adems de mejorar la satisfaccin del consumidor y permitir que la
empresa se convierta en un productor de alta calidad y bajo costo en el mercado. La estadstica es un
elemento decisivo en el incremento de la calidad, ya que las tcnicas estadsticas pueden emplearse
para describir y comprender la variabilidad.
Virtualmente todos los procesos y sistemas de la vida real exhiben variabilidad. Por ejemplo, considere
la situacin donde, de un proceso de maquinado, se seleccionan varios componentes del motor de una
aeronave y se mide la altura de la turbina del propulsor de cada parte. Si el instrumento de medicin
tiene una resolucin suficiente, la altura de cada turbina ser diferente; esto es, habr variabilidad en la
dimensin. Otro ejemplo: si se cuenta el nmero de defectos en los gabinetes para computadoras
personales, se encontrar cierta variabilidad en los conteos, ya que algunos gabinetes tendrn pocos
defectos, mientras que otros tendrn muchos. Esta nocin de variabilidad se extiende a todos los
ambientes. Existe variabilidad en el espesor del recubrimiento de xido en las pastillas de silicio, en el
rendimiento por hora de un proceso qumico, en el nmero de errores en los dibujos de ingeniera y en
el tiempo necesario para ensamblar el motor de un automvil.
Por qu se presenta variabilidad? En general, la variabilidad es el resultado de cambios en las
condiciones bajo las que se hacen las observaciones. En el contexto de la manufactura, estos cambios
pueden ser diferencias en las propiedades de los materiales utilizados, en la forma en que trabajan los
obreros, en las variables del proceso (tales como la temperatura, la presin o el tiempo de ocupacin)
y en factores ambientales (como la humedad relativa). La variabilidad tambin se presenta debido al
sistema de medicin utilizado. Por ejemplo, la medicin obtenida a partir de una escala puede depender
del lugar del panel en que se coloque el objeto que se ha de medir.
El campo de la estadstica y la probabilidad consiste de mtodos tanto para describir y modelar la
variabilidad, como para tomar decisiones en presencia de sta. En la Estadstica Inferencial lo que se
desea hacer es tomar una decisin acerca de una poblacin en particular. El trmino poblacin se refiere
a la recoleccin de mediciones de todos los elementos del universo con respecto al cual se quieren
obtener conclusiones o tomar decisiones. En la mayora de las aplicaciones de la estadstica, los datos
disponibles consisten de una muestra de la poblacin de inters. Esta muestra es slo un subconjunto
de observaciones seleccionadas de una poblacin.
El campo de la Estadstica Inferencial se ha desarrollado principalmente desde comienzos de este siglo.
Es resultado de los mtodos para organizar y resumir datos, cuyos orgenes se remontan a varios siglos
atrs. Estos mtodos para resumir y organizar datos se denominan Estadstica Descriptiva. La mayor
parte del uso moderno de la estadstica, particularmente en la ciencia y la ingeniera, se dirige ms hacia
la inferencia que a la descriptiva. Por ejemplo, un ingeniero que disea un nuevo circuito de
computadora fabricar una muestra (prototipo) de ellos, y entonces querr conclusiones sobre la forma
en que estos dispositivos funcionarn una vez que se produzcan a gran escala.

Las computadoras y la estadstica


La computadora se ha convertido en una herramienta importante en la presentacin y el anlisis de
datos. Si bien muchas tcnicas estadsticas slo necesitan una calcula de mano, cuyo empleo consume
Estadstica - Lic. Jessica Oliva G.

Pgina | 10

mucho tiempo y esfuerzo, la computadora realiza las tareas con mucha mayor eficiencia. La mayor
parte del anlisis estadstico se realiza utilizando una biblioteca de programas estadsticos. El usuario
introduce los datos y luego selecciona los tipos de anlisis y la presentacin de los resultados que le
interesan. 1

CONCEPTO BSICOS
POBLACIN: En estadstica el concepto de poblacin va ms all de lo que comnmente se
conoce como tal. En trminos estadsticos, poblacin es un conjunto finito o infinito de personas,
animales o cosas que presentan caractersticas comunes, sobre los cuales se quiere efectuar un estudio
determinado. En otras palabras, la poblacin se define como la totalidad de los valores posibles
(mediciones o conteos) de una caracterstica particular de un grupo especificado de personas, animales
o cosas que se desean estudiar en un momento determinado. As, se puede hablar de la poblacin de
habitantes de un pas, de la poblacin de estudiantes universitarios del Departamento de Lambayeque,
de la poblacin de casas de la Urbanizacin Las Brisas de la ciudad de Chiclayo, el nmero de carros
marca Toyota de la ciudad de Lambayeque, la estatura de un grupo alumnos de la USAT, la talla, etc.
La poblacin es el conjunto formado por todos los valores posibles que puede asumir la variable objeto
de estudio, ya que constituye la totalidad del grupo que se quiere estudiar los que van a poseer una
caracterstica de ese grupo especfico de individuos, animales o cosas. Es la coleccin de todos los
elementos que se estn estudiando, acerca de los cuales se intenta sacar conclusiones, el cual puede
ser un conjunto finito o infinito de personas, animales o cosas que presentan caractersticas comunes.
As por ejemplo, en un estudio sobre la preferencia de los electores que participaran en una eleccin
presidencial, la poblacin consiste en todos los participantes registrados para votar en ese proceso.
Pero el trmino no slo est asociado a la coleccin de seres humanos y organismos, tambin pueden
ser cosas no vivientes tales como: el estudio de mercado que se realiza para determinar las ventas
anuales de los supermercados de una zona determinada de una ciudad, luego, las ventas anuales de
todos los supermercados constituyen as mismo la poblacin.
MUESTRA: La muestra es un subconjunto de la poblacin, seleccionado de tal forma, que sea
representativo de la poblacin en estudio, obtenindose con el fin de investigar alguna o algunas de
las propiedades de la poblacin de la cual procede. En otras palabras es una parte de la poblacin que
sirve para representarla. Es una parte o porcin extrada de un conjunto por mtodos que permiten
considerarla como representativa del mismo. Entonces, una muestra no es ms que una parte de la
poblacin que sirve para representarla. La muestra debe obtenerse de la poblacin que se desea
estudiar; una muestra debe ser definida sobre la base de la poblacin determinada, y las conclusiones
que se obtengan de dicha muestra slo podrn referirse a la poblacin en referencia.
La muestra debe ser representativa ya que debe contener las caractersticas relevantes de la poblacin
en las mismas proporciones en que estn incluidas en tal poblacin, es decir, contiene las caractersticas
ms importantes de esa coleccin de elementos que representan la poblacin bajo estudio, a fin de
investigar alguna o algunas de las propiedades de la poblacin de la cual procede; y las conclusiones
que se obtengan de dicha muestra slo podrn referirse a la poblacin en referencia.

Douglas C. Montgomery, George C. Runger: Probabilidad y Estadstica aplicadas a la Ingeniera

Estadstica - Lic. Jessica Oliva G.

Pgina | 11

La muestra es el elemento bsico sobre el cual se fundamenta la posterior inferencia acerca de la


poblacin de donde se ha tomado. Por ello, su escogencia y seleccin debe hacerse siguiendo ciertos
procedimientos o parmetros que son indispensables, es decir, se selecciona de acuerdo con una regla
o plan definido. En estadstica, en vez de estudiar las poblaciones en su totalidad, se acude al recurso
de considerar solamente una parte de ella, a la cual se le denomina muestra. Por lo tanto, una muestra
es una parte de la poblacin, seleccionada de acuerdo con una regla o plan definido.
MUESTREO: Es el procedimiento mediante el cual se obtiene una o ms muestras de una
poblacin determinada. Existen dos tipos de muestreos a saber:
Muestreo no Probabilstico: Es aquel en el cual se toma la muestra segn el criterio del investigador,
estos pueden ser: muestreo intencional u opintico y el muestreo sin norma o circunstancial.
Muestreo Probabilstico: Es aquel que se selecciona utilizando mtodos aleatorios en los que se
utilizan las probabilidades matemticas. Entre estos se pueden mencionar: Muestreo aleatorio simple,
muestreo estratificado, muestreo por conglomerado o por rea y muestreo sistemtico.
UNIDAD DE ANLISIS: es el objeto o elemento indivisible que ser estudiado en una poblacin,
sobre los cuales se van a obtener datos. Es el que genera el fenmeno estudiado y proporciona datos
concretos.
DATO: es el valor o respuesta que adquiere la variable en cada unidad de anlisis. Es el resultado
de la observacin, entrevista o recopilacin en general. Son la materia prima de la estadstica. Es el
elemento primario de toda observacin o bsqueda.
VARIABLES: Las variables son magnitud que puede tener un valor cualquiera de los
comprendidos en un conjunto de valores de un estudio o investigacin determinada. Son todos aquellos
datos u observaciones que pueden ser expresados mediante nmeros, es decir, son caractersticas de
una poblacin determinada, susceptible de medicin. Son caractersticas que pueden ser observadas
en determinado fenmeno natural, social, econmico, poltico etc. Las mismas son susceptibles de
adoptar distintos valores o ser expresadas en varias categoras. Existen muchas definiciones de
variables, entre las cuales tenemos:
Son aquellos datos u observaciones que pueden ser expresados cuantitativamente, es decir, son
caractersticas de una poblacin especfica, en las cuales se realiza una investigacin en un momento
dado. Las variables por lo general se representan con letras maysculas y sus valores particulares con
minsculas, es decir, si se hace referencia a los salarios devengados por un grupo de trabajadores la
variable salario estara representado por una letra mayscula, en este caso Xi y varios salarios de
diferentes trabajadores en particular, estaran representados con la letra minscula correspondiente,
as: x1 = 180.000, x2 = 190.000, x3 = 480.00, etctera.
Es aquella caracterstica de una poblacin que puede tomar diferentes valores en un estudio
determinado. Son smbolos tal como X, Y, Z, A, B, etc., que puede tomar un valor cualquiera de una
caracterstica especificada de un estudio determinado. Por ejemplo, la estatura de las personas, la talla
de un grupo de trabajadores petroleros, la edad de un conjunto de estudiantes universitarios, el ndice
acadmico de los estudiantes de la USAT, son variables. En otras palabras, una variable es una funcin
que asocia a cada elemento de la poblacin la medicin de una caracterstica, particularmente de aquella
que se desea observar.
Estadstica - Lic. Jessica Oliva G.

Pgina | 12

TIPO DE VARIABLES
Cualitativa o de Atributos: Cuando expresan una cualidad, caracterstica o atributo, tienen un
carcter cualitativo, sus datos se expresan mediante una palabra, es no numrico, por lo tanto
las operaciones aritmticas, como sumar y obtener promedios, no son significativas. Cuando la
informacin es cualitativa, generalmente interesa saber cuntas o qu proporcin entra en cada
categora.
Ejemplos: sexo, nacionalidad, marcas de auto, grado de satisfaccin con la universidad, causas
de accidentes, lugar de nacimiento, estado civil, etc.

Cuantitativa o Numrica: Cuando el valor de la variable se expresa por una cantidad, es de


carcter numrico. El dato o valor puede resultar de la operacin de contar o medir, por lo tanto
las operaciones aritmticas, como sumar y obtener promedios, son significativas.
Ejemplos: Nmero de hijos, kilmetros recorridos, tiempo de vuelo, la velocidad de las
embarcaciones, etc.
Las variables cuantitativas se pueden clasificar a su vez en discretas o continuas.
- Cuantitativas Discretas: cuando el valor de la variable resulta de la operacin de contar,
su valor est dado slo por nmeros (enteros positivos).
Ejemplos: cantidad de materias aprobadas, nmero hijos, nmero de computadoras, etc.
- Cuantitativas Continuas: cuando la variable es susceptible de medirse, es toda variable
cuyo valor se obtiene por medicin o comparacin con una unidad o patrn de medida.
Puede asumir cualquier valor dentro del rango de medicin, por tanto se expresa en
cualquier nmero real. Normalmente se miden magnitudes como ser longitud, superficie,
volumen, peso, tiempo, dinero.
Ejemplos: peso al nacer, tiempo de servicios, horas trabajadas, ingreso mensual,
temperatura, etc.

MEDICIN: La asignacin o magnitud que se aplica a las categoras o clases de acuerdo a ciertas
reglas o smbolos. Consiste en la recopilacin de datos y su utilizacin mediante el empleo de una serie
de normas de tipo estadstico; es la representacin simblica de un dato o serie de datos obtenidos por
algn tipo de observacin.
ESCALAS DE MEDICIN DE LAS VARIABLES
Una escala de medicin es una asignacin de valores numricos a las caractersticas de una muestra
o una poblacin, se mide bsicamente en proporcin de escala. Las escalas de medicin son el
conjunto de los posibles valores que determinada variable puede tomar. Por tal razn, los tipos de
escala de medicin estn ntimamente ligados con los tipos de variables a estudiar. Las magnitudes
de las observaciones cuantitativas se conocen como los valores que una variable puede asumir.
Consiste entonces, en una serie de graduaciones que permiten darle un valor numrico a las
caractersticas que estamos midiendo; para hacer ms comprensible y que adquiera un significado
mediante un arreglo ordenado para establecer un anlisis estadstico. Son denominaciones o
clasificaciones de individuos o caractersticas. Las escalas de medicin es el alma fundamental de
toda investigacin Cientfica, puesto que, slo a travs de ellas es como se pueden calibrar los
fenmenos, sus relaciones, entre otros.

Estadstica - Lic. Jessica Oliva G.

Pgina | 13

Se refieren habitualmente a las asignaciones de nmeros a observaciones, de una forma tal que los
nmeros sean susceptibles de anlisis por medio de manipulaciones u operaciones; estas escalas
permiten asignarle un valor numrico a las caractersticas que se estn midiendo. Por lo general
proceden de las medidas de una o ms variables. Dependiendo de la medicin y de la esencia de
las variables, se obtienen diversas clases de datos que originan diferentes escalas. Resulta
intensamente conocer el tipo de escala que representan los datos, debido a que, de su esencia
dependen las tcnicas estadsticas que se debern aplicar para su anlisis. Para lograr estadsticas
confiables hay que manipular cuantiosos datos estadsticos, los cuales poseen determinadas
caractersticas.
Por ejemplo, si los datos son alumnos, entre algunas de ellos se puede sealar el peso, la estatura,
el sexo, el rendimiento acadmico, entre otros. Al elaborar estadsticas con datos y su caracterstica
es necesario contarlas, jerarquizarlas y medirlas, es por ello que, se utilizan las escalas de medicin
como el proceso de asignar nmeros o establecer una correspondencia uno a uno entre objetivos y
observaciones.
Las escalas de medicin se clasifican de la siguiente forma: Escala Nominal, Escala Ordinal,
Escala de Intervalos y Escalas de razn o Proporcin.

Escala de Medicin Nominal: Es aquella en la que los nmeros slo se emplean para
diferenciar los objetos de distintas categoras o cuando se emplean nombres. Se dice que los
datos que se obtienen para una variable cualitativa se miden en una escala nominal. Si los datos
observados simplemente se clasifican en distintas categoras que no implican orden, se tiene un
nivel de medicin nominal. Ejemplos de nmeros, esta caracterstica son las que usan los
jugadores de bisbol, los nmeros telefnicos, los nmeros de las Cedulas de Identidad,
etctera. Se usa una escala nominal cuando se distribuyen conjuntos de objetos, personas o
caractersticas entre dos o ms categoras. La Escala Nominal se utiliza como medida de
identidad. Los nmeros pueden servir como indicativos o etiquetas para identificar objetos o
clases, pues se usa cuando un objeto se diferencia de otro solamente por la nominacin con que
se conoce. La escala nominal es la forma ms dbil de medicin porque no se puede intentar
el conteo de las diferencias dentro de una categora determinada o especificar cualquier orden
o direccin a lo largo de las diversas categoras. Sin embargo, no se intenta medir diferencias
entre los valores clasificados dentro de una categora determinada.
Propiedades de la escala Nominal
1. No intervienen mediciones, ni escala, en vez de esto solo hay cuentas o conteos.
2. Esta escala es considerada excluyente, es decir que la persona u objeto se incluye solamente
en una categora.
3. No existe un orden especfico para esta categora.
4. No presentan el cero.
5. No se basa en diferencia cuantitativa.
6. Los elementos de una categora deben de ser equivalentes, idnticos.

Ejemplos:
Una muestra de personas puede clasificarse con base en la religin profesada:
Estadstica - Lic. Jessica Oliva G.

Pgina | 14

(1) Cristianos;
(2) Judos;
(3) Musulmanes;
(4) Otros; y
(5) Sin Creencia alguna.
O bien podran clasificarse segn el sexo, el color de los ojos, algn partido poltico, etctera.
Otros ejemplos de escala nominal puede ser el nmero de placa de los vehculos, los nmeros
de los telfonos de una ciudad, la Cedula de Identidad de los habitantes de un pas, etctera.
El tipo de operacin estadstica ms utilizada en la escala nominal es el conteo de las
frecuencias con que se presentan las caractersticas en las unidades de las respectivas
subclases. Estas frecuencias pueden ser presentadas con nmeros absolutos, porcentajes y
proporciones. Adems, puede calcularse razones, tasas de incremento, y el coeficiente de
contingencia.

Escala de Medicin Ordinal: Es aquella en la que los nmeros se utilizan para diferenciar en
orden de supremaca de acuerdo con cierto criterio jerrquico, como son los nmeros que se
emplean para clasificar los distintos estratos socio-econmicos o para designar preferencias.
Si los datos observados se clasifican en categoras distintas en las que existe algn orden, se
obtiene un nivel de medicin ordinal Cuando los objetos son medidos en escala ordinal los que
tengan la misma asignacin se consideran iguales; pero los que tengan asignaciones diferentes
pertenecen a categoras distintas. La diferencia entre dos nmeros ordinales no tiene significado
cuantitativo, slo expresan, por ejemplo, que una situacin es mejor que otra, pero no cunto.
La escala ordinal es una forma un tanto ms fuerte de medicin que la nominal, porque se dice
que un valor observado que se clasifica en una categora posee ms la propiedad que se mide
que algn valor observado que se clasifica en otra categora.
Tambin, la escala ordinal siegue siendo una forma de medicin dbil porque no se pueden
hacer planteamientos numricos significativos con respecto a las diferencias entre las
categoras. Es decir, la ordenacin establece slo cul categora es mayor, mejor o
preferida; y no se habla cunto es mayor, mejor o ms preferida. Esta escala se emplea,
cuando un estudio est basado en ciertas normas que se asignan a un conjunto de objetos,
personas o caractersticas o a un conjunto de categoras ordenadas. Las categoras de la escala
se ordenan d acuerdo con la cantidad de rasgos o caractersticas que representan cada una de
ellas ya que la escala ordinal distingue los diferentes valores de la variable, ubicando las
caractersticas en orden, desde la ms alta hasta la ms baja.
Propiedades de la escala Ordinal
1. Las observaciones o elementos se les ordena en rangos o categoras diferentes.
2. Cada categora o rango mantiene una relacin entre s, estas relaciones se expresan en
trminos algebraicos de desigualdades (mayor que o menor que).
3. No es posible definir unidades de mediciones iguales en todos los puntos de la escala.

Estadstica - Lic. Jessica Oliva G.

Pgina | 15

4. Las categoras son mayores o menores que otras categoras, es decir, que existe una
clasificacin de mayor a menor (jerarqua).
5. Las categoras son mutuamente excluyentes y exhaustivas.
6. No presentan el cero.
Se pueden clasificar los habitantes de una ciudad de acuerdo a su situacin econmica, a los
estudiantes tomando en cuenta a su rendimiento acadmico, etctera. Aunque la escala ordinal
resulta en cierta forma ms precisa que la nominal, no alcanza el grado de precisin deseado
en una investigacin.
Otro ejemplo, el orden jerrquico de los militares (Subteniente, Teniente, Capitn, Mayor,
Teniente Coronel, Coronel, General) y la clasificacin acadmica de los profesores
universitarios (instructor, asistente, agregado, asociado, titular) son ejemplos de escala ordinal.
En la escala ordinal las unidades de las subclases guardan una cierta relacin entre s, esto se
pone de manifiesto cuando existe la posibilidad de establecer la relacin menor que o mayor
que, respecto a las caractersticas de las unidades escaladas. Por ejemplo, el grado militar de
A es el de Subteniente y el de B es el de Teniente, luego el grado de B es mayor que el de A
(BA)

Escala de Medicin de Intervalos: Es una escala ms especializada que las dos anteriores,
puesto que es posible ordenar las mediciones y expresar adems en cunto difiere una situacin
de la otra. Por Ejemplo, en las mediciones de temperatura ambiental no slo se puede afirmar
hoy hace ms calor que ayer, si no que de la misma forma se puede expresar hoy la
temperatura es cuatro grados centgrados ms alta que la de ayer a la misma hora. Esta
escala se caracteriza por tener una unidad de medida y un origen (cero) arbitrario. La distancia
entre dos mediciones tiene un significado preciso. La escala de intervalos a diferencia de la
nominal y ordinal, es una escala efectivamente cuantitativamente. Una escala de intervalo es
una escala ordenada en la cual la diferencia entre las mediciones es una cantidad significativa.
La escala de intervalos posee adems, de las caractersticas de la escala nominal y ordinal, la
propiedad de que la distancia entre dos valores es de una magnitud conocida, lo que le permite
a esta escala un mayor grado de perfeccin, ya que proporciona nmeros que manifiestan
diferencias palpables entre individuos, objetos o cosas. Por tal razn, la escala de intervalo
revela que un individuo u objeto es tantas unidades ms grande o ms pequeo, ms pesado o
ms ligero, ms rpido o ms lento que otro, es decir, muestra la cantidad en la que un objeto
se diferencia de otro cuantitativamente. En esta escala el punto cero y la unidad de medicin
son arbitrarios. La razn entre dos intervalos es siempre independiente del punto cero y de la
unidad que se emplee en la medicin. En el caso de las escalas de intervalos las unidades de
medicin son iguales.
Propiedades de la escala de Intervalo:
1. Esta escala implica la cuantificacin de los datos
2. En estas medidas se utilizan unidades constantes de medicin (capacidad, peso, cntimos,
grados Fahrenheit o centgrados) los cuales producen intervalos iguales entre puntos de la
escala.

Estadstica - Lic. Jessica Oliva G.

Pgina | 16

3. Proporcionan nmeros que manifiestan diferencias palpables entre individuos, objetos o


cosas.
4. En esta escala de intervalos el punto cero (0) y la unidad de medida es arbitrario.
5. Se pueden aplicar todas las medidas estadsticas ms conocidas, con excepcin del
coeficiente de variacin.
6. Son mutuamente exclusivas y exhaustivas.
Un ejemplo de esta escala lo constituyen las escalas utilizadas para medir temperatura, bien sea
en grados Centgrados o Fahrenheit. En estas escalas la diferencia entre 80 y 85 es igual a la
que existe entre 90 y 95 o entre dos puntos cualesquiera de la escala. La escala de intervalo
tiene carcter cuantitativo y esto le permite el clculo de las medidas estadsticas ms comunes
(medias, desviaciones tpicas o estndar, coeficientes de correlacin de Pearson, entre otros),
esto confirma l porque muchos valores estadsticos se utilizan con las escalas de intervalos.

Escala de Medicin de Razn o Proporcin: Esta constituye el nivel ms alto de medicin,


posee todas las caractersticas de las escalas nominales, ordinales y de intervalos; adems tiene
un cero absoluto o natural que tiene significado fsico. Si en ella la medicin es cero, significa
ausencia o inexistencia total de la propiedad considerada. Son posibles todas las operaciones
aritmticas. Los nmeros indican los valores concretos de la propiedad que s est midiendo;
peso, estatura, ingresos monetarios y gastos directos, son ejemplos de medidas con una escala
de razn.
La distancia entre dos valores de la escala es conocida en el sentido cuantitativo y su razn es
independiente de las unidades empleadas. Por ejemplo, en las unidades de longitud, peso y
capacidad el valor cero indica ausencia de medida, mientras que en la escala de intervalo si se
tiene cero grado centgrado no se puede afirmar que hay ausencia de temperatura. La escala de
razn permite establecer ciertas comparaciones entre los valores que no son permitidos en la
escala de intervalo. Por lo tanto, la proporcin de un punto cualquiera de la escala a otro es
independiente de la unidad de medida. Si una persona mide 2.00 m puede afirmarse que duplica
en estatura a otro que mide 1.00 m Las escalas de razn ms comunes corresponden a medidas
de longitud, peso, capacidad, sonido, entre otros. Al medir la temperatura absoluta la escala de
Kelvin, que es de este tipo, tiene su punto cero a 273, este valor es el ms bajo posible. Cuando
se emplea este tipo de escala, los nmeros indican razones o cocientes entre ciertas magnitudes
de los objetos, y los datos obtenidos con tales escalas pueden ser sometidos a los tratamientos
ms elaborados.

Estadstica - Lic. Jessica Oliva G.

Pgina | 17

Propiedades de la escala a razn:


1. La distancia entre los nmeros es un tamao conocido y constante.
2. Los datos tienen un punto cero significativo.
3. Puede utilizarse cualquier prueba de tipo estadstico, incluyendo el coeficiente de
variacin.
4. Permite hacer comparaciones entre los nmeros verdaderos con un cero aritmtico siendo
arbitrario nicamente la unidad de medida.
Ejemplo de escala a razn:
Nmero de televisores vendidos en el ltimo trimestre del ao 2007
Meses
N de televisores
Octubre
4.000
Noviembre
6.000
Diciembre
15.000
Generalmente, se supone que los datos que se obtienen para una variable cuantitativa se miden
en escalas de intervalo o de razn. Estas escalas constituyen los niveles ms elevados de
medicin. Son formas ms fuertes de medicin que la escala nominal y ordinal, porque
permiten comprender no slo cul de los valores de un estudio es mayor o menor, sino por
cuntas unidades de medida. Las escalas de razn son medidas de Longitud, peso, capacidad,
etc., los nmeros reflejan razones entre particularidades y los datos obtenidos segn tales
escalas pueden ser sometidos a cualquier tratamiento estadstico
LOS PARMETROS.- Son cualquiera caracterstica que se pueda medir y cuya medicin se lleve
a cabo sobre todos los elementos que integran una poblacin determinada, los mismos suelen
representarse con letras griegas. El valor de un parmetro poblacional es un valor fijo en un momento
dado.
Ejemplo: La media Aritmtica = (mu), La desviacin Tpica = , (Sigma) etctera.
LOS ESTADGRAFOS (Estadsticos o Estimadores).- Son aquellas caractersticas medibles,
cuya medicin se realiza sobre los componentes de una muestra, los mismos se representan con letras
del alfabeto castellano. Los estadgrafos no tienen un valor nico, sino que pueden tomar distintos
valores al ser calculados a partir de muestras diferentes.
Ejemplos: la media aritmtica = X , La desviacin Tpica = S.

Estadstica - Lic. Jessica Oliva G.

Pgina | 18

Elaboracin de matriz de datos en Excel.


BARRAS DE HERRAMIENTAS DE EXCEL.
A continuacin se relacionan para cada una de las ventanas principales de Excel los iconos que aparecen
en la barra de herramientas.

REA DE TRABAJO
Veamos algunos de los conceptos bsicos de Excel:
Un libro de Excel equivale a un documento de Word o archivo.
Una hoja es una porcin del libro, formada por filas y columnas.
Se sabe en qu hoja estamos trabajando si miramos su etiqueta.
Una columna es una seleccin vertical de celdas, en cada hoja hay 16000 columnas nombradas con
las letras de la A a la XFD.
Una fila es una seleccin horizontal de celdas, desde la fila 1 a 1 milln por hoja.
Una celda es la interseccin entre una fila y una columna.
La celda activa es aquella que se representa con un contorno y es donde se encuentra el cursor.
Excel es una hoja de clculo que facilita los clculos y la obtencin de indicadores y estadsticos
para estudiar el comportamiento de una o varias variables.
Se podra entender como una matriz de filas y columnas.
Cada combinacin de fila y columna se denomina celda. Por ejemplo la celda A1, B33, Z68.
Un conjunto de celdas se denomina rango, y en Excel se expresa como A1:B4.
En cada celda se puede recoger: - rtulo, nmero, frmula
Estadstica - Lic. Jessica Oliva G.

Pgina | 19

Como su nombre indica, la hoja de clculo nos permite calcular, hacer operaciones matemticas,
lgicas, estadsticas, financieras, etc.
Con la hoja de clculo EXCEL (u otras similares) se pueden obtener fcilmente estadsticos y
medidas que resuman y caractericen una variable, una distribucin de frecuencias, o una
distribucin bidimensional (n-dimensional) de frecuencias, es decir varias variables conjuntamente.
La primera pantalla que aparece en Excel es la siguiente:

Un primer recorrido por la hoja de clculo nos permite conocer las:


- opciones de men
- barra de herramientas
- barra de estado.....
Podemos utilizar la hoja de clculo:
a. Para obtener representaciones grficas segn el tipo de variable.
b. Para ir haciendo los clculos necesarios para obtener los distintos estadsticos (media,
mediana, moda, cuantiles, varianzas, g1, etc.). A partir de unos datos (o de una
distribucin de frecuencias) hacemos los clculos necesarios para desarrollar una
frmula y paso a paso calcular hasta obtener el resultado final. (Sumas, productos,
divisiones, potencias, races, etc.)

Estadstica - Lic. Jessica Oliva G.

Pgina | 20

c. Para analizar un conjunto de informacin. Se usar en el men de Herramientas la


opcin Analizar Datos. Permite describir un conjunto de informacin correspondiente
a una o varias variables.
d. Permite aplicar tcnicas estadsticas ms sofisticadas (regresin, contrastes de
hiptesis, estimacin por intervalos, etc.).
INTRODUCCIN DE DATOS
En Excel se distingue tres tipos de datos:
Ttulos (texto y caracteres).
Valores (Constantes numricas).
Frmula o funciones.
Una vez introducido un dato en una celda debemos pulsar INTRO o TAB para hacerlo efectivo.
DISEO DE LA BASE DE DATOS
Una base de datos, tabla o lista como se conoce habitualmente en Excel, no es ni ms ni menos que una
hoja de clculo, pero con la diferencia de que lleva siempre una fila superior con una lista de ttulos o
cabeceras.
Los datos que contendr sern estructurados y organizados, los datos completos de una fila se
denominarn Registro y cada dato contenido en una columna ser un campo. La primera fila siempre
debe contener los Ttulos de los campos.
Para crear correctamente una BASE DE DATOS debemos tener en cuenta:

No debemos dejar filas ni columnas en blanco.

Crear rtulos de columna en la primera fila de la lista. Excel utiliza los rtulos para generar
informes, as como para buscar y organizar los datos.

En los rtulos de columna utiliza una fuente, un formato o un estilo de letras maysculas que sea
diferente del formato que se asigne a los datos de la lista.

No insertes espacios adicionales al comienzo de una celda ya que afectarn a las clasificaciones y
bsquedas.
Se utilizar como ejemplo el siguiente cuestionario para la construccin de una base de datos en Excel.
Ejemplo de cuestionario
1. Sexo: 1. Hombre
2. Mujer
2. Marca de gaseosa que prefiere
3. Percepcin acerca del sabor de la gaseosa
4. Marca de gaseosa que no comprara
En la hoja de clculo de Excel, se procede a disear la base de datos para el cuestionario elaborado.
La primera celda A1, debe ser el nmero de registro y a continuacin en las siguientes celdas (B1, C1,
D1.) los nombres o abreviaturas que corresponde a la pregunta del cuestionario.

Estadstica - Lic. Jessica Oliva G.

Pgina | 21

Luego que se tienen los ttulos en la primera fila, se procede al llenado de los registros (cuestionarios),
debe tener en cuenta que cada fila es un registro.

Una vez llenado el primer registro (Cuestionario N 1), se contina con los dems registros hasta
completar la base datos. Para este ejemplo se completar 30 registros. Si los primeros caracteres que
escribes en una celda coinciden con una entrada ya existente en la misma columna, Excel rellenar
automticamente los dems. A esta operacin se la conoce como Autocompletar.

Estadstica - Lic. Jessica Oliva G.

Pgina | 22

ORGANIZACIN Y PRESENTACIN DE DATOS


Cuando se realiza la recopilacin de antecedentes con fines estadsticos, se obtiene una gran cantidad de
datos, algunas veces estos estn en su forma natural o emprica (fuentes primarias) y otras ya estn
organizadas en tablas, cuadros y grficos (fuentes secundarias). Los datos pueden estar incompletos,
incorrectos, desordenados, pero en todos los casos constituyen los datos bsicos para iniciar un estudio,
conocer y analizar el comportamiento y las caractersticas de los elementos de una poblacin.
En el trabajo estadstico, siempre se dispone de muchos datos que, definitivamente tienen que ser
clasificados, ordenados y presentados adecuadamente, de tal manera que facilite la comprensin,
descripcin y anlisis del fenmeno estudiado, y obtener conclusiones vlidas para la toma de decisiones.
En general, la organizacin y presentacin de los datos estadsticos, supone realizar los siguientes pasos:
a) Evaluacin y crtica: consiste en inspeccionar la validez y confiabilidad de los datos, para corregir
los errores y omisiones de acuerdo a ciertas reglas fijas. A partir de datos incorrectos no se pueden
obtener buenos resultados.
b) Codificacin: es una tcnica mediante la cual los datos o respuestas (numrica o verbal) se convierte
en un nmero, smbolo o lenguaje que permita su procesamiento o tabulacin.
c) Clasificacin: consiste en establecer las categoras de las variables.
d) Procesamiento o tabulacin de datos: es el registro de nmero de casos (frecuencia o repeticin) en
cada una de las categoras de la variable de acuerdo al plan de tabulacin previamente establecido.
e) Presentacin de los datos: los resultados de la tabulacin se presentan en tablas y grficos. La
presentacin de datos implica tener la informacin estadstica organizada para proceder al anlisis
e interpretacin de los resultados.
En el trabajo estadstico, lo que se tiene disponible en un primer momento es un material numrico, producto
de la observacin o recopilacin de datos, que son categorizados, ordenados, procesados y presentados en
tablas y grficos; hay proceso de resumen estadstico que se concreta con el clculo de indicadores.
Hay dos formas de presentar ordenadamente los datos estadsticos:
i)

En forma de tablas estadsticas

ii)

Mediante grficos y diagramas

Fundamentalmente se usa la forma tabular, los grficos se utilizan complementariamente para ilustrar
mediante figuras el comportamiento de las variables y facilitar la comprensin de los fenmenos estudiados.

TABLAS ESTADSTICAS
Presentan ordenadamente los datos estadsticos en filas y columnas, clasificados y agrupados de acuerdo a
un criterio especfico. Los datos presentados en tablas constituyen la informacin estadstica. Esta
informacin no slo es un valor numrico sino que adems merece una interpretacin de tipo cualitativo
segn el contexto que lo origin. Una tabla estadstica es el resultado de trabajos previos (planeamiento,
recopilacin, tabulacin, clculos, etc.), son las que se incluyen frecuentemente en el cuerpo de los estudios
de las investigaciones o de los informes.
Son esquemas organizados en los que se registran los datos estadsticos en forma organizada con la
frecuencia de cada uno de estos, los mismos se observan en columnas y filas con la finalidad de presentar
la informacin recopilada de una investigacin o estudio determinado. Por lo tanto, las tablas estadsticas
es una ordenacin de datos numricos en filas y columnas con las especificaciones correspondientes acerca
Estadstica - Lic. Jessica Oliva G.

Pgina | 23

de la naturaleza de los datos. Constituye una forma til de presentar los datos estadsticos obtenidos en una
investigacin a travs de cuadros, tablas y grficos. Esta puede presentar la informacin para referencias
generales o para un uso especfico o particular.
La ordenacin de datos en tablas estadsticas, denominada forma tabular o tabulacin, estn constituidos
por datos cuantitativos y stos a su vez estn en filas y columnas de acuerdo con las especificaciones de los
datos. La tabulacin es una presentacin sistemtica de los datos estadsticos de una investigacin
determinada, estos se presentan en forma resumida a travs de las tablas o cuadros estadsticos.
Las tablas estadsticas estn compuestas por las siguientes partes:
1. Ttulo.
2. Encabezamiento.
3. Columna Matriz. o Concepto
4. Cuerpo.
5. Notas de Encabezado
6. Nota de Pie
7. Fuente de Datos

1. Ttulo: Es una descripcin del contenido de la tabla. Debe ser compacta y completa. Este comprende las
siguientes partes:

Numeracin de la tabla: cuando las tablas forman parte de un texto o de un grupo deben ser
numerados en la parte superior central de la hoja.

Titulo Propiamente Dicho: se debe seguir los siguientes puntos:


-

Se debe ubicar centrado en la parte superior de la tabla, y usando letras maysculas para todo el
enunciado.

Se debe redactarse con precisin y que exprese brevemente los datos que se presentan en el
cuadro.

Un ttulo completo indica:


Qu son los datos incluidos en el cuerpo de la tabla?
Dnde est el rea representada por los datos?
Cmo estn los datos clasificados?
Cundo ocurrieron los datos?

2. Encabezado: Es el ttulo de la parte de una columna o columnas. Las tablas ms simples pueden consistir
solamente de dos columnas y dos encabezados: Una para los conceptos y otra para los datos. Debe
disponerse en la parte superior del cuadro y las designaciones que comprenden debern escribirse en lo
posible horizontalmente, debiendo ser preciso y breves, as mismos se dispondr en un orden lgico de
izquierda a derecha. Otra observacin para la elaboracin del encabezamiento, es que tanto l como las
diversas columnas deben separarse con rayas, cerrando el cuadrado por la parte superior e inferior con

Estadstica - Lic. Jessica Oliva G.

Pgina | 24

una raya gruesa o una doble raya, en la actualidad existe la preferencia de no rayar verticalmente el
encabezamiento.
3. Concepto o Columnas Matriz: La descripcin en hilera de la tabla son llamados conceptos; y estos son
colocados al lado izquierdo de la tabla. La naturaleza de las clasificaciones es indicada por los
encabezados de las columnas, incluyendo la columna matriz. Es bueno Recordar que los datos
estadsticos pueden referirse a clasificaciones cualitativas, cuantitativas, cronolgicas o geogrficas;
recordar esto es importante puesto que la naturaleza de los datos tomando en cuenta esta clasificacin
determinar en parte el arreglo en que se lleven stos a la columna matriz. Existen variadas formas de
arreglo de los datos en la columna matriz. Es permisible disponerlos en orden alfabtico, mtodo que se
usa habitualmente cuando los datos se clasifican geogrfica o cualitativamente. Pueden ordenarse
tambin segn clases fijadas por la costumbre: casado, soltero, divorciado, viudo. Es factible observar
que si las diferentes nominaciones son ordenadas alfabticamente, se hace muy sencillo localizarlas.
Cuando se trata de clasificaciones cuantitativas, el arreglo puede hacerse en orden ascendente o
descendente. Cuando se refiere a clasificaciones cronolgicas, se ordenan los aos en sentido ascendente:
1995, 1996, 1997, 1998, y cuando se trate de meses se comienza por el mes de Enero.
4. Cuerpo del cuadro: El cuerpo del cuadro es la parte que contiene los datos estadsticos presentados en
ste. Cada dato individual ocupa en el cuadro un lugar que corresponde a la interseccin de una fila y
una columna dada; por tanto, el significado de los datos en un lugar est indicado por las especificaciones
o partidas combinadas de la columna y la fila que se interceptan. Cuando el valor de uno de los lugares
del cuerpo del cuadro sea cero es conveniente marcar ese lugar con un guin, si no existe el dato, si es
estimado, o si la cifra indica alguna consideracin distinta a la del resto de los otros, debe indicarse con
una llamada y su respectiva aclaratoria al pie del cuadro. La representacin efectiva de los datos en la
tabla depende de los arreglos de las columnas en hileras.
5. Nota de Encabezado: Son usualmente escritas justamente arriba de los encabezados y debajo de los
ttulos. Son usados para explicar ciertos puntos relacionados con la tabla completa que no han sido
incluidos en el ttulo ni en los encabezados ni en los conceptos.
6. Nota de Pie: Las notas de pie son usualmente colocadas debajo de los conceptos. Son usados para
clarificar algunas partes incluidas en la tabla que no son explicadas en otras partes, tal como las notas de
pie en la tabla. Las notas al pie de los cuadros se utilizan para hacer aclaratorias sobre uno o varios
elementos en particular. La nota sobre la fuente de los datos debe indicar el origen de la informacin
presentada en el cuadro.
7. Fuentes: Las fuentes de datos o simplemente fuentes, es usualmente escrita debajo de las notas de pie.
Si los datos fueron recopilados y presentados por la misma persona, es costumbre no establecer la fuente
en la tabla. El objeto de la indicacin de las fuentes de los datos es el de proporcionar el debido
reconocimiento a la persona u organismo que recopil y /o public los datos, adems de indicar, a quienes
deseen ampliar la informacin, el origen de la misma
Uso de porcentajes: En las tablas estadsticas, normalmente se utilizan porcentajes. Existen cuadros que
slo poseen datos en forma de porcentajes, mientras que otros vienen expresados tanto en valores absolutos
como en porcentajes. La finalidad del uso de los porcentajes en los cuadros es facilitar la comparacin, de
tal manera que las relaciones que puedan existir se perciban. Cuando se usan estos es necesario recalcar las
bases sobre las cuales se han establecido dichos porcentajes; esto tiene como propsito indicar al lector cual
es la base que se est utilizando para determinar el mismo.

Estadstica - Lic. Jessica Oliva G.

Pgina | 25

PROPIEDADES DE LAS TABLAS ESTADSTICAS


o

Deben simplificar la presentacin de los datos

Tratar un solo tema

Elaborar un arreglo apropiado de clasificacin.

El tamao de la tabla debe crearse de tal manera que no sea ni muy largo y angosto, ni muy ancho o
corto.

Cada signo de presentacin que se va a utilizar debe estar plenamente identificado.

Las notas que se encuentran al pie de los cuadros deben incluir las descripciones en forma precisa.

Ejemplo de tabla:

Nmero de cuadro
Tabla N 1
Ttulo

Encabezamiento

C
U
E
R
P
O

Razn de falla en el sistema de cajeros automticos del Banco UAW


durante los ltimos 6 meses en la ciudad de Chiclayo

Razn de la falla

N veces

Servidor sin memoria disponible

32

43.2

Software del servidor

30

40.5

Falla elctrica

8.1

Hardware del servidor

5.4

Conexin fsica

2.7

74

100.0

Total
Fuente

Estadstica - Lic. Jessica Oliva G.

Fuente: Banco UAW

Pgina | 26

DISTRIBUCIONES DE FRECUENCIA
Despus de la recopilacin de los datos, es necesario resumirlos y presentarlos en forma tal, que faciliten
su comprensin y su posterior anlisis y utilizacin. Para ello, se ordenan en cuadros numricos y luego se
presentan en grficos.

DISTRIBUCIN DE FRECUENCIAS PARA VARIABLE CUALITATIVA:


Supongamos que en una muestra de n unidades estadsticas se observan k categoras o modalidades
diferentes C1, C2,..., Ck de alguna variable cualitativa X. La tabulacin de estos n datos, es la distribucin
de frecuencias por categoras.

Categoras de la
variable X

Frecuencias

Frecuencias

Frecuencia

Absoluta ni

Relativas hi

Porcentajes Pi

C1

n1

h1

p1

C2

n2

h2

p2

Ck

nk

hk

pk

Total

1.00

100.00

La frecuencia absoluta ni, es el nmero de datos observados en cada categora o modalidad. La suma de
todas las frecuencias absolutas es igual al total n de datos observados.
La frecuencia relativa hi, se define en cada categora por hi = ni / n. La suma de todas las frecuencias
relativas es igual a uno.
La frecuencia relativa porcentual se define en cada fila por hi %= hi x 100%. El total de las frecuencias
porcentajes es igual a cien.

Ejemplo:
Razn de la falla

ni

hi

hi%

Servidor sin memoria disponible

32

0.432

43.2

Software del servidor

30

0.405

40.5

Falla elctrica

0.081

8.1

Hardware del servidor

0.054

5.4

Conexin fsica

0.027

2.7

74

1.000

100.0

Total

Estadstica - Lic. Jessica Oliva G.

Pgina | 27

DISTRIBUCIN DE FRECUENCIAS PARA VARIABLES CUANTITATIVAS DISCRETAS


Sea x1, x2,..., xn un conjunto de n observaciones discretas y sean y1, y2, ..., ym el conjunto de valores
diferentes que toman las observaciones originales (m n).
En general para construir una tabla de distribucin de frecuencias requiere realizar las siguientes
operaciones:
Clasificacin: que consiste en determinar las categoras, que son los distintos valores que toman las
variables o los intervalos de clase.
Tabulacin: que consiste en distribuir las observaciones en las respectivas categoras de la variable. Aqu
se contabiliza cuantos elementos hay en cada categora, es decir, determinar cuntas veces se repite
(frecuencia) cada valor distinto o categora de la variable.
Cuando es grande el nmero de datos observados de una variable discreta, su organizacin es muy
engorrosa. En este caso para resumir los datos y poder calcular las medidas descriptivas, es conveniente
seguir el mtodo de organizacin de variable continua por intervalos.
Se llama frecuencia absoluta, al nmero de veces que aparece este valor en el conjunto de observaciones
y se representa por ni, i= 1, 2, ..., m.

La suma de todas las frecuencias absolutas simple es igual al nmero total de observaciones.

Valores
diferentes
observados

Frecuencias
absolutas
ni

Frecuencias
Relativas
hi

y1

n1

h1

Frecuencias
Relativas
Porcentuales
hi%
h1%

y2

n2

h2

h2%

...

...

...

...

ym

nm

hm

hm%

Total

Nm

100

Se llama frecuencia relativa, al cociente de la frecuencia absoluta entre el nmero de observaciones.

hi

ni
n

La suma de todas las frecuencias relativas es igual a la unidad.

Se llama frecuencia relativa porcentual, a la frecuencia relativa multiplicada por cien.

Estadstica - Lic. Jessica Oliva G.

Pgina | 28

Ejemplo:
Cantidad de Artculos
defectuosos

N Lotes

hi

hi%

0.05

14

0.14

14

18

0.18

18

25

0.25

25

20

0.20

20

10

0.10

10

0.05

0.03

Total

100

1.00

100

DISTRIBUCIN DE FRECUENCIAS PARA VARIABLES CONTINUAS


Sea x1, x2,..., xn un conjunto de n observaciones continuas, siendo n el tamao de la muestra.
En general para construir una tabla de distribucin de frecuencias requiere realizar los siguientes pasos:
1. Determinar la amplitud o recorrido(R): es la longitud del recorrido de los datos. O sea:
R = xmx xmin
2. Determinar el nmero de intervalos(m): Haciendo uso de la frmula de STURGES
m = 1 + 3.32 log(n)
Se recomienda que el nmero de clases est entre 5 y 15
3. Determinemos la amplitud de clase (C):
C=R/m
4. Construir los intervalos de clase partiendo de xmin luego se va sumando la amplitud de clase. Los
extremos de un intervalo deben estar preferentemente definidos, de modo que no exista duda o
ambigedad en el momento de la tabulacin. Un valor xi slo puede pertenecer a un intervalo y
slo uno. En este caso denominaremos el intervalo Li-Ls que significa que es cerrado por la
izquierda y abierto por la derecha.
5. Luego se calcula la marca de clase, que es el punto medio del intervalo denotado por yi.

yi

Li Ls
2

Donde: Li es el lmite inferior del intervalo


Ls es el lmite superior del intervalo

6. Luego obtener la frecuencia absoluta (ni ) que es el procedimiento que consiste en distribuir las
observaciones en los diferentes intervalos.
Estadstica - Lic. Jessica Oliva G.

Pgina | 29

7. Calcular las frecuencias absolutas acumuladas (Ni), que es la suma de las frecuencias absolutas
hasta la i-sima frecuencia absoluta.
i

N i n1 n 2 ... n i

j1

8. Calcular la frecuencia relativa, que es el cociente de la frecuencia absoluta entre el nmero de


observaciones.

hi

ni
n

La suma de todas las frecuencias relativas es igual a la unidad.


9. Calcular la frecuencia relativa acumulada, que es la suma de las frecuencias absolutas hasta la
i-sima frecuencia relativa.
i

H i h1 h 2 ... h n h j
j1

Hi

o tambin:

Ni
n

Li-Ls

yi

ni

Frecuencias
Absolutas
Acumuladas
Ni

Y0 y1

y1

n1

N1

h1

H1

h1%

y1 y2

y2

n2

N2

h2

H2

h2%

....

...

...

...

...

...

...

ym-1 ym

ym

nm

Nm=n

hm

Hm=1

hm%

Intervalos de Marcas Frecuencias


clase
de clase Absolutas

Totales

Frecuencias
Relativas

Frecuencias Frecuencias
Relativas
Relativas
Acumuladas Porcentuales
Hi
hi%

hi

100

Ejemplo:
Ingresos
($)

yi

ni

Ni

hi

Hi

36 45

40.5

0.13

0.13

13

45 54

49.5

11

0.11

0.24

11

54 63

58.5

16

27

0.36

0.60

36

63 72

67.5

12

39

0.27

0.87

27

72 81

76.5

43

0.09

0.96

81 90

85.5

45

0.04

1.00

Total

Estadstica - Lic. Jessica Oliva G.

45

1.00

100

Pgina | 30

REPRESENTACIN GRFICA DE INFORMACIN ESTADSTICA


El fin que persigue todo grfico es el de dar una idea rpida de la situacin que en ese momento se est
investigando. Por tal motivo, la presentacin de los datos por medio de grficos debe ser de una forma
simple y de una compresin fcil. Es preferible construir un conjunto de grficos en donde cada uno de
ellos presente un aspecto sencillo de una situacin determinada, que presentar un solo grfico en el cual se
observen demasiadas relaciones que se haga difcil estudiar de una forma efectiva. Por lo tanto, no debe
sobrecargarse un grfico para tratar de mostrar demasiadas categoras, ya que, la simplicidad es una de la
caracterstica bsica de estos.
Existe una gran variedad de tipos de grficos entre los que se pueden mencionar los pictogramas,
cartogramas, de cuadrados, de tringulos y crculos proporcionales, de sectores circulares, de barras,
lineales, estereogramas, polares, etc., pero los ms utilizados y de interpretacin sencilla son los: Los
grficos de barras, los de sectores circulares y los lineales. En esta asignatura solo se estudiaran las
siguientes grficas:
1. Diagrama de Barras.
2. Diagrama Circular o de Pastel.
3. Histograma.
4. Polgono de Frecuencia.
5. Diagrama de Lneas.
Los diagramas de lneas, el histogramas, el polgono de frecuencia y la ojiva son grficos cartesianos
porque para su construccin requieren del plano cartesiano, a estos se le denominan en trminos generales
grficos de lneas. El diagrama de barras y el de pastel se les denomina grficos de sectores, puesto que, no
requieren del plano cartesiano para su construccin.
Diagrama de Barras
Los diagramas de barras son grficas que se utilizan con mucha frecuencia para representar datos de
una investigacin determinada, son de fcil interpretacin para cualquier lector. Estos grficos estn
constituidos por una serie de rectngulos o barras. La longitud y anchura de cada barra representa un
fenmeno.

Estadstica - Lic. Jessica Oliva G.

Pgina | 31

La forma de elaborar los mismos es la siguiente: se utiliza un sistema de coordenadas rectangulares y


se llevan al eje de las x los valores que toma la variable en estudio y en el eje de las y se colocan
las frecuencias de cada barra. Luego se construyen los rectngulos, tomando como base al eje de las
abscisas, cuya altura ser igual a cada una de las diferentes frecuencias que presentan las variables en
estudio. La magnitud con que viene expresada la variable se observa en la longitud de las barras
(rectngulos). Es importante destacar que solamente la longitud de las barras y no su anchura es lo que
denota la diferencia de magnitud entre los valores de la variable. Todas las barras tienen que tener una
anchura igual, separadas entre s, preferiblemente por una longitud igual a la mitad del ancho de estas
Diagrama de barras correspondiente a los aos de servicio de
los empleados de la Empresa
18
16

Frecuencias

14
12
10
8

16

12
9

4
2

7
4

0
6

10

11

12

Aos de servicio

o distancias iguales entre barras. Es recomendable, que las barras no sean ni excesivamente cortas y
anchas, ni demasiado largas y angostas, esto es con el objeto de dar una visin objetiva de la
investigacin en estudio. Las barras se pueden graficar tanto verticalmente como horizontalmente. Se
pueden elaborar barras compuestas y barras agrupadas. Ejemplo:
Grfico Circular o de Pastel
La grfica de pastel (grfico de sectores) es un tipo de grfica que consiste en representar por medio de
la circunferencia o un crculo las magnitudes que expresan los datos de un estudio determinado. Este
tipo de grfica considera la circunferencia como representante de los datos estadsticos de una
investigacin cualquiera. Por tal motivo, se dividir en tantos sectores como variables tenga la
investigacin en estudio; la magnitud de cada sector se encontrar en relacin directa con la magnitud
de la variable a representar, tomando en cuenta que toda la investigacin se representa con 360. En
general, los datos que se representan por medio de este diagrama son partes componentes de un total.
Para su elaboracin se procede de la siguiente forma: se considera la circunferencia como
representacin del total de la investigacin en estudio, por tal motivo, se dividir toda su superficie en
tantas secciones como variables tenga la investigacin en estudio, las superficies de las sesiones de la
circunferencia deben ser proporcionales a la magnitud de cada componente representado por las
variables.
Ejemplo: Sea la siguiente tabla sobre la Razn de falla en el sistema de cajeros automticos del Banco
UAW

Estadstica - Lic. Jessica Oliva G.

Pgina | 32

Razn de la falla

N veces

Servidor sin memoria disponible

32

43.2

Software del servidor

30

40.5

Falla elctrica

8.1

Hardware del servidor

5.4

Conexin fsica

2.7

Total

74

100.0

En la grfica de pastel se observa la variable y el % correspondiente de la misma.

Conexin fsica
2.7%
Servidor sin
memoria
disponible
43.2%

Software del
servidor
40.5%

Falla elctrica
8.1%

Hardware del
servidor
5.4%

Histograma
El histograma es un diagrama en forma de columna, muy parecido a los grficos de barras. Se define
como un conjunto de rectngulos paralelos, en el que la base representa la clase de la distribucin y su
altura la magnitud que alcanza la frecuencia de la clase correspondiente. Son barras rectangulares
levantadas sobre el eje de las abscisas del plano cartesiano utilizando escalas adecuadas para los valores
que asume la variable en la distribucin de frecuencia. El ancho de la base de los rectngulos es
proporcional a cada clase de la distribucin, de tal manera que, cuando la distribucin tiene clases de
igual el tamao de todos los rectngulos tendr bases iguales. Los lados del rectngulo se levantan
sobre los puntos del eje de las x que corresponden a los lmites de cada clase y la longitud de los mismos
ser igual a la frecuencia que tenga esa clase, los lados por lo tanto corresponden a la frecuencia de
cada clase de la distribucin de frecuencia.
Cuando se elaboran grficas estadsticas en el plano cartesiano es recomendable que en el eje de las
ordenadas se representen las frecuencias y en el eje de las abscisas las variables independiente. El eje
de las y que representa las frecuencias debe empezar siempre en cero. Es importante sealar que la
longitud del eje de las y que representa la altura tenga el 75 % de la longitud del eje de las x, es decir,
si las variable independientes ocupan en el eje x 8 cm, la mxima altura que ocuparan las frecuencias
en el eje y tendr que ser de 6 cm.
Pasos para construir un histograma
1. Se trazan dos ejes de coordenadas, el de abscisas y el de ordenada. Se coloca sobre el eje de las x
los limites inferiores de cada clase y el ltimo lmite superior de la distribucin, y sobre el eje de
las y se coloca la magnitud de la frecuencia de cada clase.

Estadstica - Lic. Jessica Oliva G.

Pgina | 33

Clases

Marca de
clase (yi)

20 24

22

25 29

15

27

30 34

16

32

35 39

21

37

40 44

16

42

45 49

47

50 54

52

55 59

11

57

60 64

62

Total

100

2. Se trazan perpendiculares por los lmites de cada clase, la altura de las perpendiculares ser igual a
la frecuencia de cada clase; y para finalizar se unen las dos perpendiculares que representan a cada
clase, el resultado final ser el histograma.
Histograma correspondiente a las horas extras laboradas
por un grupo de obreros petroleros.

25
21

Frecuencias

20
15

16

16

15
11
10

8
6
4

0
0
15

20

25

30

35

40

45

50

55

60

65

Horas extras laboradas

Polgono de frecuencia
Es un diagrama de lneas que representa los puntos medios y las respectivas frecuencias de una
distribucin de frecuencia de clase. Es una representacin grfica cerrada de una distribucin de
frecuencia. Es otra de las formas de graficar los valores de una distribucin de frecuencia de clase.
No existe ninguna razn estadstica para seleccionar los polgonos de frecuencia en vez de los
histogramas o viceversa, los histogramas simplemente representan una manera de graficar y los
polgonos de frecuencia otra; la diferencia entre ambos radica en que una barra vertical rectangular
representa una clase y su frecuencia en el histograma y un punto cumple la misma funcin en el
polgono de frecuencia.
Estadstica - Lic. Jessica Oliva G.

Pgina | 34

Pasos para elaborar un polgono de frecuencia


1. Se dibuja un plano cartesiano.
2. Se traza sobre el eje de las abscisas, a distancias iguales, los puntos medios de las diferentes clases
de la distribucin de frecuencia.
3. Se levantan perpendiculares por cada una de las marcas de clase, con una longitud igual a la
frecuencia de cada una de las clases que integran la distribucin de frecuencia. Al final de cada
perpendicular se marca un punto.
4. Los puntos resultantes se unen por medio de una lnea recta obtenindose una lnea poligonal.
5. Con la finalidad de cerrar la lnea poligonal se agrega una clase imaginaria con frecuencia cero a
cada extremo de la distribucin de frecuencia, por tal motivo ambos extremos del polgono se
cortan con el eje de las abscisas.
Tambin se puede elaborar un polgono de frecuencia despus de haber graficado un histograma; si se
determina el punto medio de cada rectngulo de un histograma y esos puntos medios se unen por medio
de segmentos de recta dan como resultado el polgono de frecuencia.
Observe que los puntos medios, 17 y 67 del polgono son imaginarios, se utilizan para cerrar la lnea
poligonal, lo que da origen al polgono de frecuencia.
Poligono de frecuenca relacionado con las horas extras laboradas
por un grupo de obreros petroleros de la zona
25
21

Frecuencias

20

15

15

16

16

11

10
8
6

0
17

0
22

0
27

0
32

Diagrama

37

42

47

Puntos Medios

52

57

62

67

de Lnea

El diagrama de lnea es una grfica que se representa en el plano cartesiano, con los datos de un
fenmeno determinado para el cual se ha elaborado un cuadro estadstico. En trminos generales se
puede decir que son aquellas lneas que se dibujan en los ejes cartesianos, siguiendo algunos criterios.
Criterios para elaborar un diagrama de Lneas
1. La utilizacin de la escala que se utilizar en el plano cartesiano puede variar tomando en cuenta
el fenmeno que se va graficar. No es necesario que las abscisas (ejes x) y las ordenadas (eje y)
del plano cartesiano lleven la misma escala; sin embargo, cuando las magnitudes de las variables
no se diferencian sustancialmente, es recomendable utilizar escalas iguales para obtener un grfico
de mayor precisin.

Estadstica - Lic. Jessica Oliva G.

Pgina | 35

2. Cuando una de las variables en estudio se inicia con valores muy altos es recomendable no
comenzar el eje por el origen cartesiano sino por un valor prximo o por el mismo valor por donde
comienza la variable.
3. Es costumbre representar en el eje de las x del plano cartesiano la variable independiente del estudio
que se realiza y en el eje de las y la variable dependiente. En aquellos casos que se dificulta
distinguir el tipo de variable se recomienda colocar en la ordenada del plano cartesiano las
frecuencias de las variables en estudio y sobre la abscisa la variable cronolgica (aos, meses,
semanas, das, horas, etc.).

Ejemplo: Los datos que se presenta a continuacin corresponden a los aos de servicios de 60
empleados de una empresa
4 3 4 5 6 7 8 9 10

8 4 8 6 3 8 10

7 10 9 10

8 3 5 7 8 6 10 9

8 5 3 8 7 8 10

8 10 8

7 9 8 7 6 5 7 10

9 8 10 7 6 7

7 6

Procedimiento.- Con los datos se procedi a elaborar una tabla estadstica:

Aos de servicio de los Empleados de una Empresa


Aos de Servicio

N de Empleados

12

16

10

TOTAL

60

Luego se marc en el eje de las x los aos de servicio con la frecuencia correspondiente en
el eje de las y. Luego, esos puntos se unieron mediante lneas y el resultado fue la grfica
de lnea de los aos de servicio de los empleados de la empresa

Estadstica - Lic. Jessica Oliva G.

Pgina | 36

Grfica de Lnea correspondiente a los aos de servicio de los empleados de la


empresa

20
18
16

Frecuencias

14
12
10
8
6
4
2
0
3

10

Aos de servicio

Estadstica - Lic. Jessica Oliva G.

Pgina | 37

MEDIDAS DESCRIPTIVAS.
INTRODUCCIN
La naturaleza de los datos permite, en muchos casos, cierto tipo de anlisis a partir de los grficos de la
distribucin. Sin embargo, tambin es necesario considerar resmenes numricos que permitan tener una
mejor idea de la manera como los datos estn distribuidos a lo largo de la recta. Estas caractersticas
numricas se llaman estadgrafos.
Algunas de estas medidas dependen de todas las observaciones y son muy sensibles a las fluctuaciones de
stas; otras sin embargo, no dependen de todas las observaciones, siendo resistentes ante los cambios de
los valores extremos.
La mayor parte de los conjuntos de datos muestran a agruparse alrededor de un valor central. Estos valores,
que de alguna manera tipifican al conjunto, se llaman medidas de posicin. Entre estas medidas se tiene: la
media aritmtica, la mediana, la moda y los percentiles
Adems de las medidas de tendencia central estn las medidas que indican la dispersin que se produce en
torno de la media de los datos. Entre estas medidas se tiene: la varianza, la desviacin estndar, el
coeficiente de variacin.
La manera como estn distribuidos los datos de un conjunto puede resumirse en lo que se llama la asimetra
y el apuntamiento de la curva que los describe.

MEDIDAS DE TENDENCIA CENTRAL


MEDIA ARITMTICA O PROMEDIO:
La medida de tendencia central con la cual probablemente est usted ms familiarizado es la media
aritmtica; se conoce tambin como media o promedio; se representa como x y se conoce como "x barra".
Aunque la media es una excelente medida de resumen de una serie de datos, stos deben seguir una
distribucin aproximadamente normal.
A la media se le llama "el centro de gravedad" de una distribucin de frecuencias. Esto significa que la
media acta como el punto de apoyo en una balanza, como se ve en la figura.
Fig.: La media es el centro de gravedad de la distribucin

Simbologa:

Muestra
Poblacin

Tamao
(nmero de datos)
n
N

Media aritmtica

x : media muestral
: media
poblacional

Calculo de la media para datos no agrupados

Estadstica - Lic. Jessica Oliva G.

Pgina | 38

x x2 ... xn
x 1

i 1

Se lee as: la media es igual a la suma de las xs dividido por n.


Ejemplo: La siguiente tabla muestra el nmero de reclamos y quejas presentadas por clientes de una tienda
a lo largo de una semana. Si se elige al azar un da de la semana cuntos reclamos se espera tener?
Da de la semana
Reclamos / da

Lun

Mar

Mier

Jue

Vier

Sab

10

12

10

15

x
i 1

8 10 5 12 10 15 60

10 reclamos
6
6

Interpretacin: Se espera que los clientes de esta tienda realicen 10 reclamos por da.

Calculo de la media para datos agrupados


m

y n y 2 n 2 ... y m n m
y 1 1

y n
i

i 1

yi : marca de clase i

Ejemplo: La distribucin de frecuencias siguiente, representa los puntajes obtenidos en una evaluacin del
desempeo, aplicado al personal tcnico de una empresa. Si se elige al azar un tcnico Qu puntaje se
espera que tenga en su evaluacin de desempeo?
Desempeo
(puntos)

Marca de clase
yi =(li + ls)/2

Nmero de
tcnicos (ni)

11 - 16

(11+16)/2 = 13.5

16 - 21

18.5

21 - 26

23.5

15

26 - 31

28.5

23

31 - 36

33.5

10

Total

60

13.5(4) 18.5(8) 23.5(15) 28.5(23) 33.5(10) 1545

25.7
60
60

Interpretacin: Se espera que el tcnico elegido al azar tenga un puntaje de 25.7 en su evaluacin de
desempeo.

Ventajas y desventajas de la media aritmtica


Estadstica - Lic. Jessica Oliva G.

Pgina | 39

Ventajas:
Es un concepto familiar a la mayora de las personas e intuitivamente claro.
Es nica para cada conjunto de datos.
Es posible comparar medias de diferentes muestras.
Desventajas:
Puede verse afectada por los valores extremos.
Si la muestra es grande y los datos no estn agrupados, su clculo es tedioso.
Si los datos estn agrupados en clases con extremos abiertos, no es posible calcular la media

Nota: La media aritmtica como estadgrafo de posicin de una distribucin, proporciona una idea de la
posicin de los valores alrededor de la media, La media es un promedio, por tanto no significa:
Que todos los valores observados resultan ahora ser iguales.
Que la media se ubica exactamente en el centro de la distribucin, excepto si la distribucin es
simtrica. Entonces, la media aritmtica en general no divide a la distribucin.

Ejercicio:

En una pequea empresa de 10 trabajadores se hizo una prueba de razonamiento y otra de


habilidad. Se obtuvieron las siguientes calificaciones.
Razonamiento

48 38 65 56 16 55 28 62 32 48

Habilidad

36 18 54 47 21 56 68 70 72 38

En cul prueba se espera que tengan mayores resultados los trabajadores?

LA MEDIANA O EL VALOR MEDIANO: Me


Es la medida que divide en dos subconjuntos a los datos, de tal manera que 50% de los datos es menor a la
mediana y el otro 50% es mayor a la mediana.
La mediana es el valor central de la variable, es decir, supuesta la muestra ordenada en orden creciente o
decreciente, el valor que divide en dos partes la muestra.

Clculo de la mediana para datos no agrupados


Cuando el nmero de datos es impar, la mediana es el valor del elemento intermedio: Me = xn 1 / 2
Ejemplo: Los siguientes datos se refieren al nmero de clientes atendidos durante los ltimos 9 das en una
tienda. 14, 12, 7, 17, 10, 13, 15, 10, 12
Primero se ordenan los datos:
7, 10, 10, 12, 12 13, 14, 15, 17
Interpretacin: Durante 5 das se atendieron a menos de 12 clientes y durante 5 das se atendieron a ms de
12 clientes.

Estadstica - Lic. Jessica Oliva G.

Pgina | 40

Cuando el nmero de datos es par, la mediana es igual al promedio de los valores centrales

xn / 2 xn / 2 1

Me =

Ejemplo: Se tienen los siguientes datos 14, 26, 12, 20, 25, 26, 34, 36, 10
Primero se ordenan los datos
10 12 14 20 25 26 34 36
Me: (20+25)/2 = 22.5

Calculo de la mediana para datos agrupados

2 N i 1
Me l i c

ni

Donde:
Li : lmite inferior del intervalo mediano
c

: amplitud del intervalo mediano

ni

: frecuencia del intervalo mediano

Ni-1 : frecuencia acumulada antes del intervalo mediano


Para determinar el intervalo mediano se debe calcular el valor de n/2 y ubicar en la columna de frecuencias
acumuladas la frecuencia que supera al valor de n/2, en ese lugar se ubicar el intervalo mediano.
Ejemplo: La tabla siguiente muestra la experiencia profesional (aos) del personal tcnico que labora en
una empresa.
Experiencia
profesional
(aos)
0 - 3
3 - 7
7 - 11
11 - 15
15 - 19
19 - 23
Total

N de tcnicos
(ni)
4
12
24
16
10
4
70

Ni
4
16
40 IMe
56
66
70

35 16
aos
Me 7 4
10.2
24

Interpretacin: El 50% de los profesionales tcnicos que laboran en esta empresa tienen una experiencia
laboral igual o menor a 10 aos 2 meses. El otro 50% de los profesionales tiene una experiencia laboral
igual o mayor a 10 aos y 2 meses.

Ventajas y desventajas de la mediana

Estadstica - Lic. Jessica Oliva G.

Pgina | 41

Ventajas
La mediana es ms recomendable que la media aritmtica, cuando:
La mediana no est afectada por los valores extremos como sucede con la media.
Se puede determinar para datos cualitativos, susceptibles de ordenarse de acuerdo a rangos,
calificaciones o categoras.
Desventajas
Como valor central, se debe ordenar primero la serie de datos.
Para una serie amplia de datos no agrupados, el proceso de ordenamiento de los datos demanda
tiempo y usualmente provoca equivocaciones.

LA MODA O VALOR MODAL: Mo


La moda es el valor de la variable que tenga mayor frecuencia absoluta, la que ms se repite, es la nica
medida de centralizacin que tiene sentido estudiar en una variable cualitativa, pues no precisa la
realizacin de ningn clculo.
Por su propia definicin, la moda no es nica, pues puede haber dos o ms valores de la variable que tengan
la misma frecuencia siendo esta mxima. En cuyo caso tendremos una distribucin bimodal o polimodal
segn el caso

Calculo de la moda para datos no agrupados


Se observa en el conjunto de datos el valor que se repite con mayor frecuencia.
- El conjunto: 2, 2, 5, 7, 9, 9, 9, 10, 10, 11, 13 tiene la moda Mo = 9.
- El conjunto: 2, 3, 4, 4, 4, 5, 5, 7, 7, 7, 9 tiene dos modas, 4 y 7; es una distribucin bimodal
- El conjunto: 3, 5, 8, 10, 12, 16, 18 no tiene moda.

Calculo de la moda para datos agrupados

1
Mo l i c

1 2
Donde:
1 : frecuencia de la clase modal menos la frecuencia de la clase anterior
2 : frecuencia de la clase modal menos la frecuencia de la clase siguiente

Ejemplo: La tabla siguiente muestra los errores de facturacin durante un mes, en una empresa
comercializadora.

Estadstica - Lic. Jessica Oliva G.

Pgina | 42

Errores de
facturacin

Das

03

37

12

7 11

11 15

15 19

Total

6
Mo 3 4
5.4
6 4

Interpretacin: Durante un mes, el nmero ms frecuente de errores


de facturacin en esta empresa comercializadora es de 5.

30

Ventajas y desventajas de la moda


Ventajas
1. Se puede utilizar tanto para datos cualitativos como cuantitativos.
2. No se ve afectada por los valores externos.
Desventajas
3. No tiene un uso tan frecuente como la media.
4. Muchas veces no existe moda (distribucin amodal)
5. En otros casos la distribucin tiene varias modas, lo que dificulta su interpretacin.

RELACIN ENTRE LA MEDIA, MEDIANA Y MODA


1.

En una distribucin de frecuencias simtricas cuya representacin grfica


es acampanada y adems unimodal: coinciden exactamente en el mismo
valor; media, mediana y moda.

2.

= Me = Mo

Si la distribucin es ms alargada para valores grandes de la variable


(asimetra a la derecha o positiva)

Mo < Me <

Estadstica - Lic. Jessica Oliva G.

Pgina | 43

3.

Si la distribucin es ms alargada para valores pequeos de la variable


(asimetra a la izquierda o negativa)

x < Me < Mo

LOS CUANTILES
Cuando los valores ordenados de una variable han de ser divididos en grupos homogneos en cuanto al
tamao, se suelen utilizar los cuantiles.
Los cuantiles ms usados en el anlisis estadstico son: cuartiles, deciles y percentiles. Los cuantiles se usan
frecuentemente para describir el comportamiento de una poblacin. Los valores se dan a menudo en tanto
por ciento.

Clculo para datos no agrupados


Trabajaremos con lo percentiles por lo que da informacin acerca de cmo se distribuyen los valores sobre
el intervalo, desde el menor hasta el mayor. El percentil se define como sigue:
El p-simo percentil es un valor tal que por lo menos p por ciento de las
observaciones son menores o iguales que este valor y por lo menos (100 p) por
ciento de las observaciones son mayores o iguales que este valor.
Para calcular del p-simo percentil se aplica el siguiente mtodo:
1 Ordenar los datos de manera ascendente

p
n , en donde p es el percentil de inters y n es la cantidad de observaciones.
100

2 Calcule un ndice i

3 Si i no es entero, se redondea. El valor entero inmediato mayor que i indica la posicin del p-simo
percentil.
Si i es entero, el p-simo percentil es el promedio de los valores de los datos ubicados en los lugares i e i+1
Ejemplo: Se tienen los siguientes valores 27, 25, 20, 15, 30, 34, 28 y 25.
Encuentre el percentil 50 y 85

Se ordena: 15 20 25 25 27 28 30 34
Para calcular el percentil 50

p 50
n =
8 4
100 100

Se calcula i

15

20

25

25

27

28

30

34

P50
P50 = (25 + 27) / 2 = 26

Estadstica - Lic. Jessica Oliva G.

Pgina | 44

Para calcular el percentil 85

p 85
n =
8 6.8 7
100 100
P85

Se calcula i

15

20

25

25

27

28

30

34

P85 = 30
Clculo para datos agrupados
Se realiza de modo similar al clculo de la mediana. Si queremos encontrar el p-simo percentil de orden

p
n .
100

p, procedemos a localizar el intervalo que contiene el dato

( p / 100)n N i 1
Pp li c

ni

Donde:
[li ls) : el intervalo que contiene dicho percentil
c

: la amplitud del intervalo

ni

: frecuencia del intervalo

Ni-1

: frecuencia acumulada antes del intervalo

Ejemplo: Los siguientes datos es el nmero de piezas fabricadas por 110 de trabajadores en una semana.
1. Cul es la cantidad de piezas como mximo que fabrica el 25% de trabajadores con menor produccin?
2. Cul es la cantidad de piezas como mnimo que fabrica el 25% de trabajadores con mayor produccin?
N de piezas
fabricadas
20 25
25 30
30 35
35 40
40 45
45 50
50 55
55 60
Total
a.

N de
trabajadores
5
7
9
14
20
26
18
11
110

Ni
5
12
21
35 P25
55
81
99 P75
110

Se calcular el primer cuartil, tomamos P = 25

p 25
n =
110 27.5
100 100

Calculamos

Estadstica - Lic. Jessica Oliva G.

Pgina | 45

27.5 21
P25 35 5
43.1
14
El 25% de trabajadores con menor produccin fabrican como mximo 43.1 piezas.
b.

Se calcular el tercer cuartil, tomamos P = 75

p 75
n =
110 82.5
100 100

Calculamos

82.5 81
P75 50 5
50.4
18
El 25% de trabajadores con mayor produccin fabrican como mnimo 43.1 piezas.

MEDIDAS DE DISPERSIN
Las medidas de posicin central son los valores que de una manera condensada representan una serie de
datos, pero realmente no son suficientes para caracterizar una distribucin de frecuencia. Para describir una
distribucin de frecuencia o serie de datos es necesario, por lo menos otra medida que indique la dispersin
o variabilidad de los datos, es decir, su alejamiento de las medidas de posicin central. Estas medidas de
posicin central no tienen ningn valor si no se conoce como se acercan o se alejan esos valores con respecto
al promedio, en otras palabras es conocer como se dispersan o varan esos valores con respecto al promedio
de una distribucin de frecuencia.
La dispersin o variabilidad se entiende como el hecho de que los valores de una serie difieran uno de otro,
es decir, como se estn dispersando o distribuyendo en la distribucin. De acuerdo con esto es necesario
encontrar una medida que indique hasta qu punto los valores de una variable estn dispersos en relacin
con el valor tpico. Las medidas de variabilidad son nmeros que expresan la forma en que los valores de
una serie de datos cambian alrededor de una medida de posicin central la cual por lo general es la media
aritmtica.
Se llama Variacin o Dispersin de los datos, el grado en que los valores de una distribucin o serie
numrica tienden a acercarse o alejarse alrededor de un promedio. Cuando la dispersin es baja indica
que la serie de valores es relativamente homognea mientras que una variabilidad alta indica una serie de
valores heterognea.
Cuando los valores observados de una serie estn muy concentrados alrededor del promedio, se dice que
ese promedio es o ser muy representativo; pero si estn muy dispersos con relacin al promedio, es decir
muy esparcidos con respecto al promedio, entonces ese promedio es poco representativo de la serie o
distribucin, puesto que no representan adecuadamente los datos individuales de esa distribucin. Es
importante obtener una medida que indique hasta qu punto las observaciones de una serie de valores estn
variando en relacin con el valor tpico de la serie.
Las medidas de dispersin se clasifican en dos grandes grupos:
I.

Las Medidas de Dispersin Absolutas

II.

Las Medidas de Dispersin Relativas

Estadstica - Lic. Jessica Oliva G.

Pgina | 46

MEDIDAS DE DISPERSIN ABSOLUTAS


RANGO O RECORRIDO (R)
Algo que responde a la identificacin de la dispersin de los datos de una muestra es el rango, el cual se
define como la diferencia entre el dato mayor menos el dato menor de un conjunto de datos. Su obtencin
es sumamente sencilla, sin embargo se considera que no es una medida muy significativa, su aplicacin es
ms til en la llamada estadstica no paramtrica. Una expresin para el rango puede ser vista como:

Rango xmax xmin


LA DESVIACIN TPICA O ESTNDAR
Es la medida de dispersin ms utilizada en las investigaciones por ser la ms estable de todas, ya que para
su clculo se utilizan todos los desvos con respecto a la media aritmtica de las observaciones, y adems,
se toman en cuenta los signos de esos desvos. Se le designa con la letra castellana S cuando se trabaja con
una muestra y con la letra griega minscula (Sigma) cuando se trabaja con una poblacin. Es importante
destacar que cuando se hace referencia a la poblacin l nmero de datos se expresa con N y cuando se
refiere a la muestra l nmero de datos se expresa con n. La desviacin tpica se define como:
La raz cuadrada positiva del promedio aritmtico de los cuadrados de los desvos de las observaciones
con respecto a su media aritmtica.
Es una medida de bastante precisin, que se encarga de medir el promedio de la dispersin de las
observaciones de una muestra estadstica. Las influencias de las fluctuaciones del azar, al momento de
seleccionar la muestra la afectan muy poco. Le da gran significacin a la media aritmtica de la serie de
valores. Es siempre una cantidad positiva.
Para datos no agrupados
n

(x
i 1

x) 2
s

n 1

n xi2 xi

n(n 1)

Es importante recordar que cuando se trabaja con la frmula para datos no agrupados y se trata de
una muestra se utilizar como denominador n1, para corregir el sesgo, pero si en la muestra n
50, entonces se utilizar n, simplemente.

Para gatos agrupados


Para calcular la desviacin tpica en datos agrupados existen varios criterios en relacin a la
correccin del sesgo que se produce al tomar una muestra, en este estudio se considerar la frmula
que corrige el sesgo de aquellas muestras en estudio; sin embargo, cuando n sea mayor que 50, no
es necesario tal correccin. Existen muchas frmulas matemticas para calcular la desviacin tpica,

(y

y ) 2 ni

n 1

y n

2
i

ni

n 1

queda a juicio del estudiante utilizar la frmula que l considere ms fcil, siempre y cuando su
aplicacin sea valedera.

Estadstica - Lic. Jessica Oliva G.

Pgina | 47

VARIANZA
Es otra de las variaciones absolutas y la misma se define como el cuadrado de la desviacin tpica; viene
expresada con las mismas letras de la desviacin tpica pero elevada al cuadrado, as S2 y 2. Las frmulas
para calcular la varianza son las mismas utilizadas por la desviacin tpica, exceptuando las respectivas
races, las cuales desaparecen al estar elevados el primer miembro al cuadrado.

yn
y n

s2

i i

2
i i

n 1

Ejemplo: El tcnico responsable del funcionamiento de una empaquetadora automtica, la ajust en


principio, para 450 gr. Media hora despus del principio de la produccin se apartaron 10 paquetes para
verificar su peso. Los resultados son:
Peso (gr)

448

450

453

451

447

449

446

Calcular la desviacin tpica


Para calcular la desviacin tpica utilizaremos la siguiente frmula:

s
n = 7;

3144 ;

Reemplazando:

2
i

n(n 1)

1412140

71412140 3144

n xi2 xi

7(7 1)

2.41gr

Ejemplo: Calcular la varianza y la desviacin estndar de la resistencia a la tensin, en libras por pulgada
cuadrada (psi), de 80 muestras de una nueva aleacin de aluminio y litio.
Como el tamao de muestra es mayor a 50 no es necesario utilizar la correccin n-1
Entonces reemplazando en la frmula tenemos:

y ni
2
i

y n

Resistencia a la
tensin
(psi)
70 90
90 110
110 130
130 150
150 170
170 190
190 - 210
210 230
230 250
Total
Estadstica - Lic. Jessica Oliva G.

2226400
80

13080 2
80
33.13 psi

yi

ni

yi ni

yi2

yi2ni

80
100
120
140
160
180
200
220
240

2
3
6
14
22
17
10
4
2
80

160
300
720
1960
3520
3060
2000
880
480
13080

6400
10000
14400
19600
25600
32400
40000
48400
57600
254400

12800
30000
86400
274400
563200
550800
400000
193600
115200
2226400
Pgina | 48

MEDIDAS DE DISPERSIN RELATIVAS


Las medidas de variabilidad, estudiadas hasta ahora, solo permitan medir las dispersiones absolutas de los
trminos de la muestra. Las medidas, tomadas en esas condiciones, sern de utilidad, slo cuando se trata
de analizar una sola muestra; pero, cuando hay que establecer comparaciones entre distintas muestras, ser
necesario expresar tales medidas en valores relativos, que pueden ser proporciones o porcentajes.
Las medidas de dispersin relativas permiten comparar grupos de series distintas en cuanto a su variacin,
independientemente de las unidades en que se midan las diferentes caractersticas en consideracin.
Generalmente las medidas de dispersin relativas se expresan en porcentajes, facilitando as el estudio con
medidas procedentes de otras series de valores. La dispersin relativa viene a ser igual a la dispersin
absoluta dividida entre el promedio.
Existen varias medidas de dispersin relativa, pero, la ms usada es el coeficiente de variacin de Pearson,
este es un ndice de variabilidad sin dimensiones, lo que permite la comparacin entre diferentes
distribuciones de frecuencias, medidas en diferentes unidades. El coeficiente de variacin de Pearson se
designa con las letras CV. La frmula matemtica es:

CV

s
x

100

Ejemplo: Un fabricante de tubos de televisin dispone de dos tipos de tubos, A y B. Los tubos tienen una
duracin media de 1495 h. y 1875 h. respectivamente. Las desviaciones tpicas son 280 para A y 310 para
B. Determinar qu tubo presenta mayor dispersin absoluta y cul presente mayor dispersin relativa.
Podemos decir directamente que el tipo B presenta mayor dispersin absoluta, ya que la desviacin tpica
es una medida de dispersin.
Para ver la dispersin relativa debemos calcular el Coeficiente de Variacin de Pearson (CV):
Tipo de Tubo

CV

CV (%)

A
B

1495
1875

280
310

0.187
0.165

18.7
16.5

Por tanto, ser el tubo A el que presente mayor dispersin relativa en su duracin.

ESTADIGRAFOS DE ASIMETRA Y KURTOSIS:


COEFICIENTE DE ASIMETRA
En estadstica se dice que una distribucin de datos es simtrica si se le puede doblar a lo largo de un eje
vertical de una manera tal que coincidan los dos lados de la distribucin. Las distribuciones que no tienen
simetra con respecto al eje vertical se les llama sesgada o asimtrica. Una distribucin sesgada a la derecha
tiene una cola prolongada del lado derecho de la distribucin y una cola ms corta del lado izquierdo de la
misma; esta asimetra se le denomina positiva, cuando la cola de la distribucin del lado izquierdo es ms
larga que la del lado derecho, entonces la asimetra es negativa.
En una distribucin simtrica la media, la mediana y la moda son iguales. La simetra se mide por medio
del coeficiente de asimetra. Una distribucin simtrica tiene un coeficiente de asimetra igual a cero.
Cuando una distribucin de frecuencia es asimtrica, la media, la mediana y la moda se alejan una de otra,
es decir, las tres medidas de posicin son diferente; mientras ms se separe la media de la moda, mayor es
la asimetra. Si la distribucin de frecuencia es asimtricamente negativa, la cola de la curva de distribucin
se encuentra hacia los valores ms pequeos de la escala de las X y si la distribucin es asimtricamente
positiva la cola de la distribucin se ubica hacia los valores ms grandes de la escala de las X.

Estadstica - Lic. Jessica Oliva G.

Pgina | 49

Karl Pearson un estudioso de la estadstica designo el coeficiente de asimetra con las letras SK y determin
la frmula para su clculo, al cual se le denomin primer coeficiente de asimetra de Pearson

SK1

( X Mo)
S

Se tiene otro coeficiente de asimetra utilizando la mediana que se le denomina segundo coeficiente de
asimetra de Pearson, este es ms preciso que el primero

SK 2

3( X Md )
S

Si en una serie de valores la X Me Mo, entonces la distribucin de frecuencia presenta una curva
asimtrica positiva; si la X =Me = Mo = 0, la curva de la distribucin es simtrica; y si la distribucin
presenta una curva en la que el Mo Me X , entonces se dice que la curva de la distribucin asimtrica
negativa.
Si la curva de una distribucin de frecuencia es sesgada, la media tratar de ubicarse hacia el extremo o
lado opuesto, de la serie de valores, donde se concentran los datos. Es bueno hacer referencia que en una
asimetra positiva la X Me y en una asimetra negativa la X Me.

Mo < Me <

= Me = Mo

< Me < Mo

Considerar la asimetra de una curva de frecuencia marcadamente o ligeramente asimtrica, es un asunto


de criterio del investigador, puesto que no existen reglas rgidas establecidas que determinen las lneas
divisorias o parmetros entre ligeramente o marcadamente asimtrica; sin embargo cuando la mayora de
los datos de una distribucin de frecuencia se ubican en los extremos mayores o menores de las variables
se puede afirmar con certeza que la curva de la distribucin es marcadamente asimtrica.
Sin embargo, en este estudio se considerar que un coeficiente de asimetra segn los momentos
comprendido entre 0.30 SK 0.30, sera un buen lmite para considerar una curva de distribucin
como ligeramente asimtrica, de lo contrario sera marcadamente asimtrica. El SK es el coeficiente de
asimetra de mayor precisin y confiabilidad, puesto que este, utiliza para su clculo todos los valores de
la serie de datos.
Es bueno afirmar que cuando el coeficiente de asimetra de una curva de distribucin es marcadamente
asimtrico no se puede utilizar la media aritmtica como medida de tendencia central, puesto que esta es
afectada altamente por los valores extremos de una serie de datos, en su lugar es recomendable utilizar
la mediana como medida de posicin.

Estadstica - Lic. Jessica Oliva G.

Pgina | 50

COEFICIENTE DE KURTOSIS
Es el grado de apuntamiento o altura de la curva de una distribucin de frecuencia. La finalidad de la
Kurtosis es determinar si la distribucin de los trminos de una serie de valores responde a una curva
normal o no. Se utiliza para observar el promedio o posicin de la distribucin, as como la media, la
mediana y la moda, se puede en esta observar la asimetra, el grado de concentracin de los datos, en fin,
para observar en forma general el comportamiento de una serie de datos en una distribucin de frecuencia.
Por medio de la Kurtosis se determinar si la distribucin de frecuencia es demasiado puntiaguda, normal
o muy achatada.
El grado de apuntamiento o altura de una curva de distribucin se determina por medio del coeficiente
de Kurtosis, el cual se calcula utilizando el momento cuatro de una serie de valores con respecto a su
media aritmtica. La Kurtosis se designa con la letra K y la frmula de clculo es:

0.5( P75 P25 )


P90 P10

Tomando en cuenta la Kurtosis el K de una curva de distribucin puede ser: Mesocrtica, Platicrtica y
Leptocrtica.
Mesocrticas.- Es aquella curva de una distribucin de frecuencia que no es ni muy alta ni muy achatada,
es la llamada curva normal.
La curva Mesocrtica tiene un coeficiente de Kurtosis igual a tres, es decir, K = 0.263
Leptocrtica.- Es aquella curva de la distribucin que presenta un apuntamiento o altura relativamente
ms alta que la curva Mesocrtica, en esta los datos se encuentran ms concentrados alrededor del
mximo valor. El coeficiente de Kurtosis para curva Leptocrtica es mayor de tres, es decir, K 0.263
Platicrtica.- Es la curva de una distribucin de frecuencia que presenta un achatamiento ms
pronunciado que la Mesocrtica, encontrndose los datos ms dispersos alrededor del mximo valor de
la distribucin. En esta curva el coeficiente de Kurtosis es menor de tres, es decir, K 0.263

1 PLATIKURTICA

2 MESOKURTICA

3 LEPTOKURTICA

Ejemplo: El jefe en control industrial de una empresa somete a un test de fiabilidad 100 dispositivos
electrnicos idnticos y anota su duracin (tiempo hasta el fallo en horas). La recogida de datos lleva a la
distribucin de frecuencias siguiente:

Estadstica - Lic. Jessica Oliva G.

Pgina | 51

Duracin (horas)
0 200
200 400
400 600
600 800
800 1000
1000 1200
1200 1400
1400 1600
Total

N de
dispositivos
34
18
16
13
10
6
2
1
100

El jefe de control de calidad desea saber si la duracin de los


dispositivos se encuentra por debajo de la duracin esperada,
adems desea tener la informacin si la duracin de los
dispositivos est alrededor de la duracin promedio para informar
al jefe de fabricacin de los dispositivos que realice una
inspeccin.

Calculamos el coeficiente de asimetra (puede utilizarse cualquier frmula) y el coeficiente Kurtosis.

x 456

Me = 377.778

Mo = 136

s = 353.927

( X Mo) (456 136)


SK1

0.904
3( SX Md )353.3927
(456 377.778)
SK 2

0.663
S
353.927
El coeficiente de asimetra nos indica que el tiempo de duracin de los dispositivos sigue una distribucin
marcadamente positiva; es decir que el tiempo de duracin de los dispositivos est por debajo del tiempo
esperado.
P10 = 58.824

P25 = 147.059

P75 = 707.692

P90 = 980

0.5( P75 P25 ) 0.5(707.692 147.059)

0.304
P90 P10
980 58.824

El coeficiente de Kurtosis nos indica que el tiempo de duracin de los dispositivos sigue una distribucin
leptocrtica o apuntada; es decir que el tiempo de duracin de los dispositivos estn muy cerca del tiempo
promedio.

Estadstica - Lic. Jessica Oliva G.

Pgina | 52

PROBABILIDAD
INTRODUCCIN.
Como ya se ha visto, la Estadstica es una Ciencia con la que se pretende buscar las regularidades existentes
en el comportamiento de los datos. Sabemos que la Estadstica se puede clasificar en dos grandes bloques:
Estadstica Descriptiva e Inferencia Estadstica. Con el primero lo que se hace es dar un conjunto de
mtodos y herramientas que permiten estudiar esas regularidades cuando lo que observamos es toda la
poblacin. Es decir admitimos que es posible realizar esa operacin de recuento exhaustivo. En tal caso lo
que realizamos con la estadstica es estudiar, describir, el comportamiento de una variable determinada.
Esa observacin exhaustiva nos permite realizar afirmaciones categricas sobre las distintas
caractersticas de la variable, tales como cul es su media, su dispersin, la forma de la distribucin, etc.
Pero esa posibilidad de observacin exhaustiva no siempre es posible. En la gran mayora de los casos nos
vemos limitados a realizar una observacin parcial de la variable. Con ese conjunto limitado de datos
intentaremos conocer las caractersticas de toda la poblacin, es decir, intentaremos inferir su
comportamiento. As una empresa antes de lanzar un nuevo producto estar interesada en conocer cual
puede ser su cuota de mercado, para lo cual realizar un sondeo de opinin entre algunos de sus potenciales
clientes. Pero el resultado de ese sondeo, basado en una muestra (observacin parcial), no le permite
concluir cual ser su verdadera cuota de mercado. La decisin que tome respecto a ese producto estar
marcada por un cierto grado de incertidumbre.
Pero que duda cabe que, en esas situaciones, nuestras afirmaciones ya no pueden ser categricas y las
decisiones que se tomen puede que no sean las ms acertadas como consecuencia de la informacin no
contenida en la muestra. Ms bien al contrario debemos admitir que nuestras conclusiones estn sujetas a
un margen de incertidumbre que es la consecuencia de nuestra observacin parcial de la realidad.
Ante tales circunstancias nuestro objetivo ser doble: por un lado estudiar el comportamiento de la variable
y de otro reducir en la medida de lo posible ese margen de incertidumbre o, al menos, intentar cuantificar
esa falta de certeza en relacin a las caractersticas de las variables. Una forma de cuantificar esa
incertidumbre es haciendo uso del concepto de probabilidad. De hecho la probabilidad es un concepto con
el que convivimos de forma diaria, incluso sin percatarnos de l. Cada vez que hacemos uso de las
expresiones quizs, tal vez, es probable, puede que, etc. estamos implcitamente hablando en trminos
probabilsticos. La incertidumbre es una acompaante inseparable de todas las ciencias sociales e incluso
de las fsicas como seal Heisenberg con el enunciado del principio de incertidumbre de la mecnica
cuntica.
La aficin al juego fue lo que impuls el desarrollo de la probabilidad. En un esfuerzo por aumentar sus
ganancias pidieron a los matemticos que les proporcionaran las estrategias ptimas para varios juegos de
azar. Como resultado de este primer desarrollo de la teora de la probabilidad, se extiende junto con la
estadstica a muchos campos, como la poltica, los negocios, la prediccin del clima, y la investigacin
cientfica.
TRMINOS BSICO DE PROBABILIDAD
Las probabilidades son de gran importancia en la estadstica. Para iniciar el estudio de las probabilidades
es necesario definir una serie de trminos bsicos para su mejor comprensin.

Estadstica - Lic. Jessica Oliva G.

Pgina | 53

Experimento Determinstico: Es aquel experimento en el que es posible predecir el resultado final de ese
proceso aun sin haberlo realizado. Ej. Cuando los qumicos combinan oxigeno ms hidrgeno el resultado
es agua; este experimento no es necesario realizarlo para conocer el resultado.
Experimento aleatorio: Es todo proceso que consiste de la ejecucin de un acto (o prueba) uno o ms veces,
cuyo resultado en cada prueba depende del azar y en consecuencia no se puede predecir con certeza.
Ejemplo: lanzar un dado y observar su resultado, contar objetos defectuosos producidos diariamente por
cierto proceso, etc.
Espacio muestral: se denomina espacio muestral al conjunto de todos los resultados posibles de un
experimento dado. Este conjunto se denotara por . Cada resultado posible de un experimento aleatorio es
un elemento del espacio muestral, que se le conoce como punto muestral.
Ejemplo:
Experimento aleatorio: lanzar un dado y observar el resultado obtenido:
= 1, 2, 3, 4, 5, 6.
Experimento aleatorio: lanzar una moneda dos veces:
= CC, CS, SC, SS.
Experimento aleatorio: lanzar una moneda tres veces:
= CCC, CCS, CSC, CSS, SCC, SCS, SSC, CSS.
Experimento aleatorio: tomar un examen:
= aprobar, desaprobar}
Experimento aleatorio: seleccionar un alumno de acuerdo a su rendimiento acadmico
= sobresaliente, bueno, regular, malo}
Evento o suceso: Es cada resultado del experimento aleatorio o una combinacin de resultados. Tambin
se dice que es un subconjunto del espacio muestral. Los eventos se denotan por letras maysculas:
Ejemplos:
Experimento Aleatorio: se hace rodar un dado y se observa el nmero que aparece en la cara superior.
= 1, 2, 3, 4, 5, 6
Evento: A: obtener un nmero par A = 2, 4, 6

Experimento aleatorio: lanzar una moneda dos veces: = CC, CS, SC, SS.
Evento: B: obtener dos caras
B = CC

Experimento aleatorio: lanzar dos dados y se observa los puntos obtenidos


= (1,1), (1,2), (1,3), (1,4), (1,5), (1,6), (2,1), (2,2), (2,3), (2,4), (2,5), (2,6),
(3,1), (3,2), (3,3), (3,4), (3,5), (3,6), (4,1), (4,2), (4,3), (4,4), (4,5), (4,6),
(5,1), (5,2), (5,3), (5,4), (5,5), (5,6), (6,1), (6,2), (6,3), (6,4), (6,5), (6,6)
Evento: C: obtener la suma de puntos igual o mayor que 10
= (4,6), (5,5), (5,6), (6,4), (6,5), (6,6)
Evento: D: el nmero del primer dado sea mayor que el segundo
D = (2,1), (3,1), (3,2), (4,1), (4,2), (4,3) (5,1), (5,2), (5,3), (5,4), (6,1), (6,2), (6,3), (6,4), (6,5)

Estadstica - Lic. Jessica Oliva G.

Pgina | 54

Eventos Mutuamente Excluyentes: Son aquellos eventos que no pueden ocurrir simultneamente al
realizar una sola vez un experimento. Se dice que dos eventos A y B son mutuamente excluyentes si y solo
si, su interseccin es el conjunto vaco, es decir AB = . Ej. El resultado obtenido al lanzar un dado, si
sale una cara con un 3, no puede salir otro nmero en este mismo lanzamiento.
Eventos Dependientes: Son aquellos sucesos en los que el conocimiento de la verificacin de uno de ellos
altera la probabilidad de verificacin del otro. Se dice que dos o ms eventos son dependientes si la
ocurrencia de uno cualquiera de ellos afecta la probabilidad de la ocurrencia de alguno de los otros eventos.
Ej. Consideremos la probabilidad de obtener 2 cartas de basto al sacar sucesivamente 2 cartas de una baraja
de 40 cartas. Al sacar la primera carta la probabilidad de obtener basto es de 10/40 y al no sustituirla
quedaran en el paquete 39 cartas de las cuales 9 son de basto, en la segunda extraccin la probabilidad de
obtener basto es de 9/39, en este caso la segunda extraccin depende de la primera que tena como
probabilidad 10/40 y la segunda extraccin tendr ahora 9/39 como se puede observar la probabilidad de la
segunda extraccin es afectada por la primera.
Eventos Independientes: Se dice que dos o ms eventos son independientes si la ocurrencia de uno
cualquiera de ellos no afecta la probabilidad de la ocurrencia de ninguno de los otros sucesos. Ej. El evento
de obtener simultneamente un 2 al lanzar un dado y sello al tirar una moneda, est compuesto de 2 sucesos
independientes, puesto que la ocurrencia de un 2 en el dado no afecta la probabilidad de la aparicin de
sello en la moneda y viceversa.
Eventos complementarios: Dos eventos A y A son complementarios si y solo si, se cumple que: P(A) +
P (A) = P(), es decir, son eventos mutuamente excluyentes y su unin es el espacio muestral, entonces
tenemos, P(A) + P(A) = P(S), pero P() = 1, entonces,
P(A)+ P(A) = 1 P(A) = 1- P(A), donde P(A), se lee probabilidad de A complemento.
Eventos no Mutuamente Excluyentes: Son aquellos eventos que pueden verificarse simultneamente. A
estos eventos tambin se les llaman Sucesos Compatibles.
REGLAS DE CONTEO
La capacidad de identificar y contar los puntos mustrales de un experimento es un paso importante para
comprender lo que puede suceder en l. Veamos un experimento que consiste en lanzar dos monedas, donde
los resultados experimentales se definen en funcin de comportamiento de casa y sellos que dan hacia arriba
de las monedas. Cuntos resultados experimentales (o puntos mustrales) son posibles en este
experimento?
Podemos considerar que el experimento de lanzar dos monedas se lleva a cabo en dos etapas: la etapa 1
corresponde a lanzar la primera moneda, y la etapa 2 a lanzar la segunda. El diagrama de rbol es un
dispositivo grfico til para visualizar un experimento de varias etapas y enumerar los resultados
experimentales.

Estadstica - Lic. Jessica Oliva G.

Pgina | 55

CC

CS

SC

SS

Se observa que hay cuatro resultados experimentales del hecho de lanzar dos monedas, y el espacio muestral
del mismo se puede presentar mediante:
= CC, CS, SC, SS.
Regla de conteo para experimentos de etapas mltiples: Una regla til para determinar la cantidad de
puntos muestrales para un experimento de varias etapas es la siguiente:
Si un experimento se puede describir como una sucesin de k etapas, en las que hay n1 resultados en la
primera etapa, n2 en la segunda, etc., la cantidad total de resultados experimentales es igual a (n1)(n2)(nk).
Esto es, la cantidad de resultados del experimento total es el producto de las cantidades de resultados en
cada etapa.
Regla de conteo para combinaciones: La cantidad de combinaciones de N objetos tomando n a la vez es:

CnN

N!
n!( N n)!

Ejercicios:
1. Un experimento consiste en hacer tres llamadas de venta. En cada una habr compra o no compra.
a. Trace un diagrama de rbol de este experimento.
b. Identifique cada punto muestral y el espacio muestral. cuntos puntos muestrales hay?
c. Cuntos puntos muestrales habra si el experimento consistiera en cuatro llamadas?
2. En la ciudad de Milford, las aplicaciones de cambio de zonificacin siguen un proceso de dos etapas:
una revisin por la comisin de planeacin, y una decisin final por el consejo ciudadano. En el paso
1 la comisin de planeacin revisa la peticin de cambio de zonificacin y emite una recomendacin
positiva o negativa acerca del cambio. En el paso 2 en consejo ciudadano revisa la recomendacin de
la comisin de planeacin y vota aprobndola o rechazndola. En algunos casos el voto del consejo
ciudadano concord con la recomendacin de dicha comisin. El constructor de un complejo de
viviendas acaba de presentar una solicitud de cambio de zonificacin. Considere que el procesamiento
de la solicitud es un experimento.
a. Cuntos puntos muestrales hay para este experimento? Haga una lista de ellos.
b. Trace un diagrama de rbol de este experimento.
3. Un experimento consiste en seleccionar al azar 4 alumnos y conocer si practican deporte o no.
a. Cuntos puntos muestrales hay para este experimento? Haga una lista de ellos.
b. Trace un diagrama de rbol de este experimento.
4. Un inversionista que revisa el desempeo de seis acciones seleccionar dos de ellas para invertir
Cuntas combinaciones alternativas de dos acciones debe tomar en cuenta el inversionista.

Estadstica - Lic. Jessica Oliva G.

Pgina | 56

5. Prez y Compaa formar un comit de planeacin a largo plazo, con el encargo de desarrollar un plan
quinquenal estratgico para que la empresa ingrese al mercado de un nuevo producto. El presidente ha
identificado a siete gerentes capaces como candidatos para el comit. De cuntas maneras se puede
formar el comit de tres miembros?
6. Un inspector de control de calidad eligi una pieza fabricada para probarla. Posteriormente se establece
si la parte se acepta, se repara, o se desecha. Despus se prueba otra. Mencione todos los posibles
resultados de este experimento.
7. Un joven tiene cuatro camisas de los siguientes colores: roja (R), blanca (B), negra (N) y
verde(V),tambin posee dos pantalones, gris(G) y azul (A).
a. Trace un diagrama de rbol de este experimento.
b. De cuntas maneras pueden combinarse los pantalones con las camisas o viceversa?
8. Un restaurante de la localidad ofrece un men de tres componentes:
1.- Aperitivo: Sopa (S), o Ensalada(E).
2.- Plato Principal: Bist (B), Carite (C), o Pavo (P).
3.- Postre:Torta (T), o Helado (H).
Construya un diagrama de rbol, indicando el nmero posible de comidas completas (aperitivo, plato
principal y postre) que se pueden consumir.

OPERACIONES CON EVENTOS


Los eventos o sucesos son conjuntos, en consecuencia se pueden combinar eventos para formar nuevos
eventos, para el efecto se realizan diferentes operaciones con conjuntos.
AB (A unin B), es el evento que ocurre si y slo si A o B o ambos ocurren
ii. AB (A interseccin B), es el evento que ocurre si y slo si A y B suceden simultneamente
iii. A (Complemento de A), es el evento que ocurre si y slo si A no ocurre.
i.

AB

AB

Ejemplo:
En el experimento de lanzar dos monedas y un dado
= CC1, CC2, CC3, CC4, CC5, CC6, CS1, CS2, CS3, CS4, CS5, CS6,
SC1, SC2, SC3, SC4, SC5, SC6, SS1, SS2, SS3, SS4, SS5, SS6
Se define los siguientes eventos:
E = que aparezca dos caras y un nmero par
F = que aparezca un dos

Estadstica - Lic. Jessica Oliva G.

Pgina | 57

Es decir:
E = CC2, CC4, CC6
F = CC2, CS2, SC2, SS2
Ahora podemos definir:
a) E y F sucedan, es decir E F = CC2
b) Sucede E F , es decir E F = CC2, CS2, SC2, SS2, CC4, CC6
c) Que no ocurra E, es decir E (elementos que no pertenecen a F)
E = CC1, CC3, CC5, CS1, CS2, CS3, CS4, CS5, CS6, SC1, SC2
SC3, SC4, SC5, SC6, SS1, SS2, SS3, SS4, SS5, SS6
PROBABILIDAD DE UN EVENTO
Diariamente se escuchan afirmaciones que llevan implcito el concepto de probabilidad como por ejemplo
los pronsticos del tiempo que indican las probabilidades de lluvia; los galenos indican la probabilidad que
tiene un enfermo de curarse si realiza al pie de la letra sus tratamientos farmacolgicos, los docentes
especulan sobre las posibilidades de xito del estudiantado si dedican ms tiempo al estudio, las compaas
encuestadoras predicen las oportunidades que tienen los polticos de ganar una eleccin determinada, etc.
La Teora de la Probabilidad es una rama de las matemticas que se encarga de los eventos que se realizan
al azar o fenmenos aleatorios, como a menudo se les denominan. Se define la probabilidad como un
nmero comprendido entre 0 y 1, que se le asigna a un evento para sealar su posibilidad de ocurrencia.
Por lo general las probabilidades se expresan en porcentajes, tambin se pueden expresar con nmeros
decimales. Es una condicin de esta ctedra que siempre se resuelvan las fracciones con que se expresan
las probabilidades de un problema dado; los resultados de esos cocientes deben tener por lo menos 4
decimales y el mismo se representa en porcentaje. La probabilidad de cualquier evento se representa con la
letra P.
Se le asigna la probabilidad de 1 al evento que con certeza ocurrir y se le asigna la probabilidad de 0 a un
suceso que no puede ocurrir; se le asigna una probabilidad de 0.5 a un fenmeno que tenga la misma
posibilidad de suceder o de no suceder. Se le asigna una probabilidad 0 P 0.5, a un fenmeno que
tenga ms posibilidades de no suceder que de suceder; y se le asigna una probabilidad 0.5 P 1 a un
evento que tenga ms posibilidades de suceder que de no suceder.
La probabilidad es una caracterstica que interviene en todos los trabajos experimentales. Es necesario
obtener un procedimiento lgicamente slido para que dichos enunciados tengan validez cientfica. En otras
palabras, en virtud de que la probabilidad en definitiva, es un cuantificador o medida de la posibilidad de
ocurrencia de un suceso al que se le asocia un grado de incertidumbre, se debe estudiar la forma en que esta
medida puede ser obtenida.
Sea el espacio muestral asociado a un experimento aleatorio. La probabilidad de cualquier evento A de
, es el nmero real P(A) que satisface los siguientes axiomas de probabilidad:
a. 0 P(A) 1, para todo evento A
b. P() = 1
c. P() = 0

Estadstica - Lic. Jessica Oliva G.

Pgina | 58

Existen tres enfoques para el estudio de la probabilidad.


Probabilidad Clsica:
Llamada tambin probabilidad a priori debido a que es posible conocer el resultado con anterioridad, es
decir sin llevar a cabo el experimento y slo basado en un razonamiento lgico.
Se calcula a travs de
P(A) = Casos favorables de ocurrencia del evento A
Total de casos posibles
Esta definicin se basa en el supuesto de que todos los resultados probables de un experimento aleatorio
son igualmente probables; es decir, cada uno de los elementos del espacio muestral tiene la misma
probabilidad de salir.
As por ejemplo; si lanzamos un dado normal, debe considerarse que hay igual posibilidad que salga
cualquiera de los nmeros del espacio muestral = {1, 2, 3, 4, 5, 6} entonces la probabilidad de que salga
cualquier nmero ser 1/6.
En general si un experimento aleatorio tiene n resultados posibles, los n elementos del espacio muestral
tendran la misma probabilidad de salir. En consecuencia la probabilidad de que salga cualquiera de ellos
es 1/n.
Probabilidad de Frecuencia Relativa de la ocurrencia
Este enfoque surge por la necesidad de asignar probabilidades a aquellos eventos considerados no
simtricos. Los seguidores de esta corriente afirman que solo a partir de experimentos realizados varias
veces en las mismas condiciones, es posible asignar probabilidades a los eventos de un experimento
aleatorio. En trminos generales el empeo de esta teora es destacar que cuando el nmero de experimentos
aumenta, la frecuencia relativa del evento se estabiliza y se acerca bastante a un valor determinado que
podra ser prcticamente igual a la probabilidad del evento con un elevado grado de certeza. Se halla a
travs de:

P( A)

N ( A) n A

Nmero de veces que ocurri el evento A ____


Nmero total de veces que se repiti el experimento
N () n

La probabilidad de frecuencia relativa, es llamada tambin probabilidad emprica o a posteriori, debido a


que se obtiene el resultado despus de llevar a cabo el experimento un gran nmero de veces.
Ejemplo: En una encuesta realizada a 500 profesores de la ciudad de Chiclayo, se encontr que 320 de
ellos se encuentran trabajando en escuelas no estatales. Hallar la probabilidad que al seleccionar
aleatoriamente un profesor, est trabajando en una escuela no estatal.
Sea el evento A: profesor que trabaja en una escuela no estatal
# Veces que ocurri A = 320
# Total de veces que se repiti el experimento = 500
Luego:
N ( A) 320
P( A)

0.64 64.0%
N () 500

Estadstica - Lic. Jessica Oliva G.

Pgina | 59

Probabilidad subjetiva
Existen varios sucesos de sumo inters cuyas probabilidades no se pueden calcular tomando en cuenta los
mtodos de frecuencia relativa ni con la teora de la probabilidad clsica. Surge entonces, el punto de vista
subjetivo el cual hace hincapi en la probabilidad que resulta de una opinin, creencia, o juicio personal
sobre una situacin determinada. El enfoque subjetivo denominado tambin probabilidad personal, asigna
a los eventos probabilidades, aun cuando los datos experimentales sean escasos o imposibles de obtener.
Los que toman decisiones utilizando este tipo de probabilidad se fundamentan en sus propias experiencias
personales y en muchos casos en presentimientos. Este enfoque de la probabilidad personal se aplica a
problemas de toma de decisiones tales como construcciones de plantas, compras de equipos, licitaciones de
contratos, etc. La probabilidad personal se ha vuelto sistemticamente popular entre los tericos de la toma
de decisiones. Los defensores de esta corriente tratan de buscar soluciones a la asignacin de probabilidades
de aquellos eventos que solo ocurren una vez o que no pueden estar sometidos a experimentos repetidos.
La asignacin de probabilidades a un evento en estas condiciones, ms que un juicio arbitrario, es un juicio
de valor.
Ejercicios:
9. Un grupo de 34 estudiantes de una escuela de administracin, revel la siguiente seleccin de carrera
profesionales:
Contadura
10
Suponga que se selecciona un estudiante y se considera su eleccin
profesional.
Finanzas
5
a) cul es la probabilidad de que estudie la carrera de administracin?
Sistemas de informacin
3
b) qu concepto de probabilidad utiliz para hacer tal estimacin?
Administracin
6
Mercadotecnia
10
10. Se venden 500 billetes para realizar una lotera. Los talones de los billetes se mezclan bien y el ganador
es quien tiene el boleto del taln elegido aleatoriamente al efectuar el sorteo. Si alguien compr 25
billetes, Cul es la probabilidad de que gane?
11. Sea x el nivel de xito de un nuevo programa de televisin. En la tabla siguiente se observan las
probabilidades subjetivas asignadas a cada x para un nuevo programa particular, segn fueron
otorgadas por personas que laboran en tres distintos medios de difusin. cules de estos conjuntos de
probabilidades son inapropiadas? Explique su respuesta.

Grado de xito (x)


Muy exitoso
Exitoso
Nada exitoso

Estadstica - Lic. Jessica Oliva G.

A
0.5
0.4
0.3

Juez
B
0.6
0.5
-0.1

C
0.4
0.3
0.3

Pgina | 60

REGLAS DE LA PROBABILIDAD
REGLA DE LA SUMA DE PROBABILIDADES
Se usa cuando se desea averiguar la probabilidad de ocurrencia de uno u otro evento.
Si los eventos A y B son mutuamente excluyentes, la probabilidad de ocurrencia de A o de B es:
P (AB) = P (A) + P (B)
Ejemplo: De 100 alumnos de la especialidad de ingeniera, 20 desaprobaron matemtica, 32 desaprobaron
estadstica y 18 desaprobaron teologa, estos alumnos slo desaprobaron un solo curso. Cul es la
probabilidad de seleccionar un alumno que haya desaprobado matemtica o estadstica o teologa?
P(A B C) = P(A) + P(B) + P(C) =

n (A) n (B) n (C) 20


32 18

0.7
n () n () n () 100 100 100

Si los eventos A y B no son mutuamente excluyentes, la probabilidad de ocurrencia de A o de B es:


P(AB) = P(A) + P(B) P(AB)
Donde:
P(AB): Probabilidad de ocurrencia de que el evento A o B ocurran
P(AB): Probabilidad de que ocurran simultneamente los eventos A y B
Eventos Mutuamente excluyente: La ocurrencia de un evento implica que ninguno de los otros
eventos pueden ocurrir al mismo tiempo
Ejemplo: De 100 alumnos de la especialidad de ingeniera, 20 desaprobaron matemtica, 32 desaprobaron
estadstica y 18 desaprobaron teologa, 5 desaprobaron matemtica y estadstica, 9 desaprobaron
matemtica y teologa, 10 desaprobaron estadstica y teologa
a. Cul es la probabilidad de seleccionar un alumno que haya desaprobado matemtica o estadstica?
b. Cul es la probabilidad de seleccionar un alumno que haya desaprobado matemtica o teologa?
c. Cul es la probabilidad de seleccionar un alumno que haya desaprobado estadstica o teologa?
Solucin:
A: Alumno desaprob Matemtica P(A) = 20/100 = 0.20
B: Alumno desaprob Estadstica P(B) = 32/100 = 0.32
C: Alumno desaprob Teologa
P(C) = 18/100 =0.18
P(A B) = 5/100 = 0.05, P(A C) = 9/100 = 0.09, P(B C) = 10/100 = 0.10
a. P(A B) = P(A) + P(B) P(AB) = 0.20 + 0.32 - 0.05 = 0.47
b. P(A C) = P(A) + P(C) P(AC) = 0.20 + 0.18 - 0.09 = 0.29
c. P(B C) = P(B) + P(C) P(BC) = 0.32 + 0.18 0.10 =0.40

Estadstica - Lic. Jessica Oliva G.

Pgina | 61

REGLA DE LA MULTIPLICACIN
Se utiliza para calcular la probabilidad de ocurrencia simultnea de dos o ms eventos
Si los eventos A y B son dependientes, entonces la ocurrencia de un evento tiene efecto sobre la
probabilidad de ocurrencia del otro evento, por lo tanto la ocurrencia simultnea de los eventos es:
P(AB) = P(A) P(B/A)
Ejemplo: Suponga que se extrae dos cartas, una a la vez sin reemplazo, de una baraja ordinaria. Cul
es la probabilidad de que ambas cartas sean ases?
A: un as en la primera extraccin
B: un as en la segunda extraccin
P(AB) = P(A).P(B/A) = (4/52).(3/51) = 0.0045
Ejemplo: Supongamos que se extrae al azar dos frutas, de una bolsa que contiene 4 manzanas, 6 naranjas y
5 duraznos. Se obtiene una muestra sin reemplazo. Cul es la probabilidad de que se obtenga una naranja
y una manzana, en ese orden?
A: Extraer una naranja en la primera extraccin
B: Extraer una manzana en la segunda extraccin dada una naranja en la primera extraccin
P(AB) = P(A) P(B/A) = (6/15).(4/14) = 0.1143
Si los eventos A y B son independientes, entonces la ocurrencia de un evento no tiene efecto sobre la
probabilidad de ocurrencia del otro, por lo tanto la ocurrencia simultnea de los eventos es
P(A B) = P(A) P(B)
Ejemplos: Supongamos que lanzamos un par de dados legales una sola vez. Cul es la probabilidad de
obtener un 2 en el primer dado y un 4 en el segundo?
A: Obtener 2 en el primer dado
B: Obtener 4 en el segundo dado
P(AB) = P(A) P(B) = 1/6 x 1/6 = 1/36
Ejemplos: Supongamos que se extrae una muestra aleatoria de una bolsa de frutas. La bolsa contiene 4
manzanas, 6 naranjas y 5 duraznos. Si se selecciona 2 frutas, una a la vez, con reemplazo. Cul es la
probabilidad de que se obtenga una naranja y una manzana en ese orden?
A: Obtener una naranja
B: Obtener una manzana
P(AB) = 6/15 * 4/15 = 24/225
PROBABILIDAD CONDICIONAL
La probabilidad de que ocurra un evento B cuando se sabe que ha ocurrido algn otro evento A, se denomina
PROBABILIDAD CONDICIONADA y se designa como P(B/A). l smbolo P(B/A) se lee como la
probabilidad de que ocurra B sabiendo que ocurri A o sencillamente probabilidad de B dado A Las
probabilidades condicionadas estn relacionadas a probabilidades asociadas a los eventos definidos en
subpoblaciones o espacios mustrales reducidos.

Estadstica - Lic. Jessica Oliva G.

Pgina | 62

Se dice que la probabilidad de ocurrencia de un evento dado es condicionada, si esta se afecta por la
ocurrencia de otro evento presente.

P( B A) P( BA)

,
P( A)
P( A)

P(B/A) =

si P(A) 0

Ejemplo: Un profesor de matemticas da clases en una seccin matutina y una vespertina de introduccin
al clculo.
Sea A = {el profesor da una mala conferencia matutina} y
B = {el profesor da una mala conferencia vespertina}.
Si P(A) = 0.3, P(B) = 0.2 y P(AB) = 0.1, calcule las siguientes probabilidades.
a) P(B/A)

b) P(B/A)

a) P( B / A)

c) P(B/A)

P( BA) 0.1

0.33
P( A) 0.3

b) P( B' / A)

P( B' A) P( A) P( AB ) 0.3 0.1

0.67
P( A)
P( A)
0.3

c) P( B / A' )

P( BA' ) P( B) P( AB ) 0.2 0.1

0.14
P( A' )
P ( Ac )
0.7

TEOREMA DE BAYES
Es un mtodo que nos permite calcular la probabilidad de que un evento que ya ocurri (o efecto) sea
resultante de alguna causa.
Si A1, A2, , An son sucesos n mutuamente excluyentes, de los cuales al menos unos de los Ai (i = 1, 2, ...,
n) debe ocurrir, y sea B un suceso cualesquiera en , la probabilidad condicional de la ocurrencia de Ai
cuando el evento B ha ocurrido es:

P(Ai/B) =

P( Ai ) P( B / Ai )

P(A )P(B / A )

i
= n i
P ( A1 ) P( B / A1 ) P( A 2 ) P( B / A 2 ) ... P( A n ) P( B / A n )
P(Ai )P(B / Ai )
i 1

Ejemplo:
En una empresa del total de trabajadores, se tiene que el 50% son ingenieros, el 30% son abogados y el
20% son administrativos; adems se tiene que el 8% de los ingenieros, el 9% de los abogados y el 10% de
los administrativos son provincianos (nacidos fuera de la capital).
a. Supongamos que se selecciona un trabajador al azar y resulta ser provinciano. Hallar la probabilidad
de que el trabajador sea ingeniero.
b. Supongamos que se selecciona un trabajador al azar y resulta ser provinciano. Hallar la probabilidad
de que el trabajador sea abogado.
c. Supongamos que se selecciona un trabajador al azar y resulta ser provinciano. Hallar la probabilidad
de que el trabajador sea abogado.
d. Supongamos que se selecciona un trabajador al azar y resulta ser no provinciano. Hallar la
Estadstica - Lic. Jessica Oliva G.

Pgina | 63

probabilidad de que el trabajador sea ingeniero.


Solucin:
A1 = Trabajador ingeniero
A2 = Trabajador abogado
A3 = Trabajador administrativo
B = Trabajador provinciano
B = Trabajador no provinciano
P(A1) = 0.50 , P(A2) = 0.30, P(A3) = 0.20

P(B/A1) = 0.08

P(A1)=0.50
P(B/A1) = 0.92
P(B/A2) = 0.09

P(A2)=0.30
P(B/A2) = 0.91

P(B/A3) = 0.10

P(A3)=0.20
P(B/A3) = 0.90

a. P(A1/B) =

b. P(A2/B) =

c. P(A3/B) =

d. P(A2/B) =

P ( A1 ) P ( B / A1 )
P ( A1 ) P ( B / A1 ) P ( A 2 ) P ( B / A 2 ) P ( A 3 ) P ( B / A 3 )

0.50(0.08)
0.4798
0.50(0.08) 0.30(0.09) 0.20(0.10)

P( A 2 ) P( B / A 2 )
P ( A1 ) P ( B / A1 ) P ( A 2 ) P ( B / A 2 ) P ( A 3 ) P ( B / A 3 )
0.30(0.09)
0.3103
0.50(0.08) 0.30(0.09) 0.20(0.10)

P( A 3 ) P( B / A 3 )
P ( A1 ) P ( B / A1 ) P ( A 2 ) P ( B / A 2 ) P ( A 3 ) P ( B / A 3 )
0.20(0.10)
0.2299
0.50(0.08) 0.30(0.09) 0.20(0.10)

P ( A2 ) P ( B ' / A2 )
P ( A1 ) P ( B ' / A1 ) P ( A2 ) P ( B ' / A2 ) P ( A3 ) P ( B ' / A3 )
0.30(0.91)
0.2990
0.50(0.92) 0.30(0.91) 0.20(0.90)

Estadstica - Lic. Jessica Oliva G.

Pgina | 64

Anda mungkin juga menyukai