Responsable:
Lic. Jessica L. Oliva Gastulo
Pgina | 2
El gran nmero de informacin estadstica que se ofrece al pblico, por una razn u otra, escapa al
entendimiento, y una incertidumbre colectiva radica en que porcin de la estadstica es buena y cual
es mala. Indudablemente, no se puede aceptar toda la informacin sin emitir crtica. Algunas veces,
conclusiones totalmente errneas se basan en datos fehacientes. Por ejemplo, en alguna ocasin cierto
alcalde afirm que la ciudad x era la ms sana de la nacin, ya que su ndice de mortalidad era el ms
bajo del pas. Aunque concordamos con su afirmacin de que ser sano significa no estar muerto, existen
otros factores que no se tomaron en consideracin: cmo la ciudad no tena hospital, sus habitantes
tenan que ser hospitalizados en otra ciudad y si el enfermo mora el fallecimiento se registraban en el
lugar donde ciertamente ocurri la muerte y no en la ciudad de origen del difunto. Los siguientes son
algunos de los otros casos errnea basada en datos estadsticos, en otra informacin que eran fidedigna:
la estadstica seala que hubo menos accidentes de aviacin en 1920 que 1990, por lo tanto, era ms
seguro volar en 1920 que 1990, anlisis estadstico errneo aunque la estadstica es verdad. Como
existen ms accidentes de automviles en el da que en la noche es ms seguro conducir de noche, otro
error al realizar tal afirmacin, como se puede observar no siempre con las estadsticas se pueden hacer
afirmaciones tomando en cuenta algunos datos estadsticos valederos, si antes no se analizan otras
variables relacionadas con las estadsticas.
Hay que hacer una explicacin antes de comenzar un estudio formal aplicando las tcnicas estadstica;
se pondr en claro que los procedimientos estadsticos acertado de un problema implican mucho ms
que hacer algunas observaciones en la elaboracin, realizar algunas operaciones y llegar a cierto tipo
de conclusiones. Existen muchas incgnitas en la elaboracin de un estudio estadstico tales como: la
forma en que se recolectan los datos y como se planifica una investigacin o es un estudio en su
totalidad, es de importancia primordial. Como en cualquiera otra ciencia, en la estadstica hay que tener
la precaucin adecuada en todo la fase de cualquiera investigacin, desde la concepcin y
planteamiento del problema, que algunas veces es el trabajo ms dificultoso, hasta la planificacin y
el diseo, pasando por las etapas de recoleccin, organizacin, tabulacin, anlisis e interpretacin de
los datos, si no se toman en cuenta estas etapas no se podr llegar a una conclusin til o valedera. En
trminos generales, ni siquiera un prolongado y elegante manejo matemtico o estadstico de los datos,
aun con el equipo de computacin ms costoso y sofisticado del mundo, pueden salvar los estudios o
experimentos mal diseado. En realidad, los estadsticos profesionales insisten en que hasta los estudios
de muestreo ms simple deben llevarse a cabo con estricto apego a reglas bien definidas; de tal forma
que, no existe una justificacin para llamar estadstico a un estudio que no se ajuste a estas normas.
Cuando coloquialmente se habla de estadstica, se suele pensar en una relacin de datos numricos
presentados de forma ordenada y sistemtica. Esta idea es la consecuencia del concepto popular que
existe sobre el trmino y que cada vez est ms extendido debido a la influencia de nuestro entorno, ya
que hoy da es casi imposible que cualquier medio de difusin, peridico, radio, televisin, etc., no nos
tope diariamente con cualquier tipo de informacin estadstica sobre accidentes de trfico, ndices de
crecimiento de poblacin, turismo, tendencias polticas, etc. La palabra estadstica ha sido
frecuentemente referida a la informacin cuantitativa o numrica. Tambin ha sido referida
ampliamente a los mtodos que tratan con la informacin. Sin embargo, esto debera aclararse y llamar
a la informacin datos estadsticos y a los mtodos utilizados para su recoleccin, tcnicas estadsticas.
Cuando un lector tiene pocos hechos numricos, puede utilizar la informacin numrica en su mxima
extensin sin perder mucho tiempo o pensar demasiado en analizar los hechos.
Estadstica - Lic. Jessica Oliva G.
Pgina | 3
Pgina | 4
organizacin, resumen, representacin y anlisis de datos o hechos, que se presten a una evaluacin
numrica; tales como: fenmenos sociales, econmicos, polticos, culturales, etc.
Ya que solo a travs del empleo de los mtodos estadsticos es posible el ordenamiento, clasificacin,
presentacin y estudio preciso de datos, hechos y ocurrencia masivas; que estn sujetas a la explicacin
de dicha ciencia, la cual permite un mejor entendimiento del estudio que se est realizando.
Se puede por tanto clasificar la Estadstica en descriptiva, cuando los resultados del anlisis no
pretenden ir ms all del conjunto de datos, e Inferencial cuando el objetivo del estudio es derivar las
conclusiones obtenidas a un conjunto de datos ms amplio.
RAMAS DE LA ESTADSTICA
ESTADSTICA DESCRIPTIVA: Describe, analiza y representa un grupo de datos utilizando
mtodos numricos y grficos que resumen y presentan la informacin contenida en ellos. Se puede
definirse como aquel mtodo que contiene la recoleccin, organizacin, presentacin y resumen de
una serie de datos. El mencionado resumen puede ser tabular, grfico o numrico. El anlisis que se
realiza se limita en s mismo a los datos recolectados y no se puede realizar inferencia alguna o
generalizacin alguna, acerca de la poblacin de donde provienen esos datos estadsticos.
Una de las ramas de la Estadstica ms accesible a la mayora de la poblacin es la Descriptiva. Esta
se dedica nica y exclusivamente al ordenamiento y tratamiento mecnico de la informacin para su
presentacin por medio de tablas y de representaciones grficas, as como de la obtencin de algunos
parmetros tiles para la explicacin de la informacin.
La Estadstica Descriptiva es la parte de la estadstica que conocemos desde los cursos de educacin
secundaria, que se ensea en los siguientes niveles y que, por lo general, no pasa a ser un anlisis ms
profundo de la informacin. Es un primer acercamiento a la informacin y, por esa misma razn, es la
manera de presentar la informacin ante cualquier lector, ya sea especialista o no. Sin embargo, lo
anterior no quiere decir que carezca de metodologa o algo similar, sino que, al contrario, por ser un
medio accesible a la mayora de la poblacin humana, resulta de suma importancia considerar para as
evitar malentendidos, tergiversaciones o errores.
La Estadstica Descriptiva analiza, estudia y describe a la totalidad de los individuos de una poblacin,
su finalidad es obtener informacin, analizarla, elaborarla y simplificarla lo necesario para que pueda
ser interpretada cmoda y rpidamente y, por tanto, pueda utilizarse eficazmente para el fin que se
desee.
El proceso que sigue la Estadstica Descriptiva para el estudio de una cierta poblacin consta de los
siguientes pasos:
Mediante encuesta o medicin, obtencin del valor de cada individuo en los caracteres
seleccionados.
Pgina | 5
Obtencin de parmetros estadsticos, nmeros que sintetizan los aspectos ms relevantes de una
distribucin estadstica.
Por ejemplo: si un investigador aplica un test de aptitud a un grupo de graduados de un instituto superior
recientemente contratados por una empresa; entre lo que puede hacer con las puntuaciones que resultan
del test valindose de la estadstica descriptiva, estn los aspectos siguientes: arreglar las puntuaciones
o clasificarlas de manera que con solo dar un vistazo a los datos se pueda obtener una imagen general
de los mismos, construir tablas, grficas y cuadros estadsticos para visualizar el comportamiento de
los datos o bien convertir las puntuaciones brutas en rangos o en percentiles para realizar
comparaciones, etc.
ESTADSTICA INFERENCIAL: Es aquella rama de la estadstica que apoyndose en el clculo de
probabilidades y a partir de datos mustrales, efecta estimaciones, decisiones, predicciones u otras
generalizaciones sobre un conjunto mayor de datos. Puede definirse como aquella rama de la estadstica
que hace posible la estimacin de una caracterstica de una poblacin o la toma de una decisin referente
a una poblacin, fundamentndose slo en los resultados de la muestra.
La Estadstica Inferencial, por otro lado, se refiere a la rama de la estadstica que trata de los procesos
inferenciales, la que a su vez vislumbra la teora de estimacin y prueba de hiptesis. Uno de los
primordiales aspectos de la inferencia estadstica es el proceso que radica en utilizar estadsticos
mustrales para adquirir conclusiones sobre los verdaderos parmetros de la poblacin.
Los requerimientos de los mtodos de la inferencia estadstica se originan de la necesidad del muestreo.
Al tornarse muy grande una poblacin, comnmente resulta demasiado costoso, prolongado en el tiempo
y complicado obtener informacin de la poblacin completa. Las decisiones con respecto a las
caractersticas de la poblacin se deben basar en la informacin contenida en una muestra de esa
poblacin. La teora de la probabilidad suministra l vnculo, determinando la probabilidad de que los
resultados provenientes de la muestra reflejen los resultados que se obtendran de la poblacin.
Se pueden observar con albor estas ideas en el ejemplo de una encuesta poltica. Si el encuestador desea
estimar el porcentaje de votos que un candidato obtendr en una eleccin especfica, no entrevistara a
cada uno de los millares (o inclusive millones) de votantes. Ms bien, seleccionara una muestra de los
votantes. Tomando como base el resultado de la muestra, obtendra conclusiones acerca de la poblacin
total de votantes. A estas conclusiones se les asociara un planteamiento de probabilidad que especfica
la esperanza o la confianza que se tiene de que los resultados de la muestra reflejen la verdadera conducta
de los votantes de toda la poblacin.
La fidelidad de cualquier estimacin tiene una importancia enorme. Esta precisin depende en gran parte
de la forma de tomar la muestra y de la atencin que se ponga en que esta muestra suministre una imagen
fiable de la poblacin, pero casi nunca la muestra representa la poblacin en toda su plenitud, y de ello
resultar un error muestral.
La Estadstica Inferencial complementa a la descriptiva y a travs de ella se puede inferir el
comportamiento de un grupo grande (poblacin) a partir del estudio de una pequea parte de esa
(muestra). La estadstica inferencial nos permite, entre otras cosas, analizar el comportamiento de los
Estadstica - Lic. Jessica Oliva G.
Pgina | 6
mercados a partir de las tendencias de la oferta y de la demanda, y permite tambin visualizar el futuro
comportamiento de una empresa, permitiendo el anlisis de la eficiencia de las empresas. Tambin se
entiende por estadstica inferencial aquella que trata de los procesos inferenciales, la que a su vez
comprende la teora de estimacin y prueba de hiptesis. Esta, tambin provee conclusiones o inferencia,
en base a los datos simplificados y analizados; detectando las interrelaciones que puedan unirlos, las
leyes que los rigen y eliminando las influencias al azar; llegando ms all de las verificaciones fsicas
posibles. Basndose, en la muestra estudiada saca conclusiones, o sea, hace inferencia o induccin, en
cuanto al universo o poblacin, de donde se obtuvo dicha muestra. Para su estudio son necesarios
conocimientos ms profundos de la teora de probabilidades y anlisis matemticos, ya que parte de los
conocimientos resultantes en el proceso descriptivos, para deducir nuevos hechos o relaciones del
conjunto observado con otros conjuntos. Un ejemplo, en el cual se aplica la estadstica inferencial es en
la prediccin de los resultados de unas elecciones antes de que haya concluido el recuento de votos.
FINALIDAD DE LA ESTADSTICA
La estadstica es una ciencia o mtodo cientfico que en la actualidad es considerada como un poderoso
auxiliar en las investigaciones cientficas, que le permite a sta aprovechar el material cuantitativo. No
existen ciencias cuyos fenmenos no puedan ser tratados estadsticamente; por tal razn, la estadstica
la denominan algunos investigadores (Rivas Gonzlez) como el lenguaje cientfico. La misma es
indispensable en la formacin de cualquier profesional universitario o tcnico medio, ya que, por medio
de esta se pueden realizar diagnsticos de cualquiera investigacin que se desee realizar. Esta es
indispensable para realizar cualquier trabajo de investigacin que requiera una recoleccin de
informacin. Ella permite resumir los resultados de una investigacin en una forma significativa y
cmoda. La misma permite deducir conclusiones generales y as afirmar hasta donde se puede ampliar
una generalizacin de una investigacin determinada. De la misma forma permite predecir qu suceder
algo tomando en cuenta ciertas condiciones que se han analizado con datos anteriores.
En las ciencias sociales, administrativas, polticas, medicas, en educacin y en otras ciencias permite
analizar algunos de los factores casuales en sucesos complejos y que de alguna manera confundiran a
un investigador determinado. De acuerdo a lo antes planteado los mtodos estadsticos son por lo tanto
los compaeros constantes de los que realizan investigacin. La estadstica y su aplicacin, ha avanzado
de tal forma en los ltimos aos, que hoy da se ha hecho imprescindible en todas las investigaciones
cientficas sea cual fuere el carcter de esta ltima.
LA ESTADSTICA EN NUESTROS DAS
Hoy en da, la estadstica se ha convertido en un mtodo efectivo para describir con exactitud los valores
de datos econmicos, polticos, sociales, psicolgicos, biolgicos o fsicos, y sirve como herramienta
para relacionar y analizar dichos datos. El trabajo del experto estadstico no consiste ya slo en reunir
y tabular los datos, sino sobre todo en el proceso de interpretacin de esa informacin. El desarrollo
de la teora de la probabilidad ha aumentado el alcance de las aplicaciones de la estadstica. La
Probabilidad, es una rama de las matemticas que se ocupa de medir o determinar cuantitativamente la
posibilidad de que ocurra un determinado suceso. La probabilidad est basada en el estudio de la
combinatoria y es fundamento necesario de la estadstica. Numerosas colecciones de datos se pueden
aproximar con gran exactitud, utilizando determinadas distribuciones probabilsticas; los resultados de
stas se pueden utilizar para analizar datos estadsticos. La probabilidad es til para comprobar la
Estadstica - Lic. Jessica Oliva G.
Pgina | 7
fiabilidad de las inferencias estadsticas y para predecir el tipo y la cantidad de datos necesarios en un
determinado estudio estadstico. En la actualidad la estadstica ha alcanzado tal grado de
perfeccionamiento y especializacin, que podra decirse, que no existe disciplina cientfica en la cual
no se apliquen los mtodos estadsticos como herramienta indispensable para iniciar cualquiera
investigacin de envergadura.
Todo lo que hasta apartadamente tiene que ver con la recoleccin, procesamiento, anlisis e
interpretacin de datos numricos pertenece al dominio de la estadstica, comprende, por ejemplo, el
clculo del aumento, en promedio, de las utilidades de una importante compaa de ventas de artculos
por Internet los ltimos tres aos; la recoleccin y presentacin anual de la deuda a corto plazo de tres
compaas de electricidad, as como un porcentaje de su deuda a largo plazo; la evaluacin de la eficacia
de dos diferentes programas de computacin, destinado reducir el nmero de accidentes personales en
una empresa, el tiempo perdido en trabajo de alto riesgo; y el anlisis de las variaciones que ocurren de
cuando en cuando en serie de datos econmicos, ventas al menudeo, precios al consumidor y al
mayoristas, y distribucin de dinero, precios de productos comunes, productividad del sector agrcola,
etctera.
La palabra estadstica, por s sola se utiliza en varias formas. En un contexto, significa un conjunto de
datos como los que se pueden encontrar en las pginas financieras de los diarios o en los compendios
estadsticos. Pero, en otro mbito, se refiere a la totalidad de los mtodos que se aplican en la
recoleccin, organizacin, presentacin, anlisis e interpretacin de cualquier tipo de datos. En este
ltimo sentido, la estadstica es una rama de las matemticas aplicadas, y es este campo de las
matemticas el que constituye el tema central de este curso.
Una de las manifestaciones ms comentado en los ltimos aos del pasado siglo y del presente milenio,
ha sido el desarrollo de mtodos y conceptos estadsticos. Durante muchos aos, a la estadstica le
concernan principalmente la recoleccin de datos y su presentacin en tablas y grfica; hoy da ha
evolucionado hasta el punto en que su impacto se percibe en casi todas las reas de trabajo del ser
humano. Esto es debido a que la estadstica posmoderna est relacionada directamente con el problema
de la toma decisiones en condiciones de incertidumbre. Sin necesidad de entrar en detalles, existen
elementos de incertidumbre en casi todo lo que el ser humano realiza actualmente.
La caracterstica ms trascendental del reciente avance de la estadstica ha sido el cambio de los
mtodos meramente descriptivo por otros que sirven para hacer generalizaciones o, dicho lo otra
manera, un cambio de la estadstica descriptiva a la deductiva o inferencia estadstica. Por estadstica
descriptiva se entiende a cualquier tratamiento de datos que este diseado para ser resumido o describir
algunas de sus propiedades ms importantes sin intentar deducir nada que escape al alcance de los
datos. Por ejemplo, si un gobierno informa, con base a un censo, que la poblacin del pas fue de 27
millones de habitantes, esto pertenece al campo de estadstica descriptiva. Este sera tambin el caso si
calculamos el crecimiento % correspondiente de una dcada a la siguiente. Sin embargo; ste no sera
el caso si empleramos tales datos para percibir la poblacin del pas en tres aos ms o el crecimiento
porcentual en una dcada.
Pgina | 8
Pgina | 9
prueba y las prdidas de garanta; adems de mejorar la satisfaccin del consumidor y permitir que la
empresa se convierta en un productor de alta calidad y bajo costo en el mercado. La estadstica es un
elemento decisivo en el incremento de la calidad, ya que las tcnicas estadsticas pueden emplearse
para describir y comprender la variabilidad.
Virtualmente todos los procesos y sistemas de la vida real exhiben variabilidad. Por ejemplo, considere
la situacin donde, de un proceso de maquinado, se seleccionan varios componentes del motor de una
aeronave y se mide la altura de la turbina del propulsor de cada parte. Si el instrumento de medicin
tiene una resolucin suficiente, la altura de cada turbina ser diferente; esto es, habr variabilidad en la
dimensin. Otro ejemplo: si se cuenta el nmero de defectos en los gabinetes para computadoras
personales, se encontrar cierta variabilidad en los conteos, ya que algunos gabinetes tendrn pocos
defectos, mientras que otros tendrn muchos. Esta nocin de variabilidad se extiende a todos los
ambientes. Existe variabilidad en el espesor del recubrimiento de xido en las pastillas de silicio, en el
rendimiento por hora de un proceso qumico, en el nmero de errores en los dibujos de ingeniera y en
el tiempo necesario para ensamblar el motor de un automvil.
Por qu se presenta variabilidad? En general, la variabilidad es el resultado de cambios en las
condiciones bajo las que se hacen las observaciones. En el contexto de la manufactura, estos cambios
pueden ser diferencias en las propiedades de los materiales utilizados, en la forma en que trabajan los
obreros, en las variables del proceso (tales como la temperatura, la presin o el tiempo de ocupacin)
y en factores ambientales (como la humedad relativa). La variabilidad tambin se presenta debido al
sistema de medicin utilizado. Por ejemplo, la medicin obtenida a partir de una escala puede depender
del lugar del panel en que se coloque el objeto que se ha de medir.
El campo de la estadstica y la probabilidad consiste de mtodos tanto para describir y modelar la
variabilidad, como para tomar decisiones en presencia de sta. En la Estadstica Inferencial lo que se
desea hacer es tomar una decisin acerca de una poblacin en particular. El trmino poblacin se refiere
a la recoleccin de mediciones de todos los elementos del universo con respecto al cual se quieren
obtener conclusiones o tomar decisiones. En la mayora de las aplicaciones de la estadstica, los datos
disponibles consisten de una muestra de la poblacin de inters. Esta muestra es slo un subconjunto
de observaciones seleccionadas de una poblacin.
El campo de la Estadstica Inferencial se ha desarrollado principalmente desde comienzos de este siglo.
Es resultado de los mtodos para organizar y resumir datos, cuyos orgenes se remontan a varios siglos
atrs. Estos mtodos para resumir y organizar datos se denominan Estadstica Descriptiva. La mayor
parte del uso moderno de la estadstica, particularmente en la ciencia y la ingeniera, se dirige ms hacia
la inferencia que a la descriptiva. Por ejemplo, un ingeniero que disea un nuevo circuito de
computadora fabricar una muestra (prototipo) de ellos, y entonces querr conclusiones sobre la forma
en que estos dispositivos funcionarn una vez que se produzcan a gran escala.
Pgina | 10
mucho tiempo y esfuerzo, la computadora realiza las tareas con mucha mayor eficiencia. La mayor
parte del anlisis estadstico se realiza utilizando una biblioteca de programas estadsticos. El usuario
introduce los datos y luego selecciona los tipos de anlisis y la presentacin de los resultados que le
interesan. 1
CONCEPTO BSICOS
POBLACIN: En estadstica el concepto de poblacin va ms all de lo que comnmente se
conoce como tal. En trminos estadsticos, poblacin es un conjunto finito o infinito de personas,
animales o cosas que presentan caractersticas comunes, sobre los cuales se quiere efectuar un estudio
determinado. En otras palabras, la poblacin se define como la totalidad de los valores posibles
(mediciones o conteos) de una caracterstica particular de un grupo especificado de personas, animales
o cosas que se desean estudiar en un momento determinado. As, se puede hablar de la poblacin de
habitantes de un pas, de la poblacin de estudiantes universitarios del Departamento de Lambayeque,
de la poblacin de casas de la Urbanizacin Las Brisas de la ciudad de Chiclayo, el nmero de carros
marca Toyota de la ciudad de Lambayeque, la estatura de un grupo alumnos de la USAT, la talla, etc.
La poblacin es el conjunto formado por todos los valores posibles que puede asumir la variable objeto
de estudio, ya que constituye la totalidad del grupo que se quiere estudiar los que van a poseer una
caracterstica de ese grupo especfico de individuos, animales o cosas. Es la coleccin de todos los
elementos que se estn estudiando, acerca de los cuales se intenta sacar conclusiones, el cual puede
ser un conjunto finito o infinito de personas, animales o cosas que presentan caractersticas comunes.
As por ejemplo, en un estudio sobre la preferencia de los electores que participaran en una eleccin
presidencial, la poblacin consiste en todos los participantes registrados para votar en ese proceso.
Pero el trmino no slo est asociado a la coleccin de seres humanos y organismos, tambin pueden
ser cosas no vivientes tales como: el estudio de mercado que se realiza para determinar las ventas
anuales de los supermercados de una zona determinada de una ciudad, luego, las ventas anuales de
todos los supermercados constituyen as mismo la poblacin.
MUESTRA: La muestra es un subconjunto de la poblacin, seleccionado de tal forma, que sea
representativo de la poblacin en estudio, obtenindose con el fin de investigar alguna o algunas de
las propiedades de la poblacin de la cual procede. En otras palabras es una parte de la poblacin que
sirve para representarla. Es una parte o porcin extrada de un conjunto por mtodos que permiten
considerarla como representativa del mismo. Entonces, una muestra no es ms que una parte de la
poblacin que sirve para representarla. La muestra debe obtenerse de la poblacin que se desea
estudiar; una muestra debe ser definida sobre la base de la poblacin determinada, y las conclusiones
que se obtengan de dicha muestra slo podrn referirse a la poblacin en referencia.
La muestra debe ser representativa ya que debe contener las caractersticas relevantes de la poblacin
en las mismas proporciones en que estn incluidas en tal poblacin, es decir, contiene las caractersticas
ms importantes de esa coleccin de elementos que representan la poblacin bajo estudio, a fin de
investigar alguna o algunas de las propiedades de la poblacin de la cual procede; y las conclusiones
que se obtengan de dicha muestra slo podrn referirse a la poblacin en referencia.
Pgina | 11
Pgina | 12
TIPO DE VARIABLES
Cualitativa o de Atributos: Cuando expresan una cualidad, caracterstica o atributo, tienen un
carcter cualitativo, sus datos se expresan mediante una palabra, es no numrico, por lo tanto
las operaciones aritmticas, como sumar y obtener promedios, no son significativas. Cuando la
informacin es cualitativa, generalmente interesa saber cuntas o qu proporcin entra en cada
categora.
Ejemplos: sexo, nacionalidad, marcas de auto, grado de satisfaccin con la universidad, causas
de accidentes, lugar de nacimiento, estado civil, etc.
MEDICIN: La asignacin o magnitud que se aplica a las categoras o clases de acuerdo a ciertas
reglas o smbolos. Consiste en la recopilacin de datos y su utilizacin mediante el empleo de una serie
de normas de tipo estadstico; es la representacin simblica de un dato o serie de datos obtenidos por
algn tipo de observacin.
ESCALAS DE MEDICIN DE LAS VARIABLES
Una escala de medicin es una asignacin de valores numricos a las caractersticas de una muestra
o una poblacin, se mide bsicamente en proporcin de escala. Las escalas de medicin son el
conjunto de los posibles valores que determinada variable puede tomar. Por tal razn, los tipos de
escala de medicin estn ntimamente ligados con los tipos de variables a estudiar. Las magnitudes
de las observaciones cuantitativas se conocen como los valores que una variable puede asumir.
Consiste entonces, en una serie de graduaciones que permiten darle un valor numrico a las
caractersticas que estamos midiendo; para hacer ms comprensible y que adquiera un significado
mediante un arreglo ordenado para establecer un anlisis estadstico. Son denominaciones o
clasificaciones de individuos o caractersticas. Las escalas de medicin es el alma fundamental de
toda investigacin Cientfica, puesto que, slo a travs de ellas es como se pueden calibrar los
fenmenos, sus relaciones, entre otros.
Pgina | 13
Se refieren habitualmente a las asignaciones de nmeros a observaciones, de una forma tal que los
nmeros sean susceptibles de anlisis por medio de manipulaciones u operaciones; estas escalas
permiten asignarle un valor numrico a las caractersticas que se estn midiendo. Por lo general
proceden de las medidas de una o ms variables. Dependiendo de la medicin y de la esencia de
las variables, se obtienen diversas clases de datos que originan diferentes escalas. Resulta
intensamente conocer el tipo de escala que representan los datos, debido a que, de su esencia
dependen las tcnicas estadsticas que se debern aplicar para su anlisis. Para lograr estadsticas
confiables hay que manipular cuantiosos datos estadsticos, los cuales poseen determinadas
caractersticas.
Por ejemplo, si los datos son alumnos, entre algunas de ellos se puede sealar el peso, la estatura,
el sexo, el rendimiento acadmico, entre otros. Al elaborar estadsticas con datos y su caracterstica
es necesario contarlas, jerarquizarlas y medirlas, es por ello que, se utilizan las escalas de medicin
como el proceso de asignar nmeros o establecer una correspondencia uno a uno entre objetivos y
observaciones.
Las escalas de medicin se clasifican de la siguiente forma: Escala Nominal, Escala Ordinal,
Escala de Intervalos y Escalas de razn o Proporcin.
Escala de Medicin Nominal: Es aquella en la que los nmeros slo se emplean para
diferenciar los objetos de distintas categoras o cuando se emplean nombres. Se dice que los
datos que se obtienen para una variable cualitativa se miden en una escala nominal. Si los datos
observados simplemente se clasifican en distintas categoras que no implican orden, se tiene un
nivel de medicin nominal. Ejemplos de nmeros, esta caracterstica son las que usan los
jugadores de bisbol, los nmeros telefnicos, los nmeros de las Cedulas de Identidad,
etctera. Se usa una escala nominal cuando se distribuyen conjuntos de objetos, personas o
caractersticas entre dos o ms categoras. La Escala Nominal se utiliza como medida de
identidad. Los nmeros pueden servir como indicativos o etiquetas para identificar objetos o
clases, pues se usa cuando un objeto se diferencia de otro solamente por la nominacin con que
se conoce. La escala nominal es la forma ms dbil de medicin porque no se puede intentar
el conteo de las diferencias dentro de una categora determinada o especificar cualquier orden
o direccin a lo largo de las diversas categoras. Sin embargo, no se intenta medir diferencias
entre los valores clasificados dentro de una categora determinada.
Propiedades de la escala Nominal
1. No intervienen mediciones, ni escala, en vez de esto solo hay cuentas o conteos.
2. Esta escala es considerada excluyente, es decir que la persona u objeto se incluye solamente
en una categora.
3. No existe un orden especfico para esta categora.
4. No presentan el cero.
5. No se basa en diferencia cuantitativa.
6. Los elementos de una categora deben de ser equivalentes, idnticos.
Ejemplos:
Una muestra de personas puede clasificarse con base en la religin profesada:
Estadstica - Lic. Jessica Oliva G.
Pgina | 14
(1) Cristianos;
(2) Judos;
(3) Musulmanes;
(4) Otros; y
(5) Sin Creencia alguna.
O bien podran clasificarse segn el sexo, el color de los ojos, algn partido poltico, etctera.
Otros ejemplos de escala nominal puede ser el nmero de placa de los vehculos, los nmeros
de los telfonos de una ciudad, la Cedula de Identidad de los habitantes de un pas, etctera.
El tipo de operacin estadstica ms utilizada en la escala nominal es el conteo de las
frecuencias con que se presentan las caractersticas en las unidades de las respectivas
subclases. Estas frecuencias pueden ser presentadas con nmeros absolutos, porcentajes y
proporciones. Adems, puede calcularse razones, tasas de incremento, y el coeficiente de
contingencia.
Escala de Medicin Ordinal: Es aquella en la que los nmeros se utilizan para diferenciar en
orden de supremaca de acuerdo con cierto criterio jerrquico, como son los nmeros que se
emplean para clasificar los distintos estratos socio-econmicos o para designar preferencias.
Si los datos observados se clasifican en categoras distintas en las que existe algn orden, se
obtiene un nivel de medicin ordinal Cuando los objetos son medidos en escala ordinal los que
tengan la misma asignacin se consideran iguales; pero los que tengan asignaciones diferentes
pertenecen a categoras distintas. La diferencia entre dos nmeros ordinales no tiene significado
cuantitativo, slo expresan, por ejemplo, que una situacin es mejor que otra, pero no cunto.
La escala ordinal es una forma un tanto ms fuerte de medicin que la nominal, porque se dice
que un valor observado que se clasifica en una categora posee ms la propiedad que se mide
que algn valor observado que se clasifica en otra categora.
Tambin, la escala ordinal siegue siendo una forma de medicin dbil porque no se pueden
hacer planteamientos numricos significativos con respecto a las diferencias entre las
categoras. Es decir, la ordenacin establece slo cul categora es mayor, mejor o
preferida; y no se habla cunto es mayor, mejor o ms preferida. Esta escala se emplea,
cuando un estudio est basado en ciertas normas que se asignan a un conjunto de objetos,
personas o caractersticas o a un conjunto de categoras ordenadas. Las categoras de la escala
se ordenan d acuerdo con la cantidad de rasgos o caractersticas que representan cada una de
ellas ya que la escala ordinal distingue los diferentes valores de la variable, ubicando las
caractersticas en orden, desde la ms alta hasta la ms baja.
Propiedades de la escala Ordinal
1. Las observaciones o elementos se les ordena en rangos o categoras diferentes.
2. Cada categora o rango mantiene una relacin entre s, estas relaciones se expresan en
trminos algebraicos de desigualdades (mayor que o menor que).
3. No es posible definir unidades de mediciones iguales en todos los puntos de la escala.
Pgina | 15
4. Las categoras son mayores o menores que otras categoras, es decir, que existe una
clasificacin de mayor a menor (jerarqua).
5. Las categoras son mutuamente excluyentes y exhaustivas.
6. No presentan el cero.
Se pueden clasificar los habitantes de una ciudad de acuerdo a su situacin econmica, a los
estudiantes tomando en cuenta a su rendimiento acadmico, etctera. Aunque la escala ordinal
resulta en cierta forma ms precisa que la nominal, no alcanza el grado de precisin deseado
en una investigacin.
Otro ejemplo, el orden jerrquico de los militares (Subteniente, Teniente, Capitn, Mayor,
Teniente Coronel, Coronel, General) y la clasificacin acadmica de los profesores
universitarios (instructor, asistente, agregado, asociado, titular) son ejemplos de escala ordinal.
En la escala ordinal las unidades de las subclases guardan una cierta relacin entre s, esto se
pone de manifiesto cuando existe la posibilidad de establecer la relacin menor que o mayor
que, respecto a las caractersticas de las unidades escaladas. Por ejemplo, el grado militar de
A es el de Subteniente y el de B es el de Teniente, luego el grado de B es mayor que el de A
(BA)
Escala de Medicin de Intervalos: Es una escala ms especializada que las dos anteriores,
puesto que es posible ordenar las mediciones y expresar adems en cunto difiere una situacin
de la otra. Por Ejemplo, en las mediciones de temperatura ambiental no slo se puede afirmar
hoy hace ms calor que ayer, si no que de la misma forma se puede expresar hoy la
temperatura es cuatro grados centgrados ms alta que la de ayer a la misma hora. Esta
escala se caracteriza por tener una unidad de medida y un origen (cero) arbitrario. La distancia
entre dos mediciones tiene un significado preciso. La escala de intervalos a diferencia de la
nominal y ordinal, es una escala efectivamente cuantitativamente. Una escala de intervalo es
una escala ordenada en la cual la diferencia entre las mediciones es una cantidad significativa.
La escala de intervalos posee adems, de las caractersticas de la escala nominal y ordinal, la
propiedad de que la distancia entre dos valores es de una magnitud conocida, lo que le permite
a esta escala un mayor grado de perfeccin, ya que proporciona nmeros que manifiestan
diferencias palpables entre individuos, objetos o cosas. Por tal razn, la escala de intervalo
revela que un individuo u objeto es tantas unidades ms grande o ms pequeo, ms pesado o
ms ligero, ms rpido o ms lento que otro, es decir, muestra la cantidad en la que un objeto
se diferencia de otro cuantitativamente. En esta escala el punto cero y la unidad de medicin
son arbitrarios. La razn entre dos intervalos es siempre independiente del punto cero y de la
unidad que se emplee en la medicin. En el caso de las escalas de intervalos las unidades de
medicin son iguales.
Propiedades de la escala de Intervalo:
1. Esta escala implica la cuantificacin de los datos
2. En estas medidas se utilizan unidades constantes de medicin (capacidad, peso, cntimos,
grados Fahrenheit o centgrados) los cuales producen intervalos iguales entre puntos de la
escala.
Pgina | 16
Pgina | 17
Pgina | 18
REA DE TRABAJO
Veamos algunos de los conceptos bsicos de Excel:
Un libro de Excel equivale a un documento de Word o archivo.
Una hoja es una porcin del libro, formada por filas y columnas.
Se sabe en qu hoja estamos trabajando si miramos su etiqueta.
Una columna es una seleccin vertical de celdas, en cada hoja hay 16000 columnas nombradas con
las letras de la A a la XFD.
Una fila es una seleccin horizontal de celdas, desde la fila 1 a 1 milln por hoja.
Una celda es la interseccin entre una fila y una columna.
La celda activa es aquella que se representa con un contorno y es donde se encuentra el cursor.
Excel es una hoja de clculo que facilita los clculos y la obtencin de indicadores y estadsticos
para estudiar el comportamiento de una o varias variables.
Se podra entender como una matriz de filas y columnas.
Cada combinacin de fila y columna se denomina celda. Por ejemplo la celda A1, B33, Z68.
Un conjunto de celdas se denomina rango, y en Excel se expresa como A1:B4.
En cada celda se puede recoger: - rtulo, nmero, frmula
Estadstica - Lic. Jessica Oliva G.
Pgina | 19
Como su nombre indica, la hoja de clculo nos permite calcular, hacer operaciones matemticas,
lgicas, estadsticas, financieras, etc.
Con la hoja de clculo EXCEL (u otras similares) se pueden obtener fcilmente estadsticos y
medidas que resuman y caractericen una variable, una distribucin de frecuencias, o una
distribucin bidimensional (n-dimensional) de frecuencias, es decir varias variables conjuntamente.
La primera pantalla que aparece en Excel es la siguiente:
Pgina | 20
Crear rtulos de columna en la primera fila de la lista. Excel utiliza los rtulos para generar
informes, as como para buscar y organizar los datos.
En los rtulos de columna utiliza una fuente, un formato o un estilo de letras maysculas que sea
diferente del formato que se asigne a los datos de la lista.
No insertes espacios adicionales al comienzo de una celda ya que afectarn a las clasificaciones y
bsquedas.
Se utilizar como ejemplo el siguiente cuestionario para la construccin de una base de datos en Excel.
Ejemplo de cuestionario
1. Sexo: 1. Hombre
2. Mujer
2. Marca de gaseosa que prefiere
3. Percepcin acerca del sabor de la gaseosa
4. Marca de gaseosa que no comprara
En la hoja de clculo de Excel, se procede a disear la base de datos para el cuestionario elaborado.
La primera celda A1, debe ser el nmero de registro y a continuacin en las siguientes celdas (B1, C1,
D1.) los nombres o abreviaturas que corresponde a la pregunta del cuestionario.
Pgina | 21
Luego que se tienen los ttulos en la primera fila, se procede al llenado de los registros (cuestionarios),
debe tener en cuenta que cada fila es un registro.
Una vez llenado el primer registro (Cuestionario N 1), se contina con los dems registros hasta
completar la base datos. Para este ejemplo se completar 30 registros. Si los primeros caracteres que
escribes en una celda coinciden con una entrada ya existente en la misma columna, Excel rellenar
automticamente los dems. A esta operacin se la conoce como Autocompletar.
Pgina | 22
ii)
Fundamentalmente se usa la forma tabular, los grficos se utilizan complementariamente para ilustrar
mediante figuras el comportamiento de las variables y facilitar la comprensin de los fenmenos estudiados.
TABLAS ESTADSTICAS
Presentan ordenadamente los datos estadsticos en filas y columnas, clasificados y agrupados de acuerdo a
un criterio especfico. Los datos presentados en tablas constituyen la informacin estadstica. Esta
informacin no slo es un valor numrico sino que adems merece una interpretacin de tipo cualitativo
segn el contexto que lo origin. Una tabla estadstica es el resultado de trabajos previos (planeamiento,
recopilacin, tabulacin, clculos, etc.), son las que se incluyen frecuentemente en el cuerpo de los estudios
de las investigaciones o de los informes.
Son esquemas organizados en los que se registran los datos estadsticos en forma organizada con la
frecuencia de cada uno de estos, los mismos se observan en columnas y filas con la finalidad de presentar
la informacin recopilada de una investigacin o estudio determinado. Por lo tanto, las tablas estadsticas
es una ordenacin de datos numricos en filas y columnas con las especificaciones correspondientes acerca
Estadstica - Lic. Jessica Oliva G.
Pgina | 23
de la naturaleza de los datos. Constituye una forma til de presentar los datos estadsticos obtenidos en una
investigacin a travs de cuadros, tablas y grficos. Esta puede presentar la informacin para referencias
generales o para un uso especfico o particular.
La ordenacin de datos en tablas estadsticas, denominada forma tabular o tabulacin, estn constituidos
por datos cuantitativos y stos a su vez estn en filas y columnas de acuerdo con las especificaciones de los
datos. La tabulacin es una presentacin sistemtica de los datos estadsticos de una investigacin
determinada, estos se presentan en forma resumida a travs de las tablas o cuadros estadsticos.
Las tablas estadsticas estn compuestas por las siguientes partes:
1. Ttulo.
2. Encabezamiento.
3. Columna Matriz. o Concepto
4. Cuerpo.
5. Notas de Encabezado
6. Nota de Pie
7. Fuente de Datos
1. Ttulo: Es una descripcin del contenido de la tabla. Debe ser compacta y completa. Este comprende las
siguientes partes:
Numeracin de la tabla: cuando las tablas forman parte de un texto o de un grupo deben ser
numerados en la parte superior central de la hoja.
Se debe ubicar centrado en la parte superior de la tabla, y usando letras maysculas para todo el
enunciado.
Se debe redactarse con precisin y que exprese brevemente los datos que se presentan en el
cuadro.
2. Encabezado: Es el ttulo de la parte de una columna o columnas. Las tablas ms simples pueden consistir
solamente de dos columnas y dos encabezados: Una para los conceptos y otra para los datos. Debe
disponerse en la parte superior del cuadro y las designaciones que comprenden debern escribirse en lo
posible horizontalmente, debiendo ser preciso y breves, as mismos se dispondr en un orden lgico de
izquierda a derecha. Otra observacin para la elaboracin del encabezamiento, es que tanto l como las
diversas columnas deben separarse con rayas, cerrando el cuadrado por la parte superior e inferior con
Pgina | 24
una raya gruesa o una doble raya, en la actualidad existe la preferencia de no rayar verticalmente el
encabezamiento.
3. Concepto o Columnas Matriz: La descripcin en hilera de la tabla son llamados conceptos; y estos son
colocados al lado izquierdo de la tabla. La naturaleza de las clasificaciones es indicada por los
encabezados de las columnas, incluyendo la columna matriz. Es bueno Recordar que los datos
estadsticos pueden referirse a clasificaciones cualitativas, cuantitativas, cronolgicas o geogrficas;
recordar esto es importante puesto que la naturaleza de los datos tomando en cuenta esta clasificacin
determinar en parte el arreglo en que se lleven stos a la columna matriz. Existen variadas formas de
arreglo de los datos en la columna matriz. Es permisible disponerlos en orden alfabtico, mtodo que se
usa habitualmente cuando los datos se clasifican geogrfica o cualitativamente. Pueden ordenarse
tambin segn clases fijadas por la costumbre: casado, soltero, divorciado, viudo. Es factible observar
que si las diferentes nominaciones son ordenadas alfabticamente, se hace muy sencillo localizarlas.
Cuando se trata de clasificaciones cuantitativas, el arreglo puede hacerse en orden ascendente o
descendente. Cuando se refiere a clasificaciones cronolgicas, se ordenan los aos en sentido ascendente:
1995, 1996, 1997, 1998, y cuando se trate de meses se comienza por el mes de Enero.
4. Cuerpo del cuadro: El cuerpo del cuadro es la parte que contiene los datos estadsticos presentados en
ste. Cada dato individual ocupa en el cuadro un lugar que corresponde a la interseccin de una fila y
una columna dada; por tanto, el significado de los datos en un lugar est indicado por las especificaciones
o partidas combinadas de la columna y la fila que se interceptan. Cuando el valor de uno de los lugares
del cuerpo del cuadro sea cero es conveniente marcar ese lugar con un guin, si no existe el dato, si es
estimado, o si la cifra indica alguna consideracin distinta a la del resto de los otros, debe indicarse con
una llamada y su respectiva aclaratoria al pie del cuadro. La representacin efectiva de los datos en la
tabla depende de los arreglos de las columnas en hileras.
5. Nota de Encabezado: Son usualmente escritas justamente arriba de los encabezados y debajo de los
ttulos. Son usados para explicar ciertos puntos relacionados con la tabla completa que no han sido
incluidos en el ttulo ni en los encabezados ni en los conceptos.
6. Nota de Pie: Las notas de pie son usualmente colocadas debajo de los conceptos. Son usados para
clarificar algunas partes incluidas en la tabla que no son explicadas en otras partes, tal como las notas de
pie en la tabla. Las notas al pie de los cuadros se utilizan para hacer aclaratorias sobre uno o varios
elementos en particular. La nota sobre la fuente de los datos debe indicar el origen de la informacin
presentada en el cuadro.
7. Fuentes: Las fuentes de datos o simplemente fuentes, es usualmente escrita debajo de las notas de pie.
Si los datos fueron recopilados y presentados por la misma persona, es costumbre no establecer la fuente
en la tabla. El objeto de la indicacin de las fuentes de los datos es el de proporcionar el debido
reconocimiento a la persona u organismo que recopil y /o public los datos, adems de indicar, a quienes
deseen ampliar la informacin, el origen de la misma
Uso de porcentajes: En las tablas estadsticas, normalmente se utilizan porcentajes. Existen cuadros que
slo poseen datos en forma de porcentajes, mientras que otros vienen expresados tanto en valores absolutos
como en porcentajes. La finalidad del uso de los porcentajes en los cuadros es facilitar la comparacin, de
tal manera que las relaciones que puedan existir se perciban. Cuando se usan estos es necesario recalcar las
bases sobre las cuales se han establecido dichos porcentajes; esto tiene como propsito indicar al lector cual
es la base que se est utilizando para determinar el mismo.
Pgina | 25
El tamao de la tabla debe crearse de tal manera que no sea ni muy largo y angosto, ni muy ancho o
corto.
Las notas que se encuentran al pie de los cuadros deben incluir las descripciones en forma precisa.
Ejemplo de tabla:
Nmero de cuadro
Tabla N 1
Ttulo
Encabezamiento
C
U
E
R
P
O
Razn de la falla
N veces
32
43.2
30
40.5
Falla elctrica
8.1
5.4
Conexin fsica
2.7
74
100.0
Total
Fuente
Pgina | 26
DISTRIBUCIONES DE FRECUENCIA
Despus de la recopilacin de los datos, es necesario resumirlos y presentarlos en forma tal, que faciliten
su comprensin y su posterior anlisis y utilizacin. Para ello, se ordenan en cuadros numricos y luego se
presentan en grficos.
Categoras de la
variable X
Frecuencias
Frecuencias
Frecuencia
Absoluta ni
Relativas hi
Porcentajes Pi
C1
n1
h1
p1
C2
n2
h2
p2
Ck
nk
hk
pk
Total
1.00
100.00
La frecuencia absoluta ni, es el nmero de datos observados en cada categora o modalidad. La suma de
todas las frecuencias absolutas es igual al total n de datos observados.
La frecuencia relativa hi, se define en cada categora por hi = ni / n. La suma de todas las frecuencias
relativas es igual a uno.
La frecuencia relativa porcentual se define en cada fila por hi %= hi x 100%. El total de las frecuencias
porcentajes es igual a cien.
Ejemplo:
Razn de la falla
ni
hi
hi%
32
0.432
43.2
30
0.405
40.5
Falla elctrica
0.081
8.1
0.054
5.4
Conexin fsica
0.027
2.7
74
1.000
100.0
Total
Pgina | 27
La suma de todas las frecuencias absolutas simple es igual al nmero total de observaciones.
Valores
diferentes
observados
Frecuencias
absolutas
ni
Frecuencias
Relativas
hi
y1
n1
h1
Frecuencias
Relativas
Porcentuales
hi%
h1%
y2
n2
h2
h2%
...
...
...
...
ym
nm
hm
hm%
Total
Nm
100
hi
ni
n
Pgina | 28
Ejemplo:
Cantidad de Artculos
defectuosos
N Lotes
hi
hi%
0.05
14
0.14
14
18
0.18
18
25
0.25
25
20
0.20
20
10
0.10
10
0.05
0.03
Total
100
1.00
100
yi
Li Ls
2
6. Luego obtener la frecuencia absoluta (ni ) que es el procedimiento que consiste en distribuir las
observaciones en los diferentes intervalos.
Estadstica - Lic. Jessica Oliva G.
Pgina | 29
7. Calcular las frecuencias absolutas acumuladas (Ni), que es la suma de las frecuencias absolutas
hasta la i-sima frecuencia absoluta.
i
N i n1 n 2 ... n i
j1
hi
ni
n
H i h1 h 2 ... h n h j
j1
Hi
o tambin:
Ni
n
Li-Ls
yi
ni
Frecuencias
Absolutas
Acumuladas
Ni
Y0 y1
y1
n1
N1
h1
H1
h1%
y1 y2
y2
n2
N2
h2
H2
h2%
....
...
...
...
...
...
...
ym-1 ym
ym
nm
Nm=n
hm
Hm=1
hm%
Totales
Frecuencias
Relativas
Frecuencias Frecuencias
Relativas
Relativas
Acumuladas Porcentuales
Hi
hi%
hi
100
Ejemplo:
Ingresos
($)
yi
ni
Ni
hi
Hi
36 45
40.5
0.13
0.13
13
45 54
49.5
11
0.11
0.24
11
54 63
58.5
16
27
0.36
0.60
36
63 72
67.5
12
39
0.27
0.87
27
72 81
76.5
43
0.09
0.96
81 90
85.5
45
0.04
1.00
Total
45
1.00
100
Pgina | 30
Pgina | 31
Frecuencias
14
12
10
8
16
12
9
4
2
7
4
0
6
10
11
12
Aos de servicio
o distancias iguales entre barras. Es recomendable, que las barras no sean ni excesivamente cortas y
anchas, ni demasiado largas y angostas, esto es con el objeto de dar una visin objetiva de la
investigacin en estudio. Las barras se pueden graficar tanto verticalmente como horizontalmente. Se
pueden elaborar barras compuestas y barras agrupadas. Ejemplo:
Grfico Circular o de Pastel
La grfica de pastel (grfico de sectores) es un tipo de grfica que consiste en representar por medio de
la circunferencia o un crculo las magnitudes que expresan los datos de un estudio determinado. Este
tipo de grfica considera la circunferencia como representante de los datos estadsticos de una
investigacin cualquiera. Por tal motivo, se dividir en tantos sectores como variables tenga la
investigacin en estudio; la magnitud de cada sector se encontrar en relacin directa con la magnitud
de la variable a representar, tomando en cuenta que toda la investigacin se representa con 360. En
general, los datos que se representan por medio de este diagrama son partes componentes de un total.
Para su elaboracin se procede de la siguiente forma: se considera la circunferencia como
representacin del total de la investigacin en estudio, por tal motivo, se dividir toda su superficie en
tantas secciones como variables tenga la investigacin en estudio, las superficies de las sesiones de la
circunferencia deben ser proporcionales a la magnitud de cada componente representado por las
variables.
Ejemplo: Sea la siguiente tabla sobre la Razn de falla en el sistema de cajeros automticos del Banco
UAW
Pgina | 32
Razn de la falla
N veces
32
43.2
30
40.5
Falla elctrica
8.1
5.4
Conexin fsica
2.7
Total
74
100.0
Conexin fsica
2.7%
Servidor sin
memoria
disponible
43.2%
Software del
servidor
40.5%
Falla elctrica
8.1%
Hardware del
servidor
5.4%
Histograma
El histograma es un diagrama en forma de columna, muy parecido a los grficos de barras. Se define
como un conjunto de rectngulos paralelos, en el que la base representa la clase de la distribucin y su
altura la magnitud que alcanza la frecuencia de la clase correspondiente. Son barras rectangulares
levantadas sobre el eje de las abscisas del plano cartesiano utilizando escalas adecuadas para los valores
que asume la variable en la distribucin de frecuencia. El ancho de la base de los rectngulos es
proporcional a cada clase de la distribucin, de tal manera que, cuando la distribucin tiene clases de
igual el tamao de todos los rectngulos tendr bases iguales. Los lados del rectngulo se levantan
sobre los puntos del eje de las x que corresponden a los lmites de cada clase y la longitud de los mismos
ser igual a la frecuencia que tenga esa clase, los lados por lo tanto corresponden a la frecuencia de
cada clase de la distribucin de frecuencia.
Cuando se elaboran grficas estadsticas en el plano cartesiano es recomendable que en el eje de las
ordenadas se representen las frecuencias y en el eje de las abscisas las variables independiente. El eje
de las y que representa las frecuencias debe empezar siempre en cero. Es importante sealar que la
longitud del eje de las y que representa la altura tenga el 75 % de la longitud del eje de las x, es decir,
si las variable independientes ocupan en el eje x 8 cm, la mxima altura que ocuparan las frecuencias
en el eje y tendr que ser de 6 cm.
Pasos para construir un histograma
1. Se trazan dos ejes de coordenadas, el de abscisas y el de ordenada. Se coloca sobre el eje de las x
los limites inferiores de cada clase y el ltimo lmite superior de la distribucin, y sobre el eje de
las y se coloca la magnitud de la frecuencia de cada clase.
Pgina | 33
Clases
Marca de
clase (yi)
20 24
22
25 29
15
27
30 34
16
32
35 39
21
37
40 44
16
42
45 49
47
50 54
52
55 59
11
57
60 64
62
Total
100
2. Se trazan perpendiculares por los lmites de cada clase, la altura de las perpendiculares ser igual a
la frecuencia de cada clase; y para finalizar se unen las dos perpendiculares que representan a cada
clase, el resultado final ser el histograma.
Histograma correspondiente a las horas extras laboradas
por un grupo de obreros petroleros.
25
21
Frecuencias
20
15
16
16
15
11
10
8
6
4
0
0
15
20
25
30
35
40
45
50
55
60
65
Polgono de frecuencia
Es un diagrama de lneas que representa los puntos medios y las respectivas frecuencias de una
distribucin de frecuencia de clase. Es una representacin grfica cerrada de una distribucin de
frecuencia. Es otra de las formas de graficar los valores de una distribucin de frecuencia de clase.
No existe ninguna razn estadstica para seleccionar los polgonos de frecuencia en vez de los
histogramas o viceversa, los histogramas simplemente representan una manera de graficar y los
polgonos de frecuencia otra; la diferencia entre ambos radica en que una barra vertical rectangular
representa una clase y su frecuencia en el histograma y un punto cumple la misma funcin en el
polgono de frecuencia.
Estadstica - Lic. Jessica Oliva G.
Pgina | 34
Frecuencias
20
15
15
16
16
11
10
8
6
0
17
0
22
0
27
0
32
Diagrama
37
42
47
Puntos Medios
52
57
62
67
de Lnea
El diagrama de lnea es una grfica que se representa en el plano cartesiano, con los datos de un
fenmeno determinado para el cual se ha elaborado un cuadro estadstico. En trminos generales se
puede decir que son aquellas lneas que se dibujan en los ejes cartesianos, siguiendo algunos criterios.
Criterios para elaborar un diagrama de Lneas
1. La utilizacin de la escala que se utilizar en el plano cartesiano puede variar tomando en cuenta
el fenmeno que se va graficar. No es necesario que las abscisas (ejes x) y las ordenadas (eje y)
del plano cartesiano lleven la misma escala; sin embargo, cuando las magnitudes de las variables
no se diferencian sustancialmente, es recomendable utilizar escalas iguales para obtener un grfico
de mayor precisin.
Pgina | 35
2. Cuando una de las variables en estudio se inicia con valores muy altos es recomendable no
comenzar el eje por el origen cartesiano sino por un valor prximo o por el mismo valor por donde
comienza la variable.
3. Es costumbre representar en el eje de las x del plano cartesiano la variable independiente del estudio
que se realiza y en el eje de las y la variable dependiente. En aquellos casos que se dificulta
distinguir el tipo de variable se recomienda colocar en la ordenada del plano cartesiano las
frecuencias de las variables en estudio y sobre la abscisa la variable cronolgica (aos, meses,
semanas, das, horas, etc.).
Ejemplo: Los datos que se presenta a continuacin corresponden a los aos de servicios de 60
empleados de una empresa
4 3 4 5 6 7 8 9 10
8 4 8 6 3 8 10
7 10 9 10
8 3 5 7 8 6 10 9
8 5 3 8 7 8 10
8 10 8
7 9 8 7 6 5 7 10
9 8 10 7 6 7
7 6
N de Empleados
12
16
10
TOTAL
60
Luego se marc en el eje de las x los aos de servicio con la frecuencia correspondiente en
el eje de las y. Luego, esos puntos se unieron mediante lneas y el resultado fue la grfica
de lnea de los aos de servicio de los empleados de la empresa
Pgina | 36
20
18
16
Frecuencias
14
12
10
8
6
4
2
0
3
10
Aos de servicio
Pgina | 37
MEDIDAS DESCRIPTIVAS.
INTRODUCCIN
La naturaleza de los datos permite, en muchos casos, cierto tipo de anlisis a partir de los grficos de la
distribucin. Sin embargo, tambin es necesario considerar resmenes numricos que permitan tener una
mejor idea de la manera como los datos estn distribuidos a lo largo de la recta. Estas caractersticas
numricas se llaman estadgrafos.
Algunas de estas medidas dependen de todas las observaciones y son muy sensibles a las fluctuaciones de
stas; otras sin embargo, no dependen de todas las observaciones, siendo resistentes ante los cambios de
los valores extremos.
La mayor parte de los conjuntos de datos muestran a agruparse alrededor de un valor central. Estos valores,
que de alguna manera tipifican al conjunto, se llaman medidas de posicin. Entre estas medidas se tiene: la
media aritmtica, la mediana, la moda y los percentiles
Adems de las medidas de tendencia central estn las medidas que indican la dispersin que se produce en
torno de la media de los datos. Entre estas medidas se tiene: la varianza, la desviacin estndar, el
coeficiente de variacin.
La manera como estn distribuidos los datos de un conjunto puede resumirse en lo que se llama la asimetra
y el apuntamiento de la curva que los describe.
Simbologa:
Muestra
Poblacin
Tamao
(nmero de datos)
n
N
Media aritmtica
x : media muestral
: media
poblacional
Pgina | 38
x x2 ... xn
x 1
i 1
Lun
Mar
Mier
Jue
Vier
Sab
10
12
10
15
x
i 1
8 10 5 12 10 15 60
10 reclamos
6
6
Interpretacin: Se espera que los clientes de esta tienda realicen 10 reclamos por da.
y n y 2 n 2 ... y m n m
y 1 1
y n
i
i 1
yi : marca de clase i
Ejemplo: La distribucin de frecuencias siguiente, representa los puntajes obtenidos en una evaluacin del
desempeo, aplicado al personal tcnico de una empresa. Si se elige al azar un tcnico Qu puntaje se
espera que tenga en su evaluacin de desempeo?
Desempeo
(puntos)
Marca de clase
yi =(li + ls)/2
Nmero de
tcnicos (ni)
11 - 16
(11+16)/2 = 13.5
16 - 21
18.5
21 - 26
23.5
15
26 - 31
28.5
23
31 - 36
33.5
10
Total
60
25.7
60
60
Interpretacin: Se espera que el tcnico elegido al azar tenga un puntaje de 25.7 en su evaluacin de
desempeo.
Pgina | 39
Ventajas:
Es un concepto familiar a la mayora de las personas e intuitivamente claro.
Es nica para cada conjunto de datos.
Es posible comparar medias de diferentes muestras.
Desventajas:
Puede verse afectada por los valores extremos.
Si la muestra es grande y los datos no estn agrupados, su clculo es tedioso.
Si los datos estn agrupados en clases con extremos abiertos, no es posible calcular la media
Nota: La media aritmtica como estadgrafo de posicin de una distribucin, proporciona una idea de la
posicin de los valores alrededor de la media, La media es un promedio, por tanto no significa:
Que todos los valores observados resultan ahora ser iguales.
Que la media se ubica exactamente en el centro de la distribucin, excepto si la distribucin es
simtrica. Entonces, la media aritmtica en general no divide a la distribucin.
Ejercicio:
48 38 65 56 16 55 28 62 32 48
Habilidad
36 18 54 47 21 56 68 70 72 38
Pgina | 40
Cuando el nmero de datos es par, la mediana es igual al promedio de los valores centrales
xn / 2 xn / 2 1
Me =
Ejemplo: Se tienen los siguientes datos 14, 26, 12, 20, 25, 26, 34, 36, 10
Primero se ordenan los datos
10 12 14 20 25 26 34 36
Me: (20+25)/2 = 22.5
2 N i 1
Me l i c
ni
Donde:
Li : lmite inferior del intervalo mediano
c
ni
N de tcnicos
(ni)
4
12
24
16
10
4
70
Ni
4
16
40 IMe
56
66
70
35 16
aos
Me 7 4
10.2
24
Interpretacin: El 50% de los profesionales tcnicos que laboran en esta empresa tienen una experiencia
laboral igual o menor a 10 aos 2 meses. El otro 50% de los profesionales tiene una experiencia laboral
igual o mayor a 10 aos y 2 meses.
Pgina | 41
Ventajas
La mediana es ms recomendable que la media aritmtica, cuando:
La mediana no est afectada por los valores extremos como sucede con la media.
Se puede determinar para datos cualitativos, susceptibles de ordenarse de acuerdo a rangos,
calificaciones o categoras.
Desventajas
Como valor central, se debe ordenar primero la serie de datos.
Para una serie amplia de datos no agrupados, el proceso de ordenamiento de los datos demanda
tiempo y usualmente provoca equivocaciones.
1
Mo l i c
1 2
Donde:
1 : frecuencia de la clase modal menos la frecuencia de la clase anterior
2 : frecuencia de la clase modal menos la frecuencia de la clase siguiente
Ejemplo: La tabla siguiente muestra los errores de facturacin durante un mes, en una empresa
comercializadora.
Pgina | 42
Errores de
facturacin
Das
03
37
12
7 11
11 15
15 19
Total
6
Mo 3 4
5.4
6 4
30
2.
= Me = Mo
Mo < Me <
Pgina | 43
3.
x < Me < Mo
LOS CUANTILES
Cuando los valores ordenados de una variable han de ser divididos en grupos homogneos en cuanto al
tamao, se suelen utilizar los cuantiles.
Los cuantiles ms usados en el anlisis estadstico son: cuartiles, deciles y percentiles. Los cuantiles se usan
frecuentemente para describir el comportamiento de una poblacin. Los valores se dan a menudo en tanto
por ciento.
p
n , en donde p es el percentil de inters y n es la cantidad de observaciones.
100
2 Calcule un ndice i
3 Si i no es entero, se redondea. El valor entero inmediato mayor que i indica la posicin del p-simo
percentil.
Si i es entero, el p-simo percentil es el promedio de los valores de los datos ubicados en los lugares i e i+1
Ejemplo: Se tienen los siguientes valores 27, 25, 20, 15, 30, 34, 28 y 25.
Encuentre el percentil 50 y 85
Se ordena: 15 20 25 25 27 28 30 34
Para calcular el percentil 50
p 50
n =
8 4
100 100
Se calcula i
15
20
25
25
27
28
30
34
P50
P50 = (25 + 27) / 2 = 26
Pgina | 44
p 85
n =
8 6.8 7
100 100
P85
Se calcula i
15
20
25
25
27
28
30
34
P85 = 30
Clculo para datos agrupados
Se realiza de modo similar al clculo de la mediana. Si queremos encontrar el p-simo percentil de orden
p
n .
100
( p / 100)n N i 1
Pp li c
ni
Donde:
[li ls) : el intervalo que contiene dicho percentil
c
ni
Ni-1
Ejemplo: Los siguientes datos es el nmero de piezas fabricadas por 110 de trabajadores en una semana.
1. Cul es la cantidad de piezas como mximo que fabrica el 25% de trabajadores con menor produccin?
2. Cul es la cantidad de piezas como mnimo que fabrica el 25% de trabajadores con mayor produccin?
N de piezas
fabricadas
20 25
25 30
30 35
35 40
40 45
45 50
50 55
55 60
Total
a.
N de
trabajadores
5
7
9
14
20
26
18
11
110
Ni
5
12
21
35 P25
55
81
99 P75
110
p 25
n =
110 27.5
100 100
Calculamos
Pgina | 45
27.5 21
P25 35 5
43.1
14
El 25% de trabajadores con menor produccin fabrican como mximo 43.1 piezas.
b.
p 75
n =
110 82.5
100 100
Calculamos
82.5 81
P75 50 5
50.4
18
El 25% de trabajadores con mayor produccin fabrican como mnimo 43.1 piezas.
MEDIDAS DE DISPERSIN
Las medidas de posicin central son los valores que de una manera condensada representan una serie de
datos, pero realmente no son suficientes para caracterizar una distribucin de frecuencia. Para describir una
distribucin de frecuencia o serie de datos es necesario, por lo menos otra medida que indique la dispersin
o variabilidad de los datos, es decir, su alejamiento de las medidas de posicin central. Estas medidas de
posicin central no tienen ningn valor si no se conoce como se acercan o se alejan esos valores con respecto
al promedio, en otras palabras es conocer como se dispersan o varan esos valores con respecto al promedio
de una distribucin de frecuencia.
La dispersin o variabilidad se entiende como el hecho de que los valores de una serie difieran uno de otro,
es decir, como se estn dispersando o distribuyendo en la distribucin. De acuerdo con esto es necesario
encontrar una medida que indique hasta qu punto los valores de una variable estn dispersos en relacin
con el valor tpico. Las medidas de variabilidad son nmeros que expresan la forma en que los valores de
una serie de datos cambian alrededor de una medida de posicin central la cual por lo general es la media
aritmtica.
Se llama Variacin o Dispersin de los datos, el grado en que los valores de una distribucin o serie
numrica tienden a acercarse o alejarse alrededor de un promedio. Cuando la dispersin es baja indica
que la serie de valores es relativamente homognea mientras que una variabilidad alta indica una serie de
valores heterognea.
Cuando los valores observados de una serie estn muy concentrados alrededor del promedio, se dice que
ese promedio es o ser muy representativo; pero si estn muy dispersos con relacin al promedio, es decir
muy esparcidos con respecto al promedio, entonces ese promedio es poco representativo de la serie o
distribucin, puesto que no representan adecuadamente los datos individuales de esa distribucin. Es
importante obtener una medida que indique hasta qu punto las observaciones de una serie de valores estn
variando en relacin con el valor tpico de la serie.
Las medidas de dispersin se clasifican en dos grandes grupos:
I.
II.
Pgina | 46
(x
i 1
x) 2
s
n 1
n xi2 xi
n(n 1)
Es importante recordar que cuando se trabaja con la frmula para datos no agrupados y se trata de
una muestra se utilizar como denominador n1, para corregir el sesgo, pero si en la muestra n
50, entonces se utilizar n, simplemente.
(y
y ) 2 ni
n 1
y n
2
i
ni
n 1
queda a juicio del estudiante utilizar la frmula que l considere ms fcil, siempre y cuando su
aplicacin sea valedera.
Pgina | 47
VARIANZA
Es otra de las variaciones absolutas y la misma se define como el cuadrado de la desviacin tpica; viene
expresada con las mismas letras de la desviacin tpica pero elevada al cuadrado, as S2 y 2. Las frmulas
para calcular la varianza son las mismas utilizadas por la desviacin tpica, exceptuando las respectivas
races, las cuales desaparecen al estar elevados el primer miembro al cuadrado.
yn
y n
s2
i i
2
i i
n 1
448
450
453
451
447
449
446
s
n = 7;
3144 ;
Reemplazando:
2
i
n(n 1)
1412140
71412140 3144
n xi2 xi
7(7 1)
2.41gr
Ejemplo: Calcular la varianza y la desviacin estndar de la resistencia a la tensin, en libras por pulgada
cuadrada (psi), de 80 muestras de una nueva aleacin de aluminio y litio.
Como el tamao de muestra es mayor a 50 no es necesario utilizar la correccin n-1
Entonces reemplazando en la frmula tenemos:
y ni
2
i
y n
Resistencia a la
tensin
(psi)
70 90
90 110
110 130
130 150
150 170
170 190
190 - 210
210 230
230 250
Total
Estadstica - Lic. Jessica Oliva G.
2226400
80
13080 2
80
33.13 psi
yi
ni
yi ni
yi2
yi2ni
80
100
120
140
160
180
200
220
240
2
3
6
14
22
17
10
4
2
80
160
300
720
1960
3520
3060
2000
880
480
13080
6400
10000
14400
19600
25600
32400
40000
48400
57600
254400
12800
30000
86400
274400
563200
550800
400000
193600
115200
2226400
Pgina | 48
CV
s
x
100
Ejemplo: Un fabricante de tubos de televisin dispone de dos tipos de tubos, A y B. Los tubos tienen una
duracin media de 1495 h. y 1875 h. respectivamente. Las desviaciones tpicas son 280 para A y 310 para
B. Determinar qu tubo presenta mayor dispersin absoluta y cul presente mayor dispersin relativa.
Podemos decir directamente que el tipo B presenta mayor dispersin absoluta, ya que la desviacin tpica
es una medida de dispersin.
Para ver la dispersin relativa debemos calcular el Coeficiente de Variacin de Pearson (CV):
Tipo de Tubo
CV
CV (%)
A
B
1495
1875
280
310
0.187
0.165
18.7
16.5
Por tanto, ser el tubo A el que presente mayor dispersin relativa en su duracin.
Pgina | 49
Karl Pearson un estudioso de la estadstica designo el coeficiente de asimetra con las letras SK y determin
la frmula para su clculo, al cual se le denomin primer coeficiente de asimetra de Pearson
SK1
( X Mo)
S
Se tiene otro coeficiente de asimetra utilizando la mediana que se le denomina segundo coeficiente de
asimetra de Pearson, este es ms preciso que el primero
SK 2
3( X Md )
S
Si en una serie de valores la X Me Mo, entonces la distribucin de frecuencia presenta una curva
asimtrica positiva; si la X =Me = Mo = 0, la curva de la distribucin es simtrica; y si la distribucin
presenta una curva en la que el Mo Me X , entonces se dice que la curva de la distribucin asimtrica
negativa.
Si la curva de una distribucin de frecuencia es sesgada, la media tratar de ubicarse hacia el extremo o
lado opuesto, de la serie de valores, donde se concentran los datos. Es bueno hacer referencia que en una
asimetra positiva la X Me y en una asimetra negativa la X Me.
Mo < Me <
= Me = Mo
< Me < Mo
Pgina | 50
COEFICIENTE DE KURTOSIS
Es el grado de apuntamiento o altura de la curva de una distribucin de frecuencia. La finalidad de la
Kurtosis es determinar si la distribucin de los trminos de una serie de valores responde a una curva
normal o no. Se utiliza para observar el promedio o posicin de la distribucin, as como la media, la
mediana y la moda, se puede en esta observar la asimetra, el grado de concentracin de los datos, en fin,
para observar en forma general el comportamiento de una serie de datos en una distribucin de frecuencia.
Por medio de la Kurtosis se determinar si la distribucin de frecuencia es demasiado puntiaguda, normal
o muy achatada.
El grado de apuntamiento o altura de una curva de distribucin se determina por medio del coeficiente
de Kurtosis, el cual se calcula utilizando el momento cuatro de una serie de valores con respecto a su
media aritmtica. La Kurtosis se designa con la letra K y la frmula de clculo es:
Tomando en cuenta la Kurtosis el K de una curva de distribucin puede ser: Mesocrtica, Platicrtica y
Leptocrtica.
Mesocrticas.- Es aquella curva de una distribucin de frecuencia que no es ni muy alta ni muy achatada,
es la llamada curva normal.
La curva Mesocrtica tiene un coeficiente de Kurtosis igual a tres, es decir, K = 0.263
Leptocrtica.- Es aquella curva de la distribucin que presenta un apuntamiento o altura relativamente
ms alta que la curva Mesocrtica, en esta los datos se encuentran ms concentrados alrededor del
mximo valor. El coeficiente de Kurtosis para curva Leptocrtica es mayor de tres, es decir, K 0.263
Platicrtica.- Es la curva de una distribucin de frecuencia que presenta un achatamiento ms
pronunciado que la Mesocrtica, encontrndose los datos ms dispersos alrededor del mximo valor de
la distribucin. En esta curva el coeficiente de Kurtosis es menor de tres, es decir, K 0.263
1 PLATIKURTICA
2 MESOKURTICA
3 LEPTOKURTICA
Ejemplo: El jefe en control industrial de una empresa somete a un test de fiabilidad 100 dispositivos
electrnicos idnticos y anota su duracin (tiempo hasta el fallo en horas). La recogida de datos lleva a la
distribucin de frecuencias siguiente:
Pgina | 51
Duracin (horas)
0 200
200 400
400 600
600 800
800 1000
1000 1200
1200 1400
1400 1600
Total
N de
dispositivos
34
18
16
13
10
6
2
1
100
x 456
Me = 377.778
Mo = 136
s = 353.927
0.904
3( SX Md )353.3927
(456 377.778)
SK 2
0.663
S
353.927
El coeficiente de asimetra nos indica que el tiempo de duracin de los dispositivos sigue una distribucin
marcadamente positiva; es decir que el tiempo de duracin de los dispositivos est por debajo del tiempo
esperado.
P10 = 58.824
P25 = 147.059
P75 = 707.692
P90 = 980
0.304
P90 P10
980 58.824
El coeficiente de Kurtosis nos indica que el tiempo de duracin de los dispositivos sigue una distribucin
leptocrtica o apuntada; es decir que el tiempo de duracin de los dispositivos estn muy cerca del tiempo
promedio.
Pgina | 52
PROBABILIDAD
INTRODUCCIN.
Como ya se ha visto, la Estadstica es una Ciencia con la que se pretende buscar las regularidades existentes
en el comportamiento de los datos. Sabemos que la Estadstica se puede clasificar en dos grandes bloques:
Estadstica Descriptiva e Inferencia Estadstica. Con el primero lo que se hace es dar un conjunto de
mtodos y herramientas que permiten estudiar esas regularidades cuando lo que observamos es toda la
poblacin. Es decir admitimos que es posible realizar esa operacin de recuento exhaustivo. En tal caso lo
que realizamos con la estadstica es estudiar, describir, el comportamiento de una variable determinada.
Esa observacin exhaustiva nos permite realizar afirmaciones categricas sobre las distintas
caractersticas de la variable, tales como cul es su media, su dispersin, la forma de la distribucin, etc.
Pero esa posibilidad de observacin exhaustiva no siempre es posible. En la gran mayora de los casos nos
vemos limitados a realizar una observacin parcial de la variable. Con ese conjunto limitado de datos
intentaremos conocer las caractersticas de toda la poblacin, es decir, intentaremos inferir su
comportamiento. As una empresa antes de lanzar un nuevo producto estar interesada en conocer cual
puede ser su cuota de mercado, para lo cual realizar un sondeo de opinin entre algunos de sus potenciales
clientes. Pero el resultado de ese sondeo, basado en una muestra (observacin parcial), no le permite
concluir cual ser su verdadera cuota de mercado. La decisin que tome respecto a ese producto estar
marcada por un cierto grado de incertidumbre.
Pero que duda cabe que, en esas situaciones, nuestras afirmaciones ya no pueden ser categricas y las
decisiones que se tomen puede que no sean las ms acertadas como consecuencia de la informacin no
contenida en la muestra. Ms bien al contrario debemos admitir que nuestras conclusiones estn sujetas a
un margen de incertidumbre que es la consecuencia de nuestra observacin parcial de la realidad.
Ante tales circunstancias nuestro objetivo ser doble: por un lado estudiar el comportamiento de la variable
y de otro reducir en la medida de lo posible ese margen de incertidumbre o, al menos, intentar cuantificar
esa falta de certeza en relacin a las caractersticas de las variables. Una forma de cuantificar esa
incertidumbre es haciendo uso del concepto de probabilidad. De hecho la probabilidad es un concepto con
el que convivimos de forma diaria, incluso sin percatarnos de l. Cada vez que hacemos uso de las
expresiones quizs, tal vez, es probable, puede que, etc. estamos implcitamente hablando en trminos
probabilsticos. La incertidumbre es una acompaante inseparable de todas las ciencias sociales e incluso
de las fsicas como seal Heisenberg con el enunciado del principio de incertidumbre de la mecnica
cuntica.
La aficin al juego fue lo que impuls el desarrollo de la probabilidad. En un esfuerzo por aumentar sus
ganancias pidieron a los matemticos que les proporcionaran las estrategias ptimas para varios juegos de
azar. Como resultado de este primer desarrollo de la teora de la probabilidad, se extiende junto con la
estadstica a muchos campos, como la poltica, los negocios, la prediccin del clima, y la investigacin
cientfica.
TRMINOS BSICO DE PROBABILIDAD
Las probabilidades son de gran importancia en la estadstica. Para iniciar el estudio de las probabilidades
es necesario definir una serie de trminos bsicos para su mejor comprensin.
Pgina | 53
Experimento Determinstico: Es aquel experimento en el que es posible predecir el resultado final de ese
proceso aun sin haberlo realizado. Ej. Cuando los qumicos combinan oxigeno ms hidrgeno el resultado
es agua; este experimento no es necesario realizarlo para conocer el resultado.
Experimento aleatorio: Es todo proceso que consiste de la ejecucin de un acto (o prueba) uno o ms veces,
cuyo resultado en cada prueba depende del azar y en consecuencia no se puede predecir con certeza.
Ejemplo: lanzar un dado y observar su resultado, contar objetos defectuosos producidos diariamente por
cierto proceso, etc.
Espacio muestral: se denomina espacio muestral al conjunto de todos los resultados posibles de un
experimento dado. Este conjunto se denotara por . Cada resultado posible de un experimento aleatorio es
un elemento del espacio muestral, que se le conoce como punto muestral.
Ejemplo:
Experimento aleatorio: lanzar un dado y observar el resultado obtenido:
= 1, 2, 3, 4, 5, 6.
Experimento aleatorio: lanzar una moneda dos veces:
= CC, CS, SC, SS.
Experimento aleatorio: lanzar una moneda tres veces:
= CCC, CCS, CSC, CSS, SCC, SCS, SSC, CSS.
Experimento aleatorio: tomar un examen:
= aprobar, desaprobar}
Experimento aleatorio: seleccionar un alumno de acuerdo a su rendimiento acadmico
= sobresaliente, bueno, regular, malo}
Evento o suceso: Es cada resultado del experimento aleatorio o una combinacin de resultados. Tambin
se dice que es un subconjunto del espacio muestral. Los eventos se denotan por letras maysculas:
Ejemplos:
Experimento Aleatorio: se hace rodar un dado y se observa el nmero que aparece en la cara superior.
= 1, 2, 3, 4, 5, 6
Evento: A: obtener un nmero par A = 2, 4, 6
Experimento aleatorio: lanzar una moneda dos veces: = CC, CS, SC, SS.
Evento: B: obtener dos caras
B = CC
Pgina | 54
Eventos Mutuamente Excluyentes: Son aquellos eventos que no pueden ocurrir simultneamente al
realizar una sola vez un experimento. Se dice que dos eventos A y B son mutuamente excluyentes si y solo
si, su interseccin es el conjunto vaco, es decir AB = . Ej. El resultado obtenido al lanzar un dado, si
sale una cara con un 3, no puede salir otro nmero en este mismo lanzamiento.
Eventos Dependientes: Son aquellos sucesos en los que el conocimiento de la verificacin de uno de ellos
altera la probabilidad de verificacin del otro. Se dice que dos o ms eventos son dependientes si la
ocurrencia de uno cualquiera de ellos afecta la probabilidad de la ocurrencia de alguno de los otros eventos.
Ej. Consideremos la probabilidad de obtener 2 cartas de basto al sacar sucesivamente 2 cartas de una baraja
de 40 cartas. Al sacar la primera carta la probabilidad de obtener basto es de 10/40 y al no sustituirla
quedaran en el paquete 39 cartas de las cuales 9 son de basto, en la segunda extraccin la probabilidad de
obtener basto es de 9/39, en este caso la segunda extraccin depende de la primera que tena como
probabilidad 10/40 y la segunda extraccin tendr ahora 9/39 como se puede observar la probabilidad de la
segunda extraccin es afectada por la primera.
Eventos Independientes: Se dice que dos o ms eventos son independientes si la ocurrencia de uno
cualquiera de ellos no afecta la probabilidad de la ocurrencia de ninguno de los otros sucesos. Ej. El evento
de obtener simultneamente un 2 al lanzar un dado y sello al tirar una moneda, est compuesto de 2 sucesos
independientes, puesto que la ocurrencia de un 2 en el dado no afecta la probabilidad de la aparicin de
sello en la moneda y viceversa.
Eventos complementarios: Dos eventos A y A son complementarios si y solo si, se cumple que: P(A) +
P (A) = P(), es decir, son eventos mutuamente excluyentes y su unin es el espacio muestral, entonces
tenemos, P(A) + P(A) = P(S), pero P() = 1, entonces,
P(A)+ P(A) = 1 P(A) = 1- P(A), donde P(A), se lee probabilidad de A complemento.
Eventos no Mutuamente Excluyentes: Son aquellos eventos que pueden verificarse simultneamente. A
estos eventos tambin se les llaman Sucesos Compatibles.
REGLAS DE CONTEO
La capacidad de identificar y contar los puntos mustrales de un experimento es un paso importante para
comprender lo que puede suceder en l. Veamos un experimento que consiste en lanzar dos monedas, donde
los resultados experimentales se definen en funcin de comportamiento de casa y sellos que dan hacia arriba
de las monedas. Cuntos resultados experimentales (o puntos mustrales) son posibles en este
experimento?
Podemos considerar que el experimento de lanzar dos monedas se lleva a cabo en dos etapas: la etapa 1
corresponde a lanzar la primera moneda, y la etapa 2 a lanzar la segunda. El diagrama de rbol es un
dispositivo grfico til para visualizar un experimento de varias etapas y enumerar los resultados
experimentales.
Pgina | 55
CC
CS
SC
SS
Se observa que hay cuatro resultados experimentales del hecho de lanzar dos monedas, y el espacio muestral
del mismo se puede presentar mediante:
= CC, CS, SC, SS.
Regla de conteo para experimentos de etapas mltiples: Una regla til para determinar la cantidad de
puntos muestrales para un experimento de varias etapas es la siguiente:
Si un experimento se puede describir como una sucesin de k etapas, en las que hay n1 resultados en la
primera etapa, n2 en la segunda, etc., la cantidad total de resultados experimentales es igual a (n1)(n2)(nk).
Esto es, la cantidad de resultados del experimento total es el producto de las cantidades de resultados en
cada etapa.
Regla de conteo para combinaciones: La cantidad de combinaciones de N objetos tomando n a la vez es:
CnN
N!
n!( N n)!
Ejercicios:
1. Un experimento consiste en hacer tres llamadas de venta. En cada una habr compra o no compra.
a. Trace un diagrama de rbol de este experimento.
b. Identifique cada punto muestral y el espacio muestral. cuntos puntos muestrales hay?
c. Cuntos puntos muestrales habra si el experimento consistiera en cuatro llamadas?
2. En la ciudad de Milford, las aplicaciones de cambio de zonificacin siguen un proceso de dos etapas:
una revisin por la comisin de planeacin, y una decisin final por el consejo ciudadano. En el paso
1 la comisin de planeacin revisa la peticin de cambio de zonificacin y emite una recomendacin
positiva o negativa acerca del cambio. En el paso 2 en consejo ciudadano revisa la recomendacin de
la comisin de planeacin y vota aprobndola o rechazndola. En algunos casos el voto del consejo
ciudadano concord con la recomendacin de dicha comisin. El constructor de un complejo de
viviendas acaba de presentar una solicitud de cambio de zonificacin. Considere que el procesamiento
de la solicitud es un experimento.
a. Cuntos puntos muestrales hay para este experimento? Haga una lista de ellos.
b. Trace un diagrama de rbol de este experimento.
3. Un experimento consiste en seleccionar al azar 4 alumnos y conocer si practican deporte o no.
a. Cuntos puntos muestrales hay para este experimento? Haga una lista de ellos.
b. Trace un diagrama de rbol de este experimento.
4. Un inversionista que revisa el desempeo de seis acciones seleccionar dos de ellas para invertir
Cuntas combinaciones alternativas de dos acciones debe tomar en cuenta el inversionista.
Pgina | 56
5. Prez y Compaa formar un comit de planeacin a largo plazo, con el encargo de desarrollar un plan
quinquenal estratgico para que la empresa ingrese al mercado de un nuevo producto. El presidente ha
identificado a siete gerentes capaces como candidatos para el comit. De cuntas maneras se puede
formar el comit de tres miembros?
6. Un inspector de control de calidad eligi una pieza fabricada para probarla. Posteriormente se establece
si la parte se acepta, se repara, o se desecha. Despus se prueba otra. Mencione todos los posibles
resultados de este experimento.
7. Un joven tiene cuatro camisas de los siguientes colores: roja (R), blanca (B), negra (N) y
verde(V),tambin posee dos pantalones, gris(G) y azul (A).
a. Trace un diagrama de rbol de este experimento.
b. De cuntas maneras pueden combinarse los pantalones con las camisas o viceversa?
8. Un restaurante de la localidad ofrece un men de tres componentes:
1.- Aperitivo: Sopa (S), o Ensalada(E).
2.- Plato Principal: Bist (B), Carite (C), o Pavo (P).
3.- Postre:Torta (T), o Helado (H).
Construya un diagrama de rbol, indicando el nmero posible de comidas completas (aperitivo, plato
principal y postre) que se pueden consumir.
AB
AB
Ejemplo:
En el experimento de lanzar dos monedas y un dado
= CC1, CC2, CC3, CC4, CC5, CC6, CS1, CS2, CS3, CS4, CS5, CS6,
SC1, SC2, SC3, SC4, SC5, SC6, SS1, SS2, SS3, SS4, SS5, SS6
Se define los siguientes eventos:
E = que aparezca dos caras y un nmero par
F = que aparezca un dos
Pgina | 57
Es decir:
E = CC2, CC4, CC6
F = CC2, CS2, SC2, SS2
Ahora podemos definir:
a) E y F sucedan, es decir E F = CC2
b) Sucede E F , es decir E F = CC2, CS2, SC2, SS2, CC4, CC6
c) Que no ocurra E, es decir E (elementos que no pertenecen a F)
E = CC1, CC3, CC5, CS1, CS2, CS3, CS4, CS5, CS6, SC1, SC2
SC3, SC4, SC5, SC6, SS1, SS2, SS3, SS4, SS5, SS6
PROBABILIDAD DE UN EVENTO
Diariamente se escuchan afirmaciones que llevan implcito el concepto de probabilidad como por ejemplo
los pronsticos del tiempo que indican las probabilidades de lluvia; los galenos indican la probabilidad que
tiene un enfermo de curarse si realiza al pie de la letra sus tratamientos farmacolgicos, los docentes
especulan sobre las posibilidades de xito del estudiantado si dedican ms tiempo al estudio, las compaas
encuestadoras predicen las oportunidades que tienen los polticos de ganar una eleccin determinada, etc.
La Teora de la Probabilidad es una rama de las matemticas que se encarga de los eventos que se realizan
al azar o fenmenos aleatorios, como a menudo se les denominan. Se define la probabilidad como un
nmero comprendido entre 0 y 1, que se le asigna a un evento para sealar su posibilidad de ocurrencia.
Por lo general las probabilidades se expresan en porcentajes, tambin se pueden expresar con nmeros
decimales. Es una condicin de esta ctedra que siempre se resuelvan las fracciones con que se expresan
las probabilidades de un problema dado; los resultados de esos cocientes deben tener por lo menos 4
decimales y el mismo se representa en porcentaje. La probabilidad de cualquier evento se representa con la
letra P.
Se le asigna la probabilidad de 1 al evento que con certeza ocurrir y se le asigna la probabilidad de 0 a un
suceso que no puede ocurrir; se le asigna una probabilidad de 0.5 a un fenmeno que tenga la misma
posibilidad de suceder o de no suceder. Se le asigna una probabilidad 0 P 0.5, a un fenmeno que
tenga ms posibilidades de no suceder que de suceder; y se le asigna una probabilidad 0.5 P 1 a un
evento que tenga ms posibilidades de suceder que de no suceder.
La probabilidad es una caracterstica que interviene en todos los trabajos experimentales. Es necesario
obtener un procedimiento lgicamente slido para que dichos enunciados tengan validez cientfica. En otras
palabras, en virtud de que la probabilidad en definitiva, es un cuantificador o medida de la posibilidad de
ocurrencia de un suceso al que se le asocia un grado de incertidumbre, se debe estudiar la forma en que esta
medida puede ser obtenida.
Sea el espacio muestral asociado a un experimento aleatorio. La probabilidad de cualquier evento A de
, es el nmero real P(A) que satisface los siguientes axiomas de probabilidad:
a. 0 P(A) 1, para todo evento A
b. P() = 1
c. P() = 0
Pgina | 58
P( A)
N ( A) n A
0.64 64.0%
N () 500
Pgina | 59
Probabilidad subjetiva
Existen varios sucesos de sumo inters cuyas probabilidades no se pueden calcular tomando en cuenta los
mtodos de frecuencia relativa ni con la teora de la probabilidad clsica. Surge entonces, el punto de vista
subjetivo el cual hace hincapi en la probabilidad que resulta de una opinin, creencia, o juicio personal
sobre una situacin determinada. El enfoque subjetivo denominado tambin probabilidad personal, asigna
a los eventos probabilidades, aun cuando los datos experimentales sean escasos o imposibles de obtener.
Los que toman decisiones utilizando este tipo de probabilidad se fundamentan en sus propias experiencias
personales y en muchos casos en presentimientos. Este enfoque de la probabilidad personal se aplica a
problemas de toma de decisiones tales como construcciones de plantas, compras de equipos, licitaciones de
contratos, etc. La probabilidad personal se ha vuelto sistemticamente popular entre los tericos de la toma
de decisiones. Los defensores de esta corriente tratan de buscar soluciones a la asignacin de probabilidades
de aquellos eventos que solo ocurren una vez o que no pueden estar sometidos a experimentos repetidos.
La asignacin de probabilidades a un evento en estas condiciones, ms que un juicio arbitrario, es un juicio
de valor.
Ejercicios:
9. Un grupo de 34 estudiantes de una escuela de administracin, revel la siguiente seleccin de carrera
profesionales:
Contadura
10
Suponga que se selecciona un estudiante y se considera su eleccin
profesional.
Finanzas
5
a) cul es la probabilidad de que estudie la carrera de administracin?
Sistemas de informacin
3
b) qu concepto de probabilidad utiliz para hacer tal estimacin?
Administracin
6
Mercadotecnia
10
10. Se venden 500 billetes para realizar una lotera. Los talones de los billetes se mezclan bien y el ganador
es quien tiene el boleto del taln elegido aleatoriamente al efectuar el sorteo. Si alguien compr 25
billetes, Cul es la probabilidad de que gane?
11. Sea x el nivel de xito de un nuevo programa de televisin. En la tabla siguiente se observan las
probabilidades subjetivas asignadas a cada x para un nuevo programa particular, segn fueron
otorgadas por personas que laboran en tres distintos medios de difusin. cules de estos conjuntos de
probabilidades son inapropiadas? Explique su respuesta.
A
0.5
0.4
0.3
Juez
B
0.6
0.5
-0.1
C
0.4
0.3
0.3
Pgina | 60
REGLAS DE LA PROBABILIDAD
REGLA DE LA SUMA DE PROBABILIDADES
Se usa cuando se desea averiguar la probabilidad de ocurrencia de uno u otro evento.
Si los eventos A y B son mutuamente excluyentes, la probabilidad de ocurrencia de A o de B es:
P (AB) = P (A) + P (B)
Ejemplo: De 100 alumnos de la especialidad de ingeniera, 20 desaprobaron matemtica, 32 desaprobaron
estadstica y 18 desaprobaron teologa, estos alumnos slo desaprobaron un solo curso. Cul es la
probabilidad de seleccionar un alumno que haya desaprobado matemtica o estadstica o teologa?
P(A B C) = P(A) + P(B) + P(C) =
0.7
n () n () n () 100 100 100
Pgina | 61
REGLA DE LA MULTIPLICACIN
Se utiliza para calcular la probabilidad de ocurrencia simultnea de dos o ms eventos
Si los eventos A y B son dependientes, entonces la ocurrencia de un evento tiene efecto sobre la
probabilidad de ocurrencia del otro evento, por lo tanto la ocurrencia simultnea de los eventos es:
P(AB) = P(A) P(B/A)
Ejemplo: Suponga que se extrae dos cartas, una a la vez sin reemplazo, de una baraja ordinaria. Cul
es la probabilidad de que ambas cartas sean ases?
A: un as en la primera extraccin
B: un as en la segunda extraccin
P(AB) = P(A).P(B/A) = (4/52).(3/51) = 0.0045
Ejemplo: Supongamos que se extrae al azar dos frutas, de una bolsa que contiene 4 manzanas, 6 naranjas y
5 duraznos. Se obtiene una muestra sin reemplazo. Cul es la probabilidad de que se obtenga una naranja
y una manzana, en ese orden?
A: Extraer una naranja en la primera extraccin
B: Extraer una manzana en la segunda extraccin dada una naranja en la primera extraccin
P(AB) = P(A) P(B/A) = (6/15).(4/14) = 0.1143
Si los eventos A y B son independientes, entonces la ocurrencia de un evento no tiene efecto sobre la
probabilidad de ocurrencia del otro, por lo tanto la ocurrencia simultnea de los eventos es
P(A B) = P(A) P(B)
Ejemplos: Supongamos que lanzamos un par de dados legales una sola vez. Cul es la probabilidad de
obtener un 2 en el primer dado y un 4 en el segundo?
A: Obtener 2 en el primer dado
B: Obtener 4 en el segundo dado
P(AB) = P(A) P(B) = 1/6 x 1/6 = 1/36
Ejemplos: Supongamos que se extrae una muestra aleatoria de una bolsa de frutas. La bolsa contiene 4
manzanas, 6 naranjas y 5 duraznos. Si se selecciona 2 frutas, una a la vez, con reemplazo. Cul es la
probabilidad de que se obtenga una naranja y una manzana en ese orden?
A: Obtener una naranja
B: Obtener una manzana
P(AB) = 6/15 * 4/15 = 24/225
PROBABILIDAD CONDICIONAL
La probabilidad de que ocurra un evento B cuando se sabe que ha ocurrido algn otro evento A, se denomina
PROBABILIDAD CONDICIONADA y se designa como P(B/A). l smbolo P(B/A) se lee como la
probabilidad de que ocurra B sabiendo que ocurri A o sencillamente probabilidad de B dado A Las
probabilidades condicionadas estn relacionadas a probabilidades asociadas a los eventos definidos en
subpoblaciones o espacios mustrales reducidos.
Pgina | 62
Se dice que la probabilidad de ocurrencia de un evento dado es condicionada, si esta se afecta por la
ocurrencia de otro evento presente.
P( B A) P( BA)
,
P( A)
P( A)
P(B/A) =
si P(A) 0
Ejemplo: Un profesor de matemticas da clases en una seccin matutina y una vespertina de introduccin
al clculo.
Sea A = {el profesor da una mala conferencia matutina} y
B = {el profesor da una mala conferencia vespertina}.
Si P(A) = 0.3, P(B) = 0.2 y P(AB) = 0.1, calcule las siguientes probabilidades.
a) P(B/A)
b) P(B/A)
a) P( B / A)
c) P(B/A)
P( BA) 0.1
0.33
P( A) 0.3
b) P( B' / A)
0.67
P( A)
P( A)
0.3
c) P( B / A' )
0.14
P( A' )
P ( Ac )
0.7
TEOREMA DE BAYES
Es un mtodo que nos permite calcular la probabilidad de que un evento que ya ocurri (o efecto) sea
resultante de alguna causa.
Si A1, A2, , An son sucesos n mutuamente excluyentes, de los cuales al menos unos de los Ai (i = 1, 2, ...,
n) debe ocurrir, y sea B un suceso cualesquiera en , la probabilidad condicional de la ocurrencia de Ai
cuando el evento B ha ocurrido es:
P(Ai/B) =
P( Ai ) P( B / Ai )
P(A )P(B / A )
i
= n i
P ( A1 ) P( B / A1 ) P( A 2 ) P( B / A 2 ) ... P( A n ) P( B / A n )
P(Ai )P(B / Ai )
i 1
Ejemplo:
En una empresa del total de trabajadores, se tiene que el 50% son ingenieros, el 30% son abogados y el
20% son administrativos; adems se tiene que el 8% de los ingenieros, el 9% de los abogados y el 10% de
los administrativos son provincianos (nacidos fuera de la capital).
a. Supongamos que se selecciona un trabajador al azar y resulta ser provinciano. Hallar la probabilidad
de que el trabajador sea ingeniero.
b. Supongamos que se selecciona un trabajador al azar y resulta ser provinciano. Hallar la probabilidad
de que el trabajador sea abogado.
c. Supongamos que se selecciona un trabajador al azar y resulta ser provinciano. Hallar la probabilidad
de que el trabajador sea abogado.
d. Supongamos que se selecciona un trabajador al azar y resulta ser no provinciano. Hallar la
Estadstica - Lic. Jessica Oliva G.
Pgina | 63
P(B/A1) = 0.08
P(A1)=0.50
P(B/A1) = 0.92
P(B/A2) = 0.09
P(A2)=0.30
P(B/A2) = 0.91
P(B/A3) = 0.10
P(A3)=0.20
P(B/A3) = 0.90
a. P(A1/B) =
b. P(A2/B) =
c. P(A3/B) =
d. P(A2/B) =
P ( A1 ) P ( B / A1 )
P ( A1 ) P ( B / A1 ) P ( A 2 ) P ( B / A 2 ) P ( A 3 ) P ( B / A 3 )
0.50(0.08)
0.4798
0.50(0.08) 0.30(0.09) 0.20(0.10)
P( A 2 ) P( B / A 2 )
P ( A1 ) P ( B / A1 ) P ( A 2 ) P ( B / A 2 ) P ( A 3 ) P ( B / A 3 )
0.30(0.09)
0.3103
0.50(0.08) 0.30(0.09) 0.20(0.10)
P( A 3 ) P( B / A 3 )
P ( A1 ) P ( B / A1 ) P ( A 2 ) P ( B / A 2 ) P ( A 3 ) P ( B / A 3 )
0.20(0.10)
0.2299
0.50(0.08) 0.30(0.09) 0.20(0.10)
P ( A2 ) P ( B ' / A2 )
P ( A1 ) P ( B ' / A1 ) P ( A2 ) P ( B ' / A2 ) P ( A3 ) P ( B ' / A3 )
0.30(0.91)
0.2990
0.50(0.92) 0.30(0.91) 0.20(0.90)
Pgina | 64