Anda di halaman 1dari 34

INSTITUTO UNIVERSITARIO DE TECNOLOGA

DE ADMINISTRACIN INDUSTRIAL
SEDE PUERTO LA CRUZ
CONVENIO MARCO IUTA UNERMB

Facilitador:
Ing. Ricardo Cortez

Elaborado por
Bello Patricia CI: 19183341
Calma Itsvhan CI: 11907222
Guerra George CI: 15878125
Hernndez Jos CI: 14894854
Hernndez Leislani CI: 15587503
Jaramillo Alejandro CI: 16853706
Mata Jos CI: 14081613
Sifontes Julio CI: 12915172

Puerto La Cruz, Octubre de 2013

Introduccin

Hoy en da vivimos en un mundo repleto de informacin, es decir, de


datos, y no cabe duda que para interpretarlos correctamente es fundamental
el conocimiento de la Estadstica, que podra definirse como el arte de
obtener conclusiones a partir de datos.
La Estadstica puede dar respuesta a muchas de las necesidades que
la sociedad nos plantea. Su tarea fundamental es la simplificacin de los
datos, con el objetivo de representar la realidad y transformarla, predecir su
futuro o simplemente conocerla.
La importancia de la estadstica en la actualidad, no se pone en
discusin. Casi todos los programas profesionales universitarios incluyen en
su currculo, al menos un curso de estadstica.
El uso de la probabilidad y de la estadstica se ha extendido, no tan
solo a las reas tradicionales universitarias o escolsticas, sino tambin a
todos los campos de la ingeniera, la agricultura, la biologa, la qumica, las
comunicaciones, la economa, la electrnica, la medicina, la fsica, las
ciencias polticas, la psicologa, la sociologa, las encuestas polticas, la
mercadotecnia, la ecologa, la meteorologa, y as sucesivamente.
En este sentido es de gran importancia el conocimiento bsico de todos
los aspectos que abarca la estadstica.

1. Aleatorio(a): Evento al que se permite que suceda sin intentar tomar el


control del resultado o consecuencia del evento. Por ejemplo, si se lanza un

dado no cargado, es igualmente probable que ocurra cualquiera de los 6


nmeros.
2. Anlisis de perfil: Es el tipo de anlisis que permite evaluar el efecto del
tiempo y la comparacin entre distintos grupos. Ejemplo: Si disponemos de
datos de dos grupos, con tres rplicas por grupo, cada individuo se mide a
distintos tiempos y se quiere establecer el efecto del tratamiento.

3. Anlisis de regresin simple: Este anlisis explica el comportamiento de


una variable cuantitativa de inters y (consumo de gasolina de un coche
hibrido, temperatura del agua marina) como funcin de otra variable
cuantitativa X observable (velocidad del vehculo en ciudad, profundidad a la
que se observa la temperatura del agua). Y = variable respuesta, endgena o
dependiente y X = regresor, predictor, variable explicativa, exgena o
independiente
4. Anlisis de regresin: consiste en emplear mtodos que permitan
determinar la mejor relacin funcional entre dos o ms variables
concomitantes (o relacionadas). Aplicaciones de regresin son numerosas y
ocurren en casi todos los campos, incluyendo ingeniera, la fsica, ciencias
econmicas, ciencias biolgicas y de la salud, como tambin ciencias
sociales. Ejemplo: El consumo de gasolina de un vehculo, cuya variacin
puede ser explicada por la velocidad media del mismo. Podemos incluir en el
trmino del error aleatorio el efecto del conductor, del tipo de carretera, las
condiciones ambientales, etc.

5. Atributos: Los atributos tambin llamados caracteres cualitativos, son


aquellos que no son susceptibles de medicin, es decir que no se pueden
expresar mediante un nmero. La forma de expresar los atributos es

mediante palabras, por ejemplo; profesin, estado civil, sexo, nacionalidad,


etc. Puede notar que los atributos no se presentan en la misma forma en
todos los elementos. Estas distintas formas en que se presentan los atributos
reciben el nombre de "modalidades". Ejemplo: El estado civil de cada uno de
los estudiantes del curso de estadsticas I, no se presenta en la misma
modalidad en todos.

6. Auto correlacin: Se puede definir como la correlacin entre miembros de


series de observaciones ordenadas en el tiempo (informacin de series de
tiempo) o en el espacio (informacin de corte de transversal). Un ejemplo
pueden ser los factores omitidos en la regresin que estn correlacionados a
travs del tiempo. El anlisis univariante de series temporales nos sugiere
que las variables econmicas siguen distintas estructuras de autocorrelacin.

7. Beta: Es una distribucin de probabilidad continua. Ejemplo: Proporcin de


ancianos con enfermedad de Alzheimer entre los residentes en un centro de
mayores.

8. Censo: Es el recuento de individuos que conforman una poblacin


estadstica, definida como un conjunto de elementos de referencia sobre el
que se realizan las observaciones. El censo de una poblacin estadstica
consiste bsicamente, en obtener mediciones del nmero total de individuos
mediante diversas tcnicas de recuento. Por ejemplo, en diversos pases se
llevan a cabo censos poblacionales que por lo general se realizan cada 10
aos, mismo perodo utilizado para censos agropecuarios.

9. Certidumbre: Es la condicin que prevalece cuando se est plenamente


informado acerca de un problema, se conocen soluciones alternativas y se
saben cules sern los resultados de cada solucin.

10.

Coeficiente de correlacin parcial: Un coeficiente de correlacin

parcial es una tcnica de control estadstico que expresa el grado de relacin


lineal entre dos variables tras eliminar de ambas el efecto atribuible a
terceras variables.
11.

Coeficiente de correlacin: Es una medida que indica que tan


asociadas estn las variables dependiente e independiente en un modelo de
regresin lineal, o de manera similar explica, junto con el coeficiente de de
determinacin (que es el cuadrado del coeficiente de correlacin) que tanto
depende realmente Y de X. Por ejemplo, si se analiza la estatura y el peso de
los alumnos de una clase es muy posible que exista relacin entre ambas
variables: mientras ms alto sea el alumno, mayor ser su peso.
12.

Coeficiente de determinacin mltiple: Mide la tasa porcentual de

los cambios de Y que pueden ser explicados por

simultneamente.

13.

Coeficiente de determinacin: El coeficiente de determinacin, r2 -

la proporcin de la variacin total en la variable dependiente Y que est


explicada por o se debe a la variacin en la variable independiente X. El
coeficiente de determinacin es el cuadrado del coeficiente de correlacin, y
toma valores de 0 a 1. Ejemplo: Dan Ireland, presidente de la sociedad de
alumnos de la Universidad de Toledo, est preocupado por el costo de los
libros. Para tener un panorama del problema elige una muestra de 8 libros de
venta en la librera. Decide estudiar la relacin entre el nmero de pginas
del libro y el costo.

14.

Coeficiente de variacin: Permite comparar la dispersin entre dos

poblaciones distintas e incluso, comparar la variacin producto de dos


variables diferentes (que pueden provenir de una misma poblacin).Estas
variables podran tener unidades diferentes, por ejemplo, podremos
determinar si los datos tomados al medir el volumen de llenado de un envase
de cierto lquido varan ms que los datos tomados al medir la temperatura
del liquido contenido en el envase al salir al consumidor. El volumen los
mediremos en centmetros cbicos y la temperatura en grados centgrados.
El coeficiente de variacin elimina la dimensionalidad de las variables y tiene
en cuenta la proporcin existente entre una medida de tendencia y la
desviacin tpica o estndar.

15.

Correlacin de rango: Tambin llamada correlacin de spearman, se

basa en reemplazar los valores originales de ambas variables, por nmeros


enteros positivos, comenzando por 1 en adelante, que correspondan a su
ordenamiento de mayor a menor a mayor magnitud (Rangos). Por ejemplo
un caso donde se puede aplicar la correlacin de rango puede ser el
siguiente: En un juego de tiro al blanco con escopeta de perdigones por dos
participantes a un tablero, obtienen el siguiente registro despus de 15
disparos cada uno. Determinar el coeficiente de variacin para ambos casos.

16. Correlacin serial: Es la correlacin existente entre los miembros de una


serie de observaciones ordenadas en el tiempo o en el espacio. Por ejemplo
un problema entre la inflacin y el desempleo en Estados Unidos.

17.

Correlacin: Es la forma numrica en la que la estadstica ha podido

evaluar la relacin de dos o ms variables, es decir, mide la dependencia de


una variable con respecto de otra variable independiente. Ejemplo saber si la

produccin de celulares en la empresa Nokia tiene correlacin con las


ganancias obtenidas por cada semestre.

18.

Covarianza: Es una tcnica estadstica que, utilizando un modelo de

regresin lineal mltiple, busca comparar los resultados obtenidos en


diferentes grupos de una variable cuantitativa, pero "corrigiendo" las posibles
diferencias existentes entre los grupos en otras variables que puedieran
afectar tambin al resultado (covariantes). Ejemplo: Supongamos que se
est comparando la presin arterial sistlica de un grupo de mujeres
diabticas segn su nivel de estudios.

19.

Cuestionario: Es un instrumento que contiene varias preguntas y que

trata de una diversidad de fenmenos o caractersticas. Puede tener


preguntas cerradas o preguntas abiertas o las dos al mismo tiempo. Ejemplo

Preguntas Cerradas:
1. Hace uso permanente del Internet de la UDLAP?
S

No

Preguntas abiertas:
1. Qu es lo que ms le gusta de nuestra empresa?
20.

Datos continuos: Datos que pueden tomar cualquier valor (un

nmero infinito de valores) dentro de un cierto intervalo. Por ejemplo, las


estaturas de un grupo de personas forman datos continuos, pero el nmero
de personas en ese grupo forman datos discretos.
21.

Datos discretos:

Datos que slo toman un nmero finito de valores,

lo opuesto a datos continuos. El nmero de un grupo de personas es un


ejemplo de ello.

22.

Datos externos: Es cuando la informacin es obtenida fuera de la

organizacin. Por ejemplo datos publicados en revistas, peridicos,


instituciones de investigacin, universidades, publicaciones editadas por
gobierno federal, editores privados, encuestas, entrevistas etc

23.

Datos primarios: son aquellos que nosotros como investigadores

obtenemos directamente de la realidad, recogindolos (producindolos) con


nuestros propios instrumentos. Son datos de primera mano. Ejemplo:
observar o realizar una encuesta.

24.

Datos secundarios: son informaciones ya han sido producidas por

otras personas o instituciones. La utilizacin de documentacin en la


investigacin social constituye por lo tanto una fuente secundaria. Ejemplo El
anlisis de datos recolectados por otras fuentes.

25.

Datos sin procesar: Informacin antes de ser organizada o analizada

por mtodos estadsticos. Conjunto de datos que no han recibido ningn


tratamiento estadstico. Ejemplo supongamos que el personal de admisin de
una universidad, preocupado por el xito de los estudiantes que escogen
para ser admitidos, desea comparar el desempeo de los estudiantes
universitario con otros logros, como calificaciones en el nivel anterior,
resultados de exmenes y actividades extracurriculares.
26.

Deflacin de precios: Situacin caracterizada por un descenso

generalizado de los precios y una acusada cada de la demanda. El mejor


ejemplo de deflacin por cada en la demanda es la Gran Depresin que tuvo
lugar en Estados Unidos y durante la cual el IPC cay un 24% en el perodo
1929 - 1933.

27.

Depuracin de los datos: Consiste en la revisin de la aplicacin

generada con el fin de eliminar los posibles errores que puedan existir en
unos datos. Por ejemplo la actualizacin de un registro tiene por objetivo que
los datos contenidos en el sistema sean los ms recientes posibles, adems,
deben ser confiables, adecuados y congruentes; y para ello se realiza una
depuracin de datos.

28. Desviacin estndar: Esta medida nos permite determinar el promedio


aritmtico de fluctuacin de los datos respecto a su punto central o media. La
desviacin estndar nos da como resultado un valor numrico que
representa el promedio de diferencia que hay entre los datos y la media.
Para calcular la desviacin estndar basta con hallar la raz cuadrada de la
varianza, por lo tanto su ecuacin sera:

. Ejemplo: El gerente de una

empresa de alimentos desea saber que tanto varan los pesos de los
empaques (en gramos), de uno de sus productos; por lo que opta por
seleccionar al azar cinco unidades de ellos para pesarlos. En este caso es
necesario aplicar la desviacin estndar.
29.

Dispersin: Medida en la que los datos se dispersan alrededor de un

punto central (normalmente la media aritmtica) en una muestra. Ejemplo: Si


tenemos una produccin de franelas y sabemos que diariamente se
producen un promedio de 500 franelas, y si un da se produce un mnimo de
415 franelas y otro da se produce un mximo de 573 franelas entonces si
vemos el RANGO de produccin estar entre 158 franelas, es decir,
podemos tener una produccin de 158 franelas a partir del valor mnimo, esto
es una medida de dispersin.

30.

Distribucin asimtrica: Es una medida de forma de una distribucin

que permite identificar y describir la manera como los datos tiende a reunirse
de acuerdo con la frecuencia con que se hallen dentro de la distribucin.
Permite identificar las caractersticas de la distribucin de datos sin
necesidad de generar el grfico.
31.

Distribucin bimodal: Se presenta como dos distribuciones muy

separadas. Suele aparecer cuando se han recopilado datos a partir de dos


procesos distintos. Por ejemplo las caractersticas de una pieza suministrada
por dos proveedores diferentes.

32.

Distribucin binomial: Es una distribucin de probabilidad discreta

que mide el nmero de xitos en una secuencia de n ensayos de Bernoulli


independientes entre s, con una probabilidad fija p de ocurrencia del xito
entre los ensayos. Un experimento de Bernoulli se caracteriza por ser
dicotmico, esto es, slo son posibles dos resultados. Ejemplo: se tira una
moneda 10 veces: cuntas caras salen? Si no ha salido ninguna la variable
toma el valor 0; si han salido dos caras la variable toma el valor 2; si todas
han sido cara la variable toma el valor 10

33.

Distribucin de frecuencias relativas: Describe los porcentajes del

nmero total de observaciones correspondiente a cada categora. Se puede


expresar en tantos por ciento y se representa por fi. La suma de las
frecuencias relativas es igual a 1, siempre y cuando no sea igual que 7 o por
debajo de los 7 primeros nmeros sucesivos. Una distribucin de frecuencia
relativa no nos indica cul es el nmero de observaciones en cada categora,
sino cul es el porcentaje de observaciones en cada categora.

34.

Distribucin de frecuencias: Es un formato tabular en la que se

organizan los datos en clases, es decir, en grupos de valores que describen


una caracterstica de los [datos] y muestra el nmero de observaciones del
conjunto de datos que caen en cada una de las clases.

35.

Distribucin de X2 (ji cuadrada):

Llamada Chi cuadrado o Ji

cuadrado, es una distribucin de probabilidad continua con un parmetro


que
donde

representa

los

grados

de

libertad

de

la

variable

aleatoria

son variables aleatorias normales independientes de media cero y

varianza uno. El que la variable aleatoria


representa habitualmente as:

tenga esta distribucin se

. Es conveniente tener en cuenta que

la letra griega se transcribe al latn como chi1 y se pronuncia en castellano


como ji. Ejemplo: Se ha tomado una muestra aleatoria de 40 bateras y se ha
registrado su duracin en aos. Estos resultados se los ha agrupado en 7
clases, si se necesita verificar con 5% de significancia que la duracin en
aos de las bateras producidas por este fabricante tiene duracin distribuida
normalmente con media 3.5 y desviacin estndar 0.7, se requiere la
distribucin Ji Cuadrada.
36. Distribucin de la muestra: Es una distribucin de Probabilidad de una
estadstica muestral calculada a partir de todas las muestras posibles de
tamao "n" elegidas al azar de una poblacin determinada.
37.

Distribucin de muestreo de la media Es de tipo probabilstico e

indica cun probables son diversas medias de la muestra. La distribucin es


una funcin de la media, de la desviacin estndar de la poblacin y del
tamao de la muestra. Un ejemplo de aplicacin es el siguiente problema: Se
considera una poblacin de cinco cerdos y un granjero que quera
estimar la proporcin de los que estaban bajos de peso. Se enfoco el

problema en el peso promedio de los cerdos, en cuyo caso resulto apropiada


la distribucin de los valores medios de la muestra.

38.

Distribucin de muestreo de una estadstica: Es la distribucin de

probabilidad del mismo, calculado en cada una de las muestras posibles


extradas aleatoriamente de la poblacin.

39. Distribucin de Poisson: Es una de las distribuciones de probabilidad


discreta. Esta distribucin se utiliza para calcular las posibilidades de un
evento con la tasa media dada de valor (). Una variable aleatoria de Poisson
(x) se refiere al nmero de xitos en un experimento de Poisson.
problema

donde

se

puede

utilizar

la

distribucin

Poisson

Un
seria:

Consideremos, en una oficina dos clientes llegaron hoy. Calcular las


posibilidades de exactamente tres clientes que se lleg en la maana.

40.

Distribucin de probabilidad: Indica toda la gama de valores que

pueden representarse como resultado de un experimento si ste se llevase a


cabo. Por ejemplo, si se lanzan dos dados y X es el nmero de veces que
sale un 6, entonces X es una variable aleatoria, y toma, al azar, uno de los
valores 0, 1 2. El estudio de las distribuciones de probabilidad es similar al
de la variable estadstica, el equivalente de la frecuencia relativa en la
variable aleatoria es la probabilidad.
41. Distribucin discreta de probabilidad: Son aquellas en las que la variable
puede pude tomar un nmero determinado de valores. Ejemplo: si se lanza
una moneda al aire puede salir cara o cruz; si se tira un dado puede salir un
nmero de 1 al 6; en una ruleta el nmero puede tomar un valor del 1 al 32.

42.

Distribucin F: La distribucin F de Fisher es una distribucin que

depende de dos parmetros. Es una distribucin que aparece, con


frecuencia, como distribucin de un estadstico de test, en muchos contrastes
de hiptesis bajo las suposiciones de normalidad. Ejemplo: Por ejemplo,
todos los contrastres ANOVA Su tabla es compleja porque al depender de
dos parmetros complica su diseo. Se acostumbran, pues, a publicar tantas
tablas como niveles de significacin interese manejar.
43.

Distribucin hipergeomtrica: Es una de las distribuciones de

probabilidad discreta. Esta distribucin se utiliza para calcular la probabilidad


de una seleccin aleatoria de un objeto sin repeticin. Aqu, el tamao de la
poblacin es el nmero total de objetos en el experimento. Por ejemplo
Consideremos, 5 bolas se eligen al azar del total de 10 bolas sin repeticin.
Calcular la probabilidad de obtener exactamente dos bolas rojas de 6 bolas
rojas en este caso se usa la probabilidad hipergeomtrica.
44. Distribucin normal estndar: Es aquella que tiene por media el valor cero,
=0, y por desviacin tpica la unidad, =1.
45.

Distribucin normal: Es una de las distribuciones de probabilidad de

variable continua que con ms frecuencia aparece aproximada en


fenmenos reales. La grfica de su funcin de densidad tiene una forma
acampanada y es simtrica respecto de un determinado parmetro
estadstico. Esta curva se conoce como campana de Gauss y es el grfico de
una funcin gaussiana. Un problema de su uso seria el siguiente: El tiempo
medio en realizar una misma tarea por parte de los empleados de una
empresa se distribuye segn una distribucin normal, con media de 5 das y
desviacin tpica 1 da. Calcular el porcentaje de empleados que realizan la
tarea en un tiempo inferior a 7 das.

46.

Distribucin t de Student: Es una distribucin de probabilidad que

surge del problema de estimar la media de una poblacin normalmente


distribuida cuando el tamao de la muestra es pequeo. Aparece de manera
natural al realizar la prueba t de Student para la determinacin de las
diferencias entre dos medias muestrales y para la construccin del intervalo
de confianza para la diferencia entre las medias de dos poblaciones cuando
se desconoce la desviacin tpica de una poblacin y sta debe ser estimada
a partir de los datos de una muestra.
47.

Distribucin uniforme: Es aquella que puede tomar cualquier valor

dentro de un intervalo, todos ellos con la misma probabilidad. Ejemplo: el


precio medio del litro de gasolina durante el prximo ao se estima que
puede oscilar entre 140 y 160 ptas. Podra ser, por tanto, de 143 ptas., o de
143,4 ptas., o de 143,45 ptas., o de 143,455 ptas, etc. Hay infinitas
posibilidades, todas ellas con la misma probabilidad.

48. Distribuciones de frecuencias acumuladas: La frecuencia acumulada es


la suma de las frecuencias absolutas de todos los valores inferiores o iguales
al valor considerado. Se representa por Fa.

49. Divisin de la variacin total: Es la variacin est dada por (Y - Media) y


es bsica para la determinacin de la varianza y de la desviacin estndar de
la muestra.
50. Dominios: Es el conjunto de valores para los que una determinada funcin
est definida.
51.

Encuestas de mercado: Es una tcnica que permite recopilar datos,

de cualquier aspecto que se desee conocer para, posteriormente,


interpretarlos y hacer uso de ellos. Sirven al comerciante o empresario para

realizar una adecuada toma de decisiones y para lograr la satisfaccin de


sus clientes.
52.

Encuesta: Es un estudio estadstico en el que la informacin se

obtiene de la muestra mediante la realizacin de un cuestionario.

53.

Error aleatorio: Se produce como consecuencia de realizar el estudio


con una muestra en lugar de estudiar a toda la poblacin y generalizar los

resultados que hemos obtenido en nuestra muestra a la poblacin. Slo se


pueden eliminar parcialmente si se refina el equipo o el mtodo analtico, y
repitiendo las medidas (como por ejemplo, leer una temperatura o el pH) o
aumentando el tiempo de observacin (como por ejemplo el tiempo de
medida de radioactividad).

54. Error de medicin: Es la diferencia existente entre el valor obtenido al medir


una variable con relacin a su valor real y objetivo. Por ejemplo Se puede
producir error de medicin por causas que determinan su ocurrencia en
forma aleatoria (error aleatorio) o bien ser efecto de un error que ocurre en
forma sistemtica (sesgo).

55.

Error de muestreo: es la desviacin de la muestra seleccionada de

las verdaderas caractersticas, rasgos, comportamientos, cualidades o


figuras de toda la poblacin.

56.

Error estndar de la estimacin: El error estndar nos permite

deducir la confiabilidad de la ecuacin de regresin que hemos desarrollado.


Este error se simboliza Se y es similar a la desviacin estndar en cuanto a
que ambas son medidas de dispersin. El error estndar de la estimacin

mide la variabilidad, o dispersin de los valores observados alrededor de la


lnea de regresin.

57.

Error estndar de la media: Tambin conocido como la desviacin

estndar de la media, ayuda a determinar las diferencias entre ms de una


muestra de la informacin. Las cuentas de clculo de las variaciones podran
estar presentes en los datos. Por ejemplo, si tomas el peso de muestras
mltiples de hombres, las mediciones pueden variar sustancialmente en cada
muestra, y algunos pueden pesar 150 libras (68 kg), mientras que otros, 300
libras (136 kg).

58.

Error estndar de un coeficiente de regresin: En el anlisis de

regresin, el trmino "error estndar" tambin se utiliza en el error estndar


de la regresin frase en el sentido de los mnimos cuadrados ordinarios
estimacin de la desviacin estndar de los errores subyacentes.

59.

Error estndar: El error estndar indica la propagacin de las

mediciones dentro de una muestra de datos. Es la desviacin estndar


dividida por la raz cuadrada del tamao de la muestra de datos. La muestra
puede incluir datos de las mediciones cientficas, resultados de exmenes,
las temperaturas o una serie de nmeros al azar.
60.

Error muestral: Es la diferencia entre un estadstico y su parmetro

correspondiente. Todo error lo es en relacin a algn patrn o punto de


referencia. En el caso del error muestral, el punto de referencia es la
poblacin de la que se obtiene o saca la muestra.

61.

Error por falta de muestreo: Error que puede atribuirse a fuentes que

no son de muestreo, aleatorias o no aleatorias. Por ejemplo: entrevistados


que se incluyen en la muestra no contesta.

62.

Espacio muestral: Es el conjunto de todos los resultados posibles. Se

simboliza con la letra E. Los elementos que lo forman se escriben entre


llaves: { }. Ejemplo: Si consideramos el experimento aleatorio que consiste en
lanzar un dado, los posibles resultados son 1, 2, 3, 4, 5 y 6. Entonces: E =
{ 1, 2, 3, 4, 5, 6 }
63.

Esperanza: Puede interpretarse intuitivamente como el valor medio de

infinitas observaciones. De hecho, si X i representa una observacin en un


individuo. Ejemplo: Si una persona compra una papeleta en una rifa, en la
que puede ganar de 5.000 Bs un segundo premio de 2000 Bs con
probabilidades de: 0.001 y 0.003. Cul sera el precio justo a pagar por la
papeleta?
64.

Estadstica: Es una ciencia formal que estudia la recoleccin, anlisis

e interpretacin de datos de una muestra representativa, ya sea para ayudar


en la toma de decisiones o para explicar condiciones regulares o irregulares
de algn fenmeno o estudio aplicado, de ocurrencia en forma aleatoria o
condicional.
65. Estadstica de ji cuadrada: X (pronunciado como "ji-cuadrado" y a veces
como "chi-cuadrado") a cualquier prueba en la que el estadstico utilizado
sigue una distribucin si la hiptesis nula es cierta. Algunos ejemplos de
pruebas son: La prueba de Pearson, la cual tiene numerosas
aplicaciones: La prueba de frecuencias, la prueba de independencia y la
prueba de bondad de ajuste.

66.

Estadstica de prueba: Es un valor, determinado a partir de la

informacin de la muestra, usado para decidir si rechazar o no la hiptesis


nula.

67.

Estadstica descriptiva: Refiere a los mtodos de recoleccin,

descripcin, visualizacin y resumen de los datos, que pueden ser


presentados en forma numrica o grfica.

68. Estadstica inferencial: Se refiere a la generacin de los modelos y


predicciones relacionadas a los fenmenos estudiados, teniendo en cuenta el
aspecto aleatorio y la incertidumbre en las observaciones.
69.

Estadstica F: Tambin llamada prueba F de Snedecor es cualquier

prueba en la que el estadstico utilizado sigue una distribucin F si la


hiptesis nula no puede ser rechazada.

70.

Estadstica t: Es cualquier prueba en la que el estadstico utilizado

tiene una distribucin t de Student si la hiptesis nula es cierta. Se aplica


cuando la poblacin estudiada sigue una distribucin normal pero el tamao
muestral es demasiado pequeo como para que el estadstico en el que est
basada la inferencia est normalmente distribuido, utilizndose una
estimacin de la desviacin tpica en lugar del valor real. Es utilizado en
anlisis discriminante.
71.

Estadstico: Es una medida usada para describir alguna caracterstica

de una muestra , tal como una media aritmtica, una mediana o una
desviacin estndar de una muestra.

72.

Evento: Es el resultado posible o un grupo de resultados posibles de

un experimento y es la mnima unidad de anlisis para efectos de clculos


probabilsticos. Ejemplo: que una persona sea doctor que tenga 56 aos, ser
estudiante y ya estar casado.

73.

Eventos independientes: Estos eventos no se ven afectados por

otros independientes. Ejemplo: el color del zapato y la probabilidad que


llueva hoy.

74.

Frecuencia absoluta: Es el nmero de veces que aparece en la

muestra dicho valor de la variable, la representaremos por ni. La Frecuencia


Absoluta hace un recuento del nmero de repeticiones de la variable.

75. Frecuencia relativa: Es el cociente entre o nmero de observaciones de una


clase (frecuencia ordinaria o absoluta) o total de casos de una distribucin
(frecuencia total). De cada una de las modalidades es el cociente entre la
frecuencia absoluta y el nmero total de datos.

76.

Frecuencia acumulada: Es la frecuencia de ocurrencia de valores de

un fenmeno menores que un valor de referencia. La frecuencia acumulada


se llama tambin frecuencia de noexcedencia. El anlisis de la frecuencia
acumulada se hace con el propsito de obtener una idea de cuantas veces
ocurrira un cierto fenmeno lo que puede ser instrumental en describir, por
ejemplo en el control de inundaciones.

77.

Grados de libertad: Nmero de valores de una muestra que podemos

especificar libremente, despus de que ya sabemos algo sobre dicha


muestra.

78.

Grfica lineal: Es un grfico que conlleva un conjunto de puntos

unidos por segmentos de lneas. Por lo general esta grfica se utiliza para
mostrar una tendencia.
79. Grfico circular: Tambin llamado cuadro de pastel. Es una grfica circular
que utiliza radios para dividir el crculo en sectores, de manera que las reas
de los sectores son proporcionales a las cantidades representadas.
80. Grfico de barras: Grfica que muestra datos de forma visual utilizando
barras horizontales o verticales cuyas longitudes son proporcionales a las
cantidades que representan. Se pueden utilizar cuando un eje no puede
tener una escala numrica.

81. Grfico de histogramas: Grfica que muestra la frecuencia de los datos, en


la que el eje horizontal representa unidades discretas, ciertos rangos, o
intervalos,

en

tanto

Frecuentemente,

se

que

el

dibujan

eje

vertical

barras

representa

rectangulares

la

con

frecuencia.
sus

reas

proporcionales a las frecuencias dentro de los rangos o de los intervalos.

82.

Hiptesis alternativa: Son posibilidades alternativas ante las

hiptesis de investigacin y nula. Ofrecen otra descripcin, explicaciones


distintas a las que proporcionan los ya mencionados tipos de hiptesis, estas
slo pueden formularse cuando efectivamente hay otras posibilidades
adicionales a las hiptesis de investigacin y nula. Ejemplo: E n qu medida
el grado de instruccin se relaciona al aborto provocado? Hiptesis alterna:
En la medida que el grado de instruccin sea menor la probabilidad de
abortar ser mayor.
83.

Hiptesis nula: Estas son lo contrario de las hiptesis de

investigacin, tambin constituyen proposiciones acerca de la relacin entre

variables, solamente sirven para refutar o negar lo que afirma la hiptesis de


investigacin. Ejemplo: E n qu medida el grado de instruccin se relaciona
al aborto provocado? Hiptesis nula: En la medida que el grado de
instruccin sea menor la probabilidad de abortar ser menor
84. Hiptesis simple: Son aquellas que especifican un nico valor para el
parmetro (por ejemplo m=m0).
85.

Hiptesis: Es un enunciado conjetural de la relacin entre dos o ms

variables. Las hiptesis siempre se presentan en forma de enunciados


declarativos y relacionan, de manera general o especfica, las variables entre
s; y contienen implicaciones claras para probar las relaciones enunciadas
86.

Indicador: Se trata de un nmero o de un ndice (un valor sobre una

escalera de medida), derivado de la observacin de un conjunto de


fenmenos. Variable que permite evaluar ciertos cambios en el curso del
tiempo.

87.

Incertidumbre: Es la aleatoridad o el error proveniente de varias

fuentes como las descritas al usar la metodologa estadstica". Por ejemplo,


al lanzar una moneda, unas veces resultar cara, y otras, cruz. Estos
fenmenos, denominados aleatorios, se ven afectados por la incertidumbre.

88.

Inferencia estadstica: Es una parte de la estadstica que estudia

cmo sacar conclusiones generales para toda la poblacin a partir del


estudio de una muestra, y el grado de fiabilidad o significacin de los
resultados obtenidos. Busca obtener informacin sobre la poblacin
basndose en el estudio de los datos de una muestra tomada a partir de ella,
as por ejemplo: Supngase ahora que el docente de Matemtica utiliza el
promedio de calificaciones obtenidas por uno de sus cursos para estimar la

calificacin promedio de los 5 cursos a su cargo. Como se est realizando


una generalizacin acerca los diferentes cursos, en este caso el maestro usa
la Estadstica Inferencial.
89.

Informacin de clasificacin: Es aquel proceso por el que se

caracteriza a los diferentes tipos, estructuras y valores de la informacin para


que las organizaciones puedan extraer valor de ella. consiste en saber con
qu informacin contamos, cmo tratarla, de cul deshacerse, dnde
guardarla y cmo recuperarla de nuevo para hacerla trabajar.

90.

Informacin de identificacin: Se refiere a la informacin que puede

usarse para identificar, contactar o localizar a una persona en concreto, o


puede usarse, junto a otras fuentes de informacin para hacerlo.

Son

informaciones personales habitualmente demandadas o protegidas, las


cuales se clasifican como pblicas o privadas, segn el pas, tales como: el
nombre, el domicilio, el nmero de identificacin personal en sus distintas
formas, el nmero de telfono, la direccin IP (en algunos casos), el
documento de identidad, el nmero del carnet de conducir, el nmero de la
tarjeta de crdito o de la cuenta bancaria, el nmero de matrcula del
vehculo propio, los rasgos fsicos entre otros.
91. Informe de investigacin: Representa el resultado final del largo proceso
de investigacin. Su articulacin estructural constituye ser el modo de como
los investigadores ordenan, clasifican y presentan los datos.
92.

Intervalo de confianza: Se llama a un par o varios pares de nmeros

entre los cuales se estima que estar cierto valor desconocido con una
determinada

probabilidad

de

acierto.

Formalmente,

estos

nmeros

determinan un intervalo, que se calcula a partir de datos de una muestra, y el


valor desconocido es un parmetro poblacional.

93.

Intervalo muestral: Se define como el nmero de datos que caen

dentro de casa intervalo clase.


94.

Lmites de confianza: Son los lmites del intervalo de confianza

inferior (LIC) y superior (LSC), se determinan sumando y restando a la media


de la muestra un cierto nmero Z (dependiendo del nivel o coeficiente de
confianza) de errores estndar de la media .
95. Lnea de regresin: Si observamos un diagrama de dispersin, podemos
obtener una primera idea de si existe relacin o no entre las variables
estadsticas. Con el coeficiente de correlacin podemos medir la correlacin
lineal, en caso de existir. Vamos ahora a calcular las lneas que mejor se
aproximen a la nube de puntos. A estas lneas se les llama lneas de
regresin.
96.

Media: Es la medida de posicin central ms utilizada, la ms

conocida y la ms sencilla de calcular, debido principalmente a que sus


ecuaciones se prestan para el manejo algebraico, lo cual la hace de gran
utilidad. La media se define como la suma de todos los valores observados,
dividido por el nmero total de observaciones.

es el smbolo de la media

aritmtica.

97.

Mediana: Es el valor que ocupa el lugar central de todos los datos

cuando stos estn ordenados de menor a mayor. La mediana se puede


hallar slo para variables cuantitativas. La mediana se representa por Me.
98.

Medidas de dispersin: Tambin llamadas medidas de variabilidad,

muestran la variabilidad de una distribucin, indicando por medio de un


nmero, si las diferentes puntuaciones de una variable estn muy alejadas

de la mediana media. Cuanto mayor sea ese valor, mayor ser la


variabilidad, cuanto menor sea, ms homognea ser a la mediana media.
As se sabe si todos los casos son parecidos o varan mucho entre ellos.

99.

Medidas de localizacin: Dividen la distribucin en partes iguales,

sirven para clasificar a un individuo o elemento dentro de una determinada


poblacin o muestra. As en psicologa los resultados de los test o pruebas
que realizan a un determinado individuo, sirve para clasificar a dicho sujeto
en una determinada categora en funcin de la 53-1-u-puntuaciMn obtenida.

100.

Medida de distancia: Miden la distancia entre dos objetos de forma que,


cuanto mayor (resp. menor) sea su valor, ms (resp. menos) diferentes son
los objetos y menor (resp. mayor) la probabilidad de que los mtodos de
clasificacin los pongan en el mismo grupo.

101.

Medidas de tendencia: Son valores que se ubican al centro de un conjunto


de datos ordenados segn su magnitud. Generalmente se utilizan 4 de estos
valores tambin conocidos como estadgrafos, la media aritmtica, la
mediana, la moda y al rango medio.

102.

Medidas de variabilidad: Son intervalos que indican la dispersin de los


datos en la escala de medicin. Responden la pregunta: Dnde estn
diseminadas las puntuaciones o los valores obtenidos?. Las medidas de
variabilidad ms utilizadas son: amplitud (rango), desviacin estndar y
varianza.

103.

Moda: Es el valor que tiene mayor frecuencia absoluta. Se representa por Mo.
Ejemplo; Buscar la moda de 5

12

nmero que ms se repite, la moda es 5.

1 Como la moda es el

104.

Muestra: Es un subconjunto de una poblacin. Por ejemplo: "la poblacin de


la ciudad que a estudiar es de 8 millones de personas si para hacer estudia
se toman en cuenta solo el 10% de esta poblacin esa es la muestra.

105.

Muestra aleatoria / muestra de probabilidad: Es extrada al azar cuando la


manera de seleccin es tal, que cada elemento de la poblacin tiene igual
oportunidad de ser seleccionado. Son generalmente preferidas por los
estadsticos porque la seleccin de las muestras es objetiva y el error
muestral puede ser medido en trminos de probabilidad bajo la curva normal.

106.

Nivel de confianza: Son intervalos aleatorios que se usan para acotar un


valor con una determinada probabilidad alta. Por ejemplo, puedo calcular un
intervalo de confianza para la media, o la distribucin; pero nunca puedo
llegar a tener un valor exacto con total seguridad.

107.

Nivel de significancia: Denominado tambin tamao del error de tipo I, es la


probabilidad de rechazar la hiptesis cuando sta es cierta. Para obtener el
nivel de significacin, se debe restar el nmero que aparece a uno. Por
ejemplo, un valor de ".01" significa que existe un 99% (1-.01= .99) de
probabilidades de que sea cierto.

108.

Observacin: Es la tcnica de recogida de la informacin que consiste


bsicamente,

en

observar,

acumular

interpretar

las

actuaciones,

comportamientos y hechos de las personas o objetos, tal y como las realizan


habitualmente.

109.

Parmetro: Es una medida usada para describir alguna caracterstica de una


poblacin, tal como una media aritmtica, una mediana o una desviacin
estndar de una poblacin.

110.

Pendiente: Es la inclinacin de un elemento (natural, ideal o constructivo)


respecto de la horizontal. La pendiente de una recta es el grado de
inclinacin.

111.

Poblacin de encuesta: Es el conjunto de cosas, personas, animales o


situaciones que tiene una o varias caractersticas o atributos comunes, por
ejemplo: los habitantes de El Salvador en el presente ao, las personas
menores de edad en el ao 2001; los estudiantes de la Universidad, las
reacciones de un nuevo medicamento, las diferencias entre los tratamientos
de diferentes formulaciones de insecticidas, entre otras.

112.

Poblacin finita: Es el conjunto compuesto por una cantidad limitada de


elementos. Por ejemplo el nmero de especies, el nmero de estudiantes, el
nmero de obreros.

113.

Poblacin infinita: Es la que tiene un nmero extremadamente grande de


componentes. Por ejemplo el conjunto de especies que tiene el reino animal.

114.

Probabilidad: Mide las posibilidades de que cada uno de los posibles


resultados en un suceso que depende del azar sea finalmente el que se de.
Por ejemplo: la probabilidad mide la posibilidad de que salga "cara" cuando
lanzamos una moneda, o la posibilidad de que salga 5 cuando lanzamos un
dado.

115.

Promedio: Suma de todos los valores numricos dividida entre el nmero de


valores para obtener un nmero que pueda representar de la mejor manera a

todos los valores del conjunto. Por ejemplo, el promedio de 6 nmeros (3, 4,
2, 2, 5, 2) es (3 + 4 + 2 + 2 + 5 + 2) 6 = 3
116.

Promedio Ponderado: Es una forma un poco ms compleja de calcular la


media, pero de gran utilidad prctica. Se calcula sumando las cantidades a
ponderar y dividindolas por el nmero de ellas. Por ejemplo: 8, 4 y 3 sera:
8+4+3 que dividido entre 3 (que es el nmero de componentes) y sera: 15/3
= 5, en este caso, 5 seria el promedio ponderado.

117.

Rango: Es el intervalo de menor tamao que contiene a los datos; es igual a


la diferencia entre el valor mximo y el valor mnimo; por ello, comparte
unidades con los datos.

118.

Regresin discriminante: Es una tcnica estadstica multivariante cuya


finalidad es describir (si existen) las diferencias entre g grupos de objetos
sobre los que se observan p variables (variables discriminantes).

119.

Regresin mltiple: Es un mtodo para analizar el efecto de dos o mas


variables independientes sobre una dependiente; as mismo, es una
extensin de la regresin lineal solo que con un mayor nmero de variables
independientes. Es decir sirve para predecir el valor de una variable
dependiente

conociendo

el

valor y la

influencia

de

las variables

independientes incluidas en el anlisis.

120.

Regresin: Es la tendencia de una medicin extrema a presentarse ms


cercana a la media en una segunda medicin. La regresin se utiliza para
predecir una medida basndonos en el conocimiento de otra.

121.

Teorema bayes: Es un resultado enunciado por Thomas Bayes en 1763 que


expresa la probabilidad condicional de un evento aleatorio A dado B en
trminos de la distribucin de probabilidad condicional del evento B dado A y
la distribucin de probabilidad marginal de slo A. Ejemplo: a partir de que ha
ocurrido el suceso B (ha ocurrido un accidente) deducimos las probabilidades
del suceso A (estaba lloviendo o haca buen tiempo?).

122.

Teorema de Chebyshev: Permite determinar que proporcin de los valores


que se tienen en los datos debe estar dentro un determinado nmero de
desviaciones estndar de la media.

123.

Teorema del lmite central: Indica que, en condiciones muy generales, si Sn


es la suma de n variables aleatorias independientes, entonces la funcin de
distribucin de Sn se aproxima bien a una distribucin normal (tambin
llamada distribucin gaussiana, curva de Gauss o campana de Gauss). As
pues, el teorema asegura que esto ocurre cuando la suma de estas variables
aleatorias e independientes es lo suficientemente grande.

124.

Variable: Una propiedad caracterstica de la poblacin que estamos


interesados en estudiar. Ejemplo: La edad de una persona. La altura de una
persona. El peso de una persona. Temperatura en una ciudad.

125.

Valor crtico: Es un trmino utilizado en las estadsticas que representa el


nmero que debe lograrse con el fin de demostrar la significacin estadstica.

126.

Valor de la muestra: Es el que pensamos que ms se aproxima al valor real


de dicha medida.

127.

Valor esperado: El valor que se espera obtener de un experimento


estadstico.

128.

Valor

z: En este valor se encuentran valores ms altos y ms bajos,

aproximadamente la mitad para cada lado, los cuales se dispersan segn


una medida denominada desviacin estndar.

129.

Variables cualitativas: Son variables que describen caractersticas o


cualidades. Ejemplo: Sexo del empleado, estado civil, jerarqua del
empleado, etc.

130.

Cualitativas se dividen:

Variable cualitativa ordinal: presenta modalidades no nmericas, en


las que existe un orden. Por ejemplo: La nota en un examen:
suspenso, aprobado, notable, sobresaliente.

Variable cualitativa Nominal: presenta modalidades no numricas


que no admiten un criterio de orden. Por ejemplo: El estado civil, con
las siguientes modalidades: soltero, casado, separado, divorciado y
viudo.

131.

Variables cuantitativas:

Variable discreta: Slo admite valores aislados. (Por ejemplo el


nmero de goles marcados por los equipos de ftbol de Primera
Divisin)

Variable continua: Puede admitir cualquier valor dentro de un


intervalo. (Como ejemplo, tenemos la estatura de los alumnos de 3 de
ESO del instituto).

132.

Varianza:
Es el cuadrado de la desviacin estndar: 2 . Se define as: Es la
media de las diferencias con la media elevadas al cuadrado.

Conclusin
En la actualidad la estadstica es una ciencia que ha logrado ganar
importantes espacios en muchos mbitos cotidianos, es indispensable en
estudios de poblaciones, predicciones de riesgos, pero sobre todo
proporciona herramientas valiosas en la toma de decisiones eso sin quitarle
al ser humano la ltima palabra.
La estadstica resulta fundamental para conocer el comportamiento de
ciertos eventos, por lo que ha adquirido un papel clave en la investigacin.
Se usa como un valioso auxiliar y en los diferentes campos del conocimiento
y en las variadas ciencias. Es un lenguaje que permite comunicar
informacin basada en datos cuantitativos.
Es tan importante que casi no existe actividad humana en que no est
involucrada la Estadstica. Las decisiones ms importantes de nuestra vida
se toman con base en la aplicacin de la Estadstica.
Los conceptos antes mencionados han sido analizados e investigados
de tal manera de hacer ms fcil su comprensin y entendimientos, ya que la
estadstica es la ciencia que trata de entender, organizar y tomar decisiones
que estn de acuerdo con los anlisis efectuados.

Bibliografa
http://www.mathematicsdictionary.com/spanish/vmd/full/r/randomevent.htm
http://web.udl.es/Biomath/Bioestadistica/Dossiers/Temas
%20especiales/ANOVA/Analisis%20de%20perfiles.pdf
http://www.uam.es/personal_pdi/ciencias/abaillo/AmbEst/Tema3.pdf
http://tarwi.lamolina.edu.pe/~fmendiburu/indexfiler/academic/metodos1/Regresion.pdf
http://www.ugr.es/~bioestad/_private/cpfund5.pdf
http://www.monografias.com/trabajos15/estadistica/estadistica.shtml#ixzz2iP
http://www.eumed.net/libros-gratis/2010c/720/AUTOCORRELACION.htm
http://www.ugr.es/~mcdiaz/bayes/teoria3_2.htm
http://es.wikipedia.org/wiki/Censo_%28estad%C3%ADstica%29

http://manuelazo.wordpress.com/2013/01/14/caracteristicas-principales-delos-sig/
http://html.rincondelvago.com/distribucion-por-muestreo.html
http://es.easycalculation.com/statistics/learn-poisson-distribution.php
metodoscuantitativo2.galeon.com/enlaces2218784.htm
http://carmesimatematic.webcindario.com/distribucionesp.htm
http://www.aulafacil.com/CursoEstadistica/Lecc-27-est.htm
http://estadisticaorquestainstrumento.wordpress.com/2013/01/07/ladistribucion-f-de-fisher/
http://es.easycalculation.com/statistics/learn-hypergeometric-distribution.php
http://www.ditutor.com/distribucion_normal/distribucion_normal.html
http://es.wikipedia.org/wiki/Distribuci%C3%B3n_normal
http://www.aulafacil.com/CursoEstadistica/Lecc-33-est.htm
http://www.contactopyme.gob.mx/promode/invmdo.asp
http://www.hiru.com/matematicas/elaboracion-de-encuestas
http://ricardoruizdeadana.blogspot.com/2011/02/unidad-v-error-aleatoriosistematico.html

http://escuela.med.puc.cl/Recursos/recepidem/insIntrod3.htm
http://www.buenastareas.com/ensayos/Resumen-Error-EstandarInterpretacion
http://www.ehowenespanol.com/calcular-error-estandar-media
http://centrodeartigos.com/articulos-enciclopedicos/article_93404.html
http://www.buenastareas.com/ensayos/Investigacion-De-Mercado-Errore
http://www.ceibal.edu.uy/contenidos/areas_conocimiento/mat/probabilidad
http://www.ditutor.com/distribucion_binomial/esperanza_matematica.html
http://es.wikipedia.org/wiki/Estad%C3%ADstica
http://marcylissetheliasvasquez.blogspot.com/2008/09/eventos.html
http://www.mathematicsdictionary.com/spanish
http://html.rincondelvago.com/hipotesis-de-investigacion.html
http://www.monografias.com/trabajos57/hipotesis
http://www.monografias.com/trabajos96/conceptos-basicos-estadistica
http://es.wikipedia.org/wiki/Informacin_personal
http://es.wikipedia.org/wiki/Intervalo_de_confianza

http://www.slideshare.net/LuisAngelVanegas/intervalos-de-confianza4261416
http://recursostic.educacion.es/descartes/web/materiales_didacticos/bidimens
ional_lbarrios/regresion_est.htm
http://www.vitutor.net/2/11/moda_media.html
es.wikipedia.org/wiki/Medidas_de_dispersin
http://www.suagm.edu/umet/biblioteca /MEDIDAS_DE_VARIABILIDAD.pdf
http://www.monografias.com/trabajos11/tebas/tebas.shtml#ixzz2ihOFH8cl
http://conceptodefinicion.de/observacion/#ixzz2ihQGbIAW
http://colposfesz.galeon.com/est501/suma/conceptos/estadistica.htm
http://primaria.aulafacil.com/matematicas-sexto-primaria/Curso/Lecc-31.htm
http://www.buenastareas.com/ensayos/Definici%C3%B3n-DeRango/4524940.html
http://estadisticauazteca.blogspot.com/2010/07/regresion-multiple.html
http://nutriserver.com/cursos/bioestadistica/Teorema_Bayes.html
http://estadistica-deskriptive-mr.blogspot.com/
es.wikipedia.org/wiki/Teorema_del_lmite_central
ecursostic.educacion.es/newton/web/materiales_didacticos

Anda mungkin juga menyukai