Anda di halaman 1dari 30

ESTADSTICA I

Conceptos Bsicos

CARRERA: INGENIERIA EN SISTEMAS DE


INFORMACIN Y CIENCIAS DE LA COMPUTACION
Qu estudia la Estadstica?
La Estadstica es la rama de la Matemtica
que se ocupa de recopilar datos (en censos,
encuestas, etc), de organizarlos para una
mejor comprensin del fenmeno que se
desea estudiar y de analizarlos con un
determinado objetivo.
La estadstica se aplica a todas las ciencias,
pues facilita el estudio de hechos del mundo
o de la sociedad.
CONCEPTOS BASICOS SOBRE ESTADISTICA

Rama de la matemtica que utiliza grandes conjuntos


de datos numricos para obtener inferencias basadas
en el clculo de probabilidades.
- Diccionario de la real academia de la lengua espaola -

Es la rama de los mtodos cientficos que trata los


datos obtenidos contando o midiendo las propiedades
de poblaciones de fenmenos naturales.
- Kendall y Stuart -
Ejemplo:

Se hizo una encuesta a 8976 personas, de las cuales 8707


respondieron que calman su dolor de cabeza tomando una
aspirina. Si la encuesta est bien hecha, este dato puede ser
utilizado por los mdicos, quienes podran afirmar que si un
paciente sufre de dolor de cabeza, tiene un 97 % de probabilidad
de calmarla tomando una aspirina.
DIVISIN DE LA ESTADISTICA
La Estadstica Descriptiva o Deductiva: Trata
del recuento, ordenacin y clasificacin de los datos
obtenidos en las observaciones. Para que la mente
pueda interpretar datos muy numerosos, es preciso
resumirlos o reducirlo. La estadstica descriptiva sirve
como herramienta o instrumento para describir,
resumir o reducir las propiedades de un conjunto de
datos que se puedan manejar.
La estadstica Descriptiva es el estudio que
incluye la obtencin, organizacin, presentacin y
descripcin de informacin numrica.
Deductiva es pasar de lo general a lo particular.
DIVISIN DE LA ESTADSTICA
LA ESTADSTICA INDUCTIVA O INFERENCIAL:

Trata de llegar a conclusiones que sobrepasan el alcance


de los datos analizados; es decir, se trata de tcnicas que
se emplean para inferir o deducir caractersticas
desconocidas a partir de un conjunto de datos conocidos,
apoyndose fundamentalmente en el clculo de
probabilidades.
La inferencia estadstica es una tcnica mediante la
cual se obtienen generalizaciones o se toman
decisiones en base a una informacin parcial o
completa obtenida mediante tcnicas descriptivas.

Induccin es pasar de lo particular a lo general.


MTODOS ESTADSTICOS

Es la materia prima de la estadstica,


consiste en conjuntos de nmeros obtenidos
al contar o de reunir cosas.
Los mtodos estadsticos se aplican en la
recoleccin, organizacin, presentacin,
anlisis e interpretacin de los datos
numricos
Algunos conceptos de Estadstica
Poblacin: Llamamos poblacin al conjunto de individuos (personas,
animales, cosas) sobre la cul se estudia una determinada caracterstica.

Ejemplos:

Datos que se recopilan Poblacin

Se registra el peso de los alumnos de un curso Alumnos del curso


Se hace una encuesta en las viviendas de un barrio para Habitantes del barrio
determinar cuntas personas viven en cada una de ellas

El tamao de la poblacin es el nmero de individuos que la componen.


Cuando el tamao de una poblacin es muy grande, se trabaja con una
parte de ella llamada muestra.

Ejemplo: A una consultora le encargan hacer un estudio acerca de cul es la


intencin del voto en el municipio de Chiquimula en las prximas elecciones.
Como no es posible encuestar a todos los ciudadanos, la consultora toma un
grupo de 500 y sobre l analiza la variable. Con los datos recopilados sobre
esta muestra, se puede hacer una proyeccin de los votos que obtendr cada
candidato.

Importante!!! Para que el estudio estadstico sea confiable, es muy


importante que la seleccin de los individuos de una muestra resulte
representativa de la poblacin que se analiza, o sea, se deben obtener de
ella resultados aproximadamente iguales a los que se hubieran obtenido
considerando el total de la poblacin.
ESCALAS DE MEDICIN
Escalas nominales: se utilizan como medidas de identidad. Los
nmeros sirven de indicativos para identificar objetos o clases. Ejemplo:
las personas se pueden clasificar por sexo, raza, religin, etc.

Escala Ordinal: Los nmeros se reflejan de mayor a menor o


viceversa.

Escala de intervalos: Proporciona nmeros que reflejan diferencias


entre individuos u objetos. Ejemplo los termmetros Celcius y
Farhrenheit, el tiempo y las puntuaciones obtenidas en pruebas o test de
inteligencia.

Datos: Son medidas o valores susceptibles de ser observados y


contados. Para hacer un anlisis estadstico, es necesario hacer una
recopilacin de datos.
CENSO
Es una tcnica de recoleccin de datos estadsticos que se
realiza a toda la poblacin.

ENCUESTA

Es la tcnica que nos permite recolectar datos estadsticos que se


realiza una muestra de la poblacin.

Se clasifica en:
- Descriptiva.- Cuando registra datos referentes a las
caractersticas de los elementos o individuos.

- Explicativa.- Cuando averigua las causas o razones que


originan los fenmenos.

- Mixtas.- Cuando es descriptiva y explicativa.


Variables: son los caracteres o cualidades de la poblacin que es objeto
de estudio o anlisis. Pueden ser:
VARIABLES ESTADSTICAS

CUANTITATIVAS CUALITATIVAS
Son medibles y se expresan No se pueden medir y se
por medio de un nmero expresan con palabras.
Tiene distintas
modalidades, que son las
diferentes situaciones que
DISCRETAS CONTINUAS se pueden presentar.
Cuando solo pueden Cuando pueden tomar Ejemplos:
tomar algunos valores infinitos valores Sexo: Femenino Masculino
determinados. comprendidos entre dos Color de ojos
Ejemplos: valores determinados. Color del cabello
N de padres vivos Ejemplos:
N de hermanos Altura, peso, etc
VARIABLES DEPENDIENTES E INDEPENDIENTES:

Una variable es dependiente si es efecto de


otra y es independiente si es la causa del
valor de otra.
Frecuencia absoluta: es el nmero de veces que se repite una
observacin o valor de la variable (f).

Frecuencia relativa de una observacin: es el cociente entre su


frecuencia absoluta y el nmero total de observaciones realizadas
(fr).

fr f
n
Observaciones
La tabla que muestra la frecuencia relativa, absoluta y
acumulada se llama distribucin de frecuencias.

La suma de las frecuencias absolutas es el total de


observaciones.

La suma de las frecuencias relativas es siempre 1.


Si multiplicamos por 100 cada frecuencia relativa,
obtenemos el porcentaje de cada valor de la variable
(%).
% f r . 100
Porcentaje = frecuencia relativa . 100
Datos Agrupados en Intervalos

Cuando trabajamos con una variable continua,


podemos agrupar los valores en intervalos. Para eso
es necesario conocer el rango de la variable
(diferencia entre el mayor y el menor valor que toma la
variable) y luego dividirlo en partes iguales llamadas
intervalos. En los intervalos se incluye el primer valor,
pero no el ltimo, salvo en el ltimo intervalo en el que
se incluyen los dos.
Ejemplo:

El peso de un grupo de mujeres esta dado en la siguiente tabla:

Observa:
Los pesos se distribuyen en intervalos de
igual amplitud. En este caso la amplitud es
Intervalos Frecuencia Marca de clase .
Pesos ( kg Absoluta xi*
de 45 a 48 8 En cada intervalo se incluye el primer valor,
pero no el ltimo, excepto en el ltimo
de 48 a 51 10 intervalo en el que se incluyen los dos.
de 51 a 54 12 Valor central de un intervalo
El valor central del intervalo, se obtiene
de 54 a 57 9
como promedio de los valores extremos de
de 57 a 60 6 dicho intervalo y se llama marca de clase
(punto medio de cada intervalo).
Las medidas de tendencia central
Son valores que se ubican al centro de un conjunto de datos ordenados
segn su magnitud. Generalmente se utilizan 3 de estos valores tambin
conocidos como estadigrafos, la media aritmtica, la mediana y la moda.

La media aritmtica es la medida de posicin utilizada con ms frecuencia. Si se


tienen n valores de observaciones, la media aritmtica es la suma de todos y caca
uno de los valores dividida entre el total de valores: Lo que indica que puede ser
afectada por los valores extremos, por lo que puede dar una imagen distorcionada
de la informacin de los datos.

La Mediana, es el valor que ocupa la posicin central en un conjunto de datos, que


deben estar ordenados, de esta manera la mitad de las observaciones es menor
que la mediana y la otra mitad es mayor que la mediana, resulta muy apropiada
cuando se poseen observaciones extremas.

La Moda es el valor de un conjunto de datos que aparece con mayor frecuencia. No


depende de valores extremos, pero es ms variables que la media y la mediana.
Medidas de Posicin
Son Indicadores usados para sealar que porcentaje de datos
dentro de una distribucin de frecuncias superan estas
expresiones, cuyo valor representa el valor del dato que se
encuentra en el centro de la distribucin de frecuencia
CUARTILES: permiten dividir un conjunto de datos en 4 partes iguales.

DECILES: son muy parecidos a los cuartiles; pero dividen al conjunto de


datos en 10 partes iguales

PERCENTILES: tambin se lo conoce como centil, y permite dividir un


conjunto de datos en 100 partes iguales.
QUE ES LA DISPERSIN?
La dispersin es la variacin en un conjunto de datos que proporciona
informacin adicional y permite juzgar la confiabilidad de la medida de
tendencia central.

MEDIDAS DE DISPERSIN
Las medidas de dispersin nos permiten conocer si los valores en general estn
cerca o alejados de los valores centrales, muestran la variabilidad de una
distribucin de datos, indicando por medio de un nmero si las diferentes
puntuaciones de una variable estn muy alejadas de la medida de tendencia
central.
Medidas de dispersin:

Desviacin estndar o tpica

La desviacin estndar (s ) es una medida (cuadrtica)


que informa de la media de distancias que tienen los datos
respecto de su media aritmtica, expresada en las mismas
unidades que la variable. Es decir mide cunto se separan los
datos.
La frmula es fcil: es la raz cuadrada de la varianza. As
que, "qu es la varianza?. Es la media de las diferencias con
la media elevadas al cuadrado.

DESVIACIN MEDIA: Esta medida de dispersin considera todos los


datos, esta definida como el promedio aritmtico de los valores absolutos
de la desviacin de cada valor de la variable con respecto a la media
aritmtica.
Regresin y Correlacin
La regresin y la correlacin son dos tcnicas estrechamente
relacionadas y comprenden una forma de estimacin.
En forma ms especifica el anlisis de correlacin y regresin
comprende el anlisis de los datos muestrales para saber que es y
como se relacionan entre si dos o mas variables en una poblacin. El
anlisis de correlacin produce un nmero que resume el grado de la
correlacin entre dos variables; y el anlisis de regresin da lugar a
una ecuacin matemtica que describe dicha relacin.
El anlisis de correlacin generalmente resulta til para un trabajo de
exploracin cuando un investigador o analista trata de determinar que
variables son potenciales importantes, el inters radica bsicamente
en la fuerza de la relacin. La correlacin mide la fuerza de una entre
variables; la regresin da lugar a una ecuacin que describe dicha
relacin en trminos matemticos
Regresin lineal

La regresin lineal simple comprende el intento de desarrollar


una lnea recta o ecuacin matemtica lineal que describe la
reaccin entre dos variables.
La regresin es una tcnica utilizada para inferir datos a partir de
otros y hallar una respuesta de lo que puede suceder.
Ejemplo
Anlisis de Correlacin

EL objetivo de un estudio de correlacin es determinar


la consistencia de una relacin entre observaciones
por partes. EL termino correlacin significa relacin
mutua, ye que indica el grado en el que los valores de
una variable se relacionan con los valores de otra. Se
considera tres tcnicas de correlacin uno para datos
de medicin, otro para datos jerarquizados y el ltimo
para clasificaciones nominales.
Datos Continuos: r de Pearson
Datos jerarquizados de: r Spearman
Datos nominales: el coeficiente de contingencia
Grficos Estadsticos
Los grficos estadsticos se utilizan muchsimo, y con
ellos la informacin obtenida puede ser leda con
claridad y rapidez. Los grficos ms usados son:
Diagramas de barras, grficos circulares.
pictogramas, histogramas, polgono de frecuencia.

Para variables discretas: Para variables continuas:


- diagramas de barras - histogramas
- pictogramas - polgono de frecuencia
- grfico circular o de pastel - grfico circular o de pastel
Ejemplos

Diagramas de barra: Se construyen con rectngulos.


Para el ejemplo de las notas obtenidas por los alumnos de ingenieria de la
UMG, se tiene:

En el eje x se representan
. y en el eje y,
.

1 2 3 4 5 6 7 8 9 10
Grfico circular: Para armar el grfico circular correspondiente,
dividimos el crculo en sectores, segn los porcentajes obtenidos
Al crculo, que representa el 100%, le
corresponde un ngulo central de 360.
Por lo tanto, para hallar la amplitud del ngulo
correspondiente a un sector que representa un
30%, por ejemplo, hacemos:

100 % 360
30 % x x 30 % 360
100 %
Pictogramas: En ellos se recurre a dibujos relacionados con el tema tratado.
En realidad son diagramas de barras en los que las barras se sustituyen con
dibujos alusivas a la variable.
Histogramas y polgono de frecuencia
Para el ejemplo de los pesos de los empleados tenemos:

PESO DE 65 EMPLEADOS DE UNA FABRICA DE ENSAMBRE DE DISPOSITIVOS MOVILES

20

15

10
EMPLEADOS

0
60 70 80 90 100 110 120 130
PESO Kg.

Anda mungkin juga menyukai