Anda di halaman 1dari 10

PROYECTO DE AUTOESTUDIO ESTADISTICA INFERENCIAL

ENTREGA 1

GRUPO
JEFERSON ANDRES BELTRAN BERNAL
LINA MARCELA CARDENAS BOLIVAR
CLAUDIA LILIANA PEREZ SOSA
MARIA SOLEDAD SANGUINO APONTE

PROFESOR. ALBERTO BOADA

INSTITUCIN UNIVERSITARIA POLITCNICO GRAN COLOMBIANO


FACULTAD DE INGENIERIA Y CIENCIAS BASICAS
INGENIERA INDUSTRIAL ESTADSTICA INFERENCIAL
BOGOT DC, SEPTIEMBRE 2014

INTRODUCCIN
La Estadstica es una ciencia formal que estudia la recoleccin, anlisis e
interpretacin de datos de una muestra representativa, ya sea para ayudar en la
toma de decisiones o para explicar condiciones regulares o irregulares de algn
fenmeno o estudio aplicado, de ocurrencia en forma aleatoria o condicional. Sin
embargo, la estadstica es ms que eso, es decir, es el vehculo que permite llevar
a cabo el proceso relacionado con la investigacin cientfica.
Para este proyecto se tuvo en cuenta una muestra representativa de 60 datos, de
la base de datos kuiper, en la variable de millaje, y basados en esta muestra
vamos a realizar el anlisis e interpretacin de estos datos, a fin de aplicar los
conocimientos adquiridos en formacin acadmica, este anlisis de datos nos
permite realizar la explicacin de las condiciones de la muestra tomada.

1. VARIABLES DE ESTUDIO
Como variable cuantitativa se tuvo en cuenta la variable Millaje de la base
de datos. Y como variable cualitativa se tuvo en cuenta la variable tipo. Se
realiz el anlisis de las siguientes medidas:
1.1.

Medidas de tendencia central


Media: 20522,05
Mediana: 20717,5
Moda: N/A
El promedio de millaje de los carros objeto de la muestra es de
20522,05.
No tenemos moda en la muestra, ya que no hay ningn dato que se
repita.

1.2.

Medidas de posicin
Q1: 17126,75
Q2: 20717,50
Q3: 25027,25
El 25% de los autos tienen un millaje entre 17126,75 y 20717,50 y
este valor est ms cerca a la media por tal motivo el cuartil 3 que
representa el 75% de la muestra est ms amplio del lado derecho.
Lo que significa que los datos estn ms dispersos del lado derecho.

1.3.

Medidas de forma
Skewness: 0,63
Curtosis: 3,10
Como la Curtosis es > 3, podemos decir que es Leptocrtica, es
decir que hay una mayor centralizacin de las variables entorno a la
media.
Es Skewness o la asimetra es > 0, podemos decir que la
distribucin de los datos es sesgada a la derecha, es decir que en su
mayora los valores se concentran a la izquierda de la media, y los
valores extremos estn a la derecha.

1.4.

Coeficiente de variacin

CV: 37,73%
Podemos decir que no es ni homogneo ni heterogneo sino media,
porque (20% CV < 40%)
2. CAJA DE BIGOTES
BoxPlot

-10000

10000

20000

30000

40000

50000

60000

MILLAJE

En mi caja de bigotes contamos con un valor Me=20.717,50 y una Media de


20.522,05; lo cual nos indica que es asimtrica con cola izquierda.

3. VARIABLE CUALITATIVA
TIPO
Convertible
Coupe
Wagon
Sedan

frequency
7
26
18
9
60

percent
11,7
43,3
30,0
15,0
100,0

Histogram
50
45
40
35
30
Percent 25
20
15
10
5
0

Convertible

Coupe

Wagon

Sedan

TIPO

Suponiendo que el histograma, lo elaboramos para analizar las ventas


mensuales de automviles; podemos concluir que el 43,3% de automviles
Coupe, han sido los ms demandados y que por el contrario, los
convertible, quienes tuvieron el 11,7% de ventas, no tuvieron muy buenos
resultados en el mes.

4. Uso de R para variable cuantitativa


Paso 1: Exportar datos de Excel

Paso 2: Para que R reconozca los datos como base de datos le damos un
nombre para que la reconozca

Paso 3: Una vez R reconoce la base de datos podemos hallar medidas con
el comando summary, Hallamos (el mnimo, el mximo, los cuartiles, la
media y la mediana)

Paso 4: Para hallar la Curtosis y el Skewness es necesario cargar el


paquete moments.

Paso 5: Una vez cargado el paquete moments lo llamamos para ejecucin


con el comando library(moments) y luego R nos reconoce los comandos
Kurtosis y skewness

Paso 6: Para hallar el coeficiente de variacin se usa el comando sd, antes


de hacer uso de este comando realizamos el attach de la variable

Paso 7: Antes de realizar la construccin del diagrama de tallos y hojas y el


histograma es necesario realizar el attach de la base de datos que nos
permite elegir la variable sobre la cual vamos a trabajar, una vez ejecutado
el attach procedemos a elegir el comando stem que nos construye el
diagrama de tallos y hojas, y para realizar el histograma utilizamos el
comando hist

Paso 8: Para realizar la caja de bigotes realizamos con el comando boxplot

REFERENCIAS BIBLIOGRAFICAS
-

Manual R. Notas sobre R: Un entorno de programacin para Anlisis de


Datos y Grficos Versin 1.0.1 (2000-05-16)

CIBERGRAFIA
-

Consulta realizada (13/09/2014)


http://www.ugr.es/~proman/ED/Comenzando_DescriptivaUnidim_RComman
der.pdf

Anda mungkin juga menyukai