Proyecto de Autoestudio Estadistica Inferencial

PROYECTO DE AUTOESTUDIO ESTADISTICA INFERENCIAL
ENTREGA 1
GRUPO
JEFERSON ANDRES BELTRAN BERNAL
LINA MARCELA CARDENAS BOLIVAR
CLAUDIA LILIANA PEREZ SOSA
MARIA SOLEDAD SANGUINO APONTE
PROFESOR. ALBERTO BOADA
INSTITUCIN UNIVERSITARIA POLITCNICO GRAN COLOMBIANO

FACULTAD DE INGENIERIA Y CIENCIAS BASICAS
INGENIERA INDUSTRIAL ESTADSTICA INFERENCIAL
BOGOT DC, SEPTIEMBRE 2014
INTRODUCCIN
La Estadstica es una ciencia formal que estudia la recoleccin, anlisis e
interpretacin de datos de una muestra representativa, ya sea para ayudar en la
toma de decisiones o para explicar condiciones regulares o irregulares de algn
fenmeno o estudio aplicado, de ocurrencia en forma aleatoria o condicional. Sin
embargo, la estadstica es ms que eso, es decir, es el vehculo que permite llevar
a cabo el proceso relacionado con la investigacin cientfica.
Para este proyecto se tuvo en cuenta una muestra representativa de 60 datos, de
la base de datos kuiper, en la variable de millaje, y basados en esta muestra
vamos a realizar el anlisis e interpretacin de estos datos, a fin de aplicar los
conocimientos adquiridos en formacin acadmica, este anlisis de datos nos
permite realizar la explicacin de las condiciones de la muestra tomada.
1. VARIABLES DE ESTUDIO
Como variable cuantitativa se tuvo en cuenta la variable Millaje de la base
de datos. Y como variable cualitativa se tuvo en cuenta la variable tipo. Se
realiz el anlisis de las siguientes medidas:
1.1.
Medidas de tendencia central

Media: 20522,05
Mediana: 20717,5
Moda: N/A
El promedio de millaje de los carros objeto de la muestra es de
20522,05.
No tenemos moda en la muestra, ya que no hay ningn dato que se
repita.
1.2.
Medidas de posicin
Q1: 17126,75
Q2: 20717,50
Q3: 25027,25
El 25% de los autos tienen un millaje entre 17126,75 y 20717,50 y
este valor est ms cerca a la media por tal motivo el cuartil 3 que
representa el 75% de la muestra est ms amplio del lado derecho.
Lo que significa que los datos estn ms dispersos del lado derecho.
1.3.
Medidas de forma
Skewness: 0,63
Curtosis: 3,10
Como la Curtosis es > 3, podemos decir que es Leptocrtica, es
decir que hay una mayor centralizacin de las variables entorno a la
media.
Es Skewness o la asimetra es > 0, podemos decir que la
distribucin de los datos es sesgada a la derecha, es decir que en su
mayora los valores se concentran a la izquierda de la media, y los
valores extremos estn a la derecha.
1.4.
Coeficiente de variacin
CV: 37,73%
Podemos decir que no es ni homogneo ni heterogneo sino media,
porque (20% CV < 40%)
2. CAJA DE BIGOTES
BoxPlot
-10000
10000
20000
30000
40000
50000
60000
MILLAJE
En mi caja de bigotes contamos con un valor Me=20.717,50 y una Media de

20.522,05; lo cual nos indica que es asimtrica con cola izquierda.
3. VARIABLE CUALITATIVA
TIPO
Convertible
Coupe
Wagon
Sedan
frequency
7
26
18
9
60
percent
11,7
43,3
30,0
15,0
100,0
Histogram
50
45
40
35
30
Percent 25
20
15
10
5
0
Convertible
Coupe
Wagon
Sedan
TIPO
Suponiendo que el histograma, lo elaboramos para analizar las ventas

mensuales de automviles; podemos concluir que el 43,3% de automviles
Coupe, han sido los ms demandados y que por el contrario, los
convertible, quienes tuvieron el 11,7% de ventas, no tuvieron muy buenos
resultados en el mes.
4. Uso de R para variable cuantitativa

Paso 1: Exportar datos de Excel
Paso 2: Para que R reconozca los datos como base de datos le damos un
nombre para que la reconozca
Paso 3: Una vez R reconoce la base de datos podemos hallar medidas con
el comando summary, Hallamos (el mnimo, el mximo, los cuartiles, la
media y la mediana)
Paso 4: Para hallar la Curtosis y el Skewness es necesario cargar el

paquete moments.
Paso 5: Una vez cargado el paquete moments lo llamamos para ejecucin

con el comando library(moments) y luego R nos reconoce los comandos
Kurtosis y skewness
Paso 6: Para hallar el coeficiente de variacin se usa el comando sd, antes

de hacer uso de este comando realizamos el attach de la variable
Paso 7: Antes de realizar la construccin del diagrama de tallos y hojas y el

histograma es necesario realizar el attach de la base de datos que nos
permite elegir la variable sobre la cual vamos a trabajar, una vez ejecutado
el attach procedemos a elegir el comando stem que nos construye el
diagrama de tallos y hojas, y para realizar el histograma utilizamos el
comando hist
Paso 8: Para realizar la caja de bigotes realizamos con el comando boxplot
REFERENCIAS BIBLIOGRAFICAS
-
Manual R. Notas sobre R: Un entorno de programacin para Anlisis de

Datos y Grficos Versin 1.0.1 (2000-05-16)
CIBERGRAFIA
-
Consulta realizada (13/09/2014)

http://www.ugr.es/~proman/ED/Comenzando_DescriptivaUnidim_RComman
der.pdf

Proyecto de Autoestudio Estadistica Inferencial

Diunggah oleh

Informasi Dokumen

Hak Cipta

Format Tersedia

Bagikan dokumen Ini

Bagikan atau Tanam Dokumen

Opsi Berbagi

Apakah menurut Anda dokumen ini bermanfaat?

Apakah konten ini tidak pantas?

Hak Cipta:

Format Tersedia

Proyecto de Autoestudio Estadistica Inferencial

Diunggah oleh

Hak Cipta:

Format Tersedia

PROYECTO DE AUTOESTUDIO ESTADISTICA INFERENCIAL

PROFESOR. ALBERTO BOADA

INSTITUCIN UNIVERSITARIA POLITCNICO GRAN COLOMBIANO

Medidas de tendencia central

En mi caja de bigotes contamos con un valor Me=20.717,50 y una Media de

Suponiendo que el histograma, lo elaboramos para analizar las ventas

4. Uso de R para variable cuantitativa

Paso 4: Para hallar la Curtosis y el Skewness es necesario cargar el

Paso 5: Una vez cargado el paquete moments lo llamamos para ejecucin

Paso 6: Para hallar el coeficiente de variacin se usa el comando sd, antes

Paso 7: Antes de realizar la construccin del diagrama de tallos y hojas y el

Paso 8: Para realizar la caja de bigotes realizamos con el comando boxplot

Manual R. Notas sobre R: Un entorno de programacin para Anlisis de

Consulta realizada (13/09/2014)

Anda mungkin juga menyukai