ENTREGA 1
GRUPO
JEFERSON ANDRES BELTRAN BERNAL
LINA MARCELA CARDENAS BOLIVAR
CLAUDIA LILIANA PEREZ SOSA
MARIA SOLEDAD SANGUINO APONTE
INTRODUCCIN
La Estadstica es una ciencia formal que estudia la recoleccin, anlisis e
interpretacin de datos de una muestra representativa, ya sea para ayudar en la
toma de decisiones o para explicar condiciones regulares o irregulares de algn
fenmeno o estudio aplicado, de ocurrencia en forma aleatoria o condicional. Sin
embargo, la estadstica es ms que eso, es decir, es el vehculo que permite llevar
a cabo el proceso relacionado con la investigacin cientfica.
Para este proyecto se tuvo en cuenta una muestra representativa de 60 datos, de
la base de datos kuiper, en la variable de millaje, y basados en esta muestra
vamos a realizar el anlisis e interpretacin de estos datos, a fin de aplicar los
conocimientos adquiridos en formacin acadmica, este anlisis de datos nos
permite realizar la explicacin de las condiciones de la muestra tomada.
1. VARIABLES DE ESTUDIO
Como variable cuantitativa se tuvo en cuenta la variable Millaje de la base
de datos. Y como variable cualitativa se tuvo en cuenta la variable tipo. Se
realiz el anlisis de las siguientes medidas:
1.1.
1.2.
Medidas de posicin
Q1: 17126,75
Q2: 20717,50
Q3: 25027,25
El 25% de los autos tienen un millaje entre 17126,75 y 20717,50 y
este valor est ms cerca a la media por tal motivo el cuartil 3 que
representa el 75% de la muestra est ms amplio del lado derecho.
Lo que significa que los datos estn ms dispersos del lado derecho.
1.3.
Medidas de forma
Skewness: 0,63
Curtosis: 3,10
Como la Curtosis es > 3, podemos decir que es Leptocrtica, es
decir que hay una mayor centralizacin de las variables entorno a la
media.
Es Skewness o la asimetra es > 0, podemos decir que la
distribucin de los datos es sesgada a la derecha, es decir que en su
mayora los valores se concentran a la izquierda de la media, y los
valores extremos estn a la derecha.
1.4.
Coeficiente de variacin
CV: 37,73%
Podemos decir que no es ni homogneo ni heterogneo sino media,
porque (20% CV < 40%)
2. CAJA DE BIGOTES
BoxPlot
-10000
10000
20000
30000
40000
50000
60000
MILLAJE
3. VARIABLE CUALITATIVA
TIPO
Convertible
Coupe
Wagon
Sedan
frequency
7
26
18
9
60
percent
11,7
43,3
30,0
15,0
100,0
Histogram
50
45
40
35
30
Percent 25
20
15
10
5
0
Convertible
Coupe
Wagon
Sedan
TIPO
Paso 2: Para que R reconozca los datos como base de datos le damos un
nombre para que la reconozca
Paso 3: Una vez R reconoce la base de datos podemos hallar medidas con
el comando summary, Hallamos (el mnimo, el mximo, los cuartiles, la
media y la mediana)
REFERENCIAS BIBLIOGRAFICAS
-
CIBERGRAFIA
-