Anda di halaman 1dari 5

Cuando se trabaja con variables cuantitativas

Produccin de palta
Tengo 500 registros, cuando tengo ms datos es mejor porque voy a ver
como se comporta la variable.
No es lo mismo un anlisis de 5 aos a un anlisis de 20 aos
En toneladas
Tengo una cantidad de datos P1, p2, p3 Pm
Si yo quiero analizar este conjunto de datos debo hallar un valor que
represente a todos. Resumindolo en un solo valor, obteniendo una medida
de resumen o promedios.
Reuno todos los datos en una medida de resumen, o medidas de tendencia
central, resumen el conjunto de datos en uno solo:
Media aritmtica
Mediana
Moda
La que mas se utiliza es la media aritmtica, porque su valor promedio se
utiliza toda la informacin.
La mediana solamente ordena y esta es el valor central de todas ellas, para
su clculo no se usa toda la data, es su inconveniente.
La moda, es lo que ms se repite.
Pero a las finales cuando quiero ver la cubra de distribucin uso las tres.
Cual es el problema de usar la media, le afecta los valores extremos, por
exceso o por defecto.
El indicador que me indica si esta medida es buena, es la medida de
variabilidad:
La varianza ( s2)
La desviacin estndar ( s)
El rango ( Max Min)
Coeficiente de variacin ( cv)
La media aritmtica no sirve cuando esta sola.

La desviacin estndar
Mide la diferencia que hay entre cada observacin con respecto al valor
promedio.
Ejemplo

Si S es pequeo, el P representa al conjunto de datos, no tengo calores


extremos.
Si el S es grande, el P no representa al conjunto de datos, tengo valores
extremos.
Es un valor absoluto, porque lleva los unidades de las variables.
Como me doy cuenta si el S es grande o pequeo.
Depende la variable que estoy analizando.
Por ejemplo analizo rendimiento de una accin, es propio de esta que su
variabilidad sea alta, pues estas constantemente suben y bajan,
Por ejemplo analizo tiempo de ejecucin de produccin, debo esperar que la
variabilidad sea pequea, pues si es alta significa que tengo problemas en
la produccin.

En el anlisis de la produccin de palta:


1. Hay un comportamiento entre los primeros aos de produccin, esto
me resultara en una variabilidad alta.
2. Debo segmentar la informacin que voy a analizar para tener una
mejor data de variabilidad, segn un criterio.
3. El que establece el criterio de segmentacin es el que maneja la
variable.

Produccin de palta en reas.


Tengo un promedio de produccin para ambas reas. Entonces debo
comparar con coeficientes de variacin.
Que sea bueno o malo depende de la variable que estoy analizando.
Cuando hay una variabilidad pequea significa que la data se comporta muy
parecido.

Cuando hablamos del comportamiento de una variable, esta puede tener un


comportamiento simtrico o asimtrico, basndome en las 3 medidas,

Simtrico: En valor las 3 medidas de tendencia central se parecen.


Asimetrica positiva: tengo un valor extremo que hace que el valor tienda
hacia la derecha. Y el mayor porcentaje de las observaciones tiene valores
inferiores al valor de promedio.
Valor extremo superior al de la media aritmtica.

Asimetrica negativa: hay un valor muy pequeo inferior al promedio que


hace que la curva tienda a la izquierda, el mayor porcentaje de
observaciones tiene valores superiores al promedio.
Ejemplo:
Distribucin de sueldos es asimtrica positiva, se mezclan todos los sueldos
del funcionario mas alto al mas pequeo, y es lgico que haya un valor muy
superior al promedio.
Distribucin forma y comportamiento que tiene una variable, explicando
porque tiene este comportamiento.
Pareto solo se utiliza para priorizar acciones.

Ejemplo: VENTAS DE PRODUCTOS.


7 productos y de ellos el setimo me produce una rentabilidad del 5%
Lo saco del mercado?
Depende si es mi producto bandera, por el cual me conoce el mercado.
Si es mi producto bandera no puedo retirarlo ya que aunque no me
produzca rentabilidad por este producto me conoce el mercado.
Siempre terminamos haciendo estadstica descriptiva de nuestra data.

Datos
Analisis de datos
Estadstica descriptiva
Aceptar
Dame el rango de la variable q quiero analizar
Marcamos todo el rango de informacin de las variables a analizar

Es amodal porque no tiene moda.


Variable aleatoria
La diferencia es que nosotros no sabemos los valores que va tener esta
variable hasta que no se lleve a cabo el estudio, entonces presumimos que
todas las variables que manejamos son casi aleatorias.
La diferencia cuando se infiere, es que se trabaja con errores, por lo que
tenemos que tener en cuenta es la distribucin o forma
Tomar una muestra y en base a esta muestra concluir para la poblacin,
cuando se hace estadstica descriptiva los resultados eran para ese conjunto
de datos.
Cuando hacemos inferencia, tomamos una muestra y hacemos que estos
resultados sirvan para toda la poblacin
Toda la inferencia estadstica se basa en la distribucin normal.
Una variable tiene que estar perfectamente definida
La distribucin normal
Principal caracterstica por tener una distribucin simtrica, media, mediana
y moda iguales.
En esta el rea bajo la curva mide uno o 100 y ello esta medida en
desviacin estndar, puedo determinar el rea teniendo la media o la
desviacin estandar.
Cuando quiero determinar variabilidades o porcentajes debo hacer una
distribucin Z
Que es lo que tiene la distribucin normal estandar en los ejes

En Excel, distribucin normal estandar


En z voy a tener este valor de z, porque nosotros vamos a hacer el proceso
de estandarizar
Por ejemplo si quiero el rea de -1 y 1, pongo los valores de Z -1
Pero si tengo rea y necesito el valor de z uso la distribucin normal inversa.
Si me dan de dato la probabilidad entonces me va devolver el Z,

Quien se distribuye normalmente o quien se distribuye es la variable, esta


tiene la forma, otra cosa es la condicin para resolver el problema.

Ejemplo de calificaciones
Variable x es la calificacin.
Este tiene una media de ( 485, y desviacin 30)
Me preguntan la probabilidad de que x sea mayor que 500
P ( x > = 500)
Entonces debo estandarizar mi variable para encontrar el rea.
P ( x . 485/30) = 500 485 / 30
P (Z >= 0.5)
En Excel pongo el dato de 0.5 como dato de z en la formula de distribucin
normal estandar.
Y me devuelve el rea de 0.69146246
Entonces
1 menos 0.6914, tenemos que el porcentaje de aprobados debe ser de
30.85%

Anda mungkin juga menyukai