Anda di halaman 1dari 8

MEDIDAS DE

LOCALIZACIÓN Y
DETECCIÓN DE VALORES
ATÍPICOS Y VALORES Z
TEOREMA DE CHEBYSHEV Y REGLA EMPÍRICA Y DETECCIÓN DE DATOS
ATIPICOS
MEDIDAS DE LOCALIZACIÓN

◦ Se encuentran alejadas del resto de las observaciones en una


variable o en la distribución conjunta de dos o más variables.
◦ En otras palabras, se ubican distantes a los otros valores.
Generalmente es fácil detectar esto en las tablas de datos o
(especialmente) en los gráficos. Si el conjunto de datos se
expresa visualmente en un gráfico, los valores atípicos se ubican
“distantes” a los otros valores. Si, por ejemplo, la mayoría de los
datos en un conjunto de datos formaran una línea recta, no se
podría interpretar razonablemente que los valores atípicos fueran
parte de esa línea.
DETECCIÓN DE VALORES ATÍPICOS

◦ Un valor atípico es una observación extrañamente grande o pequeña. Los


valores atípicos pueden tener un efecto desproporcionado en los resultados
estadísticos, como la media, lo que puede conducir a interpretaciones
engañosas. Por ejemplo, un conjunto de datos incluye los valores: 1, 2, 3, y 34.
El valor medio, 10, que es mayor que la mayoría de los datos (1, 2, 3), se ve muy
afectado por el punto extremo de los datos: 34. En este caso, el valor medio
hace que parezca que los valores de los datos son más altos de lo que
realmente son. Es necesario investigar los valores atípicos, porque pueden
proporcionar información útil sobre los datos o el proceso.
TEOREMA DE CHEBYSHEV

◦ Para demostrar cómo la desviación estándar es indicadora de la dispersión de la


distribución de una variable aleatoria, el matemático ruso Pafnuty Lvovich
Chébyshev desarrolló un teorema en el que ofrece una garantía mínima acerca
de la probabilidad de que una variable aleatoria asuma un valor dentro de k
desviaciones estándar alrededor de la media.
Para cualquier variable aleatoria X con media µy desviación estándar ó, la
probabilidad de que X tome un valor contenido en k desviaciones estándar de la
media, siendo k una constante positiva cualquiera, es cuando menos.

1-1/k²
LA REGLA EMPIRICA

◦ Una de las ventajas del teorema de de Chebyshev es que se aplica a


cualquier conjunto de datos, sin importar en que forma estén distribuidos;
pero se ha visto en la práctica que si un conjunto de datos se distribuye,
aproximadamente, en forma de campana es posible aplicar en ellos la
llamada, regla empirica.

◦ esta regla permite encontrar el porcentaje de datos que debe estar dentro
de determinadas desviaciones estándar respecto a la media. A
continuación se determinan estos porcentajes:
◦ aproximadamente el 68% de los datos están a menos de una desviación
estándar de la media
◦ aproximadamente el 95% de los datos están a menos de dos desviaciones
estándar de la media
◦ casi todos los datos de la muestra están a tres desviaciones de la media
VALOR ATÍPICO

◦ En estadística, tales como muestras estratificadas, un valor atípico (en inglés


outlier) es una observación que es numéricamente distante del resto de los
datos. Las estadísticas derivadas de los conjuntos de datos que incluyen
valores atípicos serán frecuentemente engañosas. Por ejemplo, en el cálculo
de la temperatura media de 10 objetos en una habitación, si la mayoría
tienen entre 20 y 25 ºC, pero hay un horno a 350 °C, la mediana de los datos
puede ser 23, pero la temperatura media será 55. En este caso, la mediana
refleja mejor la temperatura de la muestra al azar de un objeto que la
media. Los valores atípicos pueden ser indicativos de datos que pertenecen
a una población diferente del resto de las muestras establecidas.
◦ Valores teta
◦ Valores del seno y del coseno en los ángulos fundamentales
grados radianes Seno coseno

0 0 0 1

30 𝜋/6 ½ 3/2

45 𝜋/4 2/2 2/2

60 𝜋/2 3/2 ½

90 𝜋/2 1 0

Anda mungkin juga menyukai