Anda di halaman 1dari 8

TIPOS DE SERIES ESTADISTICAS:

SERIES SIMPLES

Se considerarán para el caso que nos ocupa, series finitas. (están acotadas). Es decir, que tienen una
cantidad de números limitada (pocos) y que sea posible realizar operaciones no engorrosas utilizando
calculadoras.

Están dadas entonces, por una cantidad finita de datos estén estos ordenados o no.

DATOS NO AGRUPADOS
Datos no agrupados es el conjunto de observaciones que se presentan en su forma original tal y como
fueron recolectados, para obtener información directamente de ellos. Los datos no agrupados es un
conjunto de información si ningún orden que no nos establece relación clara con lo que se pretende
desarrollar a lo largo de un problema, esto se soluciona mediante una tabulación que nos conduce a una
tabla de frecuencias.
Muchas veces el proceso de análisis de datos se cuenta con un gran volumen de información en bruto
(datos no agrupados)

DATOS AGRUPADOS

Distribución de frecuencia de clase o de datos agrupados (n>20): es aquella distribución en la que la


disposición tabular de los datos estadísticos se encuentran ordenados en clases y con la frecuencia de
cada clase, es decir los datos originales de varios valores adyacentes del conjunto se combinan para
formar un intervalo de clase.

PROCESO DE UNA DISTRIBUCIÓN DE FRECUENCIAS:

RANGO

El rango de clase, conocido también como amplitud de clase o recorrido de clase, es el límite dentro de
los cuales están comprendidos los valores de la serie de datos, en otras palabras, es el número de
diferentes valores que toma la variable en un estudio de investigación dada. Es la diferencia entre el
valor máximo de una variable y el valor mínimo que ésta toma en una investigación cualquiera. El rango
de una distribución de frecuencia se designa con la letra R.

INTERVALO DE CLASE Y LÍMITES DE CLASE.


Los intervalos de clase se emplean si las variables toman un número grande de valores o la variable es
continua.
Se agrupan los valores en intervalos que tengan la misma amplitud denominados clases. A cada clase se
le asigna su frecuencia correspondiente.
Límites de la clase
Cada clase está delimitada por el límite inferior de la clase y el límite superior de la clase.
AMPLITUD DE INTERVALO
Dentro de los conceptos fundamentales de la estadística y la representación gráfica de variables que
son continuas, existe una conveniencia por agrupar los valores de una variable en intervalos que por lo
general serán del mismo tamaño; elección que se hace por cierto en función del número de datos de que
se dispone y de la variación de los mismos.

Cada intervalo quedará entonces definido por sus límites superior e inferior...a la diferencia entre ambos
extremos se le denomina "amplitud del intervalo"
FRECUENCIA ABSOLUTA:
el número de veces que aparece un valor, se representa con donde el subíndice representa cada uno de
los valores. La suma de las frecuencias absolutas es igual al número total de datos, representado por f1.
FRECUENCIA ACUMULADA: la suma de frecuencias absolutas de todos los valores iguales o inferiores al
valor considerado, se representa por N1 .
Frecuencia relativa acumulada: el resultado de dividir la frecuencia acumulada entre el número total de
datos, se representa por .
(nótese que cuando se trata de acumuladas las letras que las representan están en mayúscula)
LIMITES EXACTOS.
Los limites nominales de una clase indican los valores mínimos y máximos aceptables en esa clase, sin
embargo, existe una zona entre el limite superior de una clase y el limite inferior de la clase siguiente
que no esta incluida en los limites nominales.
Aquí es donde intervienen los conceptos de limites exactos, los cuales marcan con precisión el valor
inicial y el final de cada clase.
PUNTO MEDIO (estadísticas)
El punto medio es el valor medio de un conjunto de datos. Para un conjunto de datos con un número
impar de miembros, es el miembro del conjunto de datos con apenas tantos valores menos que su valor
como mayor que él. Para un conjunto de datos con un número par de miembros, es el promedio de los
dos valores medios del conjunto de datos. El punto medio se utiliza en estadísticas para analizar un
conjunto de datos.
PORCENTAJE:
La frecuencia relativa es un tanto por uno, sin embargo, hoy día es bastante frecuente hablar siempre en
términos de tantos por ciento o porcentajes, por lo que esta medida resulta de multiplicar la frecuencia
relativa por 100. La denotaremos por pi.

PROPORCIÓN
Matemáticamente, una proporción es la igualdad de dos razones cuyo objetivo es establecer la relación
entre una parte con respecto al todo. En las proporciones no se multilica el cociente resultan e por 100,
ya que la relación se establece respecto de la unidad. Las proporciones y los porcentajes ofrecen la
misma información, auque estos últimos se emplean más por ser más fácil su comprensión.

PROPORCIÓN POBLACIONAL
En poblaciones dicotómicas con una proporción de éxitos el estimador puntual del parámetro es
la proporción muestral de éxitos, p, que coincide con la media de la muestra cuando se codifica como 1
la característica que se considera como éxito y 0 la que se considera no éxito. A partir de un tamaño
muestral moderadamente grande el estadístico p tiene una distribución aproximadamente normal. El
intervalo de confianza para la proporción poblacional está centrado en la proporción muestral; siendo

sus límites superior e inferior donde z /2 es el valor crítico correspondiente al

grado de confianza 1- de la distribución normal tipificada y es el error típico de la


proporción.

CURVAS DE FRECUENCIAS. OJIVAS SUAVIZADAS

El conjunto de datos puede considerarse normalmente como perteneciente a una muestra extraída de
una población grande. A causa de las muchas observaciones que podemos realizar en la población es
posible teóricamente (para datos continuos) elegir los intervalos de clase muy pequeños y todavía tener
un número adecuado de observaciones dentro de cada clase. Así se tiene que el polígono de frecuencias
o el de frecuencias relativas para una población grande puede estar formado por muchos pequeños
segmentos rectos que aproximan el conjunto a una curva, las curvas de este tipo pueden llamarse curvas
de frecuencias o curvas de frecuencias relativas, respectivamente.

ESTADISTICOS DE TENDENCIA CENTRAL


MEDIA ARITMETICA
En matemáticas y estadística, la media aritmética, también llamada promedio o media, de un conjunto
finito de números es el valor característico de una serie de datos cuantitativos, objeto de estudio que
parte del principio de la esperanza matemática o valor esperado, se obtiene a partir de la suma de todos
sus valores dividida entre el número de sumandos. Cuando el conjunto es una muestra aleatoria recibe el
nombre de media muestral siendo uno de los principales estadísticos muestrales.
MEDIA ARMÓNICA
Construcción geométrica para hallar las medias aritmética (A), cuadrática (Q), geométrica (G) y armónica
(H) de dos números a y b.
La media armónica (designada usualmente mediante H) de una cantidad finita de números es igual
al recíproco, o inverso, de la media aritmética de los recíprocos de dichos valores y es recomendada para
promediar velocidades.
Así, dados n números x1, x2, ... , xn la media armónica será igual a:
La media armónica resulta poco influida por la existencia de determinados valores mucho más grandes
que el conjunto de los otros, siendo en cambio sensible a valores mucho más pequeños que el conjunto.
La media armónica no está definida en el caso de que exista algún valor nulo.
MEDIA CUADRÁTICA
Construcción geométrica para hallar las medias aritmética (A), cuadrática (Q), geométrica (G) y armónica
(H) de dos números a y b.
En matemáticas, la media cuadrática, valor cuadrático medio o RMS (del inglés root mean square) es una
medida estadística de la magnitud de una cantidad variable. Puede calcularse para una serie de valores
discretos o para una función matemática de variable continua. El nombre deriva del hecho de que es la
raíz cuadrada de la media aritmética de los cuadrados de los valores.
MEDIA GEOMÉTRICA
Construcción geométrica para hallar las medias aritmética (A), cuadrática (Q), geométrica (G)
y armónica (H) de dos números a y b.
En matemáticas y estadística, la media geométrica de una cantidad arbitraria de números (por
decir n números) es la raíz n-ésima del producto de todos los números, es recomendada para datos de
progresión geométrica, para promediar razones, interés compuesto y números índices.

MEDIANA ESTADÍSTICA

La mediana estadística es el número central de un grupo de números ordenados por tamaño. Si la


cantidad de términos es par, la mediana es el promedio de los dos números centrales:
Para averiguar la mediana de un grupo de números:
 Ordena los números según su tamaño
 Si la cantidad de términos es impar, la mediana es el valor central.
 Si la cantidad de términos es par, suma los dos términos del medio y divide por 2.
MODA
En estadística, la moda es el valor con mayor frecuencia en una distribución de datos.
Se hablará de una distribución bimodal de los datos adquiridos en una columna cuando encontremos dos
modas, es decir, dos datos que tengan la misma frecuencia absoluta máxima. Una distribución trimodal
de los datos es en la que encontramos tres modas. En el caso de la distribución uniforme discreta,
cuando todos los datos tienen la misma frecuencia, se puede definir las modas como indicado, pero
estos valores no tienen utilidad. Por eso algunos matemáticos califican esta distribución como «sin
moda».

ESTADISTICOS DE VARIABILIDAD
ESTADÍSTICOS DE POSICIÓN

Para una variable discreta, se define el percentil de orden k, como la observación, Pk, que deja por
debajo de si el k% de la población. Esta definición nos recuerda a la mediana, pues como consecuencia
de la definición es evidente que

Med= P50

En el caso de una variable continua, el intervalo donde se encuentra , se calcula buscando el


que deja debajo de si al k% de las observaciones. Dentro de él, Pk se obtiene según la relación:
CUANTILES

Los cuantiles son puntos tomados a intervalos regulares de la función de distribución de una variable
aleatoria.
El término cuantil fue usado por primera vez por Kendall en 1940. El cuantil de orden p de una

distribución (con 0 < p < 1) es el valor de la variable que marca un corte de modo que una

proporción p de valores de la población es menor o igual que . Por ejemplo, el cuantil de orden
0,36 dejaría un 36% de valores por debajo y el cuantil de orden 0,50 se corresponde con
la mediana de la distribución.

CUARTILES

Los cuartiles son valores que dividen una muestra de datos en cuatro partes iguales.
Utilizando cuartilespuede evaluar rápidamente la dispersión y la tendencia central de un
conjunto de datos, que son los pasos iniciales importantes para comprender sus datos. 25% de
los datos es menor que o igual a este valor.

DECIL (ESTADÍSTICA)

En estadística descriptiva, el concepto decil se refiere a cada uno de los 9 valores que dividen un grupo
de datos (clasificados con una relación de orden) en diez partes iguales, y de manera que cada parte
representa un décimo de la población. En resumen, los deciles son cada uno de los nueve valores que
dividen un conjunto de datos en diez grupos con iguales efectivos. Son los nueve valores que dividen la
serie de datos en diez partes
EL PERCENTIL

es una medida de posición usada en estadística que indica, una vez ordenados los datos de menor a
mayor, el valor de la variable por debajo del cual se encuentra un porcentaje dado de observaciones en
un grupo de observaciones. Por ejemplo, el percentil 20º es el valor bajo el cual se encuentran el 20 por
ciento de las observaciones.
Se representan con la letra P. Para el percentil i-ésimo, donde la i toma valores del 1 al 99. El i % de la
muestra son valores menores que él y el 100-i % restante son mayores.
Aparecen citados en la literatura científica por primera vez por Francis Galton en 18851

 P25 = Q1.
 P50 = Q2 = mediana.
 P75 = Q3.

ESTADÍSTICOS DE DISPERSIÓN:
RANGO INTERCUARTÍLICO

En estadística descriptiva, se le llama rango intercuartílico o rango intercuartil, a la diferencia entre el


tercer y el primer cuartil de una distribución. Es una medida de la dispersión estadística.
A diferencia del rango, se trata de un estadístico robusto.

Definición

El rango intercuartílico es una medida de variabilidad adecuada cuando la medida de posición central
empleada ha sido la mediana. Se define como la diferencia entre el tercer cuartil (Q3) y el primer cuartil
(Q1), es decir: RQ = Q3 - Q1. A la mitad del rango intercuartil se le conoce como desviación cuartil (DQ),
es afectada muy poco por cuentas extremas. Esto lo hace una buena medida de dispersión para
distribuciones sesgadas: DQ = RQ/2= (Q3 - Q1)/2.

RANGO SEMICUARTIL

El rango semi-intercuartil es un medio de la diferencia entre el primer y tercer cuartiles. Es la mitad de la


distancia requerida para cubrir la mitad de las cuentas. El rango semi-intercuartil es afectado muy poco
por cuentas extremas. Esto lo hace una buena medida de dispersión para distribuciones sesgadas. Se

obtiene evaluando .

DESVIACIÓN MEDIA

La desviación media es la media aritmética de los valores absolutos de las desviaciones respecto a la
media. Se simboliza por y se calcula aplicando la fórmula

Informa de lo muy dispersados (o no) que están los datos. Una desviación media elevada implica mucha
variabilidad en los datos, mientras que una desviación media igual a cero implica que todos los valores
son iguales y por lo tanto coinciden con la media.

VARIANZA

En teoría de probabilidad, la varianza o variancia (que suele representarse como {\displaystyle \sigma

^{2}} ) de una variable aleatoria es una medida de dispersióndefinida como la esperanza del
cuadrado de la desviación de dicha variable respecto a su media. O en pocas palabras, es la media de los
residuos al cuadrado.

Su unidad de medida corresponde al cuadrado de la unidad de medida de la variable: por ejemplo, si la


variable mide una distancia en metros, la varianza se expresa en metros al cuadrado. La varianza tiene
como valor mínimo 0. La desviación estándar (raíz cuadrada de la varianza) es una medida de dispersión
alternativa, expresada en las mismas unidades que los datos de la variable objeto de estudio.

DESVIACIÓN TÍPICA

La desviación típica o desviación estándar (denotada con el símbolo σ o s, dependiendo de la


procedencia del conjunto de datos) es una medida de dispersión para variables de razón (variables
cuantitativas o cantidades racionales) y de intervalo. Se define como la raíz cuadrada de la varianzade
la variable.

Para conocer con detalle un conjunto de datos, no solo basta con conocer las medidas de tendencia
central, sino que necesitamos conocer también la desviación que presentan los datos en su distribución
respecto de la media aritmética de dicha distribución, con objeto de tener una visión de los mismos más
acorde con la realidad al momento de describirlos e interpretarlos para la toma de decisiones.
MEDIDAS DE ASIMETRIA Y CURTOSIS

SESGO

Sesgo proviene de sesgar, un verbo que hace referencia a torcer o atravesar algo hacia uno de sus lados.
El término, por lo tanto, se utiliza para hablar de algo torcido, cortado o que se sitúa de forma oblicua.

El diccionario de la Real Academia Española (RAE) define sesgo


como la oblicuidad o torcimiento de una cosa hacia un lado. El
concepto también se utiliza en sentido simbólico para mencionar
una tendencia o inclinación.

Por ejemplo: “Las medidas anunciadas por el gobernador tienen un


innegable sesgo autoritario”, “Su pensamiento refleja un sesgo
fascista que seguramente adquirió durante su paso por el
ejército”, “La película tiene un sesgo homosexual que la hizo muy
popular entre la comunidad gay”.

La noción de sesgo es muy utilizada en la psicología. Un sesgo cognitivo es una característica en


particular de un sujeto, que incide en el procesamiento de la información y que forma lo que se conoce
como prejuicio cognitivo (la clase de distorsión que afecta el modo de percibir la realidad).

SESGO SIMETRICO

Simétrica.- Se da cuando en una distribución se distribuyen aproximadamente la misma cantidad de los


datos a ambos lados de la media aritmética. No tiene alargamiento o sesgo. Se representa por una curva
normal en forma de campana llamada campana de Gauss (matemático Alemán 1777-1855) o también
conocida como de Laplace (1749-1827).También se dice que una distribución es simétrica cuando su
media aritmética, su mediana y su moda son iguales, en símbolos Md=Mo

SESGO POSITIVO

En estadística tradicional se dice que hay sesgo cuando los valores empíricos de un suceso no coinciden
con la media aritmética, luego la puntuación diferencial no es igual a cero. En la teoría de Probabilidad
Imposible se dirá que hay sesgo cuando la probabilidad empírica de sujeto u opción no es idéntica a la
probabilidad teórica, siendo entonces el Nivel de Sesgo distinto de cero. Si la diferencia de probabilidad
empírica menos teórica es igual a un valor positivo entonces se dirá que hay sesgo positivo, indicando el
Nivel de Sesgo, la diferencia de ambas variables, la probabilidad empírica menos la teórica, el valor
cuantitativo en que la probabilidad empírica excede o supera a la probabilidad teórica. En caso inverso,
que el valor del Nivel Sesgo sea igual a un valor negativo, entonces hay sesgo negativo, siendo la medida
de en cuanto la probabilidad empírica se encuentra por debajo de la teórica.

SESGO NEGATIVO

Estudios de sesgo negativo son aquellos que estudian probabilidades empíricas inferiores a la
probabilidad en igualdad de oportunidades, la probabilidad teórica, 1/N. Dada una probabilidad empírica
cualquiera inferior a probabilidad en igualdad de oportunidades, inversión de N, 1/N, producirá un sesgo
negativo proporcional a la diferencia de ambas probabilidades, empírica menos teórica. Cuando el
objeto de estudio sea la investigación de las tendencias empíricas inferiores a lo que debería ser un
comportamiento en igualdad de oportunidades, se dice que es un estudio de sesgo negativo.
CURTOSIS
La curtosis de una variable estadística/aleatoria es una característica de forma de su distribución de
frecuencias/probabilidad.
Según su concepción clásica, una mayor curtosis implica una mayor concentración de valores de la
variable muy cerca de la media de la distribución (pico) y muy lejos de la misma (colas), al tiempo que
existe una relativamente menor frecuencia de valores intermedios (hombros). Esto explica una forma de
la distribución de frecuencias/probabilidad con colas más gruesas, con un centro más apuntado y una
menor proporción de valores intermedios entre pico y colas.
Una mayor curtosis no implica una mayor varianza, ni viceversa.
Un coeficiente de apuntamiento o de curtosis es el cuarto momento con respecto a la media
estandarizado que se define como:

donde se ha sustraído 3 (que es la curtosis de la distribución normal o gaussiana) con objeto de generar
un coeficiente que valga 0 para la Normal y tome a ésta como referencia de curtosis.
Tomando, pues, la distribución normal como referencia, una distribución puede ser:

El coeficiente de curtosis puede usarse como un indicador, en combinación de otros, de la posible


existencia de observaciones anómalas, de no normalidad (ver, p.ej., el Test de Jarque-Bera) o de
bimodalidad

Anda mungkin juga menyukai