xi
xi
xi
= x.
Propriedades da soma: a) b) c)
n i =1 n i =1 n i =1
c = nc c xi = c
( xi yi )
n i =1
xi
n i =1
xi
n i =1
yi
Propriedades do produto: a) c = c n
i =1 n n n
b) c xi = c n xi
i =1 n i =1
c) xi yi = xi yi
i =1 n i =1 i =1 n
Medidas de posio
So medidas que indicam um ponto em torno do qual se concentram os dados (a posio dos dados). Sejam x1, x2, x3, ..., xn, n valores numricos. As medidas de posio mais usuais so: Mdia aritmtica A mdia aritmtica, indicada por m ou x , definida por:
n
x=
i =1
xi
Se os valores xi, i=1, 2, ..., k (k<n) ocorrem com freqncias fi, i=1, 2, ..., k, respectivamente, ento a mdia aritmtica pode ser obtida por:
k
x=
i =1 k
f i xi fi
i =1
Mediana A mediana o valor central do conjunto de valores, organizados em ordem crescente ou decrescente, se n for mpar, ou a mdia dos dois centrais, se n for par. A mediana tal que 50% dos valores a precedem e 50% a sucedem. Moda A moda o valor que ocorre com maior freqncia. A moda pode no existir ou no ser nica. Mdia aritmtica ponderada Se aos n valores associam-se fatores de ponderao ou pesos w1, w2, w3, ..., wn, respectivamente, a mdia aritmtica ponderada dados por:
n
x=
i =1 n
wi xi wi
i =1
A escolha da medida de posio a ser usada depende das caractersticas dos dados e do objetivo do uso. Pode-se estar interessado no tamanho mximo, no tamanho mnimo ou no tamanho mdio de uma espcie animal. Situaes que apresentam valores discrepantes fazem com que a mdia seja prejudicada, ento a mediana pode ser mais apropriada. Algumas propriedades das medidas de posio: a) A mdia calculada a partir de todas as observaes. b) A mediana no prejudicada pela presena valores extremos, como a mdia. c) Somando-se, subtraindo-se ou multiplicando-se os valores a uma constante, a mdia ficar somada, subtrada ou multiplicada pela constante. d) A soma dos desvios em relao mdia nula, ou seja, ( xi x ) = 0
A propriedade (c) de extrema importncia quando trabalhamos com unidades diferentes dos dados (kg, g, Km, m etc.).
Medidas de disperso
Como o prprio nome diz, so medidas que indicam quo dispersos encontram-se os valores. As medidas de disperso mais usuais so: Amplitude total a diferena entre o maior e o menor valor (Amplitude total = xmx. xmn.). Soma de quadrados a soma dos quadrados dos desvios em relao mdia aritmtica.
SQ = ( xi x) 2
Varincia a mdia das somas dos quadrados dos desvios em relao mdia aritmtica, geralmente denotada por S2.
S2 = ( xi x) 2 n
Desvio Padro a raiz quadrada da varincia, geralmente denotada por s ( s = S 2 ). Coeficiente de variao uma medida de disperso relativa. representado por CV e definido como:
CV = 100 s x
Representa a porcentagem de variao por unidade de mdia. Algumas propriedades das medidas de disperso: a) A varincia no tem a mesma unidade dos valores, o que ocorre com o desvio padro. b) A SQ a menor soma de desvios ao quadrado, ou seja: ( xi x) 2 ( xi M ) 2 , M. c) Somando-se ou subtraindo-se os valores a uma constante, a varincia e a soma de quadrados na se alteram. d) Multiplicando-se os valores a uma constante, a varincia e a soma de quadrados ficaro multiplicadas pela constante ao quadrado.
Medidas separatrizes
So medidas que representam as posies dos valores do conjunto, dividindo-o em partes iguais e podem ser: quartis, decis etc. Os quartis dividem o conjunto de valores em quatro partes iguais, como mostra a Tabela a seguir: Tabela 1 - Descrio dos quartis. Estatstica Notao 1 quartil Q1 2 quartil Q2 = Mediana 3 quartil Q3 Interpretao 25% dos dados so valores o precedem 50% dos dados so valores o precedem 75% dos dados so valores o precedem
A diferena (Q3-Q1) denominada intervalo interquartlico. Outras separatrizes usuais so: Decis: Dividem o conjunto de dados em dez partes iguais. Percentis: Dividem o conjunto de dados em cem partes iguais.
No SAS: Obter as estatsticas descritivas. Representar graficamente (Box Plot). Eliminar os outliers se houverem, e reapresent-los. Exerccio ED2: Considere os valores observados para trs espcies animais, cujos valores so apresentados a seguir e encontram-se no Excel (ED.XLS, planilha ED2)
E1 E2 E3
No SAS: Obter as estatsticas descritivas, por espcie. Representar graficamente (Box Plot). Eliminar os outliers se houverem, e reapresent-los.