Anda di halaman 1dari 8

18/4/2014

Moda (estatstica) Wikipdia, a enciclopdia livre

Moda (estatstica)
Origem: Wikipdia, a enciclopdia livre.

Em estatstica descritiva, a moda o valor que detm o maior nmero de observaes, ou seja, o valor ou valores mais frequentes, ou ainda "o valor que ocorre com maior freqncia num conjunto de dados, isto , o valor mais comum".1 O termo moda foi utilizado primeiramente em 1895 por Karl Pearson, sob influncia do termo moda referindo-se ao uso popular com o significado de objeto que se est usando muito no tempo presente.2 A moda no necessariamente nica, ao contrrio da mdia ou da mediana. especialmente til quando os valores ou observaes no so numricos, uma vez que a mdia e a mediana podem no ser bem definidas.3 Bimodal: possui dois valores modais. Amodal: no possui moda. Multimodal: possui mais do que dois valores modais. EXEMPLOS: A moda de {ma, banana, laranja, laranja, laranja, pssego} laranja. A srie {1, 3, 5, 5, 6, 6} apresenta duas modas (BIMODAL): 5 e 6. A srie {1, 3, 2, 5, 8, 7, 9} no apresenta moda (AMODAL). A srie {1, 3, 5, 5, 6, 6, 7, 7} apresenta mais do que duas modas (MULTIMODAL): 5, 6 e 7 Para outros usos, ver Moda (https://en.wikipedia.org/wiki/Mode_(disambiguation)). Intensificando a ideia, a moda o valor que aparece mais frequentemente em um conjunto de dados. A moda de uma distribuio de probabilidade discreta o valor x em que a sua funo massa de probabilidade leva o seu valor mximo. Em outras palavras, o valor que mais provvel de ser amostrada. A moda de uma distribuio de probabilidade contnua o valor x em que sua funo densidade de probabilidade tem o seu valor mximo, de modo que, informalmente falando, a moda est no auge. Como a estatstica mdia e mediana, a moda uma forma de expressar, em um nico nmero, informaes importantes sobre uma varivel aleatria ou de uma populao. O valor numrico da moda o mesmo que o da mdia e mediana de uma distribuio normal, e pode ser muito diferente em distribuio altamente enviesadas. A moda no necessariamente nica, j que a funo de massa de probabilidade ou funo densidade de probabilidade pode ter o mesmo valor mximo em vrios pontos x1, x2, etc. O caso mais extremo ocorre em distribuies uniformes, onde todos os valores ocorrem igualmente com frequncia. A definio acima nos diz que apenas mximas globais so modas. Ligeiramente confusa, quando uma funo de densidade de probabilidade tem vrios mximos locais, comum referir-se a todos os mximos locais como modos de distribuio. Tal distribuio contnua chamado multimodal (em oposio a unimodal). Em distribuies unimodais simtricas, como a normal (ou gaussiana) distribuio (distribuio cuja a funo densidade, quando representamos graficamente, d a famosa "curva de sino", a mdia (definindo-se), mediana e moda coincidem. Para as amostras, sabe-se que elas so elaboradas a partir de uma distribuio simtrica, a mdia da amostra pode ser utilizada como uma estimativa da populao moda.

ndice
1 Moda de uma amostra
http://pt.wikipedia.org/wiki/Moda_(estat%C3%ADstica) 1/8

18/4/2014

Moda (estatstica) Wikipdia, a enciclopdia livre

2 Comparao da mdia, mediana e moda 3 Uso 4 Singularidade e Definies 5 Propriedades 6 Exemplo para uma distribuio assimtrica 7 Condio de Van Zwet 8 Distribuies Unimodais 9 Intervalo de confiana para o modo com um nico ponto de dados 9.1 Testes Estatsticos 10 Histria 11 Referncias 12 Ligaes externas 13 Ver Tambm

Moda de uma amostra


A moda de uma amostra o elemento que ocorre com mais frequncia na coleo. Por exemplo, a moda da amostra [1, 3, 6, 6, 6, 6, 7, 7, 12, 12, 17] 6. Dada a lista de dados [1, 1, 2, 4, 4] da moda no nico - o conjunto de dados pode ser dito para ser bimodal, enquanto que um conjunto de mais do que duas modas podem ser descritos como multimodal. Para uma amostra de uma distribuio contnua, tal como [... 0.935, 1.211 ..., 2.430 ..., 3.668 ..., 3.874 ...], o conceito inutilizvel em sua forma bruta, uma vez que no h dois valores ser exatamente o mesmo, de modo que cada valor ir ocorrer precisamente uma vez. De modo a estimar a moda, a prtica usual a discretizar os dados atravs da atribuio de valores de frequncia para intervalos de igual distncia, como para fazer um histograma , substituindo eficazmente os valores pelos valores mdios dos intervalos so atribudos. A moda o valor em que o histograma atinge o seu pico. Para amostras pequenas ou mdias o resultado deste procedimento sensvel escolha de largura do intervalo, se escolhido muito estreita ou larga, normalmente se deve ter uma fraco considervel dos dados concentrados num nmero relativamente pequeno de intervalos (de 5 a 10 ), enquanto que a fraco dos dados que caem fora destes intervalos tambm considervel. Uma abordagem alternativa a estimativa densidade de gros (https://en.wikipedia.org/wiki/Kernel_density_estimation) , a qual, essencialmente, borra amostras de ponto para produzir uma estimativa contnua da funo densidade de probabilidade, que pode fornecer uma estimativa do modo. A seguir MATLAB (ou Octave), exemplo de cdigo calcula a moda de uma amostra:

X=s o r t ( x ) ; i n d i c e s = f i n d ( d i f f ( [ X ;r e a l m a x ] )>0 ) ;%o s n d i c e se mq u ev a l o r e sr e p e t i d o sm u d a n a [ m o d e L , i ]= m a x( d i f f ( [ 0 ;i n d i c e s ] ) ) ; %m a i o rc o m p r i m e n t op e r s i s t n c i ad ev a l o r e sr e p e t i d o s m o d e = X ( i n d i c e s ( i ) ) ;

O algoritmo implica, como primeiro passo para classificar a amostra em ordem ascendente. Em seguida, ele calcula a derivada discreta da lista ordenada, e encontra os ndices de onde esta derivada positiva. Em seguida, ele calcula a derivada discreta deste conjunto de ndices, localizando o mximo desta derivada de ndices, e, finalmente, avalia a amostra classificada no ponto em que ocorre esse mximo, o que corresponde ao ltimo membro do estiramento de valores repetidos.

Comparao da mdia, mediana e moda


Veja tambm: mdia e mediana

http://pt.wikipedia.org/wiki/Moda_(estat%C3%ADstica)

2/8

18/4/2014

Moda (estatstica) Wikipdia, a enciclopdia livre

Tipo Mdia Aritmtica Mediana Moda

Comparao das mdias de valor comum { 1, 2, 2, 3, 4, 7, 9 } Descrio Exemplo Soma dos valores de um conjunto de dados dividido pelo nmero de valores:: Valor mdio que separa os maiores e menores metades de um conjunto de dados Mais freqente valor em um conjunto de dados (1+2+2+3+4+7+9) /7 1, 2, 2, 3, 4, 7, 9 1, 2, 2, 3, 4, 7, 9

Resultado 4 3 2

Uso
Ao contrrio de mdia e mediana, o conceito de moda tambm faz sentido para "dados nominais" (i.e., no consistindo valores numricos (https://en.wikipedia.org/wiki/Numerical) no caso de mdia ou mesmo de valores ordenados, no caso do rendimento mdio). Por exemplo, tomando uma amostra de nomes de uma famlia coreana, pode-se achar que "Kim" ocorre com mais frequncia do que qualquer outro nome. Ento, "Kim" seria a moda da amostra. Em qualquer sistema de votao em que uma pluralidade determina vitria, um valor nico modal determina o vencedor, enquanto um resultado multi-modal exigiria algum procedimento de desempate ocorra. Ao contrrio de mediana, o conceito de mdia faz sentido para qualquer varivel aleatria assumindo valores de um espao vetorial, incluindo os nmeros reais (um unidimensional espao vetorial) e os nmeros inteiros (que podem ser considerados embutidos nas reais). Por exemplo, uma distribuio de pontos no plano tero tipicamente uma mdia e uma moda, mas o conceito de mediana, no se aplica. A mediana faz sentido quando h uma ordem linear dos valores possveis. Generalizaes do conceito de mediana para espaos de dimenses superiores so a mdia geomtrica (https://en.wikipedia.org/wiki/Geometric_median) e o ponto central (https://en.wikipedia.org/wiki/Centerpoint_(geometry)).

Singularidade e Definies
Para o restante, a suposio que ns temos (uma amostra de) uma varivel aleatria real. Para algumas distribuies de probabilidades, o valor esperado pode ser infinito ou indefinido, mas se definido, ele nico. A mdia de uma (finita) amostra sempre definida. A mediana o valor de ,tal modo que, as fraes que no excedam-o e no caem abaixo so ambos pelo menos 1/2. No necessariamente o nico, mas nunca totalmente infinito ou indefinido. Para uma amostra de dados o valor "no meio do caminho", quando a lista de valores ordenada no aumento de valor, onde geralmente para uma lista de mesmo comprimento tomada a mdia numrica dos dois valores mais prximos a "meio caminho". Por fim, como referido antes, a moda no necessariamente nica. Certas distribuies patolgicas (por exemplo, a distribuio de Cantor (https://en.wikipedia.org/wiki/Cantor_distribution)) no tm a moda definido em tudo. Para uma amostra de dados finito, a moda um (ou mais) dos valores da amostra.

Propriedades
Assumindo propriedades, e pela simplicidade, singularidade, a seguir esto algumas das propriedades mais interessantes. Todas as trs medidas tm a seguinte propriedade: Se a varivel aleatria (ou cada valor da amostra) submetido linear ou transformao afim que substitui X por ax + b, ento so a mdia, mediana e moda.
http://pt.wikipedia.org/wiki/Moda_(estat%C3%ADstica) 3/8

18/4/2014

Moda (estatstica) Wikipdia, a enciclopdia livre

No entanto, se houver uma transformao montona arbitrria, apenas a mediana segue, por exemplo, se X substitudo por exp (X), as alteraes mdias de m para exp (m), mas a moda significativo e no ir. A mediana tambm muito forte na presena de valores extremos, enquanto que a mdia muito sensvel. Em distribuies unimodais contnuas, a mediana se encontra, como uma regra do polegar, entre a mdia e a moda, cerca de um tero do caminho que vai de modo significativo a. Em uma frmula, (Modo 2 mdia +) mdio / 3. Esta regra, devido Karl Pearson, aplica-se frequentemente e ligeiramente a distribuies no simtricas que se assemelham a uma distribuio normal, mas no sempre verdadeira e, em geral, as trs estatsticas podem aparecer em qualquer ordem. 4 5 Para distribuies unimodais, a moda est dentro desvios padro da mdia, e o desvio quadrtico mdio sobre a moda entre o desvio padro e duas vezes o desvio padro.6

Exemplo para uma distribuio assimtrica


Um exemplo de uma enviesada distribuio a riqueza pessoal (https://en.wikipedia.org/wiki/Distribution_of_wealth) : Poucas pessoas so muito ricos, mas entre aqueles que alguns so extremamente ricos. No entanto, muitos so bastante pobres. [[Image:Comparao da mdia (https://en.wikipedia.org/wiki/Mean), mediana e moda de duas distribuies log-normais com diferentes assimetrias.]] Uma classe bem conhecida de distribuio que podem ser arbitrariamente distorcida dada pela distribuio log-normal. Ela obtida atravs da transformao de uma varivel aleatria X tendo uma distribuio normal em varivel aleatria Y = eX. Em seguida, o logaritmo da varivel aleatria Y normalmente distribuda, da o nome. Tomando a mdia de X ser 0, a mediana de Y ser um, independente do desvio padro de X. Isto assim porque X tem uma distribuio simtrica, pelo que a sua mdia tambm 0. A transformao de X para Y montona, e assim encontramos a mediana e0 = 1 para Y. Quando X tem desvio padro = 0,25, a distribuio de Y fracamente enviesada. Usando frmulas para a distribuies log-normais , encontramos:

De fato, a mdiana de cerca de um tero no caminho da mdia para o modo. Quando X tem um elevado desvio padro, = 1, a distribuio de Y fortemente distorcida. Agora

Aqui, regra de ouro de Pearson (https://en.wikipedia.org/wiki/Skewness#Pearson.27s_skewness_coefficients) falha.

Condio de Van Zwet


Derivada de Van Zwet uma desigualdade que fornece condies suficientes para essa desigualdade de segurar.7 A desigualdade Moda Mediana Mdia tem se que F( Mediana - x ) + F( Mediana + x ) 1
http://pt.wikipedia.org/wiki/Moda_(estat%C3%ADstica) 4/8

18/4/2014

Moda (estatstica) Wikipdia, a enciclopdia livre

para todos os x onde F() a funo de distribuio cumulativa da distribuio.

Distribuies Unimodais
A diferena entre a mdia e a moda da distribuio contnua unimodal limitada pelo desvio padro multiplicado pela raiz quadrada de trs.8 Em smbolos

Onde | | o valor absoluto. Alis, esta frmula tambm o modo de Pearson ou primeiro coeficiente de assimetria.9 A diferena entre a moda e a mediana tem o mesmo limite.8 Em smbolos

Intervalo de confiana para o modo com um nico ponto de dados


uma crena comum, mas falso que a partir de uma nica observao x, no podemos obter informaes sobre a variabilidade na populao e que, consequentemente, que os intervalos de confiana comprimento finito para mdia e / ou varincia so impossvel, mesmo em princpio. possvel para uma distribuio unimodal desconhecido para estimar um intervalo de confiana para o modo com um tamanho de amostra de 1.10 Isto foi mostrado pela primeira vez pelo Abade e Rosenblatt 11 e prorrogada por Blachman e Machol (https://en.wikipedia.org/wiki/Robert_Machol).12 Este intervalo de confiana pode ser aguado quando a distribuio pode ser assumido como sendo simtrico. ainda possvel afinar este intervalo se a distribuio normalmente distribudo. Deixe o intervalo de confiana de ser 1 - . Em seguida, os intervalos de confiana para os variates gerais, simtricas e normalmente distribudo, respectivamente, so

onde X a varivel aleatria, o modo e | | o valor absoluto. Estas estimativas so conservadoras. Os intervalos de confiana para o modo no nvel de 90% dada por estes estimadores so X 19 | X - |, X 9 | X - | X e 5.84 | X - | para o geral, simtrica e normalmente distribudo variates respectivamente. O intervalo de confiana de 95% para uma varivel com distribuio normal dada por X 10,7 | X - |. Pode ser interessante notar que a mdia eo modo coincidir se os variates so normalmente distribudos. Os 95% com destino a uma varivel normalmente distribuda foi melhorado e agora conhecido por ser X 9,68 | X - |13 O limite para um intervalo de confiana de 99% X 48,39 | X - '| Nota Machol mostrou que, dada uma densidade conhecida simtrica sobre 0 que, dado um nico valor da amostra (x) que os intervalos de confiana de 90% da mdia da populao so14
http://pt.wikipedia.org/wiki/Moda_(estat%C3%ADstica) 5/8

18/4/2014

Moda (estatstica) Wikipdia, a enciclopdia livre

onde a mediana da populao. Se a forma exata da distribuio no conhecida, mas conhecido por ser simtrico em torno de zero, ento temos

onde X a varivel aleatria, a mdia da populao e a e k so nmeros reais arbitrrios. Tambm possvel calcular o intervalo de confiana para o desvio padro de uma nica observao, se a distribuio simtrica em relao a 0.15 Para uma distribuio normal com uma variao desconhecida e um nico ponto de dados (X) a 90%, 95 intervalos de confiana% e 99% para o desvio padro de [0, 8 | X |], [0, 17 | X |] e [0, 70 | X |] . Estes intervalos podem ser curto se o meio conhecido por ser delimitada por um mltiplo do desvio padro. Se a distribuio conhecido por ser o normal, ento possvel calcular o intervalo de confiana tanto a mdia e varincia de um valor simples.16 Os intervalos de confiana de 90% so

Os intervalos de confiana podem ser estimados para todo o intervalo escolhido. Este mtodo no limitado para a distribuio normal, mas pode ser usado com qualquer distribuio conhecida.

Testes Estatsticos
Estes estimadores tm sido usados para criar testes de hiptese para amostras simples de distribuies unimodal normais ou simtricas.17 Vamos a distribuio tem uma mdia assumida ( 0 ). A hiptese nula assumido que a mdia da distribuio se encontra dentro do intervalo de confiana da mdia da amostra (m). A hiptese nula aceite se

em que x o valor da amostra e k uma constante. A hiptese nula rejeitada se

O valor de k depende da escolha do intervalo de confiana e a natureza da distribuio assumida. Se a distribuio assumida ou conhecido por ser o normal, em seguida, os valores de k para os 50%, 66,6%, 75%, 80%, 90%, 95% e 99% de intervalos de confiana so 0,50, 1,26, 1,80, 2,31, 4,79 , 9,66 e 48,39, respectivamente. Se a distribuio assumida ou conhecida por ser unimodal e simtrica, mas no o normal, em seguida, os valores de k para os 50%, 66,6%, 75%, 80%, 90%, 95% e 99% de intervalos de confiana so 0,50, 1,87, 2,91 , 3.94, 8.97, 18.99, 99.00, respectivamente. Para ver como isso funciona teste que assumimos ou saber a priori que a populao da qual a amostra retirada tem uma mdia de 0 e que a populao tem uma distribuio unimodal simtrica - uma classe que inclui a distribuio normal. Queremos saber se a mdia estimada a partir da amostra representativa da populao em um nvel pr escolhido de confiana. Suponha que a distribuio normal e deixar o intervalo de confiana de 95%. Depois de k = 9,66.

http://pt.wikipedia.org/wiki/Moda_(estat%C3%ADstica)

6/8

18/4/2014

Moda (estatstica) Wikipdia, a enciclopdia livre

Assumindo-se que a amostra representativa da populao, a mdia da amostra (m), ento, situar-se dentro da gama determinada a partir da frmula:

Se a amostragem subseqente mostra que a mdia da amostra fique fora destes parmetros a mdia da amostra considerada a diferir significativamente da mdia da populao.

Histria
O modo termo origina com Karl Pearson em 1895.18 Deve-se observar que aquilo que se expressa como "maioria" num determinado conjunto de dados no necessariamente representa o valor que seja a moda estatstica.19 A referncia mais antiga conhecida do conceito da moda apresenta-se no cerco no inverno de 428 a.C. dos peloponsios e becios aos plateus e atenienses. Os sitiados, necessitando construir escadas adequadas s muralhas inimigas, fizeram com que muitas pessoas contassem as fileiras de tijolos. Com tal estratagema, ainda que houvesse um nmero grande de erros, um nmero grande de contagem seria confivel.20

Referncias
1. 2. 3. 4. 5. 6. 7. 8. 9. 10. SPIEGEL, Murray R. Estatstica. So Paulo: McGraw-Hill do Brasil, 1976. GONALVES, Fernando A. Estatstica descritiva. 2.ed. So Paulo: Atlas, 1978. BUNCHAFT, Guenia; KELLNER, Sheilah R. Oliveira. Estatstica sem mistrios. V. I. 2.ed. Petrpolis: Vozes, 1997. Relationship between the mean, median, mode, and standard deviation in a unimodal distribution (http://www.se16.info/hgb/median.htm). HIPPEL, Paul T. von. (2005). "Mean, Median, and Skew: Correcting a Textbook Rule (http://www.amstat.org/publications/jse/v13n2/vonhippel.html)". J. of Statistics Education 13 (2). Bottomley, H.. "Maximum distance between the mode and the mean of a unimodal distribution (http://www.se16.info/hgb/mode.pdf)". van Zwet WR (1979) "Mean, median, mode II", Statistica Neerlandica, 33 (1) 15 a b http://www.se16.info/hgb/cheb2.htm#3unimodalinequalities Eric W. Weisstein, Pearson Mode Skewness (http://mathworld.wolfram.com/PearsonModeSkewness.html) em MathWorld EDELMAN, D.. (1990). "A confidence interval for the center of an unknown unimodal distribution based on a sample of size 1". The American Statistician 44 (4): 285287. DOI:10.1080/00031305.1990.10475740 (http://dx.doi.org/10.1080/00031305.1990.10475740). ABBOT , J. H.. (1963). "Two stage estimation with one observation on the first stage". Annals of the Institute of Statistical Mathematics 14 (1): 229235. DOI:10.1007/BF02868644 (http://dx.doi.org/10.1007/BF02868644). BLACHMAN, N. M.. (1987). "Confidence intervals based on one or more observations". IEEE Transactions on Information Theory 33 (3): 373382. DOI:10.1109/TIT.1987.1057306 (http://dx.doi.org/10.1109/TIT.1987.1057306). WALL, M. M.. (2001). "An effective confidence interval for the mean With samples of size one and two". The American Statistician 55 (2): 102105. DOI:10.1198/000313001750358400 (http://dx.doi.org/10.1198/000313001750358400). Machol R (1964) IEEE Trans Info Theor RODRGUEZ, C. C.. Maximum Entropy and Bayesian Methods. [S.l.: s.n.], 1996. 175182 p. vol. 70. Arxiv (http://arxiv.org/abs/{{{archive}}}/{{{id}}}) ISBN 978-94-010-6534-4 ROSENBLATT , J.. (1966). "Confidence interval for standard deviation from a single observation". Technometrics 8 (2): 367 368. DOI:10.1080/00401706.1966.10490358 (http://dx.doi.org/10.1080/00401706.1966.10490358). VALENTINE, H. T.. (1991). "Confidence Intervals from Single Observations in Forest Research (http://www.ingentaconnect.com/content/saf/fs/1991/00000037/00000001/art00030)". Forest Science 37 (1): 370373. Pearson, Karl (1895). "Contributions to the Mathematical Theory of Evolution. II. Skew Variation in Homogeneous Material", Philosophical Transactions of the Royal Society of London, Ser. A , 186, 343-414 HUOT, Rjean. Mtodos quantitativos para as cincias humanas. Lisboa: Piaget, 1999. WALLIS, W Allen; ROBERT, Hary V. Curso de estatstica. V. 1. Rio de Janeiro: Fundo de Cultura, s.d.

11. 12. 13. 14. 15. 16. 17. 18. 19. 20.

Ligaes externas
http://pt.wikipedia.org/wiki/Moda_(estat%C3%ADstica) 7/8

18/4/2014

Moda (estatstica) Wikipdia, a enciclopdia livre

Ancilla DallOnder Zat; MODA ESTATSTICA: RELAES CONCEITUAIS (http://www.pucrs.br/edipucrs/erematsul/minicursos/modaestatistica.pdf) - www.pucrs.br A Guide to Understanding & Calculating the Mode (http://www.stats4students.com/Essentials/Measures-CentralTendency/Overview_2.php) (em ingls) Weisstein, Eric W., "Mode (http://mathworld.wolfram.com/Mode.html)" - MathWorld.

Ver Tambm
Coeficiente de variao Valor esperado Desvio padro Obliquidade Curtose Obtida de "http://pt.wikipedia.org/w/index.php?title=Moda_(estatstica)&oldid=38174008" Categoria: Estatstica Esta pgina foi modificada pela ltima vez (s) 17h49min de 15 de fevereiro de 2014. Este texto disponibilizado nos termos da licena Atribuio-Partilha nos Mesmos Termos 3.0 no Adaptada (CC BY-SA 3.0); pode estar sujeito a condies adicionais. Consulte as condies de uso para mais detalhes.

http://pt.wikipedia.org/wiki/Moda_(estat%C3%ADstica)

8/8

Anda mungkin juga menyukai