A evoluo das coisas teis Clipes, garfos, latas, zperes e outros objetos do nosso cotidiano
Henry Petroski
Barbies, bambols e bolas de bilhar 67 breves comentrios sobre a fascinante qumica do dia-a-dia
Joe Schwarcz
david salsburg
Traduo:
SUZANA HERCULANO-HOUZEL
Instituto de Cincias Biomdicas/UFRJ
Rio de Janeiro
Dedicado a Fran, minha querida esposa h 42 anos. Ao longo de minha carreira, enquanto eu acumulava histrias sobre homens e mulheres que zeram a revoluo estatstica, ela insistia em que eu as reunisse num livro no matemtico. Fran, que no tem treinamento matemtico, ajudou-me nas vrias revises, indicando-me os pontos em que minhas explicaes no estavam claras. Este livro, em especial as sees nitidamente compreensveis, deve-se sua persistncia.
Ttulo original: The Lady Tasting Tea (How Statistics Revolutionized Science in the Twentieth Century) Traduo autorizada da edio norte-americana publicada em 2002 por Owl Books, um selo de Henry Holt and Company de Nova York, EUA. Copyright 2001, W.H. Freeman and Company Copyright da edio brasileira 2009: Jorge Zahar Editor Ltda. rua Mxico 31 sobreloja 20031-144 Rio de Janeiro, RJ tel.: (21) 2108-0808 / fax: (21) 2108-0800 e-mail: jze@zahar.com.br site: www.zahar.com.br Todos os direitos reservados. A reproduo no-autorizada desta publicao, no todo ou em parte, constitui violao de direitos autorais. (Lei 9.610/98) Projeto grco: Bruna Benvegnu
CIP-Brasil. Catalogao-na-fonte Sindicato Nacional dos Editores de Livros, RJ. Salsburg, David, 1931S17s Uma senhora toma ch...: como a estatstica revolucionou a cincia no sculo XX / David Salsburg; traduo Jos Maurcio Gradel; reviso tcnica Suzana Herculano-Houzel. - Rio de Janeiro: Jorge Zahar Ed., 2009. (Cincia da vida comum) Traduo de: The lady tasting tea Inclui bibliograa e ndice ISBN 978-85-378-0116-1 1. Cincia - Mtodos estatsticos - Histria. I. Ttulo. CDD 001.422 CDU 001.8
08-5192
Thou shalt not answer questionnaires Or quizzes upon World Affairs, Nor with compliance Take any test. Thou shalt not sit With statisticians nor commit A social science. W.H. AUDEN*
To understand Gods thoughts, we must study statistics, for these are the measure of His purpose. FLORENCE NIGHTINGALE**
* No responders a questionrios /ou argio a respeito dos Negcios do Mundo /No com aquiescncia /Fars qualquer teste. No sentars /com estatsticos ou cometers /uma cincia social. ** Para entender as idias de Deus, precisamos estudar estatstica, porque essa a medida de Seu propsito.
sumrio
2. As distribuies assimtricas
O laboratrio biomtrico de Galton 25 | Correlao e regresso 26 | Distribuies e parmetros 27 | O plano da Biometrika 30
7. Fisher triunfante
A viso sheriana versus a viso pearsoniana da estatstica 66 | Os mtodos de probabilidade mxima de Fisher 68 | Algoritmos iterativos 69
8. A dose letal
Anlise de probit 74 | Bliss na Leningrado sovitica durante o terror stalinista 76
Eplogo 250 Linha do tempo 252 Notas 257 Referncias bibliogrcas 266 ndice remissivo 274
Prefcio
A cincia chegou ao sculo XIX com a rme viso losca de que o Universo funcionaria como o mecanismo de um imenso relgio. Acreditava-se que havia um pequeno nmero de frmulas matemticas (como as leis do movimento de Newton e as leis dos gases de Boyle) capazes de descrever a realidade e prever eventos futuros. Tudo de que se necessitava para tal predio era um conjunto completo dessas frmulas e um grupo de medies a elas associadas, realizadas com suciente preciso. A cultura popular levou mais de 40 anos para se pr em dia com essa viso cientca. Tpico desse atraso cultural o dilogo entre o imperador Napoleo Bonaparte e Pierre Simon Laplace nos primeiros anos do sculo XIX. Laplace havia escrito um livro monumental e denitivo, no qual descreve como calcular as futuras posies de planetas e cometas com base em algumas observaes feitas a partir da Terra. No encontro meno alguma a Deus em seu tratado, sr. Laplace, teria questionado Napoleo, ao que Laplace teria respondido: Eu no tinha necessidade dessa hiptese. Muitas pessoas caram horrorizadas com o conceito de um Universo mecnico, sem Deus, que funcionasse para sempre sem interveno divina e com todos os eventos futuros determinados pelos que teriam ocorrido no passado. De certa forma, o movimento romntico do sculo XIX foi uma reao a esse frio e exato uso da razo. No entanto, uma prova dessa nova cincia apareceu na dcada de 1840 e deslumbrou a imaginao popular. As leis matemticas de Newton foram usadas para prever a existncia de mais um planeta e Netuno foi descoberto no lugar que as leis previram. Quase todas as resistncias ao Universo mecnico desmoronaram, e essa posio losca tornou-se parte essencial da cultura popular. Embora Laplace no precisasse de Deus em sua formulao, ele necessitou de algo que denominou funo erro. A observao de planetas e cometas a
13
14
partir da Terra no se ajustava com preciso s posies previstas, fato que Laplace e seus colegas cientistas atriburam a erros nas observaes, algumas vezes atribuveis a alteraes na atmosfera da Terra, outras vezes a falhas humanas. Laplace reuniu todos esses erros numa pea extra (a funo erro), que atrelou a suas descries matemticas. Essa funo erro absorveu as imprecises e deixou apenas as puras leis do movimento para prever as verdadeiras posies dos corpos celestes. Acreditava-se que, com medies cada vez mais precisas, diminuiria a necessidade da funo erro. Como ela dava conta de pequenas discrepncias entre observado e previsto, a cincia do sculo XIX estava nas garras do determinismo losco a crena de que tudo determinado de antemo pelas condies iniciais do Universo e pelas frmulas matemticas que descrevem seus movimentos. No nal do sculo XIX, os erros haviam aumentado, em vez de diminuir. proporo que as medies se tornavam mais precisas, novos erros se revelavam. O andar do Universo mecnico era trpego. Falharam as tentativas de descobrir as leis da biologia e da sociologia. Nas antigas cincias, como fsica e qumica, as leis que Newton e Laplace tinham utilizado mostravam-se meras aproximaes grosseiras. Gradualmente, a cincia comeou a trabalhar com um novo paradigma, o modelo estatstico da realidade. No nal do sculo XX, quase toda a cincia tinha passado a usar modelos estatsticos. A cultura popular no conseguiu acompanhar essa revoluo cientca. Algumas idias e expresses vagas (como correlao, probabilidades e risco) at entraram no vocabulrio popular, e a maioria das pessoas est consciente das incertezas associadas a algumas reas da cincia, como medicina e economia, mas poucos no-cientistas tm algum entendimento da profunda mudana de viso losca que ocorreu. O que so esses modelos estatsticos? Como apareceram? O que signicam na vida real? So descries dedignas da realidade? Este livro uma tentativa de responder a essas perguntas. Ao longo da narrativa, tambm iremos abordar a vida de alguns homens e mulheres que se envolveram nessa revoluo. Ao lidar com essas questes, necessrio distinguir trs idias matemticas: aleatoriedade, probabilidade e estatstica. Para a maioria das pessoas, aleatoriedade apenas sinnimo de imprevisibilidade. Um aforismo do Talmude transmite essa noo popular: No se devem procurar tesouros enterrados, porque tesouros enterrados so encontrados aleatoriamente, e, por denio, no se pode procurar o que encontrado aleatoriamente. Para o cientista moderno, entretanto, existem muitos tipos diferentes de aleatoriedade. O conceito
Prefcio 15
de distribuio probabilstica (descrito no Captulo 2) nos permite estabelecer limitaes aleatoriedade e nos d limitada capacidade de prever eventos futuros aleatrios. Assim, para o cientista moderno, eventos aleatrios no so simplesmente indomados, inesperados e imprevisveis sua estrutura pode ser descrita matematicamente. Probabilidade uma palavra atual para um conceito muito antigo. Ele aparece em Aristteles, que armou: da natureza da probabilidade que coisas improvveis aconteam. De incio, ela envolve a sensao de algum a respeito do que se pode esperar. Nos sculos XVII e XVIII, um grupo de matemticos, entre eles duas geraes dos Bernoulli, Fermat, De Moivre e Pascal, trabalhou numa teoria matemtica da probabilidade que comeou com jogos de azar. Eles desenvolveram alguns mtodos muito sosticados para contar eventos igualmente provveis. De Moivre conseguiu inserir os mtodos de clculo nessas tcnicas, e os Bernoulli foram capazes de estabelecer alguns profundos teoremas fundamentais, chamados leis dos grandes nmeros. No nal do sculo XIX, a probabilidade matemtica consistia essencialmente em sosticados truques, mas lhe faltava uma slida fundamentao terica. Apesar da natureza incompleta da teoria da probabilidade, ela se mostrou til para a idia, que ento se desenvolvia, de distribuio estatstica. Uma distribuio estatstica ocorre quando consideramos um problema cientco especco. Por exemplo, em 1971, foi publicado pela revista mdica inglesa Lancet um artigo da Harvard School of Public Health que analisava se o consumo de caf estaria relacionado ao cncer do trato urinrio inferior. O estudo fora realizado com um grupo de pacientes, alguns dos quais haviam desenvolvido esse tipo de cncer, enquanto outros sofriam de outras doenas. Os autores do relatrio coletaram dados adicionais sobre esses pacientes, tais como idade, sexo e histria familiar de cncer. Nem todos que bebem caf contraem cncer do trato urinrio, e nem todos que apresentam cncer do trato urinrio so bebedores de caf assim, alguns fatos contradiziam a hiptese dos pesquisadores. No entanto, 25% dos pacientes com esse tipo de cncer habitualmente tomavam quatro ou mais xcaras de caf por dia. Apenas 10% dos pacientes sem cncer bebiam tanto caf. Parecia haver alguma evidncia a favor da hiptese. Essa coleta de dados forneceu aos autores uma distribuio estatstica. Usando as ferramentas da probabilidade matemtica, eles construram uma frmula terica para aquela distribuio, a funo de distribuio probabilstica, ou simplesmente funo de distribuio, que utilizaram para examinar a questo. Equivale funo erro de Laplace, mas muito mais complexa. A construo da
16
funo de distribuio terica faz uso da teoria das probabilidades e empregada para descrever o que se pode esperar de dados futuros tomados aleatoriamente do mesmo grupo de pessoas. O assunto deste livro no probabilidade e teoria da probabilidade que so conceitos matemticos abstratos. Aqui se trata da aplicao de alguns teoremas da probabilidade a problemas cientcos, o mundo das distribuies estatsticas e funes de distribuio. A teoria da probabilidade sozinha insuciente para descrever os mtodos estatsticos, e algumas vezes acontece de os mtodos estatsticos na cincia violarem alguns dos teoremas da probabilidade. O leitor encontrar a probabilidade perambulando pelos captulos, empregada, quando necessria, e ignorada, quando no. Como os modelos estatsticos da realidade so matemticos, s podem ser totalmente compreendidos em termos de frmulas e smbolos matemticos. Tentei aqui algo um pouco menos ambicioso: descrever a revoluo estatstica na cincia do sculo XX por intermdio de algumas das pessoas (muitas delas ainda vivas) que nela estiveram envolvidas. Tratei muito supercialmente o trabalho que elas criaram, s para provar como suas descobertas individuais se encaixaram no quadro geral. O leitor deste livro no aprender o suciente para se lanar anlise estatstica de dados cientcos isso exigiria vrios anos de estudos universitrios , mas espero que ele compreenda algo da profunda mudana da losoa bsica representada pela viso estatstica da cincia. A quem um no-matemtico procura para entender essa revoluo na cincia? Acho que, para comear, recomendvel uma senhora provando ch...
Era uma tarde de vero em Cambridge, Inglaterra, no nal dos anos 1920. Um grupo de professores universitrios, suas esposas e alguns convidados tomara lugar a uma mesa no jardim para o ch da tarde. Uma das mulheres insistia em armar que o ch servido sobre o leite parecia car com gosto diferente do que apresentava ao receber o leite sobre ele. As cabeas cientcas dos homens zombaram do disparate. Qual seria a diferena? No podiam conceber diferena alguma na qumica da mistura. Um homem de estatura baixa, magro, de culos grossos e cavanhaque comeando a car grisalho interessou-se pelo problema. Vamos testar a proposio, animou-se. Comeou a esboar um experimento no qual a senhora que insistira haver diferena seria servida com uma seqncia de xcaras, algumas com o leite servido sobre o ch, e outras com o ch servido sobre o leite. Quase posso ouvir alguns leitores menosprezando esse esforo como momento menor de uma conversa em tarde de vero. Que diferena faz se a senhora consegue distinguir uma infuso da outra?, perguntaro. Nada existe de importante ou de grande mrito cientco nesse problema, argumentaro com desprezo. Essas cabeas privilegiadas deveriam usar sua poderosa capacidade cerebral para algo que beneciasse a humanidade. Lamento, mas, apesar do que os no-cientistas possam pensar sobre a cincia e sua importncia, minha experincia leva-me a acreditar que a maioria dos cientistas se empenha em suas pesquisas porque est interessada nos resultados e porque obtm estmulo intelectual com suas tarefas. Raras vezes os bons cientistas pensam a respeito da importncia de seu trabalho. Assim foi naquela ensolarada tarde em Cambridge. A senhora poderia ou no estar certa sobre o paladar do ch. A graa estava em encontrar um modo de armar se estava certa, e, sob a direo do homem de cavanhaque, comearam a discutir como poderiam fazer isso.
17
18
Entusiasmados, vrios deles se envolveram no experimento e em poucos minutos estavam servindo diferentes padres de infuso sem que a senhora os pudesse ver. Ento, com ar de objetividade, o homem de cavanhaque ofereceulhe a primeira xcara. Ela tomou um pequeno gole e declarou que, naquela, o leite fora colocado sobre o ch. Ele anotou a resposta sem comentrios e lhe passou a segunda xcara...