Anda di halaman 1dari 11

RESENHA/REVIEW

BERBER SARDINHA, Tony. 2004. Lingstica de Corpus. Barueri, SP: Editora Manole. Resenhado por/by: Izabella dos Santos MARTINS (LAEL/PUC-SP-CNPq) A descoberta da plvora. Uma revoluo. Um admirvel mundo novo, cheio de possibilidades e caminhos nunca dantes navegados. Logo no incio da leitura do livro de Tony Berber Sardinha que define a Lingstica de Corpus como rea de estudos que trata da Coleta e da explorao de corpora, ou conjunto de dados lingsticos textuais coletados criteriosamente, com o propsito de servirem para a pesquisa de uma lngua ou variedade lingstica (p. 3) , o leitor no familiarizado com o tema abordado deve, ao se deparar com a Lingstica de Corpus, sentir-se impactado com essas vrias impresses passando por sua cabea. Os leitores j familiarizados com certeza sentir-se-o presenteados com a publicao do livro, que um verdadeiro tratado terico e manual prtico, de grande utilidade para os que lidam com corpora. O autor do livro, Tony Berber Sardinha professor associado do Departamento de Lingstica e do Programa de Estudos Ps-Graduados em Lingstica Aplicada e Estudos da Linguagem da Pontifcia Universidade Catlica de So Paulo (PUC-SP), e no exagero dizer que o maior expoente da rea de Lingstica de Corpus no Brasil. O autor vem apresentando uma produo profcua, que culminou no lanamento do livro em questo, cuja leitura permite ao leitor intuir mesmo que de forma comedida, como convm ao discurso acadmico seu entusiasmo e sua paixo pelo trabalho com corpora. So vrias as qualidades do livro. Chama a ateno o seu didatismo: o autor passa para o leitor, de forma clara, concisa e sem o rebuscamento e o maneirismo tpicos de alguns textos acadmicos, os conceitos, as teorias e os procedimentos bsicos necessrios para o trabalho com corpora. Outro
D.E.L.T.A., 23:2, 2007 (383-393)

384

D.E.L.T.A., 23:2

ponto notvel do livro a riqueza de referncias bibliogrficas: por ser obra que se prope a tratar do mais variado leque de temas relacionados Lingstica de Corpus, trata-se de qualidade muito bem vinda, que demonstra a maturidade do autor para executar tarefa de tal porte, bem como a expertise necessria para fazer comparaes entre obras e autores e para critic-las. Em suma, o livro rene o melhor dos dois mundos: consegue agradar a leigos e aos membros da comunidade acadmica. parte o seu pioneirismo no h outros livros de autores brasileiros sobre Lingstica de Corpus , o livro aborda o tema em todos os seus aspectos principais, ilustrando o estado da arte da matria no Brasil e no mundo. O autor discute conceitos no os apresenta como dados nem como inquestionveis , informa sobre os corpora disponveis para pesquisa atualmente, apresenta obras de referncia bem como crticas a elas , traa o histrico e levanta perspectivas de pesquisa na rea. Como bnus, o livro apresenta ainda um dicionrio de freqncias indito do portugus brasileiro. Outro destaque da obra seu carter de manual, principalmente no que concerne aos procedimentos de utilizao do WordSmith Tools, o programa de anlise lingstica mais completo usado pelos lingistas do corpus. Uma questo abordada no livro que talvez seja a mais relevante e seu ponto de maior destaque a explicao sobre a mudana de paradigma que o advento do trabalho com corpora proporcionou para a Lingstica. Ela pode ser resumida na frase de Fillmore (1992, 35): Todo corpus me ensinou coisas sobre a linguagem que eu no teria descoberto de nenhum outro modo. Dessa maneira, o racionalismo colocado em xeque e o empirismo apontado como novo modelo e forma de pensar na Lingstica. Muitos achados, e uma quantidade surpreendente de evidncias lingsticas, s so possveis de obter pela observao e o trabalho com a linguagem em uso, autntica, pressupostos para a pesquisa em Lingstica de Corpus (LC). O advento do computador, devido sua grande memria e capacidade de armazenamento, teve e tem um papel central nessa mudana de olhar sobre a linguagem, j que proporciona sistematizao aos fatos e os evidencia. recomendvel, antes de comentar individualmente os captulos do livro, expor alguns conceitos que so caros LC, e que constituem os seus fundamentos. A LC uma abordagem empirista da linguagem, que

MARTINS: RESENHA DE BERBER SARDINHA 2004

385

vista como um sistema probabilstico. Quando se fala em emprico, o que se quer significar que aos dados obtidos, oriundos da observao da linguagem, dada primazia, e a teorizao feita a posteriori uma viso que se choca com a dos modelos mentalistas, que apregoam que a linguagem deve ser estudada por meio da introspeco, e que o conhecimento provm de princpios estabelecidos a priori. O processamento cognitivo da linguagem, bem como seus modelos estruturais de funcionamento, so o foco da pesquisa de vertentes mentalistas. Quando se diz que a linguagem vista como sistema probabilstico, o que significa que a lngua vista mais como uma questo de probabilidade que de possibilidade: ou seja, embora os traos lingsticos sejam possveis teoricamente, eles no ocorrem com a mesma freqncia, essas diferenas no serem aleatrias o fato mais importante. Para esta abordagem da linguagem, h uma correlao entre as caractersticas lingsticas e contextuais. Para seus seguidores, a linguagem vista como padronizada. Os padres (colocaes, coligaes ou estruturas) podem ser lexicais e lxico-gramaticais e apresentam regularidade e variao sistemtica. A padronizao evidenciada pela recorrncia, pela repetio sistemtica: pelo conhecimento da freqncia atestada pode-se estimar a probabilidade terica. Citando Berber Sardinha (:40), a padronizao uma regularidade expressa na recorrncia sistemtica de unidades coocorrentes de vrias ordens (lexical, gramtica, sinttica etc.). Segundo o autor, os padres podem ser de trs tipos: a colocao tipo de padro mais enfocado nos estudos de corpora vem a ser a associao entre itens lexicais, ou entre lxico e campos semnticos. A coligao a associao entre itens lexicais e gramaticais e a prosdia semntica, por sua vez, a associao entre itens lexicais e conotao (negativa, positiva ou neutra) ou instncia avaliativa. Nos modelos mentalistas, o que interessa aos pesquisadores a determinao de quais agrupamentos sintticos so permissveis, dado o conhecimento que o falante possui de sua lngua: o que est em foco a competncia lingstica, ao contrrio do foco dos empiristas, que est no desempenho, no uso lingstico. Os lingistas de corpus aplicam linguagem um princpio que chamam de idiomtico. Para eles, a lngua apresenta uma grande quantidade de frases pr ou semi construdas, que so escolhidas de forma nica (a escolha de um elemento implica na escolha de outro), apesar de parecerem escolhas segmentadas. Em outras palavras, a linguagem vista como formada por pores lexicais. Segundo Sinclair,

386

D.E.L.T.A., 23:2

que para Berber Sardinha o maior lingista de corpus da histria (:13), o espao formado pelo lxico e pela sintaxe uno: a escolha de um item lexical ou de uma categoria gramatical reduz as possibilidades de escolha tanto lexicais quanto gramaticais. Na lingstica sistmico-funcional de Michael Halliday, que apresenta uma viso da linguagem muito parecida com a de Sinclair e seus seguidores, esse espao chamado de lxico-gramtica. Sobre o estatuto da Lingstica de Corpus, Berber Sardinha expe as trs vises de diferentes pesquisadores sobre o tema. Para um grupo, a LC vista como uma metodologia, j que seu instrumental pode ser aplicado livremente em vrias disciplinas, sem mudar a orientao terica destas. Entendendo metodologia como um modo tpico de aplicar um conjunto de pressupostos de carter terico, ento a Lingstica de Corpus pode ser vista como uma metodologia (:.36). Um segundo grupo defende que a LC mais que uma metodologia, uma vez que seus praticantes produzem conhecimento novo, no adquirvel com o uso de outras ferramentas e outros pressupostos tericos. Finalmente, o terceiro grupo v a LC como uma abordagem, uma perspectiva, uma maneira de enxergar a linguagem. Segundo Kennedy (citado por Berber Sardinha: por pg), as pesquisas em LC concentram-se em quatro reas principais: a compilao de corpus; o desenvolvimento de ferramentas; a descrio da linguagem e a aplicao de corpora. No captulo 1, o livro apresenta uma viso geral sobre a Lingstica de Corpus, a comear por seu histrico. Histria fascinante, por sinal. O autor nos lembra que o primeiro corpus lingstico eletrnico, o Brown University Standard Corpus of Present-Day American English, foi lanado em 1964, e era composto por 1 milho de palavras. Ainda naoNa poca, o paradigma dominante na Lingstica era o mentalista, propalado por Noam Chomsky, que apenas sete anos antes havia lanado seu Syntactic structures, livro que continha as bases de uma viso da linguagem que acredita que os dados necessrios para o lingista esto em sua prpria mente, e podem ser acessados por meio da introspeco.j disse acima Uma vez que a Lingstica de Corpus explora a linguagem por meio de evidncias empricas, extradas por computador, v-se o tamanho da revoluo e do estranhamento causado pelo lanamento do corpus Brown e com tudo que isso trouxe em seu ensejo: uma verdadeira revoluo no modo de pensar sobre, de ver e de

MARTINS: RESENHA DE BERBER SARDINHA 2004

387

lidar com a linguagem, baseado nesta que pode ser considerada a palavrachave do trabalho com corpus: empirismo.nao causou nenhum impacto O autor esclarece que havia corpora (cujo sentido original corpo, conjunto de documentos) antes do advento do computador, desde a Antigidade, principalmente de citaes da Bblia. Ao longo do sculo XX ao contrrio de hoje, em que predomina o trabalho de descrio de linguagem a nfase dos trabalhos com corpora era o ensino de lnguas. Como lembra o autor, foi um corpus no computadorizado que deu feio aos corpora atuais, o Survey of English Usage, compilado em Londres a partir de 1959. Atualmente, tendncia, como observa o autor, a parceria entre universidades que desenvolvem pesquisas em LC e editoras ou outras empresas, principalmente com vistas criao de dicionrios, como o caso do pioneiro dicionrio Cobuild, primeiro a ser compilado a partir de um corpus computadorizado, parceria entre a editora Collins e a Universidade de Birmingham. No Brasil, a LC ainda est em estgio inicial. Berber Sardinha expe alguns marcos da LC, destacando-se Sinclair (1966) que, segundo ele, foi o trabalho pioneiro na rea de pesquisa lexical, tendo traado os rumos da maior parte dos trabalhos em LC que so desenvolvidos atualmente e Synclair (1991), em que o autor disserta sobre vrias idias centrais na rea de LC, em especial sobre a colocao. Alm das obras importantes, o autor lista ainda outros veculos importantes de divulgao de pesquisas e trabalhos na rea e isso nao importante?. O Autor apresenta muitas outras referencias A seguir, analisada a definio de corpus, destacando alguns critrios necessrios para que um conjunto de dados lingsticos possa ser considerado um corpus: a origem (os dados devem ser autnticos e escritos por falantes nativos a menos que recebam o ttulo de corpora de aprendizes, que so aqueles cujos dados so textos de falantes no nativos; o propsito (os dados devem ser objeto de estudo lingstico); a composio (os dados devem ser escolhidos e colhidos com critrio); a formatao (os dados devem ser legveis por computadores); a representatividade (os dados devem ser representativos de uma lngua ou de uma variedade lingstica, o que na prtica significa dizer que o corpus deve ser o maior possvel) e a extenso (o material deve ser vasto para ser representativo). No captulo 2, o autor trata de questes prticas que surgem quando se escolhe trabalhar com a LC, como coleta, limpeza e organizao do cor-

388

D.E.L.T.A., 23:2

pus no computador. A www como fonte de pesquisa de corpus mereceu ateno especial, sobretudo o papel dos offline browsers, ferramentas que podem ser usadas para coleta em massa de textos para criao de corpus. O passo a passo da utilizao da ferramenta descrito pelo autor, bem como o caminho a ser percorrido quando da utilizao do Perl e do emulador de Unix Cygwin, ambos usados para limpeza dos textos. A seguir, Berber Sardinha ilustra a limpeza de textos em html e de cdigos SGML. Sobre a busca em massa, Berber Sardinha salienta que um utilitrio muito usado para esses procedimentos o Grep, que usado na linha de comando, uma vez que no possui interface grfica. Sobre a substituio em massa, o autor observa que h opes alm do Microsoft Word e do Perl como o caso do utilitrio Sed, que pode ser usado com eficincia para fazer substituies em massa de textos do corpus, procedimento que no pode ser feito a contento usando-se o Word. O Text Converter, que faz parte do WordSmith Tools, apontado como boa opo para o procedimento de busca e substituio em massa, podendo ser usado para fazer uma ou vrias substituies ao mesmo tempo. Sobre a organizao do corpus, o autor afirma que no h regras gerais a serem seguidas, mas salienta que os textos devem estar de preferncia em uma pasta principal em que s existam textos do corpus. O item Criao de Cabealhos que vm a ser uma parte do arquivo de cada texto do corpus que contm informaes sobre ele abordado a seguir. O autor ensina que essas informaes podem ser codificadas de vrias maneiras, sendo uma delas as etiquetas de SGML, e as de tipo Cocoa. Uma outra maneira bastante usada por pesquisadores a criao de arquivos separados de cabealho. O captulo 3 inteiramente dedicado a um programa extremamente til para a anlise do corpus, o WordSmith Tools verso 3, de autoria de Mike Scott. O programa, obtido pela internet, pode ser baixado gratuitamente na verso demo e, se houver interesse, pode ser comprado. No ato da compra da licena, o usurio recebe um cdigo que transforma a verso demo em verso completa. Logo na introduo do captulo, o autor enumera algumas vantagens de um maior emprego dos computadores na investigao da linguagem: o fato de serem consistentes, podendo realizar tarefas tediosas de modo confivel e eficiente; o fato de permitirem ao pesquisador a possibilidade de lidar com uma maior quantidade de dados, devido sua grande memria e, finalmente, o fato de o uso dos compu-

MARTINS: RESENHA DE BERBER SARDINHA 2004

389

tadores permitir a descoberta de dados novos, que muitas vezes podem levar contestao de crenas estabelecidas. A seguir, o autor discorre sobre as ferramentas do WordSmith Tools. So elas: WordList, que possibilita a criao de listas de palavras por ordem alfabtica ou de freqncia; KeyWords, que possibilita, atravs da comparao entre 2 listas de palavras-chave, a criao de listas de palavras-chave que, por sua vez, so palavras cujas freqncias so estatisticamente diferentes no corpus de estudo e no corpus de referncia, conhecido tambm como corpus de controle cujo tamanho deve ser 2, 3 ou 5 vezes maior que o corpus de estudo; e Concord, que possibilita a criao de concordncias ou listas das ocorrncias no corpus de um item determinado pelo usurio, acompanhado do texto ao seu redor (seu cotexto). Segundo Berber Sardinha, trs princpios bsicos norteiam o funcionamento do WordSmith Tools. So eles: 1) Ocorrncia: os itens devem necessariamente ocorrer num corpus, ser observveis; 2) Recorrncia: os itens devem ocorrer pelo menos duas vezes no corpus; 3) Coocorrncia: os itens devem estar na presena de outros, mas no necessrio que estejam aparecendo seqencialmente. Em relao lista de palavras-chave, so explicitadas os critrios de escolha dos corpora de estudo e de referncia, bem como todos os procedimentos para obteno das listas de palavras-chave incluindo a as operaes que so usadas pelo programa, explicitando o tipo de raciocnio utilizado. Isso, alis, o autor faz ao longo de todo o livro: lanar luzes em um terreno um tanto sombrio. Ao colocar todos os porqus e os comos para o leitor, este acaba se convencendo de que no se est lidando com nenhum dogma matemtico, o que d um estmulo principalmente para o leitor que tem ressalvas com procedimentos quantitativos e estatsticos. Sobre as concordncias instrumentos indispensveis no estudo da padronizao lexical e da colocao , o autor apresenta os instrumentos que a ferramenta disponibiliza para o usurio e mostra o passo a passo de sua utilizao. De grande utilidade para a pesquisa em LC so as listas de colocados, que elencam as palavras que ocorrem ao redor da palavra de busca (ou ndulo), em posies determinadas. Muitas vezes, de acordo com o tipo de pesquisa que se quer realizar, ser necessrio marcar no corpus a classe gramatical de cada palavra. Para isso, o autor apresenta uma ferramenta importante: o etiquetador mor-

390

D.E.L.T.A., 23:2

fossinttico, que insere automaticamente no corpus cdigos que indicam a classe gramatical de cada palavra, e permite o tratamento de grandes quantidades de texto rapidamente. A etiquetagem pode ser morfossinttica, sinttica, semntica ou discursiva. H duas opes de etiquetadores: os que rodam on-line e os que podem ser instalados no computador. Uma vez que, para funcionarem de maneira correta, alguns etiquetadores exigem que o corpus esteja itemizado, o autor dedica uma seo do livro para tratar da itemizao separao das unidades ortogrficas. Berber Sardinha instrui sobre o uso de alguns programas de itemizao, como o Text Converter do WordSmith Tools, o Perl, o Java, sobre a etiquetagem por email, fornecida pela Universidade de Leeds, e sobre a etiquetagem via web, oferecida pela Universidade do Sul da Dinamarca. Esta ltima opo, alis, realada pelo autor como sendo uma tima opo para os pesquisadores cujos corpora de pesquisa so escritos em lngua portuguesa, uma vez que h no etiquetador via web uma interface para a etiquetagem do portugus. O captulo 5 do livro de Berber Sardinha trata de uma ilustrao prtica do processo de desenho, planejamento e pr-processamento de um corpus. Usando a sua prpria experincia da execuo do banco de dados do projeto DIRECT (Em Direo Linguagem de Negcios) que rene textos em portugus e ingls de linguagem profissional , o autor oferece dicas valiosas, que podem ser aproveitadas por pesquisadores dos mais diversos temas que se aventuram no trabalho com LC. O captulo 6 oferece uma anlise das freqncias do corpus Banco de Portugus. Essa anlise, como ressalta o autor, til para o entendimento da lngua como um todo, j que se trata de um corpus extenso e de linguagem geral. O autor lembra que uma vantagem evidente de se analisar as freqncias de um corpus grande como o caso do corpus em questo a possibilidade de se conhecer quais palavras so freqentes e quais so raras. O estudo da freqncia das palavras importante at mesmo para quem nunca pensou na questo no vis aqui proposto leia-se os pesquisadores de tradio chomskyana: a freqncia das palavras chega at a implicar nas- ou mesmo determinar as normas gramaticais. Segundo Biderman (1998, citado por Berber Sardinha, p. 163), a norma lingstica nada mais do que a mdia dos usos freqentes das palavras que so aceitas pelas comunidades dos falantes. O captulo 7 trata das concordncias, desenvolvidas para a observao dos padres de uso das palavras de um corpus. Nas palavras do autor, a

MARTINS: RESENHA DE BERBER SARDINHA 2004

391

concordncia uma listagem de ocorrncias de um item especfico, dispostas de tal modo que a palavra de busca (aquela que se tem interesse em investigar) aparece centralizada na pgina (ou na tela do computador) (p. 187). Essas palavras so acompanhadas de seu cotexto as palavras que aparecem prximas a elas num corpus. O autor difere essas palavras dos colocados que so as palavras que ocorrem ao redor do ndulo, em posies relativas a ele. A palavra de busca definida pelo usurio, uma escolha pessoal, enquanto que os colocados so todas as palavras que ocorrem ao redor do ndulo. O captulo evidencia elementos prticos da anlise da linguagem por meio de concordncias, e apresenta um glossrio com a definio dos termos mais freqentes no trabalho com elas. O autor cita vrios programas concordanciadores, recomendando o MicroConcord e o WordSmith Tools Concord. So apresentadas algumas limitaes, como em relao quantidade de linhas de concordncia (16000 o limite para o WordSmith Tools e 1600 para o MicroConcord). Em relao a esse problema, Berber Sardinha explica o procedimento que deve ser tomado pelo usurio quando o corpus apresenta mais do que esse nmero de ocorrncias para determinada palavra de busca e a est outro trunfo do livro: os problemas so expostos com honestidade, e so sempre acompanhados de sugestes para que o usurio faa sua pesquisa o melhor possvel. As listas de colocados so tambm abordadas pelo autor, no que concerne a procedimentos de obteno e classificao. Item especial dedicado s estatsticas de associao, e so apresentadas trs maneiras (razo observado/esperado; informao mtua e escore T) estatsticas de calcular se a associao entre itens lexicais pode ser considerada no aleatria a ponto de poder ser considerada uma colocao; em outras palavras, so demonstradas maneiras de se saber se a associao mais comum do que o esperado. O autor ensina a maneira de se obter as estatsticas de associao por meio de clculo em planilhas eletrnicas, no programa WordSmith Tools e via internet. O captulo seguinte trata da padronizao da lngua portuguesa segundo a Lingstica de Corpus. Usando o j citado Banco de Portugus, Berber Sardinha estuda a padronizao da partcula s, e chega a alguns achados importantes. A importncia maior da pesquisa est em demonstrar como a lxico-gramtica do portugus pode ser compreendida melhor

392

D.E.L.T.A., 23:2

quando estudada com base na abordagem de corpus. O captulo seguinte trata da comparao entre as prosdias semnticas de duas lnguas, usando para tanto as ferramentas de concordncias e as listas de colocados. O captulo especialmente relevante para os estudiosos de Estudos da Traduo, que podem ver o quo til o trabalho com corpus pode ser para obterem resultados consistentes em suas pesquisas. So mostrados os resultados das comparaes entre itens lexicais em portugus e em ingls, tais como causar/cause e acontecer/happen. O autor conclui que, devido relevncia dos achados, as informaes obtidas por meio do procedimento descrito deveriam constar de dicionrios e glossrios. O captulo 10 trata da Lingstica de Corpus e sua conexo com a Lingstica Aplicada, especialmente no tocante ao ensino de lngua estrangeira. O autor faz consideraes sobre a descrio da linguagem nativa e sobre a linguagem de aprendizes, atendo-se ao uso das concordncias no ensino (bem como nas avaliaes), que servem sobretudo para exemplificar o uso de traos lingsticos e as situaes nas quais ele ocorre. Berber Sardinha (p.279) elenca alguns benefcios advindos do uso das concordncias no ensino, quais sejam: a) Obteno de respostas a perguntas sem resposta nas obras de referncia; b) Desenvolvimento do esprito pesquisador; c) Independncia em relao ao professor, ao curso, ao livro didtico e aos materiais de referncia; d) Incentivo postura ativa do aluno; e) Centramento no aluno e individualizao do aprendizado. O autor apresenta ao leitor trs abordagens de uso da Lingstica de Corpus no ensino de lnguas: a) o Currculo Lexical, que se centra no lxico e se norteia pela mxima de que os sentidos mais comuns da linguagem so expressos pelo vocabulrio mais freqente; dessa maneira, o contedo de cada nvel se pautou na freqncia do vocabulrio, atestada no corpus do projeto Cobuild. Nessa abordagem, as atividades so centradas em tarefas; b) a Abordagem Lexical, que tambm tem no lxico seu elemento central. De acordo com Berber Sardinha, difere-se do Currculo Lexical sobretudo pela nfase na colocabilidade do lxico, uma vez que este descrito por meio de pores lxico-gramaticais, que so itens prefabricados, realizadas como colocaes ou polipalavras e ensinadas atravs de textos. Nesta abordagem, as atividades so centradas na forma, e no em tarefas; c) Aprendizado Movido por Dados, que visa a tornar o aluno um pesquisador. Aqui, ao contrrio do que acontece nas abordagens anteriores, nas quais a abordagem da LC vista na produo dos materiais, o uso do computador e das concordncias conduzido s ltimas conseqncias, com os prprios alunos pro-

MARTINS: RESENHA DE BERBER SARDINHA 2004

393

duzindo as concordncias e induzindo regras, que no so dadas a priori. Os alunos seguem trs etapas: identificao, classificao e generalizao. O ltimo captulo do livro trata do estudo da variao com Lingstica de Corpus, atravs da Anlise Multidimensional que, nas palavras do autor (p. 299) uma abordagem para anlise de corpus que usa procedimentos estatsticos (principalmente anlise fatorial), visando ao mapeamento das associaes entre um conjunto variado de caractersticas lingsticas dentro de um corpus de estudo. Uma dimenso definida como conjunto de traos que subjazem a um corpus. Essa abordagem tem um carter comparativo, j que promove contraste entre textos ou registros, e combina anlises macro com anlises micro. Neste captulo, so descritos termos e conceitos empregados neste tipo de anlise, bem como as etapas na realizao de uma anlise multidimensional. A seguir, o autor tece consideraes sobre a descrio multidimensional da lngua inglesa, alm de comentar sobre esse tipo de anlise de outras lnguas. Com tudo isso, conclui-se que a empreitada de escrever um livro de tal alcance foi realizada a (muito) contento. Pudera: falando-se de Lingstica de Corpus, o top of mind da comunidade acadmica brasileira sem dvida Berber Sardinha. No toa. Recebido em fevereiro de 2007 Aprovado em junho de 2007 E-mail: izabella.martins@gmail.com

REFERNCIA
FILLMORE, C. Corpus linguistics or computer corpus linguistics. In: Directions in corpus linguistics. Proceedings of nobel symposium 82, Stockholm, Ed. Jan Svartvik, 35-60. Berlim/Nova York, De Gruyter, 1992.