PORTUGUS BRASILEIRO E OS ESTUDOS DE TERCEIRA ONDA: POTENCIALIDADES E LIMITAES Raquel Meister Ko. FREITAG * Marco Antonio MARTINS ** Maria Alice TAVARES *** RESUMO: Bancos de dados lingusticos de fala especialmente aqueles elaborados para a pesquisa de orientao sociolingustica variacionista tm sido fonte privilegiada para a descrio do portugus brasileiro. Neste texto, discutimos procedimentos metodolgicos que deveriam ser adotados para a organizao de novos bancos de dados. Fazemos um breve retrospecto dos bancos de dados j constitudos e sugerimos a coleta e expanso de corpora de diferentes comunidades de fala e de diferentes comunidades de prtica. De acordo com proposta defendida por Eckert (2012), os estudos sociolingusticos podem ser distinguidos em trs ondas de anlise que refetem modos distintos de abordagem variao lingustica. Sugerimos estratgias para padronizar os procedimentos de organizao de bancos de dados sociolingusticos que levem em conta as trs diferentes ondas da pesquisa sociolingustica, e destacamos a terceira onda, ainda incipiente no Brasil. A padronizao dos bancos de dados sociolingusticos facilitaria a realizao de investigaes contrastivas de diferentes dialetos brasileiros, contribuindo, dessa forma, para o estabelecimento e refnamento de generalizaes e princpios de variao e mudana universais. PALAVRAS-CHAVE: Sociolingustica. Banco de dados. Variao e mudana lingustica. Fatores sociais. Estilo. Introduo Na literatura sociolingustica variacionista, a referncia metodologia costuma ocupar duas a trs linhas, quando muito um pargrafo: como corpus foram selecionados X informantes do banco de dados Y, estratifcados em Z clulas sociais. A voz passiva da construo e a exiguidade do espao dedicado * UFS Universidade Federal de Sergipe, Centro de Educao e Cincias Humanas Departamento de Letras Vernculas. So Cristvo Sergipe Brasil. 49100-000 - rkofreitag@uol.com.br ** UFRN Universidade Federal do Rio Grande do Norte, Centro de Cincias Humanas, Letras e Artes. Natal Rio Grande do Norte Brasil. 59072-970 - marcoamartins.ufrn@gmail.com *** UFRN Universidade Federal do Rio Grande do Norte, Centro de Cincias Humanas, Letras e Artes. Natal Rio Grande do Norte Brasil. 59072-970 - alicefp@hotmail.com 918 Alfa, So Paulo, 56 (3): 917-944, 2012 metodologia de organizao do corpus no condizem com o real esforo e tempo dispendidos no processo de constituio de um banco de dados, desde a prospeco e seleo de informantes at a transcrio, armazenamento e disponibilizao. Bancos de dados lingusticos de fala (especialmente os que seguem a orientao da Sociolingustica Variacionista) tm sido fonte privilegiada para a descrio do portugus brasileiro. Porm, a constituio de corpus que procure considerar as variedades do portugus brasileiro tarefa dispendiosa no s quanto a recursos fnanceiros, mas tambm quanto ao tempo. A cada projeto que constitui seu banco de dados em uma comunidade de fala, o mapeamento das variedades do portugus no Brasil vai se efetivando, mas s a padronizao dos procedimentos metodolgicos permitir a realizao de estudos contrastivos entre as variedades, para, ento, possibilitar uma descrio mais acurada do portugus brasileiro. Iniciativas para viabilizar estudos lingusticos variacionistas otimizando os recursos tm se tornado prtica no cenrio nacional, afnal, a comparao entre resultados obtidos para fenmenos variveis um recurso analtico que permite grandes avanos tericos para a pesquisa lingustica, uma vez que transcender os limites de uma nica variedade lingustica possibilita o estabelecimento, refnamento e fortalecimento de generalizaes e princpios de variao e mudana universais (TAVARES, 2002). Como um dos objetivos da Sociolingustica variacionista obter resultados que possam ser generalizados, sua metodologia deve ser pautada em confabilidade (os mesmos resultados devem ser repetidos na anlise do mesmo fenmeno) e intersubjetividade (dois pesquisadores diferentes devem obter os mesmos resultados seguindo a mesma metodologia) (BAILEY; TILLERY, 2004). Ao tecerem avaliaes de ordem metodolgica campo ainda pouco explorado nos estudos variacionistas Bailey e Tillery discutem trs razes possveis para explicar a divergncia de resultados em abordagens sociolingusticas quantitativas a partir da premissa de que diferenas metodolgicas resultam em divergncias de resultados, especialmente quanto s diferenas de entrevistador e s diferenas na amostra da populao. Bailey e Tillery (2004) retomam o estudo de Rickford e McNair-Knox (1994), em que o mesmo informante afroamericano foi entrevistado por duas entrevistadoras: uma tambm afroamericana e outra branca. A frequncia com que traos caractersticos do AAVE apareciam na entrevista realizada pela afroamericana era sensivelmente superior da entrevista realizada pela entrevistada branca. Outro aspecto que Bailey e Tillery destacam que a experincia do pesquisador de campo que realiza a entrevista (e, em menor efeito, o tpico) tambm mostra efeitos na frequncia de fenmenos. Quanto aos efeitos da amostra, Bailey e Tillery (2004) ressaltam que os estudos sociolingusticos costumam 919 Alfa, So Paulo, 56 (3): 917-944, 2012 trazer poucas informaes acerca da seleo dos seus informantes ou de sua representatividade na comunidade. Os autores sugerem, a ttulo de recomendao, que os pesquisadores precisam especifcar exatamente qual a amostra da populao em estudo, assim como especifcar quais os procedimentos para defnir a amostra, de modo que possam garantir a confabilidade e a intersubjetividade da anlise. A discusso de Bailey e Tillery (2004) sugere que os resultados de uma investigao sociolingustica so no raro muito mais a consequncia de escolhas metodolgicas do que o comportamento dos informantes. O que torna a situao problemtica, segundo os autores, que a sociolingustica quantitativa no tem um corpo de pesquisadores que se dediquem ao mtodo, nem literatura que explore os efeitos de diferentes entrevistadores, diferentes estratgias de elicitao dos dados, procedimentos de amostragem ou estratgias analticas. esteira da constatao de Bailey e Tillery (2004), neste texto, tecemos refexes acerca da metodologia das abordagens sociolingusticas de orientao variacionista desenvolvidas no Brasil, especifcamente no que tange constituio de bancos de dados. Fazemos um breve retrospecto dos bancos de dados j constitudos e prospectamos aes futuras neste campo, com a expanso e ampliao de amostras de variedades lingusticas (novos bancos de dados e coletas piloto). A orientao da discusso segue a proposta de Eckert (2012) a respeito das trs ondas da Sociolingustica e as ponderaes de Bailey e Tillery (2004), j apresentadas, sobre dados divergentes em sociolingustica (e que procedimentos metodolgicos so pertinentes para minimiz-los). As trs ondas da Sociolingustica e os bancos de dados brasileiros Propondo uma discusso sobre os rumos do signifcado social no estudo da variao, Eckert (2012) 1 faz uma abordagem programtica dos estudos sociolingusticos com o propsito de relevar o estudo da variao com nfase no signifcado social: como o sistema de signifcado social estruturado? Que tipos de signifcados sociais so expressos na variao? Em seu retrospecto, Eckert destaca que os estudos sociolingusticos podem ser agrupados em trs ondas de estudos, no substitutivas nem sucessivas, mas que se confguram como modos distintos de pensar a variao, com prticas analticas e metodolgicas peculiares. A proposta das trs ondas dos estudos sociolingusticos de Eckert vem recebendo sinalizaes de que merece ateno no cenrio sociolingustico brasileiro (BENTES, 2009; CAMACHO, 2010; SCHERRE, 2011; HORA; WETZELS, 1 Esse texto a verso revisada e modifcada do trabalho intitulado Variation, convention, and social meaning, que foi apresentado por Penelope Eckert na Annual Meeting of the Linguistic Society of America, em Oakland, no ano de 2005. Nessa verso mais recente de sua proposta, a autora sugere a integrao entre os nveis social e cognitivo na dinmica da variao que potencialmente os estudos de terceira onda poderiam abarcar. A verso mais antiga do texto est disponvel em <http://www.stanford.edu/~eckert/EckertLSA2005.pdf>. 920 Alfa, So Paulo, 56 (3): 917-944, 2012 2011, entre outros), motivando a discusso acerca de seu impacto para o campo de estudos. Apresentamos, a seguir, a proposta de Eckert (2012) para a abordagem de cada uma das ondas de estudos sociolingusticos, com nfase nos aspectos metodolgicos, especialmente no que diz respeito constituio de bancos de dados sociolingusticos brasileiros. Ao fnal da seo, avaliamos as potencialidades e as limitaes de cada uma das abordagens quanto constituio de bancos de dados, delimitando os aspectos que os novos bancos de dados potencialmente precisam contemplar para contribuir de modo efetivo aos estudos que enfocam o signifcado social da variao. A primeira onda de estudos sociolingusticos inicia com os estudos de Labov sobre a estratifcao do ingls na cidade de Nova Iorque, cujos resultados foram replicados em uma srie de estudos em comunidades urbanas que corroboraram um padro regular de estratifcao socioeconmica das variveis, em que o uso das variantes no padro est inversamente relacionado ao status socioeconmico do falante (ECKERT, 2012). A primeira onda estabeleceu uma base slida para o estudo da variao, evidenciando as correlaes entre variveis lingusticas e categorias sociais primrias, como classe socioeconmica, sexo, idade, escolaridade etc. Os padres regulares e sistemticos de covariao social e lingustica levantaram questes sobre relaes sociais subjacentes s categorias sociais primrias, o que conduziu ao surgimento da segunda onda, caracterizado por estudos etnogrfcos de populaes mais localmente defnidas. A premissa dos estudos de primeira onda , pois, que as variedades lingusticas carregam o status social de seus falantes. A metodologia dos estudos de primeira onda calcada na correlao entre as variveis lingusticas e as categorias socioeconmicas em sentido amplo (cuja classifcao se d de forma estvel, homognea e padronizada de modo a permitir a replicao, como faixa etria, sexo, etnicidade, escolaridade), com a estratifcao dos falantes em clulas sociais, a constituio de bancos de dados lingusticos e resultados quantitativos refnados (especialmente com o uso de tcnicas estatsticas aprimoradas para o modelo da variao lingustica, como a regresso logstica com o clculo de desvio da mdia ponderada (SANKOFF; TAGLIAMONTE; SMITH, 2005)). No Brasil, os estudos quantitativos com bancos de dados estratifcados de acordo com caractersticas sociodemogrfcas amplas tm se consolidado como modelo hegemnico, com os bancos de dados do Programa de Estudos sobre o Uso da Lngua (PEUL), da Universidade Federal do Rio de Janeiro, que foi o pioneiro no Brasil a implementar esse modelo de constituio de amostra 2 . A partir deste, foram replicados projetos em diferentes regies do Brasil, com adaptaes em sua metodologia (Projeto Variao Lingustica Urbana na Regio 2 Para mais detalhes sobre o banco de dados PEUL, ver Scherre e Roncarati (2008). 921 Alfa, So Paulo, 56 (3): 917-944, 2012 Sul do Brasil VARSUL, da equipe formada pela Universidade Federal do Paran, Universidade Federal de Santa Catarina; Universidade Federal do Rio Grande do Sul e Pontifcia Universidade Catlica do Rio Grande do Sul 3 ; Projeto Variao Lingustica na Paraba VALPB, da Universidade Federal da Paraba; Banco de Dados Sociolingustico da Fronteira e da Campanha Sul-Rio-Grandense BDS- Pampa, da equipe da Universidade Federal de Pelotas e da Pontifcia Universidade de Pelotas; Banco de Dados por Classe Social VarX, da Universidade Federal de Pelotas, entre outros). 4 Esse tipo de banco de dados possibilita captar tendncias amplas de variao e mudana em uma comunidade de fala. Implica, entretanto, a homogeneizao da amostra, como discutimos mais frente. importante destacar que a elaborao desses corpora permitiu a descrio do portugus brasileiro em diferentes aspectos lingusticos e considerando distintas variedades. De algum modo, tm-se uma descrio da variao na(s) gramtica(s) do portugus do Brasil envolvendo diferentes fenmenos e a correlao destes com variveis sociais. Os estudos de segunda onda so tambm de natureza quantitativa, mas de abordagem etnogrfca, abarcando categorias sociodemogrfcas mais abstratas, a fm de evidenciar como o vernculo assume valor local. Os estudos etnogrfcos enfocam comunidades menores por perodos de tempo relativamente longos com o objetivo de descobrir as categorias sociais localmente mais salientes. Essas categorias podem ser instanciaes locais das categorias primrias que guiam os estudos quantitativos, mas o trao distintivo crucial desse tipo de estudo a descoberta do lugar dessas categorias na prtica social local. Nesse tipo de abordagem, o foco recai nos conceitos de comunidades de fala e de identidade de grupo. Eckert (2012) traz, em referncia segunda onda, trs exemplos: (1) o estudo de Labov sobre o ingls afroamericano (AAVE), cujos resultados apontam para o uso de traos vernaculares por adolescentes como indexadores do status entre o grupo de comunidade de prtica; (2) o estudo de Milroy (1980), que enfoca comunidades de classe operria e examina a relao entre engajamento local e uso do vernculo, correlacionando o uso de variveis vernaculares locais com a densidade e a multiplicidade da rede de relaes sociais do falante; e (3) o estudo da prpria Eckert sobre o papel das categorias jokers e burnouts na indexao de classe socioeconmica em grupos adolescentes (ECKERT, 2000). No cenrio brasileiro, esse tipo de abordagem no recebeu a mesma nfase que os estudos quantitativos baseados em categorias sociais amplas. Dentre os poucos estudos que se encaixam na segunda onda, escolhemos o de Ferrari (1994) para ilustrao. Ferrari (1994) selecionou doze traos fonolgicos, escalonados entre 3 Ver Bisol, Menon e Tasca (2008). 4 Nesta relao, no inclumos o projeto Norma Urbana Culta NURC porque, apesar de subsidiar tambm descries de cunho sociolingustico, seu banco de dados no foi constitudo para essa fnalidade. 922 Alfa, So Paulo, 56 (3): 917-944, 2012 discretos em que a varivel indica uma delimitao ntida entre grupos sociais contguos ou gradientes em que a varivel no se apresenta com frequncia signifcativamente maior de um grupo social para outro , e um trao sinttico- semntico (variao de preposio locativa em vs. ni), a fm de verifcar as relaes entre variao e redes sociais na comunidade do Morro dos Caboclos, no Rio de Janeiro. A rede de relaes sociais do indivduo estabelecida na comunidade no se confgura como um indicador sociodemogrfco amplo, como sexo, idade, escolarizao etc.; trata-se de um indicador que s captado com um estudo investigativo individualizado, aos moldes etnogrfcos. Os resultados da investigao de Ferrari (1994) apontam que redes sociais relativamente fechadas possibilitam a focalizao de traos lingusticos (conservao dos traos lingusticos caractersticos da comunidade do Morro dos Caboclos), enquanto redes sociais pouco coesas associam-se difuso lingustica (abandono dos traos lingusticos da comunidade em troca de traos que os aproximam dos moradores de bairros da zona oeste carioca, nas proximidades do Morro dos Caboclos): os falantes que trabalhavam na cidade faziam uso de traos lingusticos diferentes daqueles que nunca desciam o morro. Estudos dessa natureza permitem uma avaliao mais acurada do fenmeno da variao, com nfase no valor social das variveis. So, entretanto, estudos dispendiosos e demorados, cujo corpus de anlise no segue o alinhamento dos bancos de dados constitudos de acordo com a estratifcao social baseada em indicadores sociodemogrfcos amplos. Os estudos de primeira e segunda ondas, segundo Eckert (2012), tm como foco a descrio da estrutura um retrato esttico. Os estudos de terceira onda incorporam a dinamicidade da estrutura, ou seja, como a estrutura se molda no cotidiano, com os condicionamentos sociais impostos e as relaes de poder estabelecidas atuando sobre ela. Eckert (2012) salienta que no est negando a estrutura, mas sim enfatizando o papel da estrutura no condicionamento da prtica paralelamente ao papel da prtica na produo e reproduo da estrutura, a fm de captar com mais detalhes a dinmica do valor social das variveis. Os estudos de terceira onda combinam os postulados dos estudos de primeira e de segunda onda, com uma mudana no foco: da comunidade de fala para a comunidade de prtica. Enquanto, na defnio laboviana, comunidades de fala so agrupamentos de indivduos que compartilham no necessariamente dos mesmos traos lingusticos, mas sim do mesmo juzo de valor acerca desses traos, e os reconhecem como legtimos para a identifcao do grupo, a comunidade de prtica (WENGER, 1998; ECKERT; MCCONNELL-GINET, 2010; ECKERT; MCCONNELL-GINET, 1997) um agrupamento de indivduos (comunidade) que partilham perspectivas em comum, valores e conhecimento (domnio), e que interagem entre si para se aperfeioarem e replicarem esses valores e conhecimentos (prtica). Trata-se de uma construo social, e, como tal, est sujeita s prticas dirias dos indivduos, que interagem entre si e com outras comunidades. 923 Alfa, So Paulo, 56 (3): 917-944, 2012 Em lugar de conceber o indivduo como uma entidade parte, pairando sobre o espao social, ou como um ponto em uma rede, ou como membro de um conjunto especfco ou de um conjunto de grupos, ou como um amontoado de caractersticas sociais, precisamos enfocar as comunidades de prtica. Tal foco possibilita-nos ver o indivduo como agente articulador de uma variedade de formas de participao em mltiplas comunidades de prtica. (ECKERT; MCCONNEL-GINET, 2010, p.103). A terceira onda, que se desenvolveu mais recentemente, centra o foco na variao vista no como o refexo do lugar social num ponto da escala, mas como um recurso para a construo de signifcado social. Eckert (2012) se volta necessidade de conectar essas categorias sociais mais abstratas, arraigadas na experincia do falante, com as comunidades imaginrias mais amplas, centrando foco na construo do conceito de comunidade de prtica. Uma comunidade de prtica um agregado de pessoas que se juntam para engajar-se em algum empreendimento comum. Na esteira desse engajamento, a comunidade de prtica desenvolve meios para fazer coisas que se traduzem em prticas e essas prticas envolvem a construo de uma orientao compartilhada em relao ao mundo em volta uma defnio tcita que os indivduos assumem um em relao ao outro e em relao a outras comunidades de prtica. Os estudos de terceira onda combinam a metodologia quantitativa, presente nas ondas anteriores, o corpora constitudos de modo a contemplar a dimenso mais cotidiana (o que no necessariamente captado pela entrevista sociolingustica), com observaes participantes, por exemplo. O conceito-chave para o processo de construo o de prtica estilstica. At aqui, nos estudos variacionistas, o estilo tem sido tratado como ajustes (in) formalidade da situao mediante o uso de variveis individuais. A face renovada de estilo o identifca com o modo como os falantes combinam variveis para criar modos distintivos de fala, que fornecem a chave para a construo da identidade. A identidade consiste, por sua vez, em tipos particulares explicitamente localizados na ordem social. Continuamente, os falantes atribuem signifcado social variao de um modo consequente, situao que implica certo grau de agentividade. Eckert (2012) postula que toda variao tem potencial para receber signifcado social, ainda que nem toda variao seja conscientemente controlada ou mesmo socialmente signifcativa. A indexao de variveis fonolgicas no to transparente quanto, por exemplo, o uso de partculas honorfcas, mas justamente a fuidez das primeiras que as torna acessveis a uma grande variedade de propsitos sociais. necessrio haver apenas tempo e continuidade sufcientes para convencionar a relao entre uma varivel e um signifcado social. por essa razo que variveis estveis, como a reduo de (-ing) no ingls americano, tm 924 Alfa, So Paulo, 56 (3): 917-944, 2012 signifcados to extremamente claros que podem ser referidos como esteretipos, ao passo que variantes representando mudanas em progresso so recursos mais instveis, mais transitrios e, por isso, mais disponveis para assumirem signifcado social. Um contnuo da convencionalizao acompanha um contnuo de intencionalidade, num processo que torna o sujeito agente dos processos sociais que constroem sua prpria identidade. Na linha dos estudos de terceira onda, Moore (2010) analisou a variao entre were/was em uma comunidade de prtica em Bolton, Inglaterra. Seus resultados globais seguem o padro da variao were/was obtidos por estudos baseados em bancos de dados sociolingusticos (TAGLIAMONTE, 1998; CHESHIRE; FOX, 2009). Porm, sua metodologia de coleta etnogrfca possibilitou captar a correlao entre o uso no padro e a estrutura social da comunidade de prtica, confgurando a varivel como um ndice de prtica social. A investigao de Moore (2010) intenta mostrar como os fatores sociais interagem e avaliar como cada fator condiciona o uso de were em contextos de primeira e terceira pessoa do singular. A constituio da amostra se deu em um perodo de dois anos de observao etnogrfca de adolescentes da Midlan High School, em Bolton, Inglaterra. Especifcamente, foram consideradas as gravaes de fala de 39 garotas. Para coletar esses dados, primeiramente a pesquisadora foi escola no horrio do almoo e se envolveu em atividades diversas (como almoar na cantina, assistir a um ensaio de pea de teatro, sair com os fumantes para a rea externa). Nessa etapa foram tomadas notas de campo; interaes com as adolescentes s foram gravadas aps seis meses de observao etnogrfca, e nunca foram realizadas sob a forma de uma entrevista sociolingustica clssica, mas sob a forma de um grupo de discusso e relato de atividades, envolvendo entre duas e quatro adolescentes, o que resultou em 50 horas de gravao. Alm disso, questionrios circularam entre as participantes do estudo, para coletar informaes sobre as prticas sociais das informantes (a fm de validar as observaes etnogrfcas), alm de informaes sobre classe social, identifcao de si mesmo, de famlia e da sua localidade de nascimento. A partir dessa observao etnogrfca, Moore (2010) identifcou quatro comunidades de prtica, e cada adolescente membro foi avaliada quanto a com que ocupava seu tempo na escola, com quais atividades ela se engajava, sua orientao em relao aos pares e entorno, seu estilo pessoal e sua aparncia e sua avaliao (por si mesma e pelos membros do grupo). As populares exibem uma atitude antiescola, tm um estilo esportivo e feminino de se vestir e se engajam em atividades moderadamente rebeldes, como beber e fumar. Moore (2010) destaca que, no meio do trabalho de campo, as townies fundiram-se com as populares, quando estas comearam a se engajar em atividades de certo risco, como envolvimento com drogas e atividade sexual. 925 Alfa, So Paulo, 56 (3): 917-944, 2012 Os amigos das townies so rapazes mais velhos, com quem elas ocupam seu tempo na escola. As geeks exibem uma atitude positiva em relao escola, engajando-se em atividades como a banda da escola, esportes etc. Por fm, as Eden Village, assim nomeadas em funo de residirem em bairro de status, tambm so orientadas para valores institucionais da escola, e se vestem de acordo com o estilo teen da moda, ocupando seu tempo com dana, compras e festas de pijama. Aps analisar os dados coletados considerando fatores lingusticos e sociais, controlando subamostras e especialmente como cada adolescente se identifca e identifcada pelo grupo, Moore (2010) traz evidncias quantitativas (baseada na frequncia de uso individual) de que a comunidade de prtica townie tende a fazer uso da forma no padro (were), a comunidade de prtica das populares se mostra neutra, enquanto a comunidade geeks assume uma postura desfavorvel forma no padro e a comunidade Eden Village tem um padro de uso da forma padro (was) muito prximo do categrico. Moore (2010) conclui que, para analisar o fenmeno de modo mais efciente, preciso observar o que se passa nas relaes alm do contexto institucional. No caso da variao entre was e were, os resultados globais se aproximam ao que outros estudos constataram; a distribuio considerando as comunidades de prtica permite observar que a identidade no apenas uma entidade social que correlacionada a aspectos lingusticos, mas um fenmeno sociolingustico, que construdo com o valor simblico de caractersticas sociais e lingusticas. Estudos de terceira onda tm tomado como objeto comunidades de prtica variadas, como yuppies em Beijin (ZHANG, 2008), gays (PODESVA, 2002); PODESVA; ROBERTS; CAMPBELL-KIBLER, 2002), adolescentes em escolas (ECKERT, 2000; MOORE, 2010), que no podem ser aprioristicamente defnidas, como vimos na descrio detalhada do estudo de Moore (2010). O cenrio sociolingustico brasileiro atual vem acenando com entusiasmo para os estudos de terceira onda. Camacho (2010, p.160) diz que O entendimento que temos da teoria sociolingustica permite assumir que o terceiro ciclo, na viso de Eckert (2005), o ponto de vista mais consistente com o postulado de que a linguagem um sistema adaptativo. possvel que o entendimento de Camacho (2010) seja acertado apesar de no ser baseado em resultados de estudos empricos no portugus ; porm, preciso reconhecer que os estudos baseados em categorias sociodemogrfcas amplas (os de primeira onda) so particularmente importantes para respaldar os estudos de terceira onda. Apenas para exemplifcao dessa importncia, vejamos o estudo de Bentes (2009, p.118-119): Esta anlise, que considera necessria a articulao entre diferentes recursos e nveis de linguagem para a explicao de elaborao de 926 Alfa, So Paulo, 56 (3): 917-944, 2012 registros e de estilos lingusticos (sejam eles cultos ou populares), insere- se na agenda de estudos sociolingusticos da chamada terceira onda (ECKERT, 2005), que pretende dar visibilidade aos complexos processos de elaborao de identidades, registros e estilos a partir da manipulao dos recursos das diferenas lingusticas no interior dos grupos sociais. (COUPLAND, 2001; BELL, 2001). Ao analisar a fala de Mano Brown, Bentes (2009) foca traos lingusticos que associa ao portugus no padro, como ausncia de concordncia explcita de nmero, e conclui que o comportamento do sujeito quanto ao trao considerado apenas corrobora a tendncia j afirmada em estudos sociolingsticos (NARO; SCHERRE, 2007; SCHERRE; NARO, 2007 apud BENTES, 2009, p.126). Os estudos referidos pela autora tomam por corpus amostras de bancos de dados sociolingusticos especifcamente o PEUL , o que os caracteriza como estudos de primeira onda. Hora e Wetzels (2011) tambm destacam a importncia dos estudos de primeira onda para os estudos de terceira: ao analisarem os efeitos estilsticos da variao em uma abordagem que procura se alinhar aos estudos de terceira onda entre o uso de oclusivas dentais e africadas na fala de Joo Pessoa, os autores dizem que Neste estudo, os dados coletados na Paraba (VALPB) refetem esse momento que Eckert denomina de primeira onda. (HORA; WETZELS, 2011, p.162). Assim, apesar da visibilidade e da nfase aos estudos alinhados tendncia da terceira onda dos estudos sociolingusticos, os estudos de primeira onda e, particularmente, as abordagens baseadas em bancos de dados sociolingusticos continuam a ter um signifcativo papel e importncia na sociolingustica brasileira. De um modo geral, bancos de dados constitudos de acordo com a metodologia da Sociolingustica so, ainda, importantes fontes para os estudos sociolingusticos. Faz-se necessrio, no entanto, aprimor-los para contemplar a dimenso da comunidade de prtica, do estilo e da personae, ou da terceira onda, nos termos de Eckert. Refexes nessa direo so tecidas na seo a seguir. Bancos de dados sociolingusticos no Brasil: potencialidades e limitaes Como vimos, apesar de a dinmica dos estudos de terceira onda focar relaes entre estrutura e prtica, a pesquisa sociolingustica baseada em bancos de dados segue mantendo seu espao no cenrio brasileiro, na medida em que possibilita captar tendncias amplas em uma comunidade de fala. Essa relao implica, entretanto, a homogeneizao da amostra e suas consequncias supergeneralizantes. A discusso sobre a homogeneizao da amostra de comunidades de fala no recente. Severo (2009, p.16) faz um retrospecto, apontando que atualmente 927 Alfa, So Paulo, 56 (3): 917-944, 2012 [...] as pesquisas sociolingusticas de variao/mudana (incluindo as labovianas) tm valorizado as dimenses micro de estudo, sendo que as unidades de anlise deixam de se centrar na comunidade de fala, para integrar as ideias de redes sociais e de comunidades de prtica. Bancos de dados baseados em comunidades de fala caracterizam-se pela seleo aleatria de seus informantes, que sejam nascidos na comunidade e onde tenham vivido pelo menos 2/3 da vida; que sejam flhos de pais com as mesmas caractersticas, alm de serem reconhecidos pelos pares como membro da comunidade de fala. A estratifcao dos informantes se d em funo de caractersticas sociodemogrfcas (sexo, idade, escolaridade etc.), gerando clulas sociais (confuncia de fatores estratifcadores), que devem tender ortogonalidade (GUY, 2007). Uma amostra estatisticamente representativa da comunidade de fala precisa contar com 0,5% do total da populao, margem de erro assumida nas cincias humanas. Freitag (2011b) tambm discute aspectos acerca da metodologia da constituio de amostras para bancos de dados sociolingusticos: Se os bancos de dados tm como objetivo subsidiar a descrio de uma dada variedade de lngua, e esta descrio, por conta da orientao terico-metodolgica, contempla a dimenso social, ser que a estratifcao das amostras homogeneizadas, como nos bancos de dados do PEUL e do VARSUL, refete a estrutura social do Brasil? (FREITAG, 2011b, p.44). Apenas a ttulo de ilustrao, vejamos a aplicao dos critrios de amostragem e representatividade assumidos pelos bancos de dados na aplicao aos bancos de dados Falantes Universitrios de Itabaiana/SE e Falares Sergipanos, que sero apresentados com mais detalhamento na seo a seguir. Suponhamos que um banco de dados seja constitudo a partir dos seguintes indicadores sociodemogrfcos: sexo, idade, escolaridade e zoneamento. Esse perfl social (dois sexos, trs escolaridades, cinco faixas etrias e dois zoneamentos) geraria 60 clulas sociais. Idealmente, so necessrios cinco falantes por clula social para garantir a confabilidade e a representatividade da amostra (MOLLICA; BRAGA, 2004); a condio mnima de constituio de clulas sociais prev dois falantes por clula (este o padro adotado no banco de dados do projeto VARSUL; o banco de dados do PEUL apresenta amostras com trs falantes). Assim, na condio metodolgica ideal, a amostragem seria constituda por 300 falantes; na condio mnima, 120 falantes. Agora vejamos o quo fdedigna a amostragem constituda: tomando por base os dados do Censo 2010, realizado pelo Instituto Brasileiro de Geografa e Estatstica IBGE (2010), publicados no Dirio Ofcial da Unio do dia 04/11/2010 e disponibilizados na internet para consulta interativa , a populao 928 Alfa, So Paulo, 56 (3): 917-944, 2012 do municpio de Itabaiana/SE de 86.019 habitantes; aplicando-se o corte de 0,5% (o mesmo que Labov usou em Marthas Vineyard), a amostra representativa da comunidade de fala deveria ser constituda por 430 falantes. A populao do municpio de Aracaju/SE de 552.365 habitantes; aplicando-se o corte de 0,5%, a amostra representativa da comunidade de fala deveria ser constituda por 2.762 falantes. A amostra ideal para Itabaiana/SE est relativamente prxima da amostra estatisticamente signifcativa; j para Aracaju/SE, a diferena sensivelmente alta. O quo fdedigna uma modelagem que homogeneiza duas amostras de populaes sensivelmente diferentes? As distores da homogeneizao vo alm: vejamos a distribuio da populao do estado de Sergipe quanto estratifcao etria, considerando os dados do Censo 2010, apresentados no grfco 1. Grfco 1 - Distribuio da populao do estado de Sergipe por faixas etrias. Fonte: Elaborao prpria com dados do IBGE (2010). A distribuio da populao por faixas etrias apresentada no grfco 1 aponta para uma reduo sensvel da faixa etria mais velha (com 65 anos ou mais), com aumento de populao na faixa etria de at 14 anos. Se a amostragem do banco de dados respeitasse a proporo da estratifcao da populao, em um cenrio de quatro indivduos por clula social, a faixa etria de 65 anos ou mais teria apenas um representante, e a faixa etria at 14 anos teria cinco representantes. A opo metodolgica por homogeneizar as amostras tem por implicao a restrio, ou ressalva, da generalizao dos resultados, embora reconheamos trabalhos que assumam a supergeneralizao. As ponderaes acima no signifcam a condenao dos bancos de dados constitudos nessa perspectiva; ao contrrio, so registros sistemticos e altamente produtivos para a identifcao de tendncias na comunidade, motivo que refora a necessidade de continuidade desse trabalho de armazenagem, mas no sem uma readequao metodolgica de 929 Alfa, So Paulo, 56 (3): 917-944, 2012 modo a contemplar as premissas da terceira onda. Na seo a seguir, discutimos aspectos metodolgicos que devem ser considerados na constituio de novos bancos de dados sociolingusticos (e tambm na ampliao dos j existentes), de modo que seja possvel a comparabilidade entre as amostras. Como vimos destacando, bancos de dados lingusticos tm sido fonte privilegiada para a descrio do portugus brasileiro e a tendncia recente dos estudos de terceira onda ratifca sua importncia para apontarem tendncias lingusticas na comunidade. Seguindo as premissas da confabilidade e da intersubjetividade (BAILEY; TILLERY, 2004), para dar continuidade a essa prtica produtiva, novos bancos de dados precisam conservar minimamente as estratifcaes dos bancos de dados j existentes, pois a comparao de dados em tempo real permite anlises mais acuradas com estudos de painel e de tendncia (LABOV, 2001). Assim, as variveis demogrfcas amplas sexo, idade, escolarizao etc. precisam continuar a ser controladas nas novas coletas e nas novas amostras constitudas; desejvel, entretanto, que as novas coletas aprimorem o controle do falante, suas caractersticas individuais e de prticas, de modo a permitir que se construa um perfl social que contemple indicadores sociodemogrfcos mais amplos e abstratos. Um exemplo desse tipo de controle o banco VarX: [...] a construo do VarX surgiu da necessidade de se estudar com mais profundidade aspectos referentes a classes sociais (ocupao/ profsso, renda/patrimnio e escolaridade) e suas implicaes lingusticas. (AMARAL, 2003, p.63). Nesse banco de dados, informaes mais acuradas sobre a regio onde o falante mora, se o tipo de sua casa corresponde ao padro do zoneamento, que tipos de bem de consumo possui, se sua profsso manual, tcnica ou intelectual, correlacionadas ao nvel de escolarizao, possibilitam um enquadramento mais prximo da realidade social do informante, desfazendo a homogeneizao da amostra. O banco de dados VarX estratifca esses indicadores, mas a simples incluso de mais questes relacionadas a fatores subjetivos nos questionrios/roteiros de entrevistas sociolingusticas j torna possvel que esse tipo de informao seja extrada das amostras. nessa linha tambm que vem seguindo o banco de dados Portugus Paulistano (MENDES, 2011), cujo objetivo a constituio de um corpus contemporneo do portugus paulistano que permita a sua descrio e anlise nos moldes da sociolingustica variacionista. Os novos bancos de dados sociolingusticos tm tambm investido em coletas que privilegiem a diversidade de tipos/sequncias textuais, de modo a captar estilos lingusticos mais prximos do dia a dia; o caso do projeto Amostra Lingustica do Interior Paulista ALIP, cujo banco de dados Iboruna constitudo por amostras do portugus falado na regio de So Jos do Rio Preto, e cidades circunvizinhas, na regio noroeste do Estado de So Paulo. 930 Alfa, So Paulo, 56 (3): 917-944, 2012 Em relao tendncia de homogeneizao da amostra, importante destacar que o Iboruna um banco de dados em que a distribuio dos informantes por clula social se d proporcionalmente densidade populacional das cidades da regio, como podemos ver no quadro 1. Quadro 1 - Distribuio dos informantes do bando de dados IBORUNA. Cidades da Regio de So Jose do Rio Preto Populao Numero de inIormantes 1. Bady Bassit (12 km ao sul de SJRP) 11.475 04 2. Cedral (14 km, ao sul de SJRP) 6.690 02 3. Guapiau (16 km, ao leste de SJRP) 14.049 05 4. Ipigua (18 km, ao norte de SJRP) 3.461 01 5. Mirassol (14 km, a oeste de SJRP) 48.233 16 6. Onda Verde (25 km, ao norte de SJRP) 5.407 02 7. So Jose do Rio Preto 357.705 122 Total da populao representada 447.020 152
Fonte: Gonalves (2008, p.2729). O cuidado em dimensionar a amostra de modo a garantir uma representao proporcional da populao, assim como as informaes do perfl dos falantes quanto a fatores sociodemogrfcos mais amplos colaboram para a confabilidade e a intersubjetividade da anlise, de acordo com as recomendaes de Bailey e Tillery (2004), apresentadas na introduo deste texto. Para respaldar estudos de terceira onda, novos bancos de dados precisam tambm promover a mudana do foco da comunidade de fala para a comunidade de prtica. Eckert e McConnel-Ginet (2010) explicitam o que entendem por comunidades de prtica: Uma comunidade de prtica pode ser constituda por pessoas trabalhando juntos em uma fbrica, habitus de um bar, companheiros de brincadeira em uma vizinhana, a famlia nuclear, parceiros policiais e seu etngrafo, a Suprema Corte etc. Comunidades de prtica podem ser grandes ou pequenas, intensas ou difusas; elas nascem e morrem, podem sobreviver a muitas mudanas de membros e podem estar intimamente articuladas a outras comunidades. As pessoas participam de mltiplas comunidades de prtica, e a identidade individual baseada nesta participao. Em lugar de conceber o indivduo como uma entidade parte, pairando sobre o espao social, ou como um ponto em uma rede, ou como membro de um conjunto especfco ou de um conjunto de grupos, ou como um amontoado de caractersticas sociais, precisamos enfocar as comunidades de prtica. Tal foco possibilita-nos ver o indivduo como agente articulador de uma variedade de formas de participao em mltiplas comunidades de prtica. (ECKERT; MCCONNEL-GINET, 2010, p.102-103). 931 Alfa, So Paulo, 56 (3): 917-944, 2012 A constituio de corpus de comunidade de prtica permite, por exemplo, a depender do tamanho da comunidade, que sejam considerados todos os indivduos. Permite, tambm, que se proceda ao mapeamento acurado das redes de relacionamento, observando os graus de integrao dos indivduos dentro da comunidade de fala. 5 Apesar dos pontos favorveis apresentados abordagem de comunidades de prtica, a sua implementao nica e exclusiva como fonte para os estudos sociolingusticos no benfca; alm de quebrar a srie histrica da comparabilidade de amostras de comunidades de fala (com coletas iniciadas na dcada de 1980, como vimos na seo anterior), a abordagem de comunidades de prtica, sem um estudo anterior baseado em comunidades de fala para levantar a(s) tendncia(s) ampla(s) a ser(em) analisada(s), um tiro no escuro que pode ou no resultar em uma boa investigao sociolingustica. Cada uma das abordagens apresenta suas particularidades e suas especifcidades, como sistematizamos no quadro 2. Quadro 2 - Comparao entre abordagens sociolingusticas de comunidades de fala e de comunidades de prticas. $ERUGDJHPGHFRPXQLGDGHGHIDOD $ERUGDJHPGHFRPXQLGDGHGHSUiWLFDV - estratiIicao baseada em Iatores sociodemograIicos amplos - estratiIicao baseada em valores localmente estabelecidos - distribuio homognea, tanto quanto ao tamanho quanto as categorias controladas - distribuio variavel, deIinida caso a caso - categorias deIinidas a priori - categorias deIinidas a posteriori - permisso para captar tendncias amplas da comunidade - permisso para captar valores sociais localmente estabelecidos nas relaes - coleta padronizada (entrevista sociolinguistica) - coleta etnograIica (observao participante, interaes entre grupos) - constituio da amostra em curto prazo - constituio da amostra em longo prazo Fonte: Elaborao prpria. Como podemos facilmente constatar, cada uma das abordagens apresenta peculiaridades que no permitem a implementao simultnea, por conta de incompatibilidades de natureza terico-metodolgica. Entendemos, no entanto, 5 Milroy e Gordon (2003) diferenciam as abordagens de investigao de redes sociais das de comunidades de prtica: enquanto, em redes sociais, o objetivo identifcar o n social que importante para o indivduo; em comunidades de prtica, o objetivo identifcar o agrupamento que forma o local da prtica lingustica e da prtica social. 932 Alfa, So Paulo, 56 (3): 917-944, 2012 que vivel a articulao entre as abordagens, e que essa articulao deve constar como proposta programtica nas novas coletas de dados. O ponto de partida , no entanto, a abordagem de comunidades de fala, pois a partir dessa coleta que possvel delinear as tendncias amplas da comunidade (e garantir a comparabilidade entre amostras, na medida que adotada uma metodologia j consolidada) e captar pistas para defnir abordagens de comunidades de prtica. Nas sees a seguir, nos dedicamos apresentao de trs novos bancos de dados no nordeste brasileiro Bancos de fala culta de Itabaiana/SE, Falares Sergipanos, e FALA-Natal , contemplando aspectos metodolgicos da terceira onda de estudos sociolingusticos. Banco de fala culta de Itabaiana/SE Localizada na regio do agreste central sergipano, a cidade de Itabaiana a cidade mais importante do Estado de Sergipe fora da regio da Grande Aracaju. Abrigando uma central de abastecimento e uma feira de porte signifcativo para a regio, a cidade conhecida por sua fama de comrcio forte, atuando como entreposto comercial na circunvizinhana. O itabaianense tem uma atitude muito positiva quanto a si e quanto sua cidade (FREITAG; SANTOS; SANTOS, 2009). Apesar de j haver um polo universitrio particular, a implantao do campus de Itabaiana da Universidade Federal de Sergipe, em 2006, decorrente do programa do governo federal de expanso e interiorizao da educao superior no Brasil, provocou grandes alteraes na cidade de Itabaiana e circunvizinhana. Com oferta anual em dez cursos de graduao, escolhidos de acordo com as peculiaridades e necessidades da regio (nas reas de gesto e educao), a estrutura do campus de Itabaiana recebe diariamente cerca de 2.500 alunos, em trs turnos de funcionamento, com concentrao no perodo noturno. Ser universitrio uma conquista familiar da maioria: pesa a responsabilidade de ser o primeiro universitrio em uma famlia de pais que no tiveram oportunidade de acesso escolarizao. Os primeiros exames vestibulares de Itabaiana tiveram uma concorrncia superior concorrncia dos mesmos cursos no campus sede da Universidade Federal de Sergipe, trazendo de volta aos estudos alunos que estavam no mercado de trabalho. Ser universitrio da Universidade Federal de Sergipe em Itabaiana um diferencial para esses indivduos em seus nichos familiares; traz a responsabilidade e o compromisso com o estudo. Durante pelo menos quatro horas por dia, esses estudantes travam contatos prximos, compartilhando valores e conhecimentos (no s dos seus cursos especfcos, mas do saber universitrio e sua funo social). A estrutura da unidade acadmica multicursos facilita o contato e a interao entre todos os alunos; alm disso, por muitos virem de cidades circunvizinhas (algumas distantes mais de 50 km de Itabaiana, como 933 Alfa, So Paulo, 56 (3): 917-944, 2012 o caso do municpio de Carira, na divisa entre Sergipe e Bahia), alm do contato na universidade, h o contato durante o trajeto, em nibus de transporte escolar (muitos subsidiados pelas prefeituras). Esse vnculo entre os universitrios fca explcito materialmente por meio da identifcao no vesturio: embora no seja obrigatrio o uso de uniforme, os graduandos de cada curso se unem e elaboram a camiseta do seu grupo (que pode ser do curso todo, de uma turma do curso ou de parte de uma turma), que utilizada diariamente como um uniforme, mas com a fnalidade de marcar a identidade e o pertencimento ao grupo no entre os pares universitrios, mas nas suas redes de relacionamento de origem. O acesso universidade propicia, tambm, oportunidades de insero nos programas institucionais remunerados (iniciao cientfca, iniciao docncia, extenso, monitoria etc.), de carter meritocrtico. A participao nesses programas vista como positiva e gera expectativas de continuidade e ascenso nos estudos, alando os universitrios rumo ps-graduao. O engajamento social verifcado entre os universitrios do campus de Itabaiana da Universidade Federal de Sergipe nos permite defni-los como constituintes de uma comunidade de prtica, nos termos do que propem Eckert e McConnell- Ginet (2010). No h um limite geogrfco especfco para defnir essa comunidade, mas um limite de comportamento, preservao e compartilhamento de valores associados ao ser universitrio de uma instituio pblica no interior. Em termos lingusticos, ser universitrio pressupe a passagem por 11 anos de escolarizao formal (ou, em casos de exames supletivos, demonstrar o domnio de contedos equivalente a esse tempo de escolarizao), em que h um contato direto com a cultura letrada e, por hiptese, o domnio da norma culta da lngua. Na sociedade brasileira, o ser universitrio est associado ao saber (havia um programa de televiso no formato pergunta-resposta que facultava aos participantes dispor da ajuda universitria). Pelo signifcado social que possui, pelo tipo de exigncia do prprio contexto (que prioriza seminrios, exposies orais, debates etc. como formas de avaliao), o ambiente universitrio , pois, um dos espaos onde a norma culta falada se manifesta. Ainda que em outros momentos, no seu ncleo familiar, por exemplo, o universitrio faa uso de uma variedade lingustica marcada por traos estigmatizados (o rotacismo, por exemplo), e ainda que o seu colega tambm faa uso desse trao, enquanto estiverem desempenhando seus papis nessa comunidade de prticas universitria, ambos tendem ao monitoramento para a no ocorrncia do trao em questo. O banco de dados Falantes Cultos de Itabaiana/SE (CAAE - 0301.0.107.000-11) foi constitudo tomando por base o constructo de comunidade de prtica. composto por 20 entrevistas, estratifcadas por gnero do entrevistador e do entrevistado e abrangendo a faixa etria dos 19 aos 32 anos, realizadas de acordo com protocolo da entrevista sociolingustica (envolvendo temas como risco de vida, narrativas da infncia etc.), mas com o diferencial de que o entrevistador e o entrevistado so membros da comunidade de 934 Alfa, So Paulo, 56 (3): 917-944, 2012 prtica sob anlise, o que faz com que a assimetria seja sensivelmente diminuda. Outro fator importante a ser considerado que todos os entrevistados e todos os entrevistadores se conhecem, o que no costuma acontecer, por exemplo, em coletas em comunidades de fala. 6 Por haver esse envolvimento, a conduo da interao em alguns momentos sai do molde da entrevista sociolingustica, especialmente naqueles em que o tpico discorrido est relacionado com o que constitui a comunidade de prtica: o que ser o primeiro universitrio da famlia, a oportunidade de ser universitrio em Itabaiana, prospeces para o futuro. Esses temas so comuns a entrevistado e a entrevistador e, em alguns momentos, a interao assume a forma de desabafo, confdncia, compartilhamento, o que mais uma evidncia em favor da constituio efetiva da comunidade de prtica. importante destacar que o banco de dados no foi constitudo para subsidiar, em princpio, estudos ditos de terceira onda. Seu propsito inicial foi dar suporte ao estudo do fenmeno de variao e mudana em categorias verbais do portugus, em uma perspectiva baseada em frequncias de uso. 7 A modelagem da amostra, porm, permite no s estudos de cunho quantitativo, mas tambm estudos de carter mais etnogrfco, na medida em que as entrevistas so ricas em informaes sobre o ser universitrio. O banco de dados encontra-se em fase de reviso e em breve ser disponibilizado comunidade cientfca como mais uma fonte para estudos descritivos de variedades do portugus falado. Banco de falares sergipanos A constituio e/ou ampliao de bancos de dados sociolingusticos, contemplando uma variedade do portugus brasileiro ainda no mapeada (ou pouco mapeada), como o caso de Sergipe, altamente desejvel, motivo que levou proposio do banco de dados Falares Sergipanos (CAAE - 0386.0.107.000-11). Por entendermos as ondas propostas por Eckert (2012) no como suplementares, mas complementares, a constituio de novos bancos de dados no pode abrir mo da comparabilidade com os bancos de dados j constitudos. Nessa linha de raciocnio, o banco de dados Falares Sergipanos 6 Deve-se destacar que o corpus do projeto SP2010 constitudo pelo critrio bola de neve de seleo de informantes (MILROY; GORDON, 2003) um indica o outro , procedimento que no se verifca em outros bancos de dados, a exemplo do VARSUL. 7 Projeto Variao na expresso do tempo verbal passado na fala e escrita de Itabaiana/SE: funes e formas concorrentes (FREITAG, 2009), fnanciado pela FAPITEC (Edital FAPITEC/FUNTEC-SE Universal 06/2009 Processo n. 019.203.00910/2009-0) e CNPq (Edital MCT/CNPq/MEC/CAPES 02/2010 - Cincias Humanas, Sociais e Sociais Aplicadas Processo n. 401564/2010-0). 935 Alfa, So Paulo, 56 (3): 917-944, 2012 (FREITAG, 2011a), 8 em processo de implementao, segue duas linhas de coleta a de estratifcao homogeneizada e a de comunidades de prtica. A estratifcao homogeneizada predominante nos bancos de dados j constitudos, como apresentamos em seo anterior. Para o dimensionamento da amostra, foram selecionadas seis cidades representativas do estado de Sergipe, por territrios Canind de So Francisco, Itabaiana, Lagarto, Estncia, Propri e Aracaju (fgura 1). A estratifcao etria dos informantes segue a padronizao do IBGE (2010), computando cinco faixas (at 14 anos; 15-24; 25-39; 40-64; mais de 65 anos). A seleo dos informantes (inicialmente dois para cada clula social) seguir a abordagem bola de neve, a partir do contato inicial de pesquisador de campo da comunidade, o que ser viabilizado pelo fato de a Universidade Federal de Sergipe contar com o curso de Letras na modalidade a distncia e a disciplina obrigatria Sociolingustica. Dadas as dimenses do estado e o fato de haver 14 polos universitrios, alguns dos quais nas cidades escolhidas para a constituio da amostra, no est prevista, inicialmente, a estratifcao por nvel de escolarizao, o que ser feito depois, ao ritmo da coleta, a partir de mapeamento qualitativo. Desse modo, a coleta inicial fornecer 40 entrevistas por cidade, totalizando 240 entrevistas. Paralelamente coleta de estratifcao homogeneizada, sero realizadas coletas voltadas para: i) identifcao de comunidades de prtica, aos moldes do banco de dados Falantes Cultos de Itabaiana/SE, apresentado anteriormente; e ii) observao de efeitos de sexo/gnero, com coletas de dados (entrevistas sociolingusticas) realizadas por dois entrevistadores: um homem e uma mulher, considerando que Bailey e Tillery (2004) relatam que h estudos que apontam indcios de que o sexo/gnero do entrevistador infuencia nos traos lingusticos do entrevistado, propiciando assim anlise mais acurada acerca da variao estilstica. Ademais, a partir da identifcao de tendncias amplas na amostra de estratifcao homogeneizada, podem ser realizadas coletas de dados mais particularizadas, que no podem ser defnidas aprioristicamente, mas sim a partir da observao emprica de uma realidade. 8 O projeto Falares Sergipanos integra um projeto maior, intitulado Da expressividade da lngua ao mal na literatura: base de pesquisas interinstitucionais do PPGL/UFS, fnanciado pelo edital CAPES/FAPITEC/SE 06/2012, que, em parceria com o Programa de Ps-Graduao em Lingustica da Universidade Federal de Santa Catarina (PPGLg/UFSC) e o Programa de Ps-Graduao em Literatura da Universidade Federal de Minas Gerais (Ps-Lit/UFMG), tem como um dos seus objetivos constituir o banco de dados Falares Sergipanos para respaldar a pesquisa da rea de concentrao Estudos Lingusticos do PPGL/UFS para descrio e estudos comparativos do portugus e aplicaes para o ensino de lngua estrangeira e materna. 936 Alfa, So Paulo, 56 (3): 917-944, 2012 Figura 1 - Distribuio das cidades constituintes do banco de dados Falares Sergipanos. Fonte: Freitag (2011a, p.04). Banco de Dados FALA-Natal Como j dito, estudos feitos sob a gide da sociolingustica variacionista vm fomentando a ampliao do conhecimento sobre o portugus brasileiro desde a dcada de 1970, atravs da descrio e da anlise de fenmenos variveis nos mbitos fonolgico, morfolgico, sinttico, semntico e discursivo. Contudo, h 937 Alfa, So Paulo, 56 (3): 917-944, 2012 estados da federao em que tais pesquisas so ainda incipientes ou mesmo inexistentes. o caso do Rio Grande do Norte, que no conta com um banco de dados de fala com as caractersticas necessrias para a pesquisa sociolingustica. Para suprir essa lacuna, Tavares e Martins (2012) propuseram-se a organizar um corpus de fala, que ser denominado Banco de Dados da Fala do Rio Grande do Norte (FALA-RN) e contar com amostras representativas de diferentes comunidades de fala norte-rio-grandenses. O marco inicial da organizao do FALA-RN ser a constituio do Banco de Dados FALA-Natal, que congregar entrevistas sociolingusticas a serem feitas com membros da comunidade de fala do municpio de Natal, que a capital e maior centro urbano do estado potiguar. Posteriormente, sero coletadas entrevistas sociolingusticas em comunidades de fala do interior. Os informantes do Banco de Dados FALA-Natal sero socialmente estratifcados de modo similar a informantes de bancos de dados j existentes no pas, a exemplo do PEUL, do VARSUL e do VALPB. Inicialmente, o Banco de Dados FALA-Natal ser composto por 48 entrevistas sociolingusticas com cerca de 60 minutos de durao. Essas entrevistas sero distribudas, em termos de estratifcao social, quanto ao sexo (24 informantes de sexo feminino e 24 informantes de sexo masculino), idade (12 informantes de 8 a 12 anos, 12 informantes de 15 a 21 anos, 12 informantes de 25 a 50 anos e 12 informantes de mais de 50 anos) e nvel de escolaridade (12 informantes com ensino fundamental I completo, 12 informantes com ensino fundamental II completo e 12 informantes com ensino mdio completo, alm de 12 informantes cursando o ensino fundamental I os indivduos de 8 a 12 anos). Sero gravados informantes de diferentes bairros das quatro zonas de Natal. De acordo com o Censo de 2010, a capital norte-riograndense tem, atualmente, 803.739 habitantes (IBGE, 2010). Se considerarmos uma amostragem na condio metodolgica ideal, aplicando o corte de 0,5% da populao, o banco de dados FALA-Natal deveria contar com 4.019 entrevistas. Em condies reais, o desenvolvimento de um banco de dados com esse nmero de entrevistas demandaria anos de realizao. Com o signifcativo crescimento da populao, se adotssemos tal condio para o desenvolvimento do banco, quando a ltima entrevista fosse realizada, a comunidade, com certeza, j no seria a mesma. Alm disso, a quantidade de informantes tambm depende de fnanciamento e de quanto tempo se dispe para a organizao do banco de dados, fatores que, em geral, impedem a coleta de um grande nmero de entrevistas. De qualquer forma, um nmero menor de entrevistas pode ser representativo de tendncias gerais da comunidade. Segundo Sankoff (1988, apud TAGLIAMONTE, 2006, p.23), necessrio [...] no que a amostra seja uma verso em miniatura da populao, mas apenas que tenhamos a possibilidade de fazer inferncias sobre a populao com base na amostra. Cada banco de dados deve ter um 938 Alfa, So Paulo, 56 (3): 917-944, 2012 mnimo de representatividade com base em idade, sexo, classe social e/ou nvel de educao, o que assegura que a diversidade lingustica da comunidade de fala esteja representada na amostra. Lembramos que a maior coleta de entrevistas sociolingusticas j feita foi dirigida por Shuy et al., tendo sido gravadas 702 entrevistas em Detroit, nos Estados Unidos. No entanto, as anlises mais detalhadas desse corpus utilizaram apenas 48 dessas entrevistas, com os informantes distribudos simetricamente em quatro classes sociais, em um total de 12 informantes por classe (TAGLIAMONTE, 2006). No caso do Brasil, os bancos de dados costumam ter de dois a trs informantes por clula social, o que tende a ser sufciente para a obteno dos padres gerais de variao de uma comunidade de fala no que diz respeito a diversos fenmenos variveis. Quanto ao Banco de Dados FALA-Natal, caso algumas caractersticas de uso lingustico varivel chamem, por alguma razo, a ateno no conjunto das 48 entrevistas sociolingusticas iniciais, outras entrevistas podero ser realizadas com os mesmos ou outros informantes , no sentido de possibilitar uma anlise mais refnada desses usos. Uma vez coletadas e armazenadas, as entrevistas integrantes do Banco de Dados FALA-Natal podero servir de corpus para pesquisas que objetivem: i) a descrio e a anlise da fala de Natal; ii) a comparao com outros dialetos brasileiros, com o intuito de descrever o portugus brasileiro de modo mais abrangente e detalhado, e de observar diferenas e semelhanas interdialetais; iii) a comparao com outras vertentes do portugus, como a europeia; iv) a testagem de teorias lingusticas; v) investigaes de natureza social, histrica, antropolgica, psicolgica, entre outras. Na constituio do banco de dados FALA-Natal, que est em desenvolvimento, 9
temos nos defrontado com uma srie de questes para as quais temos buscado solues. Entre essas questes, apontamos: i) representatividade da amostra; ii) difculdade de localizao de informantes com certos traos socioeconmicos; iii) necessidade de maior diferenciao de faixas etrias para testar hipteses relativas aquisio e mudana lingustica; iv) estratgias para tornar acessveis comunidade acadmica os bancos de dados sociolingusticos (e as questes ticas a implicadas); v) validade da comparao de anlises realizadas com base em dados extrados de entrevistas sociolingusticas feitas recentemente com anlises realizadas com base em dados extrados de entrevistas sociolingusticas feitas h dez ou vinte anos; vi) como considerar aspectos relacionados questo da anlise estilstica pelo vis da terceira onda, nos termos de Eckert. 9 Estamos em fase de elaborao da estrutura do banco de dados e de seleo de informantes, bem como de treinamento da equipe que realizar as entrevistas. A previso que sejam gravadas at maro de 2013 as 48 entrevistas que comporo o banco de dados em sua fase inicial. 939 Alfa, So Paulo, 56 (3): 917-944, 2012 Em relao a esse ltimo tpico, inicialmente sero coletadas entrevistas sociolingusticas em uma comunidade de fala ampla a de Natal para que seja possvel a realizao de mapeamentos de tendncias gerais de variao e de mudana em relao a essa comunidade, ou seja, em sua primeira fase, o Banco de Dados Fala Natal ser composto por entrevistas que permitiro a realizao de estudos alinhados primeira onda da sociolingustica. Todavia, nossa comunidade de fala alvo abriga, naturalmente, inmeras comunidades de prtica. Com a inteno de aprofundarmos nosso conhecimento acerca das comunidades de prtica em que se engajam cada um dos informantes a serem selecionados para o banco de dados, elaboramos uma fcha social a ser preenchida previamente entrevista na qual constam, entre outras, questes que permitem a obteno de informaes a respeito das diferentes comunidades de prtica em que se engaja o informante em sua vida cotidiana. Nessa fcha social, solicitamos, por exemplo, para os informantes de 15 a 21 anos, que respondam s seguintes questes: (i) Como ocupa seu tempo livre? e (ii) Participa de algum grupo (igreja/ jovens/ esporte/ clube)? Se sim, com que frequncia? Tambm podero ser propostos, nas entrevistas, tpicos que estimulem o informante a discorrer sobre as diferentes comunidades de prtica das quais faz parte. Com esse fm, elaboramos um roteiro para as entrevistas com sugestes de perguntas que o entrevistador pode fazer ao entrevistado. Entre essas perguntas, esto questes do tipo: (i) Com quem voc passa o tempo, alm das pessoas da sua famlia? O que vocs fazem juntos? Que tipo de lazer vocs tm? (ii) Voc participa de algum trabalho voluntrio? Como ? (iii) Voc participa de algum grupo de jovens? O que vocs fazem juntos? (iv) Voc participa de algum grupo da igreja? Como ? (v) Voc frequenta algum clube? Qual? Como ? (vi) Algo interessante j aconteceu no clube/grupo de jovens/grupo da igreja quando voc estava l? O que foi? (vii) Descreva o que voc faz em um dia, desde que acorda at ir dormir. Esse maior conhecimento sobre as comunidades de prtica em que se integra cada informante que ser obtido com base nas fchas sociais e nas prprias entrevistas poder ser levado em conta na anlise dos fenmenos variveis. Todavia, as informaes presentes nas fchas sociais e nas entrevistas no apenas fornecero subsdios para uma caracterizao mais aprofundada de cada informante no que tange a traos sociais e de prtica, como tambm traro indcios a respeito de quais comunidades de prtica entre as inmeras de que participa cada indivduo so mais importantes para a realizao de estudos nos moldes das segunda e terceira ondas da sociolingustica. Esses indcios fundamentaro as etapas posteriores de construo do Banco de Dados FALA-Natal, em que sero coletadas entrevistas adequadas para contemplar as duas ltimas ondas. 940 Alfa, So Paulo, 56 (3): 917-944, 2012 Ou seja, para a organizao do Banco de Dados FALA-Natal, estamos conscientes da necessidade de organizar no somente um conjunto de entrevistas sociolingusticas que possibilitem a realizao de pesquisas afliadas abordagem variacionista alinhada a Labov (um retrato amplo de comunidades de fala defnidas geografcamente), mas tambm abordagem etnogrfca alinhada a Milroy (um retrato local, etnogrfco, de comunidades de fala defnidas geografcamente) e abordagem da identidade social alinhada Eckert (um retrato do(s) indivduo(s) integrante(s) de comunidades de prtica, pelo vis do estilo como elemento central de constituio da persona). Pretendemos, pois, num futuro prximo, tornar disponveis fontes de dados viveis para pesquisas encaixadas em qualquer uma das trs ondas da sociolingustica. Consideraes fnais Como destacamos na introduo, a constituio de um banco de dados sociolingustico tarefa dispendiosa e ao mesmo tempo altamente produtiva, por subsidiar estudos de fenmenos variveis em diferentes nveis lingusticos, com diferentes interfaces tericas, para vrios pesquisadores. Considerando o estado da arte da Sociolingustica no Brasil, e observando a tendncia ao direcionamento para estudos de terceira onda (ECKERT, 2012), manifestada j por pesquisadores brasileiros, mas ainda no implementada de forma plena, defendemos que os novos bancos de dados devem, sim, contemplar aspectos relacionados a esta abordagem, mas sem abandonar a tradio consolidada de bancos de dados de estratifcao homogeneizada baseados em indicadores sociodemogrfcos amplos, ditos de primeira onda. Dado que o interesse em metodologia uma caracterstica da Sociolingustica e que, como dizem Bailey e Tillery (2004), nem sempre a confabilidade e a intersubjetividade tm prevalecido nos estudos sociolingusticos de cunho variacionista, defendemos a necessidade de continuidade de uma metodologia de constituio de corpus j consolidada, a fm de permitir a comparao entre amostras, inclusive em tempo real. FREITAG, R. M.; MARTINS, M. A.; TAVARES, M. A. Brazilian Portuguese sociolinguistic databases and third wave studies: potentialities and limitations. Alfa, So Paulo, v.56, n.3 p.907-934, 2012. ABSTRACT: Spoken linguistic databases especially those designed for research with a Variationist Sociolinguistics approach has been a privileged source for the description of Brazilian Portuguese. In this paper, we discuss methodological procedures that should be adopted in the development of new databases. We trace a short retrospect on already established databases and propose the collection and expansion of corpora from different speech communities and from different communities of practice. Eckert (2012) describes 941 Alfa, So Paulo, 56 (3): 917-944, 2012 the three analytical practices most commonly embraced by sociolinguistics studies. Each one of these three waves (in Eckerts terms) refects distinct ways of approaching linguistic variation. We suggest strategies to standardize procedures in the development of databases taking into account the three waves of sociolinguistic inquiry, and we shed additional light on the third wave, still incipient in Brazil. The standardization of sociolinguistics databases would make contrastive investigations of different Brazilian dialects easier, contributing, in this way, to the proposition and refnement of generalizations and universal principles of variation and change. KEYWORDS: Sociolinguistics. Databases. Linguistic variation and change. Social factors. Style. REFERNCIAS AMARAL, L. C. A concordncia verbal de segunda pessoa do singular em Pelotas e suas implicaes lingusticas e sociais. 2003. 203f. Tese (Doutorado em Letras) Universidade Federal do Rio Grande do Sul, 2003. BAILEY, G.; TILLERY, J. Some sources of divergent data in sociolinguistics. In: FOUGHT, C. Sociolinguistic variation: critical refections. New York: Oxford University, 2004. p.1130. BENTES, A. C. Tudo que slido desmancha no ar: sobre o problema do popular na linguagem. Gragoat, Niteri, v.27, p.12-47, 2009. BISOL, L.; MENON, O. P. S.; TASCA, M. VARSUL, um banco de dados. In: VOTRE, S.; RONCARATI, C. (Org.). Anthony Julius Naro e a lingustica no Brasil: uma homenagem acadmica. Rio de Janeiro: 7 Letras, 2008. p.50-58. CAMACHO, R. G. Uma refexo crtica sobre a teoria sociolingustica. DELTA, So Paulo, v.26, n.1, p.141-162, 2010. CHESHIRE, J.; FOX, S. Was/were variation: a perspective from London. Language, Variation and Change, Cambrigde, v.21, p.1-38, 2009. ECKERT, P. Three waves of variation study: the emergence of meaning in the study of sociolinguistic variation. Annual Review of Anthropology, Palo Alto, n.41, p.87-100, 2012. ______. Linguistic variation as social practice. Oxford: Blackwell, 2000. ECKERT, P.; MCCONNELL-GINET, S. Comunidades de prticas: lugar onde co- habitam linguagem, gnero e poder (1992). In: OSTERMANN, A. C.; FONTANA, B. (Org.). Linguagem, gnero, sexualidade: clssicos traduzidos. So Paulo: Parbola, 2010. p.93-108. 942 Alfa, So Paulo, 56 (3): 917-944, 2012 ______. Communities of practice: where language, gender and power all live. In: COATES, J. (Ed.). Language and gender: a reader. Oxford: Blackwell, 1997. p.484-494. FERRARI, L. V. Variao lingustica e redes sociais no Morro dos Caboclos. 1994. 204f. Tese (Doutorado em Lingustica) - Universidade Federal do Rio de Janeiro, Rio de Janeiro, 1994. FREITAG, R. M. K. Banco de dados de falares sergipanos. 2011. Projeto de Pesquisa, Universidade Federal de Sergipe, Sergipe, 2011a. ______. O social da sociolingustica: o controle de fatores sociais. Diadorim, Rio de Janeiro, v.8, p.43-58, 2011b. ______. Variao na expresso do tempo verbal passado na fala e escrita de Itabaiana/SE: funes e formas concorrentes. 2009. Projeto de Pesquisa, Universidade Federal de Sergipe, Sergipe, 2009. FREITAG, R. M. K.; SANTOS, J. C.; SANTOS, S. Fio do cano: marca lingustica identitria do itabaianense. InterSciencePlace, [S.l.], v.5, p.1-13, 2009. Disponvel em: <http://www.interscienceplace.org/interscienceplace/article/viewArticle/55>. Acesso em: 23 mar. 2012. GONALVES, S. C. L. Projeto ALIP (Amostra Lingustica do Interior Paulista). In: MAGALHES, J. S.; TRAVAGLIA, L. C. (Org.). Mltiplas perspectivas em lingustica. Uberlndia: Ed. da UFU, 2008. p.2726-2739. Disponvel em: <http:// www.flologia.org.br/ileel/artigos/artigo_478.pdf>. Acesso em: 22 mar. 2012. GUY, G. R. Introduo anlise quantitativa da variao lingustica. In: GUY, G. R.; ZILLES, A. M. Sociolingustica quantitativa: instrumental de anlise. So Paulo: Parbola, 2007. p.19-46. HORA, D.; WETZELS, L. A variao lingustica e as restries estilsticas. Revista da ABRALIN, Braslia, n. esp., p.147-188, 2011. Disponvel em: <http://www.abralin. org/revista/RVE1/v4.pdf>. Acesso em: 22 mar. 2012. IBGE. Censo demogrfco 2010. Braslia, 2010. Disponvel em: <http://www. censo2010.ibge.gov.br>. Acesso em: 22 mar. 2012. LABOV, W. Principles of linguistic change: social factors. Oxford: Blackwell, 2001. MENDES, R. B. SP-2010: construo de uma amostra da fala paulistana. 2011. Projeto de Pesquisa, Universidade de So Paulo, So Paulo, 2011. MILROY, L.; GORDON, M. Sociolinguistics: method and interpretation. Oxford: Blackwell, 2003. 943 Alfa, So Paulo, 56 (3): 917-944, 2012 MOLLICA, M. C.; BRAGA, M. L (Org.). Introduo sociolingustica: o tratamento da variao. So Paulo: Contexto, 2004. MOORE, E. Interaction between social category and social practice: explaining was/were variation. Language Variation and Change, Cambrigde, v.22, p.347- 371, 2010. PODESVA, R. J. Phonation type as a stylistic variable: the use of falsetto in constructing a persona. Journal of Sociolinguistic, Hoboken, v.11, p.478-504, 2002. PODESVA, R. J.; ROBERTS, S. J.; CAMPBELL-KIBLER, K. Sharing resources and indexing meanings in the production of gay styles. In: PODESVA, R. J. et al. (Ed.). Language and sexuality: contesting meaning in theory and practice. Stanford: CSLI Press, 2002. p.17590. SANKOFF, D.; TAGLIAMONTE, S.; SMITH, E. Goldvarb X: a variable rule application for macintosh and windows. Department of Linguistics of University of Toronto, Toronto, 2005. SCHERRE, M. M. P. Anlise e mapeamento de trs fenmenos variveis no portugus brasileiro. Projeto de pesquisa, Universidade Federal do Esprito Santo, Vitria, 2011. Disponvel em: <http://www.linguistica.ufes.br/sites/www. linguistica.ufes.br/fles/Projeto%20de%20Pesquisa%20PPGEL%20-%20UFES%20 -%20Marta%20Scherre.pdf>. Acesso em: 22 mar. 2012. SCHERRE, M. M. P.; RONCARATI, C. Programa de Estudos sobre o Uso da Lngua (PEUL): origens e trajetrias. In: VOTRE, S.; RONCARATI, C. (Org.). Anthony Julius Naro e a lingustica no Brasil: uma homenagem acadmica. Rio de Janeiro: 7 Letras, 2008. p.37-49. SEVERO, C. G. A comunidade de fala na sociolingustica laboviana: algumas refexes. Voz das Letras, Concrdia, n.9, p.01-17, 2008. Disponvel em: <http:// www.nead.uncnet.br/2009/revistas/letras/9/92.pdf>. Acesso em: 22 mar. 2012. TAGLIAMONTE, S. Analysing sociolinguistic variation. Cambridge: Cambridge University Press, 2006. ______. Was/were variation across the generations: view from the city of York. Language Variation and Change, Cambrigde, v.10, p.153-191, 1998. TAVARES, M. A. Sequenciao de informaes na fala de Natal (RN) e de Florianpolis (SC): um estudo sociofuncionalista comparativo. 2002. Projeto de Pesquisa, Universidade Federal do Rio Grande do Norte, Natal, 2002. 944 Alfa, So Paulo, 56 (3): 917-944, 2012 TAVARES, M. A.; MARTINS, M. A. Banco de Dados FALA-Natal: primeiras consideraes. Manuscrito. 2012. WENGER, E. Communities of practice: learning, meaning, and identity. Cambridge: Cambridge University Press, 1998. ZHANG, Q. Rhotacization and the Beijing Smooth Operator: the social meaning of a linguistic variable. Journal of Sociolingusitic, Hoboken, v.12, p.201222, 2008. Recebido em abril de 2012 Aprovado em julho de 2012