4322/978-85-99829-84-4
Resultados
Preliminares
Organizao de
Waldemar Ferreira Netto
So Paulo, 2016
http://dx.doi.org/10.4322/978-85-99829-84-4-0
Apresentao
Esta coletnea rene alguns dos resultados obtidos nas
pesquisas realizadas no mbito do projeto ExProsodia. Os
autores todos foram ou so membros da equipe que tem
atuado desde o ano de 2007, quando demos incio a esse
projeto. Naquele momento, era nossa inteno criar um
aplicativo que fizesse a anlise automtica da entoao da fala
totalmente baseado na experincia que as interpretaes dos
etmusiclogos tinham com as mais diferentes manifestaes
musicais. No entanto, logo nas primeiras tentativas,
reconhecemos que as dificuldades para a consecuo disso
eram imensas, uma vez que envolviam variveis sobre as quais
no tnhamos nenhuma notcia. A exiguidade de trabalhos
lingusticos que abordassem essa questo, fez-nos buscar em
outras reas informaes sobre a entoao.
Esse dilogo com as demais cincias exigiu-nos rever no s
nossos princpios tericos mas tambm nossa metodologia de
trabalho, de maneira a restabelecer os pontos de contato que
eventualmente se perderiam no monlogo cientfico que a viso
de algumas das correntes tericas da lingustica provocou. Uma
das formas desse restabelecimento foi a insero de prticas
experimentais que partiam de fatos lingusticos observados e
tratados quantitativamente. Aqui e ali, no correr do sculo XX
tentativas dessa natureza j haviam sido feitas em diversas
reas do estudo das lnguas, mas nem sempre com a
continuidade desejada. A grande exceo, que merece o maior
destaque, vem dos estudos sociolingusticos que foram
estimulados por William Labov e que serviram de paradigma
para um grande nmero de outros estudos. A despeito dessa
II
Apresentao
III
IV
Apresentao
VI
Sumrio
Apresentao ................................................................................. I
Anlise automtica de manifestaes emocionais em PB:
aplicaes do programa ExProsodia
Waldemar Ferreira Netto ............................................................... 1
A percepo de variao em semitons ascendentes em
palavras isoladas no Portugus Brasileiro
Fernanda Consoni; Waldemar Ferreira Netto .................................. 19
A percepo de variao em semitons descendentes em
palavras isoladas no portugus brasileiro
Amanda Lassak .............................................................................. 24
A variao em semitons na sincronia de interao em
entrevistas
Mayara de Sousa; Amanda Lassak; Renata Rosa ........................... 26
A variao de tom em texto espontneo memorizado longo
Marcus V. M. Martins ..................................................................... 28
Avaliao do tom mdio em manchetes telejornalsticas
apresentadas por mulheres
Gdalva da Conceio ...................................................................... 39
Relao entre variao de tom mdio da fala e
comportamento do falante
Thiago Martins ............................................................................... 42
Correlaes entre variao de tom e discurso em textos lidos
Vitor Pereira ................................................................................... 46
Determinao de tempo mdio mnimo necessrio para a
determinao de um padro emocional na entoao frasal
Lucas Negri ..................................................................................... 49
A questo da correlao entre a anlise automtica das
finalizaes prosdicas e a separao intuitiva de frases em
textos longos
Renata Rosa; Fernanda Consoni; Waldemar Ferreira Netto ............ 61
http://dx.doi.org/10.4322/978-85-99829-84-4-1
10
11
14
16
F/E
menor_FEpos_UBI
maior_FEpos_UBI
media_FEpos_UBI
dp_FEpos_UBI
skew_FEpos_UBI
mediana_FEpos_U
BI
cv_FEpos_UBI
kurt_FEpos_UBI
menor_FEneg_UBI
maior_FEneg_UBI
media_FEneg_UBI
dp_FEneg_UBI
skew_FEneg_UBI
mediana_FEneg_U
BI
cv_FEneg_UBI
kurt_FEneg_UBI
Durao
menor_intraUBI
maior_intraUBI
media_intraUBI
dp_intraUBI
skew_intraUBI
mediana_intraU
BI
cv_intraUBI
menor_interUBI
maior_interUBI
media_interUBI
dp_interUBI
mediana_interU
BI
cv_interUBI
Intensidade
menor_rmsUBI
maior_rmsUBI
media_rmsUBI
dp_rmsUBI
skew_rmsUBI
mediana_rmsU
BI
cv_rmsUBI
kurt_rmsUBI
Pausa
menor_pausa
maior_pausa
media_pausa
dp_pausa
skew_pausa
mediana_paus
a
cv_pausa
kurt_pausa
num_pausa
num_pausaUB
I
18
http://dx.doi.org/10.4322/978-85-99829-84-4-2
20
2st
3st
4st
34
52
68
15
32
55
67
117
74
33
Total
140
140
140
140
21
22
23
http://dx.doi.org/10.4322/978-85-99829-84-4-3
25
http://dx.doi.org/10.4322/978-85-99829-84-4-4
Metodologia
A anlise baseou-se no corpus coletado por Sousa (2009),
composto por 30 conversas e entrevistas entre duas pessoas
10 conversas entre homens (H-H), 10 entre mulheres (M-M) e
10 entre homens e mulheres (M-H). Os dados foram analisados
pela rotina ExProsodia (FERREIRA NETTO, 2008). Foram
realizadas anlises comparativas entre os tons subsequentes
utilizados pelos pares de interlocutores de cada dilogo.
Apresentao e Discusso dos resultados
A anlise dos tons utilizados pelos falantes aponta para o fato
de que a variao conjunta de movimentos, levando em conta a
premissa dos 3 semitons ascendentes, foi observada em apenas
16% dos casos. A anlise particularizada do grupo H-H
evidenciou que em 30% dos casos ocorreu a variao
perceptivelmente relevante, no grupo M-M foi de 10% e no MH 10%. Esses resultados corroboram a hiptese de Sousa (2009)
no que diz respeito influncia do contexto situacional e
emocional dos falantes na interao. Segundo a autora, as
conversas entre homens seriam construdas por discusses e
debates, na maioria das vezes, sobre temas polmicos. Na
tentativa de acompanhar o tom mdio de seu interlocutor, o
falante elevaria sua tessitura e faria, assim, com que o
interlocutor procurasse um nvel ainda mais alto para rebater
ou acrescentar seus argumentos.
27
http://dx.doi.org/10.4322/978-85-99829-84-4-5
Marcus V. M. Martins
fosse um elemento estruturador. Neste sentido, esta pranlise no tinha carter descritivo no que se refere a anlise
prosdica, apenas o intuito de se organizar as mesmas. A
segunda proposta, refere-se a anlise prosdica, propriamente
dita, isto se haveria alguma relao entre a variao dos
valores de F0, produzidos por um falante em uma situao de
narrao, com estes elementos estruturais da narrativa oral.
Descrio das atividades
Dadas tais propostas a coleta de corpus pressupunha uma
espontaneidade do discurso. Com o intuito de facilitar a coleta
e, principalmente, de evitar que o carter acadmico da
pesquisa viesse a interferir, optamos por coletar as gravaes
em sites, como o Youtube, ou em centros de memria e museus
de pequenas cidades onde houvesse este tipo de gravao.
A segunda etapa aps esta coleta referia-se a transcrio
ortogrfica e a segmentao das mesmas, uma vez que a Rotina
ExProsodia opera com pores menores em sua anlise, por
uma limitao do programa base, no caso o Microsoft Excel.
Desta maneira, a segmentao visava recortar um texto longo,
no caso a narrativa oral em parcelas menores, frases. Nosso
parmetro para a segmentao frasal foram os seguintes:
30
31
Marcus V. M. Martins
33
Marcus V. M. Martins
34
35
Marcus V. M. Martins
37
Marcus V. M. Martins
38
http://dx.doi.org/10.4322/978-85-99829-84-4-6
Gdalva da Conceio
M.Positiva
M.Negativa
2,0
0,0
Concluso
A variao significativa da tonalidade resultou da necessidade
dos locutores marcarem a caracterstica negativa para seus
discursos. A despeito desses resultados significativos
encontrados, verificou-se que a variao decorreu da maior
incidncia de valores mais baixos para as manchetes negativas e
40
41
http://dx.doi.org/10.4322/978-85-99829-84-4-7
43
Thiago Martins
Mdia
Alterado
166
141
151
174
158
No alterado
111
119
104
135
117,25
44
45
http://dx.doi.org/10.4322/978-85-99829-84-4-8
g1.globo.com;maisband.band.com.br;
www.redetv.com.br;www.youtube.com/user/rederecord
As restries foram: voz masculina, discurso jornalstico e
notcia completa sem interrupo. Utilizamos o software Adobe
Audition para as amostras. A anlise acstica do corpus se fez
com o software Speech Filing System, que converteu os dados
sonoros em uma lgica compreensvel para a rotina ExProsdia.
As amostras foram filtradas individualmente para a remoo de
rudos e sons alheios anlise.
Resultados
Na Tabela 1, os resultados das amostras foram separados por
falante (marcados nas linhas pelos nmeros), tipo de amostra
(feliz/agradvel e triste/desagradvel) e resultados de anlise
(frequncia mdia e tom mdio). No encontramos nenhum
padro ao analisar as estruturas como um todo. As amostras
foram produzidas sem diferenas quanto alterao de
frequncia mdia e tom mdio. O teste de correlao no
mostrou um r2 significativo para a comparao entre as
categorias semnticas (feliz ou triste) e as categorias de tom
mdio e de frequncia mdia. Pela proximidade dos resultados
(6 de 15 pares tristes/desagradveis menores que os pares
alegres/agradveis, 4 de 15 pares tristes maiores que os alegres
e 5 de 15 com resultados iguais) podemos dizer que no h um
padro na comparao de resultados comparados entre si.
47
Vitor Pereira
Freq.
Feliz mdia
Tom
Freq.
mdio Triste mdia
Tom
mdio
1-
124,9971 b1
1-
122,141
b1
2-
130,7052 c2
2-
131,7589
c2
3-
146,4579 d2
3-
144,757
d2
4-
160,222
e2
4-
158,3903
d#2
5-
150,8299 d2
5-
159,6148
d#2
6-
178,466
6-
181,871
f#2
7-
183,3938 f#2
7-
196,6561
g2
8-
168,9232 e2
8-
187,5074
f#2
9-
174,9827 f2
9-
163,3822
e2
10-
203,9993 g#2
10-
178,2342
f2
11-
122,9202 b1
11-
124,9738
b1
12-
155,2668 d#2
12-
159,0695
d#2
13-
155,6733 d#2
13-
163,0269
e2
14-
126,0693 b1
14-
131,2227
c2
15-
114,4568 a#1
15-
99,42589
g1
f2
Consideraes finais
Segundo Wennerstrom (2001), h possibilidade destes padres
estarem combinados com estruturas semnticas das oraes.
Uma possibilidade essas estruturas que marcam a emoo
na fala estarem nos fonemas, como define Grammont (1933).
48
http://dx.doi.org/10.4322/978-85-99829-84-4-9
Lucas Negri
50
51
Lucas Negri
52
- kurt_F0_UBI curtose de F0
- num_UBI quantidade de UBIs no trecho
- UBI_final frequncia da UBI final
- TM-mUBI diferena entre o TM e o menor valor de UBI (a rigor
TM - menor_F0_UBI)
- menor_TM menor frequncia alcanada no tom mdio
- maior_TM maior frequncia alcanada no tom mdio
- TM tom mdio
- dp_TM desvio padro de TM
- skew_TM assimetria (skew) de TM
- mediana_TM mediana de TM
- kurt_TM curtose de TM
- cv_TM coeficiente de variao de TM
- menor_FEpos_UBI menor frequncia positiva alcanada de
foco/nfase
- maior_FEpos_UBI maior frequncia positiva alcanada de
foco/nfase
- media_FEpos_UBI frequncia mdia de foco/nfase positivo
- dp_FEpos_UBI desvio padro de foco/nfase positivo
- skew_FEpos_UBI assimetria (skew) de foco/nfase positivo
- extensao_FEpos_UBI mediana de foco/nfase positivo
- cv_FEpos_UBI coeficiente de variao de foco/nfase positivo
- kurt_FEpos_UBI curtose de foco/nfase positivo
- menor_FEneg_UBI menor frequncia negativa alcanada de
foco/nfase
-maior_FEneg_UBI maior frequncia negativa alcanada de
foco/nfase
- media_FEneg_UBI frequncia mdia de foco/nfase negativo
- dp_FEneg_UBI desvio padro de foco/nfase negativo
- skew_FEneg_UBI assimetria (skew) de foco/nfase negativo
- extensao_FEneg_UBI mediana de foco/nfase negativo
- cv_FEneg_UBI coeficiente de variao de foco/nfase negativo
- kurt_FEneg_UBI curtose de foco/nfase negativo
53
Lucas Negri
0,5 segundo
1 segundo
1,5 segundo
2 segundos
3 segundos
54
Bravo
3,2
5,7
7,6
9,6
13,6
Triste
3,2
4,9
6,1
8,9
12,7
Geral
3,2
5,3
6,8
9,2
13,1
Lucas Negri
56
57
Lucas Negri
58
59
Lucas Negri
60
http://dx.doi.org/10.4322/978-85-99829-84-4-10
62
Concluses Parciais
Esses resultados apontam para o fato de que tonicidade da
slaba final com tom baixo um fator importante para o
reconhecimento da finalizao das frases. Apontam tambm
para o fato de que com a anlise automtica da prosdia, tal
como a desenvolvemos, h uma margem de erro reduzida para
a
segmentao
de
frases
de
fala
espontnea.
63
http://dx.doi.org/10.4322/978-85-99829-84-4-11
11
Metodologia
O material coletado para anlise composto de narrativas orais
do ciclo dos cangaceiros nordestinos: Lampio e Antnio Silvino.
A coleta foi realizada em um pequeno povoado rural do interior
do Cear, com gravador digital Zoom H4. So narrativas
completas, mas de curta durao (menos de dois minutos).
Depois fizemos a transcrio silbica das narrativas por meio do
Speech Filling System (SFS). Esse material foi segmentado por
meio da ExProsdia (FERREIRA NETTO, 2006; 2010) e esta gerou
os dados necessrios para anlise.
Apresentao e discusso de resultados
Os resultados indicam que houve alterao dos dados
levando em conta os intervalos mnimos de percepo
(CONSON et alii; 2009).
65
66
http://dx.doi.org/10.4322/978-85-99829-84-4-12
12
68
CONTEDO
fixo
FORMA
PROSDICA
estabelecida
livre
poema
frmula
LEXICAL
livre escolha
de palavras
epopia
narrativa
69
70
71
72
73
74
o
o
ko
O
re
ro
bae
ro
36
ro
re
ja
ky
r
mo
ra_u
je
ko
ky
ro
re
gue
re
(vy)te
rei
ro
je
je
pe
ky
24
75
36
38
33
33
39
38
38
39
38
37
39
34
34
36
38
A#
A#
37
38
38
41
34
A#
35
34
36
35
A#
37
36
38
37
36
34
34
35
33
31
A#
A#
42
36
C
30
A#
A#
A#
C
A#
A#
A#
B
A
G
24
76
77
34
35
34
35
35
31
26
27
27
31
30
27
D#
D#
F#
D#
42
TM
F
36
30
G
24
D#
F#
D#
D#
78
F01
F02
F03
F04
F05
F06
F07
F08
F09
F10
F11
F12
TM
33
34
35
34
35
36
34
35
33
34
33
33
29
25
38
28
27
43
38
36
33
26
35
24
C#
D#
42
G
36
F
D
C
F
24
B
A
30
E
C#
D#
80
81
http://dx.doi.org/10.4322/978-85-99829-84-4-13
83
Natalina Costa
84
85
Natalina Costa
86
87
Natalina Costa
high
nfase
mdia5
170
150
mdia4
130
mdia3
110
mdia2
90
mdia1
70
finalizao
50
1
10
11
12
13
14
88
89
Natalina Costa
Concluso
Conforme as anlises que se apresentaram acima, verificamos
que a fala das senhoras guats e a das senhoras corumbaenses
mantm como caracterstica o fato de que as finalizaes
ocorrem em tom muito prximo ao da finalizao. Verificamos
tambm que a fala das senhoras guats mantm como
caracterstica as finalizaes e os tons mdios ocorrem em tom
mais grave do que a das senhoras e moas corumbaenses.
Dessa maneira, podemos caracterizar a fala das senhoras guats
pela presena simultnea de tom mdio com finalizao grave e
pela proximidade tonal entre finalizao e tom mdio"
90
http://dx.doi.org/10.4322/978-85-99829-84-4-14
14
92
93
ordem fisiolgica.
entoao devem
possvel, a sua
da entoao est
94
97
98
100
erros
Valores brutos
57
33
Porcentagem
63%
37%
erros
Valores brutos
51
39
Porcentagem
57%
43%
101
erros
Valores brutos
53
37
Porcentagem
59%
41%
erros
Valores brutos
59
31
Porcentagem
65,50%
34,50%
102
acertos
erros
Valores brutos
44
16
Porcentagem
73%
27%
CMM - SP
Acertos
erros
Valores brutos
45
15
Porcentagem
75%
25%
103
http://dx.doi.org/10.4322/978-85-99829-84-4-15
15
105
106
]-.01
HL
0,01
ML
0,09
HC
0,20
MC
0,33
HT
0,05
MT
0,18
HN
0,12
[.01-.02[
0,28 0,42 0,43 0,40 0,30 0,37 0,40
[.02-.03[
0,33 0,25 0,17 0,14 0,29 0,22 0,23
[.03-.04[
0,16 0,09 0,09 0,06 0,14 0,10 0,12
[.04-.05[
0,11 0,07 0,04 0,02 0,09 0,04 0,06
[.050,11 0,08 0,07 0,05 0,14 0,08 0,06
Tabela 1 Dados intervalares (linhas) referentes s
frequncias das variveis de sexo e emoo dispostas nas
colunas
MN
0,20
0,39
0,21
0,10
0,04
0,06
107
108
Discusso
A anlise das variaes das emoes por meio da aplicao do
teste de convolues gaussianas do histograma de alturas
apontou diferenas significativas entre os intervalos dos picos
de probabilidades. De maneira geral, a tendncia desses
intervalos acentuou-se de forma significativa nos intervalos
entre 1% e 2%. Esse fato se deu em praticamente todas as
manifestaes emocionais. Nas leituras masculinas e das
manifestao de tristeza masculina, houve um aumento
significativo na ocorrncia dos intervalos entre 2% e 3%. A
manifestao feminina da clera, entretanto, mostrou um
comportamento invertido, estabelecendo intervalos menores
do que 2%. Esse fato compreensvel pois, na manifestao de
clera h o aumento significativo do TM, e, portanto, uma
tenso extrema das pregas vocais, impossibilitando variaes
maiores.
109
Referncias
ALMEIDA JNIOR, A. Os reveladores da mentira. Revista da
Faculdade de Direito, Universidade de So Paulo, v. 35, n. 3,
p. 604-620, jan. 1940.
111
Referncias
112
113
Referncias
114
115
Referncias
116
117
Referncias
118
119
Referncias
120
121
Referncias
122
123
Referncias
124
125
Referncias
126
Sobre os autores
Amanda Lassak - Bacharel em Letras com habilitao e
licenciatura em ingls e em portugus em 2013; bolsista da PrReitoria de Pesquisa da Universidade de So Paulo,
desenvolvendo trabalho de Iniciao Cientfica sobre aspectos
da anlise automtica da entoao, na Unversidade de So
Paulo, em 2011.
Andr Ricardo de Souza - Bacharel em Msica com habilitao
em Composio e Regncia pela Universidade Estadual Paulista,
em 2004; Mestre em Msica pela Universidade Estadual
Paulista, com trabalho sobre a definio do gesto musical;
Doutor em Filologia e Lngua Portguesa pela Universidade de
So Paulo, com tese sobre as relaes entre a entoao nas
manifestaes vocais na fala e no canto, em 2014. Seu trabalho
se desenvolve na interface entre msica e linguagem, atuando
principalmente nas reas de tcnica e expresso vocal (canto e
fala), abordagens tericas da interpretao musical e
composio, e na investigao sobre a natureza do espetculo
dramtico-musical. professor adjunto na Universidade
Estadual do Paran, responsvel pelas disciplinas de canto coral
e regncia.
Dami Baz - Bacharel em Letras pela Universidade Estadual do
Mato Grosso do Sul em 1991; Mestre em Lingustica pela
Universidade de So Paulo, com trabalho sobre marcadores
conversacionais na lngua guarani, em 2007; Doutora em
Filologia e Lngua Portuguesa pela Universidade de So Paulo,
com trabalho sobre a entoao na fala e na msica em lngua
guarani, em 2011. Tem experincia no ensino de temas relativos
s reas de Lingustica e de Lngua Portuguesa. pesquisadora