=
= + + =
g
2 k
) 1 | k ( c ) 1 | k ( P ) 1 | g ( c ) 1 | g ( P ... ) 1 | 2 ( c ) 1 | 2 ( P ) 1 ( ECM (2.2)
De maneira anloga, obtem-se o ECM(2), ECM(3),..., ECM(g). Considerando
que ECM (k) ocorre com probabilidade
k
p com k = 1, 2,...,g ento:
) ( ... ) ( ) ( g ECM p ECM p ECM p ECM
g
+ + + = 2 1
2 1
(2.3)
logo,
}
= =
k
R
i
g i dx X f i k P ,..., 1 ) ( ) | (
(2.4)
) ) | ( ) | ( ... ) ) | ( ) | ( ) ) | ( ) | ( (
=
=
= =
+ + + =
1
1
2
1 2
1
2 2 1 1
g
k
g
k
k
g
k
g k c g k P k c k P k c k P p ECM
(2.5)
A regra de classificao consiste em se determinar
k
R (com k = 1, 2,...,g)
que tornem o ECM mnimo tanto quanto possvel, isto significa alocar
~
X na
populao
k
H de forma que:
) | ( ) (
2
1
i k c X f P
g
k
k
i
=
=
(2.6)
menor e, num caso de empate, X pode ser classificado em qualquer uma das
duas populaes para as quais o empate ocorre.
No caso de todos os custos serem iguais, suficiente alocar X na
populao
k
H em que:
=
=
g
k i
i
i
X f P
1
) (
(2.7)
39
menor. Mas essa quantidade ser menor quando o termo excludo ) ( X f P
k i
for
maior. Assim, a regra de classificao do ECM mnimo com custos iguais por falhas
de classificao alocar
~
X em
k
H se:
k i todo para X f P X f P
i i k k
= > ) ( ) (
(2.8)
ou, alternativamente, alocar X em
k
H se:
k i todo para X f P X f P
i i k k
= > ) ( ln ) ( ln
(2.9)
2.2.1.3 Anlise Discriminante para Duas Populaes Mtodo de Fischer
A idia de Fischer foi transformar observaes multivariadas s X' em
observaes univariadas s Y' tais que os s Y' das populaes
1
H e
2
H sejam
separadas tanto quanto possvel. Fischer tomou combinaes lineares de X para
criar os s Y' , dado que as combinaes lineares so funes de X e por outro lado
so de fcil clculo. Assim sendo
y 1
a mdia dos s Y' obtidos dos s x' pertencentes a
1
H (populao 1) e
y 2
a mdia dos s Y' obtidos dos s x' pertencentes a
2
H
(populao 2), Fischer selecionou a combinao linear que maximiza a distncia
quadrtica entre
y 1
e
y 2
relativamente variabilidade dos s Y' . Assim, seja:
) (
1 1
H = X E = valor esperado em uma observao multivariada em
1
H .
(2.10)
) (
2 2
H = X E = valor esperado de uma observao multivariada em
2
H .
(2.11)
e supondo a matriz de covarincia | | )' )( (
i i
X X E = E i = 1, 2 como sendo a
mesma para as duas populaes, e ainda considerando a combinao linear:
1 1 1 1
'
px xp x
X c Y =
(2.12)
tem-se :
40
1
1 1 1 1
' ) ( ' ) ' ( ) ( c X E c X c E Y E
y
= H = H = H =
(2.13)
2
2 2 2 2
' ) ( ' ) ' ( ) ( c X E c X c E Y E
y
= H = H = H =
(2.14)
e
c c c X V c X c V Y V
y
E = = = = ' ) ( ' ) ' ( ) (
2
o
(2.15)
que supostamente a mesma para ambas as populaes. Ento, segundo Fischer,
a melhor combinao linear a derivada da razo entre o quadrado da distncia
entre as mdias e a varincia de Y.
c c
c
c c
c c
c c
c c
y
y y
E
=
E
=
E
'
) ' (
'
)' )( ( '
'
) ' ' ( ) (
2
2 1 2 1
2
2 1
2
2
2 1
o
o
(2.16)
onde:
2 1
o = .
Assim, como
2 1
o = e X c Y ' = tem-se que
c c
c
E '
) ' (
2
o
maximizada por:
) (
2 1
1 1
o E = E =
k k c
para qualquer k 0.
(2.17)
Logo por multiplicidade com k = 1 tem-se:
X X c Y e c
1
22 1 2 1
1
)' ( ' ) (
E = = E =
,
(2.18)
que conhecida como Funo Discriminante Linear de Fisher. Ela transforma as
populaes multivariadas
1
H e
2
H em populaes univariadas, tais que as mdias
destas populaes so separadas tanto quanto possvel relativamente varincia
populacional, considerada comum. E, para classificar a observao multivariada
0
x
usa-se o modelo:
0
1
2 1
0
)' ( x y
E =
(2.19)
41
onde
0
y o valor da Funo Discriminante de Fisher para a nova observao
0
x , e
considerando-se o ponto mdio entre as mdias das duas populaes univariadas,
), (
2
1
2 1 y y
m + = (2.20)
como
), (
2
1
2
'
2
1
'
1
c c m + = (2.21)
| |
2
1
2 1 1
1
2 1
)' ( )' (
2
1
E + E = m (2.22)
| | ) ( )' (
2
1
2 1
1
2 1
+ E =
m (2.23)
tem-se que:
0 ) (
1 0
> H m y E
(2.24)
e
0 ) (
2 0
< H m y E
(2.25)
ou seja, se
0
x pertence a
1
H espera-se que
0
y seja igual ou maior do que o ponto
mdio m. Por outro lado se
0
x pertence a
2
H , o valor esperado de
0
y ser menor
que o ponto mdio. Portanto, a regra de classificao :
alocar
0
x em
1
H
se 0
0
> m y ;
alocar
0
x em
2
H se 0
0
< m y .
Os parmetros
1
,
2
e E geralmente so desconhecidos. Ento, supondo
que se tem
1
n observaes da varivel aleatria multivariada
1
x de dimenso p , ou
seja, tem-se uma amostra aleatria da populao
1
H e
2
n observaes da varivel
aleatria multivariada
2
x de dimenso p que corresponde a uma amostra aleatria
de populao
2
H , os resultados amostrais correspondentes so:
42
=
=
1
1
1
1
1
1
n
i
i
x
n
x ;
=
1
1
1 1 1 1
1
1
)' )( (
1
1
n
i
i i
x x x x
n
S
(2.26)
=
=
2
1
2
2
2
1
n
i
i
x
n
x ;
=
2
1
2 2 2 2
2
2
)' )( (
1
1
n
i
i i
x x x x
n
S
(2.27)
Assumindo que as populaes sejam assemelhadas, natural considerar a
varincia como a mesma, da estima-se a matriz de covarincia comum E pela
matriz de covarincia amostral calculada com as amostras conjuntas,
) 2 (
) 1 ( ) 1 (
2 1
2 2 1 1
+
+
=
n n
S n S n
S
p
(2.28)
que um estimador no viciado daquele parmetro E .
Consequentemente, a Funo Discriminante Linear de Fischer Amostral
dada por:
x S x x X c Y
p
1
2 1
)' (
= = (2.29)
e a estimativa do ponto mdio entre as duas mdias amostrais univariadas,
1 1
x c y = (2.30)
e
2 2
x c y = (2.31)
dada por:
| |
2
1
2 1 1
1
2 1 2 1
)' ( )' (
2
1
) (
2
1
x S x x x S x x y y m
p p
+ = + =
) ( )' (
2
1
2 1
1
2 1
x x S x x m
p
+ =
(2.32)
Finalizando, a regra de classificao do item caracterizado pelo vetor
0
x :
Se 0
0
> m y ento
0
x alocado em
1
H
ou
Se 0
0
< m y ento
0
x alocado em
2
H
43
A combinao linear particular x S x x x c Y
p
1
2 1
)' ( '
= = maximiza a razo:
c S c
d c
c S c
x c x c
S
y y
p p y
'
) ' (
'
) ( ) (
2
2 2 1 1
2
2
2 1
=
(2.33)
onde:
2 1
x x d = (2.34)
e
2
) ( ) (
2 1
1
2
2 2
1
2
1 1
2
2 1
+
=
= =
n n
y y y y
S
n
i
i
n
i
i
y
(2.35)
2.2.1.4 Discriminao Entre Diversas Populaes
O mtodo anterior que vlido para duas populaes g=2, pode ser
estendido para diversas populaes g>2. O primeiro objetivo de Fischer com o
mtodo foi o de separar populaes, podendo ser usado tambm para classificar
novos itens em uma das populaes. Esse mtodo no necessita da suposio de
que as diversas populaes sejam normais multivariadas, porm necessrio
assumir que as matrizes de covarincia populacionais sejam iguais, ou seja,
E = E = = E = E
g
...
2 1
.
Assim preciso testar a hiptese de igualdade das matrizes de covarincia,
ou seja E = E = = E = E
g
H ... :
2 1 0
. Ento tem-se o seguinte teste:
Hiptese nula: E = E = = E = E
g
H ... :
2 1 0
Hiptese alternativa: Pelo menos uma das matrizes diferente das demais.
A estatstica de teste :
Estatstica de Teste
( )
2
1
|
|
.
|
\
|
=
i
n
p
i
S
S
M
44
onde:
i
S a estimativa da matriz de covarincia do grupo i;
p
S a estimativa da matriz de covarincia conjunta;
i
n o nmero de observaes do grupo i. (tamanho da amostra)
A transformao logartmica de M conduz a estatstica abaixo que de
tratamento matemtico mais adequado:
| |
2
1 1
2
1
1 1
1 1 1
) )( (
~ ln ) ( ln ) ( ) (
+ +
= =
)
`
=
g p p
g
i
i i p
g
i
i
S n S n c B _
(2.36)
com
(
+
+
(
(
(
(
=
=
) 1 )( 1 ( 6
1 3 2
) 1 (
1
1
1
2
1
1
g p
p p
n
n
c
g
i
g
i
i
i
(2.37)
onde:
p a dimenso do vetor x (nmero de variveis);
i
n o tamanho do grupo i;
g o nmero de grupos.
Ento uma vez aceita a hiptese nula
0
H de igualdade entre as matrizes de
covarincia, seja o vetor mdio dos diversos grupos (populaes), representado
por:
=
=
g
i
i
g
1
1
(2.38)
e
0
B a matriz Soma de produtos cruzados entre grupos populacionais tal que:
=
=
g
i
i i
B
1
0
)' )( (
(2.39)
a combinao linear x c Y ' = tem por esperana:
i
i
c x E c Y E ' ) ( ' ) ( = H =
(2.40)
45
para populao
1
H e varincia:
c c c X V c Y V
y
E = = = ' ) ( ' ) (
2
o (2.41)
para todas as populaes. Desta forma, o valor esperado
i
iy
c ' = muda quando a
populao da qual
~
X selecionado outra. Tem-se ento uma mdia global:
=
= =
g
i
iy y
c
g
1
'
1
(2.42)
e a razo entre a Soma dos quadrados das distncias das populaes para a mdia
global e a varincia de Y
c c
c B c
E '
'
0
, que uma generalizao multigrupal do caso de
duas populaes. Medindo a variabilidade entre grupos de valores (escores) Y
relativamente variabilidade comum dentro dos grupos, da mesma forma do que no
caso de duas populaes, pode-se selecionar c que maximiza esta razo.
conveniente normalizar c tal que 1 ' = Ec c .
Sejam 0 ...
2 1
> > > >
s
os ) , 1 min( p g s s autovalores no-nulos de
0
1
B
E
e
s
e e e ,..., ,
2 1
os correspondentes autovetores (escalonados tais que 1 ' = Ec c ). Ento,
fcil provar que o vetor de coeficientes c que maximiza
c c
c B c
E '
'
0
dado por
1 1
e c = .
A combinao linear X c '
1
chamada de primeira discriminante e de forma idntica,
pode-se generalizar para o k-simo discriminante com
k k
e c = , com k = 1, 2,..., s.
Como geralmente E e
i
no so conhecidas, tomam-se amostras aleatrias de
tamanho
i
n das populaes g i
i
,..., 2 , 1 , = H e denotamos o conjunto de dados da
populao , ,..., 2 , 1 , g i
i
= H por
p n
Y
i
tem-se os estimadores dos parmetros
i
e
dados por:
=
=
i
n
j
ij
i
i
x
n
x
1
1
(2.43)
=
= =
=
=
= =
g
i
i
g
i
n
j
ij
g
i
i
g
i
i i
n
x
n
x n
x
i
1
1 1
1
1
(2.44)
46
A Matriz Soma de produtos cruzados entre grupos
0
B estimada por:
=
=
g
i
i i
x x x x B
1
0
)' )( (
(2.45)
e um estimador para E pode ser obtido com base na matriz W.
= = =
= =
g
i
g
i
i i
n
j
ij ij
S n x x x x W
i
1 1 1
) 1 ( )' )( (
(2.46)
Consequentemente,
p
g
g g
g
S
g n n n
S n S n S n
g n n n
W
=
+ + +
+ + +
=
+ + + ...
) 1 ( ... ) 1 ( ) 1 (
...
2 1
2 2 1 1
2 1
(2.47)
Assim, o mesmo c que maximiza a razo
c S c
c B c
p
'
'
0
tambm maximiza
c W c
c B c
'
'
0
.
Logo, apresentar-se- otimizante c na forma mais usual, que o autovalor
i
e da
matriz
0
1
B W
, porque se e e B W
0
1
=
ento e g n n n e B S
g o p
) ... (
2 1
1
+ + + =
,
portanto, concluindo que sejam 0 ...
2 1
> > > >
g
os autovalores no nulos de
0
1
B W
e
s
e e e ,..., ,
2 1
os correspondentes autovalores, sendo ) , 1 min( p g s s e
~
i
e normalizado tal que 1 =
i p i
e S e ; ento o vetor de coeficientes que maximiza a razo
citada acima
1 1
e c = e a combinao linear x e '
1
chamada primeira discriminante
amostral. Generalizando, tem-se no passo k o k-simo discriminante amostral
s k x e
k
s , ' .
2.2.1.5 Escore Discriminante Quadrtico de Classificao
Quando a hiptese nula,
0
H , enunciada no item anterior no aceita, uma
das alternativas optar-se pela tcnica do escore discriminante quadrtico de
classificao. Considere o vetor de variveis aleatrias X de populaes com
distribuio normal multivariada com mdia
i
e matriz de covarincia
i
E , ou seja,
47
g i X X X f
i
i
i
i
p i
,..., 2 , 1 , ) ( )' (
2
1
exp
) 2 (
1
) (
2 /
=
(
E
E
=
t
(2.48)
em que ) | (
i
i
x E H = o vetor de mdias e
i i
x V E = H ) | ( a matriz de covarincia.
Tem-se ainda que os custos 0 ) | ( = i i c e g k i k i k c ,..., 2 , 1 , , 1 ) | ( = = = e da
equao (2.7), a regra de classificar fica:
alocar X em
k
H se
( ) ( ) g i X X
p
p X f p
i
i
i
i i i i
,..., 2 , 1 , '
2
1
ln
2
1
) 2 ln(
2
ln ) ( ln
1
= E E
|
.
|
\
|
=
t
(2.49)
Na equao anterior pode-se ignorar a constante ) 2 ln(
2
t |
.
|
\
| p
j que a
mesma para todas as populaes. Define-se, ento, o escore discriminante
quadrtico de classificao
Q
i
d para a populao
i
H como:
( ) ( ) g i p X X X d
i
i
i
i
i
Q
i
,..., 2 , 1 , ln '
2
1
ln
2
1
) (
1
= + E E =
(2.50)
Com vrias populaes normais, a regra de classificao consiste em
classificar X em
k
H se:
g i X d X d
Q
i
i
Q
i
,..., 2 , 1 ), ( max ) ( = =
(2.51)
Considerando que os parmetros populacionais em geral no so
conhecidos, as equaes com os estimadores sero:
g i p X X S X X S D
i i i i i i
,..., 2 , 1 , ln ) ( )' (
2
1
ln
2
1
1
= + =
(2.52)
onde:
i
X o vetor mdio do grupo i,
i
S a matriz de covarincia do grupo i.
i
P a probabilidade a priori de um individuo ser classificado no grupo i.
48
2.2.2 Regresso Logstica
A funo Logstica surgiu em 1845, ligada a problemas de crescimento
demogrfico. Em tais aspectos esta funo desempenha um papel importante. A
partir da dcada de 30 esta metodologia passou a ser aplicada no mbito da biologia
Lima (2002).
Este mtodo, assim como a regresso linear e mltipla, estuda a relao
entre uma varivel resposta e uma ou mais variveis independentes. A diferena
entre estas tcnicas de regresso se deve ao fato de que na regresso logstica as
variveis dependentes esto dispostas em categorias discriminatrias enquanto na
regresso linear estas variveis so dados contnuos. Outra diferena que na
regresso logstica a resposta pode ser entendida como uma probabilidade de
ocorrncia ] 1 , 0 [ e p , enquanto na regresso linear obtm-se um valor numrico
9 e p .
2.2.2.1 Modelo de Regresso Logstica
Seja uma varivel aleatria Y (dicotmica) e ] ,..., , [ '
2 1 p
X X X X = um vetor de
dimenso p, composto de variveis aleatrias independentes e ainda tomando-se n
observaes independentes de Y e
i
X com i=1, 2, ..., p, pode-se escrever o modelo
de Regresso Logstica, na forma:
X X
e e
e
X P
X
' '
1
1
1
) (
'
~
| |
|
+
=
+
= (2.53)
onde: ] ,..., , [ '
1 0 p
| | | | = e ] ,..., , 1 [ '
1 p
X X X =
Segundo Johson & Wichern, (1998), esse modelo o mais apropriado no
caso da varivel dependente ser dicotmica, pois a Regresso Logstica estima
diretamente a probabilidade de ocorrncia de um evento. Estes autores, tambm
salientam que a estimao dos parmetros deve ser feita pelo mtodo da mxima
verossimilhana, sendo o mais recomendado quando dispe-se de observaes
individuais da ocorrncia ou no de determinado evento.
49
2.2.2.2 Modelo de Regresso Logstica Simples
Seja a amostra aleatria composta de n pares de observaes ) , (
i i
Y X com i
= 1, 2,...,n, onde os s Y' representam os valores observados de uma varivel
dicotmica, e os s X' representam os valores observados de uma nica varivel
independente.
Assim o modelo
X
X
e
e
X P
'
1
) (
|
|
+
= , torna-se:
) (
1 0 1 0
1 0
1
1
1
) ( ) | 1 (
X X
X
e e
e
X P X Y P
| | | |
| |
+ +
+
+
=
+
= = = (2.54)
Essa expresso fornece a probabilidade condicional de que Y seja igual a 1,
dado o valor de X, ou seja, ) 1 ( X Y P = . Neste caso necessrio estimar os valores
dos parmetros s ' | . Ento com isso determinando o modelo de Regresso
Logstica a probabilidade condicional de que Y ser igual a 0, :
) | 1 ( 1 ) 0 ( X Y P X Y P = = =
(2.55)
Portanto para as n observaes tm-se:
) ( ) 1 (
i i i
X P X Y P = =
e
) ( 1 ) 0 (
i i i
X P X Y P = =
(2.56)
O mtodo da Mxima Verossimilhana melhor mtodo para se estimar os
parmetros do modelo de Regresso Logstica, ou seja, fornece estimativas para os
parmetros que maximizam a probabilidade de obter o conjunto observado de
dados.
Uma forma conveniente para expressar a contribuio da funo de
verossimilhana para os pares ) , (
i i
Y X atravs da formula:
i i
Y
i
Y
i i
X P X P X F
=
1
)] ( 1 [ ) ( ) ( (2.57)
Desde que assumindo que as observaes so independentes, a funo de
verossimilhana obtida como o produto dos termos dados na equao (2.54) como
segue:
50
[ [
= =
= =
n
i
n
i
Y
i
Y
i i
i i
X P X P X F l
1 1
1
)] ( 1 ][ ) ( [ ) ( ) (|
(2.58)
Os estimadores de Mxima Verossimilhana destes parmetros so
escolhidos de forma a maximizar essa funo, ou seja, deseja-se determinar o
estimador para | que maximize a expresso anterior. Analisando essa funo do
ponto de vista matemtico mais fcil trabalhar com o logaritmo da mesma. Assim,
tem-se a funo de log-verossimilhana dada por:
(
=
(
= =
[ [
=
=
n
i
Y
i
Y
i
n
i
i
i i
X P X P X F l L
1
1
1
)] ( 1 ][ ) ( [ ln ) ( ln )) ( ln( ) ( | |
(2.59)
Assim:
=
+ =
n
i
i i i i
X P Y X P Y L
1
)] ( 1 ln[ ) 1 ( ))] ( ln( [ ) (|
(2.60)
Ento:
=
(
(
|
|
.
|
\
|
+
+
+
=
n
i
X
X
i
X
X
i
e
e
Y
e
e
Y L
1
'
'
'
'
1
1 ln ) 1 (
1
ln ) (
|
|
|
|
|
(2.61)
Temos:
=
(
(
|
|
.
|
\
|
+
+
+
=
n
i
X
i
X
X
i
e
Y
e
e
Y L
1
' '
'
1
1
ln ) 1 (
1
ln ) (
| |
|
|
(2.62)
Mas
) 1 ln( ) 1 ln( ln
1
ln
' ' ' '
'
'
X X X X
X
X
e e e e
e
e | | | |
|
|
+ = + =
|
|
.
|
\
|
+
(2.63)
e
) 1 ln( ) 1 ln( 1 ln
1
1
ln
' '
'
X X
X
e e
e
| |
|
+ = + =
|
|
.
|
\
|
+
(2.64)
51
Substituindo (2.63) e (2.64) em (2.62) temos:
=
+ + + =
n
i
X
i
X
i
e Y e X Y L
1
' '
))] 1 ln( )( 1 ( )) 1 ln( ' ( [ ) (
| |
| |
(2.65)
Assim:
=
+ + + + =
n
i
X
i
X X
i i
e Y e e Y X Y L
1
' ' '
)] 1 ln( ) 1 ln( ) 1 ln( ' [ ) (
| | |
| |
(2.66)
Concluindo:
=
+ =
n
i
X
i
e X Y L
1
'
)] 1 ln( ' [ ) (
|
| |
(2.67)
possvel demonstrar a concavidade global da funo de log-
verossimilhana sendo, portanto, apenas necessrio anular o vetor das primeiras
derivadas desta funo em relao a | para obter os estimadores de mxima
verossimilhana. Assim para determinar o valor de | que maximiza ) (| L deve-se
derivar ) (| L em relao
0
| e
1
| e igualar o conjunto de resultados a zero. Desta
forma tem-se a seguir as chamadas equaes de verossimilhana, que so
derivadas da expresso anterior em relao | .
0 )] ( [
1
) (
1 1
'
'
0
= =
|
|
.
|
\
|
+
=
c
c
= =
n
i
i i
n
i
X
X
i
X P Y
e
e
Y
L
|
|
|
|
(2.68)
0 )] ( [
1
.
) (
1 1
'
'
1
= =
|
|
.
|
\
|
+
=
c
c
= =
n
i
i i i
n
i
X
X
i i i
X P Y X
e
e
X Y X
L
|
|
|
|
(2.69)
Temos que:
= = =
=
+
=
n
i
n
i
i
X
X
n
i
i
X P
e
e
Y
1 1
'
'
1
) (
1
|
|
(2.70)
52
O que reflete no fato da soma dos valores observados de Y ser igual a soma
dos valores esperados (preditos), mediante a aplicao do modelo obtido. Esta
propriedade importante, pois ajuda avaliar o ajuste do modelo.
O valor de | dado pela soluo das equaes anteriores chamado de
estimador de mxima verossimilhana, denotado por |
. ) (
i
X P , e representa uma
estimativa da probabilidade condicional que Y igual a 1, so que X igual a
i
X .
2.2.2.3 Modelo de Regresso Logstico Mltiplo
Considerando-se uma amostra de n pares de observaes independentes
p i Y X
i i
,..., 2 , 1 ), , ( = , da mesma forma como ocorreu no caso univariado, item
anterior, o ajuste do modelo requer que se obtenha uma estimativa do vetor
] ,..., , [ '
1 0 p
| | | | = . O mtodo de estimao usado no caso multivariado ser o
mesmo no univariado, ou seja, o da mxima verossimilhana. A funo de mxima
verossimilhana aproximadamente idntica a dada na equao com uma
mudana, sendo que ) ( X P definido por:
X
X
i
e
e
X P X Y P
'
'
1
) ( ) | 1 (
|
|
+
= = = (2.71)
Estimar-se- (p+1) equaes de verossimilhana as quais so obtidas por
derivadas da funo log-verossimilhana com respeito (p+1) parmetros. As
equaes de verossimilhana resultantes podem ser representadas como:
| | 0 ) (
1
=
=
n
i
i i
X P Y
(2.72)
e
| | 0 ) (
1
=
=
n
i
i i ij
X P Y X
(2.73)
para j = 1, 2,..., p
Da mesma forma como ocorreu com o modelo univariado, as solues das
equaes de verossimilhana requer a utilizao de um mtodo iterativo na busca
dos parmetros estimados '
| .
53
2.2.3 Redes Neurais Artificiais (RNAs)
2.2.3.1 Definio de RNAs
Muitas definies foram elaboradas desde que as RNAs comearam a surgir
como uma nova perspectiva Inteligncia Artificial. Em todas elas prevaleceram s
semelhanas ao sistema nervoso humano. A maioria das pesquisas sobre RNAs
foram motivadas pela idia de que o crebro humano um computador com
processamento de informaes bastante complexas.
Haykin (2002) define as redes neurais como sendo: Uma rede neural um
processador maciamente paralelamente distribudo constitudo de unidades de
processamento simples, que tem a propenso natural para armazenar conhecimento
experimental e torn-lo disponvel para uso. Ela se assemelha ao crebro em dois
aspectos:
1. O de que o conhecimento adquirido pela rede a partir de seu
ambiente atravs de um processo de aprendizagem.
2. Foras de conexo entre neurnios, conhecidas como pesos
sinpticos, so utilizadas para armazenar o conhecimento adquirido.
Dessa forma, uma RNA pode ser definida como uma estrutura
computacional que tem como objetivo permitir a implementao de modelos
matemticos que representem a forma como o crebro humano processa as
informaes que adquire.
Apesar de muitas definies darem a impresso de simplicidade, de
fundamental importncia ressaltar que na prtica, essa idia no acontece de forma
to simples. Durante a implementao da RNA vrios fatores podem ocorrer
impossibilitando a aplicao em certos casos. Percebe-se tambm que as solues
no so precisas quando as RNAs so aplicadas isoladamente.
Tambm no se pode deixar de mencionar que ainda existe uma longa e
rdua trajetria a ser percorrida no sentido das pesquisas para chegar a uma
arquitetura computacional que reproduza fielmente a capacidade do crebro
humano.
54
2.2.3.2 Neurnio Artificial
O neurnio artificial a estrutura bsica de processamento de uma RNA. Os
neurnios artificiais so estruturas lgicas matemticas que tm o objetivo de
simular o funcionamento de um neurnio biolgico, fazendo com que a RNA atue de
forma indutiva. A figura 2.8 mostra um modelo de neurnio artificial, com suas
entradas ) ,..., , (
2 1 n
X X X , pesos sinpticos ) ,..., , (
2 1 nk k k
W W W , bias ) (
k
b , funo soma
) (E , funo de transferncia ) ( e sada ) (
k
a .
FIGURA 2.2 MODELO DE UM NEURNIO ARTIFICIAL
FONTE: O AUTOR
O neurnio funciona basicamente como integrador de sinais. Tem a funo
de coletar sinais provenientes de outros neurnios, ou sinais da entrada da rede,
ponderar os dados atravs de pesos especficos e repassar esses dados para outros
neurnios ou para sada da rede. De acordo com a figura 2. pode-se entender a
estrutura bsica de um neurnio artificial.
Para se calcular o sinal de sada ) (
k
a , efetuada por um neurnio desse tipo,
pode-se utilizar a equao a seguir:
|
|
.
|
\
|
+ =
=
k
i
ik i k
b
n
w x a
1
(2.74)
onde :
n = o nmero total de sinais de entrada que chegam at o neurnio que est
sendo calculado;
i
x = valor de entrada para esse neurnio;
ik
w
= peso associado a essa conexo;
k
b = tm a funo de aumentar ou diminuir a entrada da funo de ativao.
55
O resultado da somatria das componentes do produto interno entre o vetor
de entrada (X) e o vetor de pesos (W) do neurnio, mapeado atravs da funo de
ativao ) ( , produzindo o valor da sada ) (
k
a do neurnio ) (k .
2.2.3.3 Funes de Ativao de uma RNA
O objetivo de uma funo de ativao restringir a amplitude da sada do
neurnio, ou seja, limitar sua sada em um intervalo de valor finito.
A funo de ativao que define a sada do neurnio artificial, ou seja, o
caminho onde a informao ser conduzida, tornando-se muito importante para o
comportamento da RNA.
Os tipos de funo de ativao mais usados para mapear uma RNA so
basicamente trs: Limiar ou Degrau, Linear por partes e Sigmoidal. As
representaes grficas dessas funes de ativao so mostradas na figura 2.9, a
seguir.
FIGURA 2.3 FUNES DE ATIVAO DE UMA RNA
FONTE: O AUTOR
2.2.3.4 Caractersticas Gerais das RNAs
Uma das principais vantagens e importncia das RNAs a sua capacidade
de aprender sozinha atravs do seu prprio uso, e de melhorar seu desempenho
baseado nessa aprendizagem.
A capacidade de uma rede aprender vem dos neurnios artificiais, que tm
funcionamento baseado no neurnio biolgico. Embora parea simples, o
56
aprendizado um processo altamente complexo. Alm de envolver diversos nveis
de abstrao, tambm rene habilidades e conceitos advindos de vrias reas do
conhecimento e no h em relao a ele uma definio nica e plena.
Apesar da complexidade, a analogia com os elementos do crebro humano
essencial para entender-se de maneira satisfatria a estrutura e o funcionamento
de uma RNA.
Segundo Pandya e Macy (1996), o sistema nervoso de um ser humano,
assim como o de qualquer primata, consiste de trs estgios bsicos: o estgio
inicial, no qual os estmulos de entrada externos so captados pelas unidades
"sensoras" (os olhos, por exemplo, captam sinais visuais); o estgio de
processamento destes sinais pelo sistema nervoso central (o crebro) e o estgio no
qual as respostas aos estmulos de entrada so obtidas (a voz pode ser ativada em
reposta a determinada entrada, bem como aes motoras ou orgnicas).
De acordo com esta definio, o crebro humano recebe informaes do
meio exterior, processa, avalia e compara as outras informaes que tem
armazenado na memria, tornando-se apto a tomar decises apropriadas. As RNAs
so baseadas no funcionamento no crebro humano. Assim, ela estruturada de
maneira a simular todas as etapas de processamento das informaes. Segundo a
definio de Pandya e Macy (1996), uma RNA pode apresentar-se da seguinte
forma:
uma camada inicial de unidades sensoras aos estmulos de entrada, que no
composta por neurnios;
uma ou mais camadas intermedirias de neurnios interligados (formando a
estrutura central de processamento da rede neural);
uma camada de neurnios de sada, conectada aos neurnios da(s) camada(s)
escondida(s), gerando a resposta final da RNA.
A figura 2.4, a seguir, mostra a estrutura de uma RNA. As entradas da rede
representam a informao existente. Elas alimentam a primeira camada de
neurnios que atravs do clculo executado pela aplicao da funo de
transferncia, geram repostas que alimentam a camada seguinte, e assim atingem a
camada de sada.
57
FIGURA 2.4 REDE NEURAL ARTIFICIAL
FONTE: O AUTOR
A forma com que os neurnios se agrupam em camadas e o conjunto de
suas conexes define a arquitetura da RNA. As arquiteturas neurais so
organizadas em camadas, com os neurnios de uma determinada camada,
conectados aos neurnios da camada posterior. Os dispositivos processadores so
agrupados por pelo menos duas camadas: uma camada para apresentao dos
dados e outra para obteno dos resultados. As redes, em geral, possuem uma ou
mais camadas intermedirias, tambm conhecidas como camadas escondidas.
Segundo Haykin (2002) existem trs tipos de arquitetura de rede:
Redes alimentadas adiante com camada nica (feedforward): o termo
camada nica se refere a camada de sada, ou seja, o processamento ocorre
somente na camada de sada. A figura a seguir mostra um modelo de uma
rede feedforward com uma nica camada.
FIGURA 2.5 MODELO DE REDE NEURAL COM UMA CAMADA
FONTE: O AUTOR
58
redes alimentadas adiante com mltiplas camadas (feedforward): esta possui
uma ou mais camadas ocultas. A figura a seguir ilustra uma rede feedforward
com duas camadas uma oculta e uma de sada.
FIGURA 2.6 MODELO DE REDE NEURAL COM DUAS CAMADAS
FONTE: O AUTOR
redes recorrentes: possui pelo menos um lao de realimentao. A figura a
seguir ilustra esse tipo de arquitetura.
FIGURA 2.7 MODELO DE REDE NEURAL RECORRENTE
FONTE: O AUTOR
59
Geralmente as redes feedforward de mltiplas camadas apresentam a
seguinte estrutura:
Camada de entrada: onde os padres so apresentados rede; nesta
camada no ocorre o processamento de informaes;
Camadas intermedirias ou escondidas (no obrigatrias): recebem
informao da camada anterior, processam os dados e enviam a resposta
para a camada seguinte;
Camada de sada: local onde se obtm o resultado final atravs do
processamento das informaes vindas da camada anterior.
2.2.3.5 Treinamento de uma RNA de Mltiplas Camadas
Em geral o treinamento um processo gradual e lento, onde os pesos so
modificados vrias vezes, seguindo-se um algoritmo de treinamento que estabelece
a forma como estes pesos so alterados. O treinamento de uma RNA pode ser
efetuado de uma das seguintes maneiras:
Treinamento supervisionado: utilizado quando so conhecidos os valores
das sadas para um determinado grupo de padres. Para cada padro apresentado,
a RNA calcula a sada (valor obtido) e o compara com o valor desejado (real) e
atualiza os pesos das conexes entre todos os neurnios buscando reduzir o erro.
Redes de Retropropagao, GRNN (General Regression Neural Networks), PNN
(Probabilistic Neural Networks), e GMDH (Group Method Data Handling) so
exemplos de redes supervisionadas.
Treinamento no supervisionado: neste caso, como no se conhecem as
sadas, os pesos so modificados em funo de critrios internos.
2.2.3.6 Algoritmo Back- Propagation
Segundo Haykin (2002) e Fausett (1994), o algoritmo back-propagation o
algoritmo de aprendizado supervisionado mais conhecido. Este algoritmo de fcil
compreenso, o que favorece a sua utilizao.
60
Durante o treinamento com este algoritmo, a rede opera em dois estgios
fundamentais. No primeiro, forward (para frente), deve-se apresentar um padro
camada de entrada. Todo o processo realizado, camada por camada, at que se
obtenha uma resposta na camada de sada. Neste momento a sada obtida
comparada sada desejada e calcula-se o erro. No estgio seguinte, backward
(para trs), a propagao ocorre da camada de sada para a camada de entrada,
onde os pesos das conexes das camadas internas vo sendo modificados
conforme o erro retro propagado.
O ajuste corretivo nos pesos das conexes entre os neurnios, para se obter
uma boa aproximao da sada encontrada resposta desejada, ser realizado
passo a passo, at que se atinja uma situao estvel, ou seja, quando os pesos
no precisam mais ser ajustados.
2.3 AVALIAO DA FUNO DE CLASSIFICAO
2.3.1 Critrio TPM (Total Probability of Misclassification)
Uma das formas de avaliar o desempenho de um procedimento de
reconhecimento de padres consiste no clculo da taxa de erro de classificao
(Total Probability of Misclassifications - TPM) dado por:
X d X f p X d X f p TPM
R R
} }
+ =
1 2
) ( ) (
2 2 1 1
(2.75)
onde
1
p e
2
p so as probabilidades de uma observao pertencente a
1
H ou a
2
H ,
respectivamente.
O valor mnimo dessa quantidade, obtido pela escolha adequada das
regies
1
R e
2
R , chamado de taxa tima de erro (Optimum Error Rate - OER). A
OER dada por:
X d X f p X d X f p OER
R R
} }
+ =
1 2
) ( ) (
2 2 1 1
(2.76)
61
onde as regies so determinadas por:
1
2
2
1
1
) (
) (
p
p
X f
X f
R > = e
1
2
2
1
2
) (
) (
p
p
X f
X f
R < =
(2.77)
Assim a OER a taxa de erro mnima para a regra de classificao TPM. O
desempenho da funo de classificao da amostra pode, a princpio, ser avaliada
pelo clculo da taxa real de erro (Actual Error Rate - AER)
X d X f p X d X f p AER
R R
} }
+ =
1 2
2 2
1 1
) ( ) (
(2.78)
onde:
1
R e
2
n n
n n
AER E
+
+
=
(2.82)
2.4 ANLISE FATORIAL
A Anlise Fatorial foi introduzida por Spearman (1904). Foi inicialmente
usada nas reas de psicologia e cincias sociais, na tentativa de identificar os
fatores relacionados com a inteligncia humana e lig-los, de algum modo, etnia.
Devido a subjetividade e falta de unicidade de suas solues, tem sido alvo de
crticas ao longo dos anos (HILLS; KACHIGAN, 1977, 1991 apud MINGOTI, 2005).
Porm, uma das tcnicas multivariadas mais conhecidas e tem sido muito utilizada
na qumica (OZERENKO; GYULMALIEV; GAGARIN, 2007), na educao
(MARQUES, 2010a), na geologia (QUEIROZ et al., 2008), na economia
(ESQUARCINI, 2005), na agricultura (CHIGUTI, 2005), na engenharia de produo
(MLLER; CHAVES NETO, 2007), entre outras.
65
Segundo Hair et al. (2009), a Anlise Fatorial um mtodo estatstico
multivariado cujo propsito principal definir a estrutura subjacente em uma matriz
de dados. Em termos gerais, a Anlise Fatorial aborda o problema de analisar a
estrutura das interrelaes (correlaes) entre um grande nmero de variveis,
definindo um conjunto de dimenses latentes comuns, chamadas de fatores. O
objetivo principal da Anlise Fatorial resumir os dados, obtendo dimenses
latentes, que quando interpretadas e compreendidas, descrevem os dados em um
nmero muito menor de conceitos do que as variveis originais individuais.
Em linhas gerais Mingoti (2005) afirma que, o que se espera que as
variveis originais estejam agrupadas em subconjuntos de novas variveis
mutuamente no correlacionadas. Deste modo, em casos no qual se tem um grande
nmero de variveis medidas e correlacionadas entre si, seria possvel, a partir da
Anlise Fatorial, identificar um nmero menor de novas variveis alternativas, no
correlacionadas e que de algum modo sumarizassem as informaes principais das
variveis originais. A
Anlise Fatorial pode ser trabalhada de forma exploratria ou confirmatria.
No primeiro caso, busca-se encontrar os fatores subjacentes s variveis originais
amostradas, sem ter noo de quantos fatores sero obtidos e de que maneira as
variveis estaro agrupadas. Na Anlise Fatorial confirmatria, tem-se um modelo
inicial pr-estabelecido, onde se deseja verificar se este modelo proposto
consistente com os dados amostrais disponveis.
2.4.1 Modelo Fatorial Ortogonal
De acordo com Johnson e Wichern (2007), o vetor aleatrio X , com p
variveis aleatrias observveis, tem vetor de mdias e matriz de covarincia E .
O modelo fatorial linearmente dependente sobre variveis aleatrias no
observveis ) p m ( F ,..., F , F
m 2 1
s chamados fatores comuns e p fontes de variaes
ativas
p 2 1
,..., , c c c , chamadas de erros ou fatores especficos. O modelo fatorial
66
p m pm 2 2 p 1 1 p p p
2 m m 2 2 22 1 21 2 2
1 m m 1 2 12 1 11 1 1
F F F X
F F F X
F F F X
c + + + + =
c + + + + =
c + + + + =
(2.83)
ou em notao matricial
) 1 p ( ) 1 m (
) m p (
) 1 p (
F . L X
c + =
(2.84)
onde L a matriz de ordem m p contendo os pesos
ij
denominados
tambm como carregamento. Assim,
ij
o peso da i-sima varivel no j-simo
fator, ento a matriz L chamada de matriz de cargas fatoriais. O i-simo fator
especfico
i
c associado somente com a varivel resposta
i
X . Os p desvios
p p 2 2 1 1
X ,..., X , X so representados pelas p+m variveis aleatrias
p 2 1 m 2 1
,..., , , F ,..., F , F c c c , as quais no so observveis.
Com tantas quantidades no observveis e para tornar til o modelo fatorial,
algumas pressuposies sobre os vetores F e c devem ser feitas, tais como
m m 1 m
I ) ' F F ( E ) F ( Cov , 0 ) F ( E
= = =
(2.85)
(
(
(
(
(
= + = c c = c = c
p
2
1
p p 1 p
0 0
0 0
0 0
) ' ( E ) ( Cov , 0 ) ( E
(2.86)
e ainda F e c so independentes, ento
m p
0 ) ' F ( E ) F ( Cov
= c = c
(2.87)
Essa suposio e a relao em (2.86) constituem o modelo fatorial
ortogonal. A estrutura de covarincia para o modelo fatorial ortogonal, pode ser
obtida da seguinte forma:
67
| | )' X )( X ( E ) X ( V = = E
(2.88)
porm de (2.86) obtm-se
| |
| |
) ' ( E ) ' F ( LE ' L ) ' F ( E ' L ) ' F F ( LE
' ' F L ' L ' F ' L ' F F L E
)' F L )( F L ( E
c c + c + c + = E
c c + c + c + = E
c + c + = E
(2.89)
logo
+ + = E ' LL (2.90)
Desta forma, a covarincia entre as variveis e os fatores calculado por:
| |
| |
| |
) ' F ( E ) ' FF ( LE ) F , X ( Cov
' F ' FF L E ) F , X ( Cov
' F ) F L ( E ) F , X ( Cov
)' F ( E F )( X ( E ) F , X ( Cov
c + =
c + =
c + =
=
(2.91)
ou seja,
L ) L , X ( Cov = (2.92)
Sendo assim, por + + = E ' LL obtm-se
i
2
im
2
1 i i
... ) X ( V + + + = (2.93)
km im 1 k 1 i k i
... ) X , X ( Cov + + = (2.94)
e de (2.92) resulta que a covarincia entre a i-sima varivel e o j-simo fator :
ij j i
) F , X ( Cov =
(2.95)
A parte da varincia que a i-sima varivel contribui para os m fatores
comuns chamada de comunalidade, que dada por:
2
im
2
1 i
2
i
... h + + = (2.96)
e
i
so as varincias especficas.
68
2.4.2 Mtodo das componentes principais via matriz de covarincia
Usando a decomposio espectral pode-se fatorar a matriz de covarincia
E . Sejam ) e , (
i i
pares de autovalores autovetores da matriz E , com
0
p 2 1
> > > > . Ento:
p p p 2 2 2 1 1 1
' e e ... ' e e ' e e + + + = E
(2.97)
| |
(
(
(
(
(
= E
p p
2 2
1 1
p p 2 2 1 1
e .
e .
e .
e . e . e .
(2.98)
o qual ajusta a estrutura de covarincia prescrita para a anlise do modelo fatorial,
tendo m fatores (m=p) e a varincia especfica 0
i
= para todo p ,..., 2 , 1 i = . A matriz
de carga tem a j-sima coluna dada por
j j
e . . Desta maneira pode-se escrever,
' LL 0 ' L . L
) p p ( ) p p ( ) p p ( ) p p (
= + = E
(2.99)
entretanto nesse caso a representao de E exata, isto , o nmero de fatores
comuns igual ao nmero de variveis. Na prtica deve-se optar por modelos que
expliquem a estrutura da covarincia usando poucos fatores comuns. Para isso,
eliminam-se os ltimos (p-m) autovelores, que pouco contribuem para E .
Negligenciando esta contribuio, obtm a aproximao
| |
p m m p
m m
2 2
1 1
m m 2 2 1 1
' L L
e .
e .
e .
e . e . e .
=
(
(
(
(
(
= E
(2.100)
A representao anterior considera que os fatores especficos c definidos no
modelo fatorial ortogonal so de menor importncia e podem ser ignorados na
fatorao de E . Se os fatores especficos forem includos no modelo, a contribuio
69
deles pode ser estimada tomando-se os elementos da diagonal de ' LL E , onde ' LL
dado em (2.100).
Considerando-se os fatores especficos, encontramos a aproximao
+ + = E ' LL (2.101)
| |
(
(
(
(
(
+
(
(
(
(
(
= E
p
2
1
m m
2 2
1 1
m m 2 2 1 1
0 0
0 0
0 0
e .
e .
e .
e . e . e .
(2.102)
onde
=
o =
m
1 j
2
ij
2
i i
, com p ,..., 2 , 1 i =
A representao (2.102) quando aplicada a matriz de covarincia amostral S
ou a matriz de correlao amostral R conhecida como a soluo por componentes
principais do modelo fatorial.
2.4.3 Mtodo das componentes principais via matriz de correlao amostral
Realizando a decomposio espectral da matriz de correlao R, obtm os
pares de autovalores autovetores ) e , (
i i
, onde
p 2 1
> > > . Sejam p m< o
nmero de fatores comuns. Ento a matriz estimada das cargas fatoriais
ij
dada
por:
| |
m m 2 2 1 1
e . e . e . L
= (2.103)
As varincias especificas estimadas so os elementos da matriz diagonal
' L
S = , ento
(
(
(
(
(
= +
p
2
1
0 0
0 0
0 0
, com
=
=
m
1 j
2
ij
2
ii i
s
(2.104)
70
e as comunalidades so estimadas por:
2
im
2
1 i
2
i
...
+ + = (2.105)
A matriz residual pode ser obtida pela aproximao de S pela soluo por
componentes principais, sendo calculada por:
)
' L
( S + + (2.106)
onde os elementos da diagonal principal so zero, e os outros elementos tambm
so pequenos, quando escolhe-se o nmero de fatores m apropriado.
Analiticamente, tem-se a soma dos quadrados das entradas de
2
p
2
1 m
...
' L
( S + + s + +
+
(2.107)
Consequentemente, um pequeno valor para o somatrio dos quadrados dos
autovalores pode ser negligenciado, implicando um pequeno valor para a soma dos
quadrados dos erros da aproximao.
Geralmente a contribuio dos primeiros fatores comuns para a varincia
amostral das variveis pode ser grandes. A contribuio para a varincia amostral
ii
s
do primeiro fator comum p ,..., 2 , 1 i ,
1 i
= . Para o primeiro fator, a soma dos
quadrados das cargas fatoriais :
1 1 1
'
1 1
2
1 p
2
21
2
11
e
e
...
= |
.
|
\
|
|
.
|
\
|
= + + + (2.108)
Desde que
1
e tenha tamanho unitrio. Em geral a proporo da varincia
total amostral no j-simo fator dada por:
+ + +
R de fatorial anlise para
p
j
pp 22 11
j
(2.109)
71
O critrio dado (anterior) geralmente usado para determinar o nmero de
fatores comuns apropriado. Quanto maior o nmero de fatores, maior a proporo
da varincia amostral explicada pelo modelo. Existem algumas maneiras de
determinar o nmero de fatores adequados, pode-se destacar o critrio de Kaiser e
o Scree-plot.
2.4.4 Rotao ortogonal de fatores
Geralmente a interpretao dos fatores obtidos na Anlise Fatorial pode no
ser uma tarefa fcil, devido a ocorrncia de coeficientes
ij
l
de grandeza numrica
similar e no desprezvel em fatores distintos. Quando isto ocorre, utiliza-se uma
transformao ortogonal dos fatores originais, na tentativa de encontrar uma
estrutura mais simples para ser interpretada. Para isso, utiliza-se uma matriz
ortogonal T que pode ser obtida por diferentes critrios, sendo que aps a rotao
dos fatores, a estrutura de varincia preservada (Rencher, 2002). Segue adiante
trs critrios de rotao: varimax, orthomax e quartimax. Neste trabalho foram
testados os trs critrios, porm o critrio varimax produziu melhores resultados, e
o nico utilizado nas interpretaes de cada Anlise Fatorial aplicada ao conjunto de
dados.
2.4.4.1 Critrio Varimax
De acordo com Mingoti (2005) o critrio de rotao varimax um mtodo
proposto por Kaiser (1958), cujo objetivo principal a busca da matriz T, tendo como
base encontrar para um determinado fator fixo, um grupo de variveis
i
Z altamente
correlacionadas com o fator e outro grupo que tenha correlao desprezvel ou
moderada com o fator. Para cada fator fixo, a soluo obtida atravs da
maximizao da variao dos quadrados das cargas fatoriais originais das colunas
da matriz L
.
72
Seja
= = = (
(
|
|
.
|
\
|
=
m
1 j
p
1 i
2
p
1 i
2
ij
4
ij
l
~
p
1
l
~
p
1
V
(2.110)
onde
i
ij
ij
h
l
~
= , sendo
i
h
*
= . O critrio varimax um dos
mais utilizados na prtica e, em geral, produz resultados mais simples que outros
mtodos.
2.4.4.2 Critrio Quartimax
Esse mtodo busca a simplificao das linhas de uma matriz de cargas
fatoriais. Segundo Hair et al. (2009) o critrio quartimax de rotao deixa muitas
variveis com cargas fatoriais altas em um nico fator, no sendo bem sucedido na
produo de estruturas mais simples.
Seja
Q
V a quantidade definida por:
(
(
|
|
.
|
\
|
=
= = = =
m
1 j
p
1 i
2
m
1 j
p
1 i
2
*
ij
4
*
ij Q
l
pm
1
l
pm
1
V
(2.111)
onde
*
ij
l
|
.
|
\
|
=
m
1 j
p
1 i
2
m
1 i
2
*
ij
4
*
ij M
l
p
l
V
(2.112)
onde
*
ij
l
+ + + = (2.113)
onde
ik
Z , so valores observados das variveis padronizadas
i
Z para o k-simo
elemento amostral e p ,..., 2 , 1 i , w
ji
= , so os pesos de ponderao de cada varivel
i
Z no fator
j
L . De acordo com Mingoti (2005), existem trs mtodos para a
determinao dos coeficientes
ji
w :
mtodo dos mnimos quadrados ponderados;
mtodo de regresso;
mtodo ad hoc.
Neste trabalho foram testados os trs mtodos, porem foi implementado
apenas o mtodo dos mnimos quadrados ponderados, uma vez que este
apresentou um melhor resultados.
74
2.4.5.1 Mtodo dos mnimos quadrados ponderados
O modelo fatorial em (2.83) assemelha-se a um modelo de regresso linear
mltipla. Desta maneira pode-se estimar o vetor F atravs do mtodo dos mnimos
quadrados ponderados usando-se as matrizes L
e +
' L
L
' L
= + + =
(2.114)
onde )' Z Z Z ( Z
pk k 2 k 1 k
= o vetor de observaes do k-simo
elemento amostral padronizado e
p m
W
a matriz de ponderao que gera os
coeficientes
ji
w .
Neste trabalho, as matrizes L
e +
estimado por:
( )
k k
1
jk
WZ Z ' L
' L
= =
(2.115)
Os escores fatoriais finais ponderados servem para criar um indicador a
partir de todos os escores fatoriais obtidos na Anlise Fatorial. De acordo com
Furtado et al. (2003) os escores fatoriais finais ponderados podem ser calculados da
seguinte maneira:
=
=
=
m
1 i
i
m
1 i
i i
(2.116)
onde
i
F
y B
k
n k
B
k
n k
B
U y y D y D T S y
i i
i
e = =
= =
(2.121)
O processo de inferncia acima descrito transforma uma informao
qualitativa em outra informao qualitativa, por meio de uma converso. O conjunto
nebuloso gerado durante o processo de inferncia pode ento ser utilizado
diretamente em um diagnstico qualitativo de tomada de deciso, ou ser convertido
em um valor escalar proporcional para atuao externa por meio de atuadores
convencionais, no caso de um sistema de controle.
A converso nebulosa para escalar (desnebulizao) transforma
informaes qualitativas em uma informao quantitativa, sendo um processo de
especificao. Para a regra de produo definida em (2.119), parte-se de um
conjunto nebuloso de sada ) (
y
i
B
obtido pelo processo de inferncia e chega-se a
um valor escalar
2
y correspondente. Os mtodos mais utilizados para a converso
nebulosa para escalar so o mtodo do centro de massa e o mtodo da mdia dos
mximos.
81
3 MATERIAL E MTODO
3.1 MATERIAL
No desenvolvimento deste trabalho foram utilizados dois bancos de dados. O
primeiro banco de dados contempla as medies de qualidade da energia eltrica
feitas no secundrio de 359 transformadores da rede de distribuio da Companhia
Paranaense de Energia (COPEL). O segundo banco de dados composto de
caractersticas fsicas e eltricas de 181 estruturas metlicas de linhas de
transmisso (LTs) da Companhia Paranaense de Energia (COPEL). As descries
de todos os conjuntos de dados so detalhadas a seguir:
3.1.1 Caso I Campanha de Medio de Distores Harmnicas de Tenso
A Copel atende cerca de 100% das residncias urbanas no Paran e 90 %
das rurais, possuindo no total cerca de 3,39 milhes de consumidores ligados sua
rede (COPEL, 2007).
Do total de consumidores, 2,6 milhes so residncias, 57 mil indstrias, 283
mil estabelecimentos comerciais e 332 mil propriedades rurais e a cada ano, em
mdia, so realizadas 70 mil novas ligaes.
As Tabelas 3.1 e 3.2 descrevem algumas caractersticas adicionais
referentes Copel:
TABELA 3.1 CARACTERSTICAS DA COPEL PARA A ATUAO NO PARAN
Indicadores Valores
reas de concesso (km
2
) 194854
Municpios atendidos 393
Localidades atendidas 1111
Populao atendida PR (Mil Habitantes) 9822
Taxa de atendimento urbano (%) 99
Consumo mdio residencial (kWh/ms) 159,6
FONTE: (COPEL, 2007)
82
TABELA 3.2 CARACTERSTICAS DA COPEL DADOS DA DISTRIBUIO
Dados de Distribuio Valores
Nmero de subestaes 34,5 kV 238
Potncia instalada (MVA) 1576
Redes de distribuio (km) 167535
Total de postes 2.296301
Nmero de transformadores de distribuio 315587
Potncia instalada em transformadores (MVA) 8009
FONTE: (COPEL, 2007)
A estrutura da Copel no estado do Paran est dividida em cinco
superintendncias sendo que cada uma delas atua em uma regio do estado e so
assim denominadas:
Superintendncia de Distribuio Leste SDL, com sede em Curitiba;
Superintendncia de Distribuio Oeste SDO, com sede em Cascavel;
Superintendncia de Distribuio Centro-Sul SDC, com sede em Ponta Grossa;
Superintendncia de Distribuio Noroeste SDN, com sede em Maring;
Superintendncia de Distribuio Norte SDT, com sede em Londrina.
A regio que possui o maior consumo no estado a regio leste (SDL-
35,6%), seguida da regio centro sul (SDC-18,6%), noroeste (SDN-17,3%), norte
(SDT-14,8%) e regio oeste (SDO-13,7%).
3.1.1.1 Medies
Devido ao fato de que existem muitos transformadores na rede de
distribuio da Copel no estado do Paran, a medio de todos eles se torna uma
prtica invivel. Para solucionar este problema buscou-se obter uma amostragem
que preservasse as informaes do universo estudado, uma das aes seguidas foi
a tomada de amostra aleatria dos transformadores que seriam medidos.
Outra ao foi a obteno do nmero de amostras que preservariam as
informaes do universo estudado, para isso, foi consultada a portaria 163/93 do
83
Departamento Nacional de guas e Energia Eltrica (DNAEE) e obteve-se uma
frmula especfica para este fim, conforme equao 6, tal que:
) . (
4
). 1 (
. .
2
S S
E N
S S N
C
a
+
=
(3. 1)
onde
C
a
- tamanho da amostra;
N - tamanho do universo considerado = 315587;
S - proporo da populao com caractersticas consideradas semelhantes,
considerado como 0,5 (pior caso);
- proporo da populao com caractersticas no semelhantes quelas de
S, considerado como 0,5 (1-S);
E - erro amostral = 5%.
Portanto, aplicando-se a (equao 3.1), de um universo total de 315.587
registros, chegou-se a um tamanho de amostra de 399 transformadores a serem
monitorados na campanha de medio. Contudo, prevendo-se as dificuldades que
poderiam ser encontradas durante as medies, tais como deslocamento,
impossibilidade de medio, qualidade das medidas a serem registradas, perda de
dados, entre outras foi estipulada uma margem de segurana de 10%, com isso, o
nmero definitivo de registros a serem observados foi de 440 transformadores.
TABELA 3.3 DISTRIBUIO DOS PONTOS DE MONITORAO
Regional Localizao Regio Amostras (%) Amostras
SDC Centro Ponta Grossa 11% 49
SDL Leste Curitiba 33% 146
SDN Noroeste Maring 18% 77
SDO Oeste Cascavel 19% 84
SDT Norte Londrina 19% 84
Total 100% 440
FONTE: (LACTEC, 2007)
84
TABELA 3.4 DISTRIBUIO DAS AMOSTRAS ENTRE REAS URBANAS E RURAIS
Regional Amostras Urbanas Amostras Rurais
SDC 38 11
SDL 136 10
SDN 68 9
SDO 69 15
SDT 76 8
Total 387 53
FONTE: (LACTEC, 2007)
Na tabela 3.3 possvel visualizar a distribuio dos pontos entre as cinco
superintendncias e na tabela 3.4, a distribuio dos pontos entre transformadores
rurais e urbanos.
O tempo utilizado para a realizao das medies foi de 14 meses, no
perodo de agosto de 2005 a julho de 2007. Foram utilizados 12 aparelhos
analisadores de energia, registrador MARH 21, descrito a seguir.
- Fabricante: RMS Sistemas Eletrnicos Brasil;
- 128 amostras por ciclo;
- Perodo de integralizao de 10 minutos;
- Memria de 4MB;
- Tenso alimentao: CA 70 a 600 V, frequncia: 50Hz ou 60Hz;
- CC 11 a 600 V;
- Exatido: classe 0,5 para tenses e correntes e classe 1 para potncias.
As medies foram realizadas com os medidores instalados por um perodo
de oito dias em mdia para cada transformador, porm, para a anlise e composio
do banco de dados utilizado neste trabalho foram considerados os dados obtidos em
um perodo de sete dias, devido ao disposto no Submdulo 2.2 do ONS e da
Resoluo n. 505 da ANEEL, que se referem aos intervalos para anlise. Na figura
3.1, a seguir, est ilustrado como exemplo o perodo de monitorao e o perodo de
anlise utilizado em uma amostra (transformador).
Os valores obtidos nas medies de DHTV foram dispostos conforme as
figuras 3.2 e 3.3, onde possvel, no eixo vertical, obter o valor da distoro em
relao fundamental, em cada fase. Estas medies foram realizadas no
barramento de 127/220V.
85
FIGURA 3.1 PERODO DE MONITORAO E PERODO DE ANLISE
FONTE: (LACTEC, 2007)
Nas figuras 3.2 e 3.3 tem-se que:
DHTVa - nveis de distoro harmnica total de tenso na fase A;
DHTVb - nveis de distoro harmnica total de tenso na fase B;
DHTVc - nveis de distoro harmnica total de tenso na fase C.
0
1
2
3
4
5
6
7
8
9
10
1/8 2/8 3/8 4/8 5/8 6/8 7/8
Perodo de Monitorao
D
i
s
t
o
r
o
H
a
r
m
n
i
c
a
T
o
t
a
l
d
e
T
e
n
s
o
[
%
]
DHTVa DHTVb DHTVc Limite ONS
FIGURA 3.2 EXEMPLO DE DHTV ABAIXO DE 6%
FONTE: (LACTEC, 2007)
Perodo de Monitorao
11:10h
01/08/05
11:10h
11/08/05
Perodo de Anlise
11:10h
01/08/05
11:10h
08/08/05
86
0
1
2
3
4
5
6
7
8
9
10
1/8 2/8 3/8 4/8 5/8 6/8 7/8
Perodo de Monitorao
D
i
s
t
o
r
o
H
a
r
m
n
i
c
a
T
o
t
a
l
d
e
T
e
n
s
o
[
%
]
DHTVa DHTVb DHTVc Limite ONS
FIGURA 3.3 EXEMPLO DE DHTV ACIMA DE 6%
FONTE: (LACTEC, 2007)
Algumas informaes importantes podem ser extradas das medies da
distoro Harmnica Total de Tenso, tais como valores mximos e mnimos obtidos
durante o monitoramento. As tabelas 3.5 e 3.6 a seguir demonstram exemplos
retirados destas informaes extradas das figuras 3.2 e 3.3.
TABELA 3.5 VALORES MXIMOS, MNIMOS E P95% DA DHTV - DENTRO DO LIMITE (6%)
DHV
T
DHTV
A
[%] DHTV
B
[%] DHTV
C
[%]
Mximo 4,70 4,90 4,60
Mnimo 2,30 2,20 2,40
P
95%
4,53 4,66 4,35
FONTE: (LACTEC, 2007)
TABELA 3.6 VALORES MXIMOS, MNIMOS E P95% DA DHTV - FORA DO LIMITE (6%)
DHV
T
DHTV
A
[%] DHTV
B
[%] DHTV
C
[%]
Mximo 4,60 7,00 7,50
Mnimo 1,80 4,00 3,90
P
95%
4,09 6,70 7,30
FONTE: (LACTEC, 2007)
Durante o monitoramento foi possvel obter tambm o espectro harmnico,
ou seja, o valor em porcentagem de cada frequncia harmnica de tenso. Nas
figuras 3.4 e 3.5 so ilustradas estas medies para o perodo de maior distoro
conforme exemplos citados nas figuras 3.2 e 3.3 respectivamente.
87
0
0,5
1
1,5
2
2,5
3
3,5
4
4,5
DHT 3 5 7 9
Ordens Harmnicas
A
m
p
l
i
t
u
d
e
[
%
]
Fase a Fase b Fase c
FIGURA 3.4 ESPECTRO DA TENSO NO PERODO DE MAIOR DISTORO ABAIXO DE 6%
FONTE: (LACTEC, 2007)
0
1
2
3
4
5
6
7
8
9
DHT 3 5 7 9 11 13 15 17 19
Ordens Harmnicas
A
m
p
l
i
t
u
d
e
[
%
]
Fase a Fase b Fase c
FIGURA 3.5 ESPECTRO DA TENSO NO PERODO DE MAIOR DISTORO ACIMA DE 6%
FONTE: (LACTEC, 2007)
Durante o monitoramento dos transformadores, foram encontradas diversas
dificuldades j previstas, tais como: dificuldade de deslocamento, impossibilidade de
medio devido alguma impossibilidade fsica, etc. Com isso, ao final da
88
campanha de medies, foram medidos no total 359 transformadores urbanos
distribudos em 186 cidades do estado do Paran, conforme exposto na tabela 3.7.
TABELA 3.7 NMERO DE TRANSFORMADORES URBANOS MEDIDOS
Superintendncia SDL SDT SDO SDC SDN TOTAL
Nmero de cidades
visitadas
29 42 55 23 37 186
Quantidade de
transformadores
128 74 62 32 63 359
FONTE: (LACTEC, 2007)
3.1.1.2 Variveis Utilizadas
O estudo obedeceu aos requisitos do Submdulo 2.2 do ONS (2002), que
estabelece como recomendao quanto aos ndices sobre distores harmnicas
totais e individuais de tenso que o mximo permitido para a distoro harmnica
total de tenso em qualquer fase seja o percentil 95%, ou seja, (P
95%
). A varivel
dependente considerada no estudo foi o P
95%
de distoro harmnica total acima de
6% e abaixo de 6%, ou seja, os grupos foram separados tendo s seguintes
caractersticas:
Grupo 0 tendo como varivel dependente o P95% da distoro harmnica
total de tenso menor que 6% em todas as fases do transformador;
Grupo 1 tendo como varivel dependente o P95% da distoro harmnica
total de tenso maior que 6% em qualquer uma das fases do transformador;
As variveis independentes ou explicativas foram separadas em
caractersticas do transformador e caractersticas de consumo. As variveis
correspondentes as caractersticas dos transformadores esto apresentadas na
tabela 3.8 e as variveis correspondentes as caractersticas de consumo dos
transformadores esto apresentadas na tabela 3.9.
89
TABELA 3.8 VARIVEIS ASSOCIADAS CARACTERSTICA DO TRANSFORMADOR
Caractersticas do Transformador Classes
Superintendncia Regional
- SDL
- SDN
- SDO
- SDC
- SDT
Tenso Primria
(Nvel de Tenso do Alimentador)
- 13.800V
- 34.500V
Fases
(Quantidade de Fases no Transformador)
- 1 Fase
- 2 Fases
- 3 Fases
Potncia
(Potncia Nominal do Transformador (kVA))
- 112,5 kVA
- 75 kVA
- 45 kVA
- 30 kVA
- 15 kVA
- 10 kVA
- 5 kVA
FONTE: COPEL 2007
TABELA 3.9 VARIVEIS ASSOCIADAS CARACTERSTICA DO CONSUMO.
Caractersticas do Consumo
Nmero de Consumidores
Consumo Mdio Mensal
Residencial 0/50 kWh
Residencial 50/100 kWh
Residencial 100/150 kWh
Residencial 150/200 kWh
Residencial 200/300 kWh
Residencial 300/500 kWh
Residencial 500/1000 kWh
Residencial >1000 kWh
Comrcio e Poder Pblico
Industrial
Rural
Iluminao Pblica
FONTE: COPEL 2007
90
3.1.2 Caso II Histrico de Quedas de Estruturas de LTs no Estado do Paran
Para realizar as anlises com das quedas de Estruturas, foi necessrio fazer
uma pesquisa de informaes em relao s estruturas que caram, a partir dos
dados histricos de quedas de estruturas metlicas.
Estes dados foram obtidos da COPEL, que alm dos dados tabelados,
possui relatrios impressos e manuscritos sobre as ocorrncias registrados e
arquivados para sua consulta, quando necessrio.
Partindo dos atributos necessrios, foi feita uma pesquisa sobre os relatrios
antigos para este levantamento de dados. Alm disto, foi feito um rastreamento para
identificar as condies em que as estruturas estavam quando caram. As
informaes tcnicas das estruturas foram identificadas nos relatrios, enquanto os
atributos de ordem climtica ou relacionada sua posio geogrfica foram
levantadas pelo posicionamento aproximado em relao s estruturas que foram
implantadas em substituio das danificadas.
At 2010, a rede eltrica do estado do Paran registrou 61 quedas de
estruturas ao longo dos ltimos 50 anos de operao e manuteno de linhas de
transmisso, sejam de 69 at 525 kV. Destas, mais de 40 linhas de transmisso
diferentes foram afetadas e aproximadamente 150 torres foram reconstrudas.
FIGURA 3.6 QUEDA DA ESTRUTURA 93 DA LT IRATI SABAR
FONTE: WAZEN 2011
91
FIGURA 3.7 QUEDA DA ESTRUTURA 34 DA LT MEDIANEIRA CU AZUL
FONTE: WAZEN 2011
A figura 3.6 ilustra a queda da estrutura 93 ocorrida na linha de 138 kV que
interliga a Subestao Irati Sabar (em Ponta Grossa), enquanto que a figura 3.7
apresenta a queda da estrutura 34 da linha de transmisso 138 kV que interliga a
subestao Medianeira Cu Azul.
A Figura 3.8 apresenta todas as linhas de transmisso que possuem pelo
menos uma estrutura que sofreu queda e teve a mesma reconstruda no estado do
Paran.
FIGURA 3.8 IDENTIFICAO DAS LINHAS ONDE OCORRERAM QUEDAS
FONTE: COPEL
92
3.1.2.1 Estruturas Metlicas em Operao na COPEL
A COPEL possui mais de 18 mil estruturas metlicas em operao. Estas
estruturas esto aplicadas em nveis de tenso de 69 a 525 kV, sendo tanto
preparadas para linhas de circuito simples como de circuito duplo. As estruturas
esto dispersas dentro de mais de 250 linhas de transmisso diferentes, com
comprimentos e caractersticas bem variadas.
possvel identificar estruturas em praticamente todo o estado do Paran,
por isso so utilizadas aproximadamente 2 mil estruturas para a anlise deste
trabalho j que a avaliao de todas necessitaria maior tempo aplicado. As
estruturas foram selecionadas de forma aleatria, desde que apresentassem as
mais diversas caractersticas ao longo do estado. A figura 3.9 representa as linhas
de transmisso selecionadas para a anlise das classificaes deste trabalho.
FIGURA 3.9 IDENTIFICAO DAS LINHAS SELECIONADAS PARA ESTUDO
FONTE: COPEL
3.1.2.2 Variveis Utilizadas
Em cada uma das quedas de estruturas ocorridas no estado do Paran foi
realizado um relatrio pelas equipes de manuteno constando as possveis causas,
os tipos de estruturas, as condies do terreno e a regio onde foram as
93
ocorrncias. A partir destas informaes e buscando informaes que tenham ficado
ocultas em um primeiro instante, foram definidos quais atributos podem interferir na
queda de uma estrutura metlica.
Portanto, os atributos selecionados para a aplicao so: tenso de
operao, vento na regio, relevo do local, massas de ar, temperatura da regio, tipo
de terreno, capacidade mecnica da estrutura, funo e tipo de fundao da
estrutura. A tabela 3.10 apresenta os atributos selecionados bem como a varivel
numrica associada a cada atributo. Os grupos foram separados tendo s seguintes
caractersticas:
Grupo 0 sendo o grupo de estruturas que no apresentou queda;
Grupo 1 sendo o grupo de estruturas que apresentou queda.
TABELA 3.10 RELAO DE CARACTERSTICAS NO-NUMRICAS PARA NUMRICAS
Car act er st i ca Var i vel No- numr i ca Var i vel Numr i ca
Rel evo
Pl anal t o 1
Pl an ci e 2
Ser r a 3
Val e 4
Massa de Ar
Par al el a 1
Per pendi cul ar 2
Tr ansver sal 3
Ter r eno
A 1
B 2
C 3
D 4
Capaci dade
Al t a 1
Bai xa 2
Funo
Ancor agem 1
Suspenso 2
Fundao
Gr el ha 1
St ub 2
Resul t ado
Nenhum 1
Queda 0
FONTE: WAZEN 2011
94
3.2 MTODO
3.2.1 Introduo
Durante as ltimas dcadas houve um considervel crescimento do
interesse em problemas de Reconhecimento e Classificao de Padres, com
consequente aumento da necessidade de mtodos para uso na elaborao de
sistemas nesta rea.
Na engenharia de potncia existem diversos trabalhos que contemplam
mtodos de Reconhecimento e Classificao de Padres, em muitos trabalhos so
feitos comparaes de mtodos com o intuito de encontrar um melhor mtodo para o
problema estudado.
Souza (2008) desenvolvimento de um modelo estatstico computacional para
a estimao das distores harmnicas de tenso a partir das caractersticas dos
transformadores de distribuio e dos consumidores utilizando-se de tcnicas de
Anlise Multivariada.
Martins (2010) utilizou o mesmo banco de dados utilizados por Souza
(2008). O objetivo final do trabalho foi o mesmo, porm foi utilizada a tcnica de
rough sets. Os resultados obtidos foram comparados ao trabalho apresentado por
Souza (2008).
Wazen (2011) avaliou os mtodos de Reconhecimento e Classificao de
Padres de Teoria de Conjuntos Aproximados (Rough Sets) e Regresso Logstica
em um conjunto de dados que contempla quedas de estruturas metlicas na rede de
distribuio.
Com base no cenrio descrito, observamos que uma arquitetura
Multiagentes que integre as vantagens e desempenho de diversos mtodos de
reconhecimento e classificao de padres em um nico sistema se torna atraente.
A arquitetura Multiagentes foi desenvolvida com o objetivo de gerenciar mtodos de
Reconhecimento e Classificao de Padres e Minerao de Dados das variveis de
entrada dos modelos bem como gerenciar a combinao dos resultados dos
mtodos aplicados.
95
3.2.2 Sistema Multiagentes
Segundo Aoki (2003), um Sistema Multiagente (SMA) tem como premissa
bsica prover mecanismos para a criao de sistemas inteligentes a partir de
entidades de software autnomas, chamadas de agentes. Esses agentes interagem
atravs de um ambiente, compartilhado por todos os membros do SMA, e sobre o
qual eles atuam alterando o seu estado.
Uma vez que cada Agente Inteligente possui certa habilidade e objetivos
prprios, o Sistema Multiagentes tem que ser capaz de prover mecanismos para
interao e coordenao dessas entidades. Dessa forma, o Sistema Multiagentes
consegue resolver problemas maiores que os domnios de conhecimento de seus
integrantes.
Os Sistemas Multiagentes podem ser classificados como reativos e
cognitivos. Os sistemas reativos so compostos por um grande nmero de agentes
muito simples que interagem entre si, sem possuir uma representao explcita do
estado do ambiente e dos outros agentes, nem de suas aes passadas (FERBER,
1999).
J os sistemas cognitivos em geral possuem poucos agentes, dado que
cada agente comporta-se de maneira racional, possui uma concepo lgica
simblica do mundo e planeja suas estratgias de ao de acordo com um forte
mecanismo de inferncia lgica. Esse tipo de agente, alm de utilizar tcnicas de
deduo e aprendizado, considera tambm aspectos caractersticos da vontade
humana, como crena, desejo e inteno (WOOLDRIDGE & JENNINGS,1998).
Segundo Gasser e Bond (1988) para se obter um comportamento coerente
em um Sistema Multiagentes, os agentes deveriam no somente compartilhar
conhecimento sobre o problema e as solues, mas tambm raciocinar sobre o
processo de coordenao entre os agentes.
3.2.2.1 Arquitetura do Sistema Multiagentes Proposta
No desenvolvimento da Arquitetura do Sistema Multiagentes foi utilizado o
software desenvolvido pela Java Agent Development Framework - JADE, que um
framework de software totalmente implementado em linguagem Java, que tem por
96
objetivos simplifica a implementao de Sistemas Multiagentes atravs de um
middle-ware que est em conformidade com as especificaes Foundation for
Intelligent Physical Agents - FIPA e atravs de um conjunto de ferramentas grficas
que suporta a depurao e fases de implantao.
Esta plataforma de agentes pode ser distribuda atravs de mquinas e a
configurao pode ser controlada atravs de uma interface grfica remota. A
configurao pode ser alterada, mesmo em tempo de execuo, movendo agentes
de uma mquina para outra, como e quando necessrio.
Todas as operaes entre os agentes so feitas dentro da arquitetura
desenvolvida no JADE, porm toda operao feita dentro de cada agente
processada em MATLAB R2010b.
Para o desenvolvimento de um Sistema Multiagentes necessrio observar
que o sistema composto por vrias entidades que iro interagir entre si para
alcanar um objetivo global, o primeiro passo identificar o objetivo de cada agente
individualmente, bem como o servio por ele oferecido. Com isso deve-se identificar
e classificar cada agente em categorias
A abordagem empregada na arquitetura proposta prev duas categorias de
agentes que so:
Agentes Especializados: so detentores do conhecimento especfico
empregado na anlise e soluo dos problemas encontrados no domnio de
aplicao.
Agentes de Suporte: so os responsveis por prestar servios que auxiliem
o processo de tomada de decises, como: estabelecer e coordenar a
comunicao entre os agentes, acessar banco de dados, interface com o
mundo real, entre outros.
A arquitetura do Sistema Multiagentes proposta neste trabalho, apresentada
na figura 3.10 composta por 4 tipos de agentes: O Agente Minerados de Dados, o
Agente de Classificao, o Agente de Comunicao e o Agente Decisor.
97
FIGURA 3.10 PROPOSTA DE ARQUITETURA DO SISTEMA MULTIAGENTES
FONTE: O AUTOR
3.2.3 Agentes de Suporte
Os agentes de suporte, considerando que o sistema deve interagir com
usurio e as informaes utilizadas estaro contidas em algum tipo de base de
dados num certo formato de apresentao prev a necessidade de trs agentes que
so:
3.2.3.1 Agente Minerador de Dados
O Agente Minerador de Dados responsvel por acessar a base de dados
automatizada e realizar o pr-processamento da informao. Neste agente
descrita a metodologia de interpretao dos dados e filtragem de dados.
Segundo Fayyad, Piatetsky-Shapiro, & Smith (1996) a Minerao de Dados
definida como a extrao de conhecimento da base de dados e o processo de
98
identificao de padres vlidos, novos, potencialmente teis e compreensveis
embutidos nos dados.
A Minerao de Dados uma tecnologia usada para revelar informao
estratgica escondida em grandes massas de dados. usada em diversas reas,
como anlise de riscos, marketing direcionado, controle de qualidade, anlise de
dados cientficos, etc. Minerao de Dados define o processo automatizado de
captura e anlise de enormes conjuntos de dados, para ento extrair um significado.
O processo de extrao de conhecimento pode ser dividido em vrias
etapas, que so:
Conhecimento e identificao do domnio do problema;
A identificao do problema contempla o estudo do domnio da aplicao e a
definio de objetivos e metas a serem alcanadas no processo de Minerao de
Dados.
Pr-processamento da informao;
Normalmente, os dados disponveis para anlise no esto em um formato
adequado para a extrao de conhecimento. Alm disso, em razo de limitaes de
memria ou tempo de processamento, muitas vezes no possvel a aplicao
direta dos algoritmos de extrao de padres aos dados.
Dessa maneira, torna-se necessria a aplicao de mtodos para
tratamento, limpeza e reduo do volume de dados antes de iniciar a etapa de
extrao de padres. importante observar que a execuo de transformaes na
base de dados deve ser guiada pelos objetivos do processo de extrao a fim de
que o conjunto de dados gerados apresente as caractersticas necessrias para que
os objetivos sejam alcanados.
Extrao de padres;
A etapa de extrao de padres direcionada ao cumprimento dos objetivos
definidos na identificao do problema. Nessa etapa so realizadas a escolha, a
configurao e a execuo de um ou mais algoritmos para extrao do
conhecimento.
99
Ps-processamento da informao;
Os algoritmos de extrao de padres podem gerar uma quantidade enorme
de padres. Porm, muitos dos quais podem no ser importantes, relevantes ou
interessantes para o usurio. Portanto, de vital importncia desenvolver algumas
tcnicas de apoio no sentido de fornecer aos usurios apenas os padres mais
interessantes (Silberschatz & Tuzhilin 1995).
Um problema bastante comum que surge quando se utilizam tcnicas de
Minerao de Dados na etapa de pr-processamento a necessidade de reduzir a
dimensionalidade do problema estudado. O processo de reduo utilizado quando
o nmero de variveis estudadas muito grande. Para reduzir a dimenso do vetor
original pode-se criar um novo vetor cujas componentes so combinaes lineares
das variveis originais. A reduo da dimensionalidade do vetor de variveis
originais pode ser feita segundo dois critrios.
Conhecimento informal do especialista utilizando a prpria vivncia em torno do
problema, ou seja, conhecimento emprico.
Conhecimento Cientfico atravs de critrios estatsticos, conhecidos como
tcnicas de seleo de variveis.
A criao de um novo vetor de variveis de menor dimenso, cujos
componentes so combinaes lineares das variveis originais, pode ser conduzida
via uma tcnica de anlise multivariada, conhecida como Anlise de Componentes
Principais .
Outro critrio interessante e muito utilizado para reduzir a dimensionalidade
dos problemas a aplicao da Anlise Fatorial, que utiliza a tcnica de
componentes principais para estimar os pesos fatoriais e possibilita a visualizao
de grupos que agregam variveis originais que tm uma determinada associao e
esto nas direes de maior variabilidade. Essas combinaes lineares das
variveis originais so chamadas de fatores. A Anlise Fatorial possibilita a
avaliao da importncia de cada varivel original por meio do conceito de
comunalidade.
100
Desta forma o Agente Minerador de Dados tem seu objetivo dividido em trs
partes principais.
I. Ao acessar o banco de dados o Agente Minerador de Dados executa um pr-
processamento dos dados, fazendo assim uma limpeza dos dados, retirando
todas as redundncias, seguidamente aplicado os testes de Bartlett e KMO
para verificar a validade da Anlise Fatorial.
II. A seguir o Agente Minerador de Dados utiliza a Anlise Fatorial para extrair
os fatores que explica a correlao existente entre as variveis originais do
banco de dados. Esses fatores agrupam as variveis iniciais que contenham
forte correlao, desta forma, as variveis originais agrupadas num mesmo
fator possuem, portanto alta correlao, enquanto que variveis de fatores
distintos possuem baixa correlao.
III. Em posse dos autovalores calculados o Agente Minerador de Dados, utiliza o
critrio de Kaiser para a seleo dos fatores. A seguir com base na rotao
Varimax e calculadas as comunalidades para cada varivel, so calculados
os escores fatoriais das observaes que sero utilizados como a nova base
de dados para os modelos de Reconhecimento e Classificao de Padres.
A figura 3.11 apresenta o processo realizado pelo Agente Minerador de
Dados.
FIGURA 3.11 PROCESSO DO AGENTE MINERADOR DE DADOS
FONTE: O AUTOR
101
3.2.3.2 Agente de Comunicao
Na arquitetura proposta utilizado um sistema de comunicao
confederado, ou seja, os Agentes Inteligentes se comunicam atravs de um
facilitador (Agente de Comunicao). Esse Agente de Comunicao responsvel
pela interconexo dos agentes, ele funciona como um centro de comunicao onde
todas as mensagens enviadas por qualquer agente passam por ele e so
direcionadas para o respectivo destinatrio.
A conversao entre os agentes est sempre relacionada com um plano
para atingir um objetivo, portanto deve-se especificar qual informao deve ser
trocada e com quem, pois um fluxo de informao muito grande pode deteriorar a
capacidade de comunicao do meio empregado, o que resultaria numa perda de
reatividade do Sistema Multiagentes. Deve lembrar-se que nessas conversaes
so trocadas informaes parciais do processo de tomada de deciso, logo
conversaes desnecessrias podem prejudicar o processo de tomada de decises.
A comunicao entre agentes fundamental para a execuo de um
Sistema Multiagentes. Ela determina o comportamento em uma sociedade,
permitindo que um agente no seja apenas um programa que executa seus
comportamentos, mas tambm um programa que recebe e envia pedidos aos
demais agentes.
A troca de mensagens na plataforma JADE realiza-se mediante mensagens
FIPA-ACL. JADE disponibiliza um mecanismo assncrono de mensagens: cada
agente possui uma fila de mensagens (caixa de entrada), onde este agente decide o
momento de ler estas mensagens. No momento desejado pelo agente este pode ler
apenas a primeira mensagem, ou ler as mensagens que satisfazem algum critrio.
Para a comunicao entre os agentes se faz necessrio a criao de um
diagrama de interao entre agentes, o qual explicita a sequncia de aes dentro
do Sistema Multiagentes, bem como a colaborao entre eles. Na figura 3.12
apresenta o diagrama de interao da arquitetura do Sistema Multiagentes.
102
FIGURA 3.12 DIAGRAMA DE INTERAO ENTRE OS AGENTES
FONTE: O AUTOR
3.2.3.3 Agente Decisor
O Agente Decisor responsvel pela interface entre o Usurio com o
sistema, sendo assim responsvel pelo gerenciamento de todo o sistema. As
funes deste agente podem ser divididas em duas funes principais:
I. Interface do Sistema com o Usurio
O Agente Decisor faz toda a comunicao do Sistema Multiagentes com o
Usurio, desta forma este agente inicia o processo de Reconhecimento de Padres
ou de Reconhecimento de Padres e Classificao de uma Nova Observao de
acordo com a necessidade do usurio.
Quando o processo de Reconhecimento de Padres solicitado ao Agente
Decisor, o mesmo tem como funo iniciar todo o processo Reconhecimento de
Padro, de acordo com a base de dados informada pelo usurio e apresentar ao
Usurio os modelos gerados e a Taxa Real de Acerto processada pelos Agentes
Especialistas, bem como os fatores gerados pelo Agente Minerados de Dados, bem
como suas comunalidades.
103
Quando o processo de Reconhecimento de Padres e Classificao de uma
Nova Observao solicitado, o Agente Decisor repete o processo de
Reconhecimento de Padres, porm neste caso o Agente Decisor tem um papel
fundamental de ponderar a classificao da nova amostra apresentada pelos
Agentes Especialistas com base na Taxa Real de Acerto. Essa ponderao
executada pelo Agente Decisor feita por uma Lgica Nebulosa.
II. Ponderao de Classificao
Para executar a ponderao de classificao o Agente Decisor utiliza uma
Lgica Nebulosa de modelo Mandani, apresentada na figura 3.13
FIGURA 3.13 PROCESSO DO AGENTE DECISOR
FONTE: O AUTOR
104
Para o modelo desenvolvido so utilizadas trs variveis numricas de
entrada contendo os valores das Taxas de Acerto Reais de cada Agente
Especialista.
Taxa Real de Acerto 1: Regresso Logstica
Taxa Real de Acerto 2: Escore Quadrtico
Taxa Real de Acerto 3: Redes Neurais
Foram utilizadas trs variveis de sada contendo os pesos para cada
Classificao da Nova Observao obtida pelos Agentes Especialistas.
Peso 1 (W
1
): Regresso Logstica
Peso 2 (W
2
): Escore Quadrtico
Peso 3 (W
3
): Redes Neurais
As funes de pertinncia desenvolvida para as variveis de entrada, e para
as variveis de sada so apresentadas na figura 3.14 e figura 3.15
FIGURA 3.14 FUNO DE PERTINNCIA PARA TAXA REAL DE ACERTO
FONTE: O AUTOR
As variveis de entrada foram divididas em quatro subconjuntos nebulosos
considerando uma faixa de valores possveis no intervalo de [0,1]. Esses
subconjuntos foram definidos, conforme descrito a seguir:
105
Ruim: escolheu-se uma funo trapezoidal com as seguintes parametrizaes
[0, 0, 0.50, 0.60];
Bom: escolheu-se uma funo trapezoidal com as seguintes parametrizaes
[0.55, 0.60, 0.70, 0.75];
Muito Bom: escolheu-se uma funo trapezoidal com as seguintes
parametrizaes [0.70, 0.75, 0.85, 0.90];
Excelente: escolheu-se uma funo trapezoidal com as seguintes
parametrizaes [0.85, 0.90, 1, 1];
FIGURA 3.15 FUNO DE PERTINNCIA PARA VARIVEL DE SADA
FONTE: O AUTOR
As variveis de sada foram divididas em cinco subconjuntos nebulosos
considerando uma faixa de valores possveis no intervalo de [0,1]. Esses
subconjuntos foram definidos, conforme descrito a seguir:
Taxa de Acerto Muito Baixa: escolheu-se uma funo trapezoidal com as
seguintes parametrizaes [0, 0, 0.10, 0.15];
Taxa de Acerto Baixa: escolheu-se uma funo trapezoidal com as seguintes
parametrizaes [0.10, 0.15, 0.35, 0.45];
Taxa de Acerto Mdio: escolheu-se uma funo triangular com as seguintes
parametrizaes [0.40, 0.50, 0.60];
Taxa de Acerto Alto: escolheu-se uma funo trapezoidal com as seguintes
parametrizaes [0.55, 0.60, 0.80, 0.85];
Taxa de Acerto Multo Alto: escolheu-se uma funo trapezoidal com as
seguintes parametrizaes [0.80, 0.85, 1, 1];
106
Foram desenvolvidas 64 regras para a base de conhecimento, a seguir
apresentado um exemplo dessas regras:
<Se Taxa Real de Acerto 1 for Bom e Taxa Real de Acerto 2 for
Muito Bom e Taxa Real de Acerto 3 for Ruim> ento < Peso 1 Mdio e
Peso 2 Alto e Peso 3. Muito Baixa.>
Com base nos pesos apresentados das variveis de sada e na
Classificao da Nova Observao dada por cada Agente Especialista possvel
calcular o valor da Resposta Final de Classificao (R.F.C.) dado na equao 3.1.
1 1 2 2 3 3
. . . . . R F C W RA W RA W RA = + + (3.1)
onde:
=
i
i
i
W
W
W
1
RA a classificao da nova observao pelo Agente Especialista 1
Regresso Logstica;
2
RA a classificao da nova observao pelo Agente Especialista 2
Escore Quadrtica;
3
RA a classificao da nova observao pelo Agente Especialista 1
Redes Neurais.
E a Regra de Classificao dada por:
e <
e >
0 _ Grupo Observao Nova c . C . F . R
1 _ Grupo Observao Nova c . C . F . R
SE
(3.1)
onde c o valor da faixa de corte do sistema (valor adotado para classificao igual
a 0,5).
107
3.2.4 Agentes de Especialistas
Os Agentes Especialistas so detentores do conhecimento especfico
empregado na anlise e soluo dos problemas encontrados no domnio de
aplicao. Na arquitetura proposta, existem trs agentes especialistas responsveis
pelos Mtodos de Reconhecimento e Classificao de Padres.
Os Agentes Especialistas recebem a nova base de dados processada pelo
Agente Minerador de Dados, em posse dessa nova base de dados cada Agente
Especialista necessita de um pr-processamento de informaes a fim de que essa
base de dados esteja em um formato necessrio para a aplicao das respectivas
tcnicas de Reconhecimento e Classificao de Padres. Todos os agentes
especialistas utilizam o mtodo de Lachenbruch (leave-one-out), para obter as
Taxas de Acertos Reais. O fluxograma da figura 3.16 apresenta o processo dos
Agentes Especialistas.
FIGURA 3.16 PROCESSO DOS AGENTES ESPECIALISTAS
FONTE: O AUTOR
108
As tcnicas e metodologias de cada Agente Especialista so descritas a
seguir.
3.2.4.1 Agente Especialista 1 Regresso Logstica
O Agente Especialista Regresso Logstica, primeiramente aplica uma
separao do banco de dados em uma matriz contendo as variveis independentes
do modelo e um vetor resposta que contem as variveis independentes do modelo.
Desta forma estima-se o vetor de parmetros ] ,..., , [ '
1 0 p
| | | | = pelo mtodo da
mxima verossimilhana, num contexto de mnimos quadrados no-lineares,
aplicando o Algoritmo de Quase-Newton.
Foram gerados n modelos com (n-1 observaes), para teste e validao da
tcnica. Esse processo conhecido como mtodo de Lachenbruch (leave-one-out).
Ao final do processo ajustado um modelo com as n observaes e que passar a
ser considerado como definitivo para o Reconhecimento e Classificao de Padres.
No modelo de Regresso Logstica necessria a utilizao de uma faixa de
corte com valores no intervalo [0,1], que serve para determinar a classificao de
uma nova observao. Foram testadas, neste trabalho, vrias faixas de corte
contidas no intervalo [0,1], porm no sistema adotou-se como valor da faixa de corte
a proporo entre os dois grupos.
3.2.4.2 Agente Especialista 2 Escore Quadrtica
O Agente Especialista Escore Quadrtica, necessita primeiramente de
uma separao do banco de dados em uma matriz contendo as variveis
independentes e um vetor contendo as variveis dependentes do modelo.
Posteriormente, a matriz das variveis independentes dividida em dois conjuntos,
cada um deles contendo as variveis referentes a cada grupo. O vetor com as
variveis dependentes do modelo no so necessrias para a criao das funes
de classificao.
109
A essas matrizes dos grupos aplicado o mtodo de Lachenbruch (leave-
one-out) e so criados n funes de classificaes com (com n-1 amostras), dessa
forma obtido a taxa de acerto real dentro de cada grupo e ao final a funo de
classificao criada com as n amostras.
3.2.4.3 Agente Especialista Redes Neurais
De posse do novo banco de dados o Agente Especialista Redes Neurais
processa as informaes do banco de dados.
A implementao da tcnica de Redes Neurais foi feita utilizando o algoritmo
desenvolvido no software MATLAB e, tambm, utilizando rotinas oriundas do prprio
pacote do MATLAB. O algoritmo aplica o mtodo de Lachenbruch (leave-one-out),
no treinamento e no teste da rede, que consiste na classificao de uma amostra
retirada do banco de dados (com n-1 observaes) que originou as regras
(LACHENBRUCH, 1975). Esse procedimento repetido n vezes.
Para a criao da Rede Neural optou-se por uma rede com treinamento
backpropagation com correo de erro pelo algoritmo de Levenberg-Marquadt que
faz parte do default da funo utilizada no MATLAB.
Assim foi necessrio fixar como nmero de neurnios na camada de entrada
que o mesmo que o nmero de variveis da base de dados fornecidas pelo Agente
Minerador de Dados. O nmero de variveis tambm define o nmero de camadas
ocultas utilizadas, ou seja, numero de camadas ocultas +1. Na camada de sada foi
fixado um neurnio. Nas camadas ocultas se optou por utilizar uma funo de
ativao sigmoidal, ou seja, do tipo tangente hiperblica.
O modelo de Rede Neural implementado sorteia os valores iniciais dos
sinpticos e das baias. Assim faz-se necessrio apenas fixar os valores das pocas
de treinamento e a magnitude do gradiente. Aps vrios testes optou-se por utilizar
1000 pocas de treinamento e uma magnitude de 0,0001.
Cada modelo de Rede Neural treinado teve um tempo computacional mdio
de 8 segundos.
110
4 RESULTADOS E DISCUSSES
Nos testes da arquitetura do sistema desenvolvido foi utilizado
primeiramente um banco de dados terico contendo oito (8) variveis dependentes e
uma (1) varivel independente. Este banco contm 40 observaes dessas variveis
sendo que dez (10) fazem parte do grupo 0 e 30 fazem parte do grupo 1. A tabela
4.1 apresenta o banco de dados utilizado para a validao da Arquitetura.
TABELA 4.1 BANCO DE DADOS PARA TESTE DA ARQUITETURA
Varivel
1
Varivel
2
Varivel
3
Varivel
4
Varivel
5
Varivel
6
Varivel
7
Varivel
8
Varivel
Resposta
1,60 1,67 152,17 0,56 0,94 0,69 12,54 26,42 1
8,65 0,13 21,24 4,17 7,02 7,02 13,35 21,11 1
3,17 0,46 84,57 1,00 1,60 1,33 5,59 7,75 1
1,63 1,58 90,15 1,02 1,25 1,06 -0,45 -3,43 1
2,15 0,87 56,5 1,16 1,40 1,5 7,46 7,83 1
1,94 1,06 61,38 0,98 1,50 1,36 0,82 3,49 1
1,97 1,03 84,46 0,40 0,95 1,14 0,45 2,08 1
1,68 1,47 104,91 0,79 1,00 0,97 -0,02 0,24 1
2,89 0,53 59,13 3,86 3,86 1,76 7,75 23,21 1
6,66 0,18 90,02 1,11 1,55 1,68 9,03 6,05 1
1,43 2,32 51,67 0,53 1,06 1,20 0,29 1,42 1
3,60 0,38 91,81 1,59 3,22 1,21 15,53 20,52 1
1,67 1,49 144,64 0,71 1,76 0,70 19,18 84,12 1
1,71 1,40 35,57 1,91 2,13 1,45 3,78 11,15 1
13,44 0,09 95,61 2,39 3,57 2,51 17,49 17,98 1
3,05 0,49 115,49 0,70 0,79 0,68 2,23 2,64 1
21,29 0,05 98,44 1,79 2,07 2,07 21,94 12,84 1
2,24 0,81 87,25 1,11 1,49 1,16 -0,06 0,98 1
3,18 0,46 76,34 2,17 2,18 1,51 10,03 7,30 1
5,71 0,28 125,00 1,29 1,29 1,29 26,06 56,67 1
1,37 2,67 229,32 0,42 0,55 0,52 -0,99 -11,28 1
1,60 1,68 78,97 1,21 1,28 1,12 6,69 29,24 1
3,54 0,39 35,21 2,27 2,65 2,65 15,00 32,73 1
1,47 2,14 87,65 0,60 1,03 1,03 -2,13 -23,46 1
4,37 0,30 84,45 1,59 1,59 1,52 3,79 7,59 1
1,64 1,55 25,26 0,16 1,48 1,48 9,01 77,34 1
1,23 4,31 187,46 0,31 0,36 0,76 0,52 7,67 1
1,25 4,05 86,62 0,36 1,03 1,03 2,07 17,35 1
5,30 0,23 94,38 0,54 1,03 1,24 -3,06 -9,83 1
1,67 1,59 216,77 0,33 0,39 0,29 -1,05 -10,85 0
1,21 4,72 387,18 0,21 0,40 0,39 -23,45 -147,63 0
1,25 4,04 102,84 -0,03 1,00 0,99 2,02 8,06 0
1,08 17,52 63,00 0,24 1,21 1,05 -7,76 -25,24 0
1,17 5,88 219,05 0,36 1,29 0,80 1,62 2,20 0
1,87 1,15 87,61 0,74 1,28 1,10 -40,36 -135,03 0
1,45 2,22 227,74 0,39 0,92 0,42 -50,67 -26,3 0
1,19 5,31 475,96 0,30 0,33 0,27 -0,61 -9,55 0
2,09 0,92 189,03 0,06 0,06 0,03 -0,08 5,61 0
1,31 15,81 154,59 0,75 1,35 1,21 4,72 34,67 0
1,72 1,39 97,87 2,61 2,61 0,61 9,70 32,58 0
1,60 1,67 152,17 0,56 0,94 0,69 12,54 26,42 1
111
Esse banco de dados reduzido foi utilizado para teste, devido ao tempo
computacional de treinamento de cada agente especialista, visto que para validao
do Sistema Multiagentes para Reconhecimento e Classificao de Padres, cada
Agente Especialista utiliza o mtodo de Lachenbruch (leave-one-out) para criao
dos seus modelos.
4.1 TESTE DO SISTEMA MULTIAGENTES PARA RECONHECIMENTO E
CLASSIFICAO DE PADRES
Nos testes da Arquitetura proposta, primeiramente foi testada a eficcia do
Agente Minerador de Dados. Para testar a eficcia do Agente Minerador de Dados
foi comparado a Taxa de Acerto Real de cada mtodo de Reconhecimento e
Classificao de Padres no banco de dados original, com a Taxa de Acerto Real de
cada mtodo de Reconhecimento e Classificao de Padres no banco de dados
dos fatores gerados pela Anlise Fatorial. As Taxas de Acerto Real com o banco de
dados original so apresentadas nos quadros 4.1, 4.2 e 4.3
QUADRO 4.1 CLASSIFICAO DOS DADOS ORIGINAIS PELO MTODO DA REGRESSO
LOGSTICA COM TAXA DE ACERTO REAL
Classificao Prevista
Grupo 0 Grupo 1
Classificao Real
Grupo 0
*7 3
70,00% 30,00%
Grupo 1
5 *25
16,66% 83,33%
Taxa de Acerto Real 80,00%
*Percentual de Acerto
QUADRO 4.2 CLASSIFICAO DOS DADOS DAS ORIGINAIS PELO MTODO DO ESCORE
QUADRTICO COM TAXA DE ACERTO REAL
Classificao Prevista
Grupo 0 Grupo 1
Classificao Real
Grupo 0
*6 4
60,00% 40,00%
Grupo 1
2 *28
6,66% 93,33%
Taxa de Acerto Real 85,00%
*Percentual de Acerto
112
QUADRO 4.3 CLASSIFICAO DOS DADOS ORIGINAIS PELO MTODO DE REDES NEURAIS
COM TAXA DE ACERTO REAL
Classificao Prevista
Grupo 0 Grupo 1
Classificao Real
Grupo 0
*8 2
80,00% 20,00%
Grupo 1
6 *24
20,00% 80,00%
Taxa de Acerto Real 80,00%
*Percentual de Acerto
Posteriormente foi aplicado o mtodo da Anlise Fatorial ao banco de dados
obtendo assim os seguintes resultados desta anlise.
TABELA 4.2 ANLISE FATORIAL DOS DADOS DE TESTE
Nmero de Fatores Autovalores Proporo da Varincia Varincia Cumulativa
1 3,86528 48,316 48,316
2 1,38006 17,251 65,567
3 1,00345 11,815 77,381
4 0,794289 9,929 87,310
5 0,540912 6,761 94,071
6 0,241361 3,017 97,088
7 0,184763 2,310 99,398
8 0,0481656 0,602 100,000
FONTE: O AUTOR
A tabela 4.2, apresenta um resumo das informaes da aplicao do Mtodo
da Anlise Fatorial para os dados de teste. O objetivo da anlise a obteno de um
nmero de fatores m com m<p sendo p a dimenso do vetor observado. Esses m
fatores so responsveis por explicar a maior parte da variabilidade das oito (8)
variveis. Neste caso, trs fatores foram extrados, ento m = 3. E para determinar o
nmero de fatores utilizou-se o mtodo de Kaiser, no qual o nmero de fatores a ser
extrado dado pelo nmero de autovalores da matriz de correlao que tinham
valores maiores que ou iguais a um (1), apresentado na figura 4.1. Juntos, eles
respondem por 77,381% da variabilidade dos dados originais.
113
FIGURA 4.1 SELEO DO NMERO DE FATORES DOS DADOS DE TESTE
FONTE O AUTOR
Na tabela 4.3 so apresentados os carregamentos (pesos) dos fatores
rotacionados pelo mtodo Varimax, as comunalidades e as porcentagens
explicativas.
TABELA 4.3 CARREGAMENTOS FATORIAIS ROTACIONADA OS DO BANCO DE DADOS DE
TESTE
Variveis Fator 1 Fator 2 Fator 3 Comunalidades
Varivel 1 0,4180 0,1120 0,6049 0,55328
Varivel 2 -0,0649 -0,0870 -0,8896 0,80334
Varivel 3 -0,5411 -0,4115 -0,0247 0,46283
Varivel 4 0,8477 0,1542 0,2848 0,82362
Varivel 5 0,9420 0,1515 0,1508 0,93326
Varivel 6 0,9150 0,0882 0,1369 0,86384
Varivel 7 0,2095 0,8648 0,2301 0,84476
Varivel 8 0,0987 0,9463 0,0087 0,90555
Total da Varincia
Explicada (%)
48,31% 17,25% 11,81%
Total da Varincia
Acumulada (%)
48,31% 65,56% 77,38%
FONTE: O AUTOR
Em relao aos dados de teste foram identificados apenas trs fatores que
representam 77,38% da variabilidade, porm esse trs fatores esto na direo de
maior variabilidade. Os fatores obtidos pela Anlise Fatorial so descritos a seguir:
Fator 1: (Varincia Explicada 48,31%)
114
- Varivel 3 (Comunalidade = 0,46283 ; Peso = -0,5411)
- Varivel 4 (Comunalidade = 0,82362; Peso = -0,8477)
- Varivel 5 (Comunalidade = 0,93326; Peso = 0,9420)
- Varivel 6 (Comunalidade = 0,86384; Peso = 0,9150)
Fator 2: (Varincia Explicada 17,25%)
- Varivel 7 (Comunalidade = 0,84476; Peso = 0,8648)
- Varivel 8 (Comunalidade = 0,90555; Peso = 0,9463)
Fator 3: (Varincia Explicada 11,81%)
- Varivel 1 (Comunalidade = 0,55328; Peso = 0,6049)
- Varivel 2 (Comunalidade = 0,80334; Peso = -0,8896)
Aps a rotao dos fatores foram calculados os escores fatoriais que so
utilizados como as variveis independentes para os mtodos de Reconhecimento e
Classificao de Padres. A partir da nova base de dados foram aplicados trs
mtodos de Reconhecimento e Classificao de Padres, todos eles utilizando o
mtodo de Lachenbruch (leave-one-out), para obter a Taxa Real de Acerto. Os
quadros 4.4, 4.5 e 4.6 apresentam as Classificaes e Taxa Real de Acerto dos
dados de teste:
QUADRO 4.4 CLASSIFICAO DOS DADOS GERADOS PELA ANLISE FATORIAL PELO
MTODO DA REGRESSO LOGSTICA COM TAXA DE ACERTO REAL
Classificao Prevista
Grupo 0 Grupo 1
Classificao Real
Grupo 0
8 2
80,00% 20,00%
Grupo 1
4 26
13,33% 86,66%
Taxa de Acerto Real 85,00%
*Percentual de Acerto
115
QUADRO 4.5 CLASSIFICAO DOS DADOS GERADOS PELA ANLISE FATORIAL PELO
MTODO DO ESCORE QUADRTICO COM TAXA DE ACERTO REAL
Classificao Prevista
Grupo 0 Grupo 1
Classificao Real
Grupo 0
8 2
80,00% 20,00%
Grupo 1
3 27
10,00% 90,00%
Taxa de Acerto Real 87,50%
*Percentual de Acerto
QUADRO 4.6 CLASSIFICAO DOS DADOS GERADOS PELA ANLISE FATORIAL PELO
MTODO DE REDES NEURAIS COM TAXA DE ACERTO REAL
Classificao Prevista
Grupo 0 Grupo 1
Classificao Real
Grupo 0
6 4
60,00% 40,00%
Grupo 1
0 30
0,00% 100,00%
Taxa de Acerto Real 90,00%
*Percentual de Acerto
Em todos os casos com a aplicao da Anlise Fatorial apresentou uma
melhora nos mtodos de Reconhecimento e Classificao de Padres, a
comparao destes resultados apresentada no quadro 4.7
QUADRO 4.7 COMPARAO DOS MTODOS DE RECONHECIMENTO E CLASSIFICAO DE
PADRES DOS DADOS DE TESTE
Taxa Real de Acerto
Regresso
Logstica
Escore
Quadrtico
Redes
Neurais
Banco de Dados
Sem Agente de
Minerao
80,00% 85,00% 80,00%
Com Agente de
Minerao
85,00% 87,50% 90,00%
Aps a aplicao do Agente Minerador testou-se a eficcia do Agente
Decisor no gerenciamento da sntese dos resultados dos Agentes Especialistas,
desta forma foi criado uma Lgica Nebulosa a fim de ponderar a classificao feita
pelos Agentes Especialistas com suas respectivas Taxa de Acerto Real. Assim para
testar a eficcia do todo o sistema foi Sistema Multiagentes para Reconhecimento e
116
Classificao de Padres, primeiramente foi aplicado a um banco de dados tericos,
posteriormente foi utilizado o mtodo de Lachenbruch (leave-one-out) em todo o
sistema como visto na figura 4.2.
Para utilizar o mtodo de Lachenbruch (leave-one-out), foi utilizado a
seguinte sequncia:
1. Na base de dados contendo n observaes e omite-se uma
observao;
2. Com (n-1) observaes aplica-se a Anlise Fatorial, com o intuito de
gerar os p fatores que sero usados pelos Agentes Especialistas;
3. Com p fatores os Agentes Especialistas geram os modelos de
Reconhecimento e Classificao de Padres e a Taxa Real de Acerto;
4. Aplica-se os modelos gerados pelos Agentes Especialistas a
observao que foi omitida;
5. Com base nas classificaes da observao omitida e na Taxa Real
de Acerto, o Agente Decisor pondera a classificao da nova
observao, obtendo assim uma classificao final;
6. A classificao final comparada com a classificao real da
observao omitida;
7. Repete-se os passos 1 at 6, at que todas as observaes tenham
sido classificadas;
8. Seja
1
n o nmero de observaes do grupo 1, e
2
n o nmero de
observaes do grupo 0, ento a Taxa Real de Acerto do Sistemas
ser dado por:
Taxa Real de Acerto =
2 1
n n
Sistema do Acerto
+
117
FIGURA 4.2 MTODO DE VALIDAO DA ARQUITETURA MULTIAGENTES
FONTE: O AUTOR
O processo de teste da eficcia da arquitetura do Sistema Multiagentes de
Reconhecimento e Classificao de Padres apresentada no quadro 4.8.
118
QUADRO 4.8 CLASSIFICAO DOS DADOS DE TESTE PELO AGENTE DECISOR COM TAXA
DE ACERTO REAL
Classificao Prevista
Grupo 0 Grupo 1
Classificao Real
Grupo 0
8 2
80,00% 40,00%
Grupo 1
0 30
0,00% 100,00%
Taxa de Acerto Real 95,00%
Sistema de ps-processamento nebuloso melhorou o desempenho global do
Sistema Multiagentes, tendo uma Taxa Real de Acerto de 95,00%, a comparao
dos mtodos de Reconhecimento e Classificao de Padres apresentada no
quadro 4.9.
QUADRO 4.9 COMPARAO DOS MTODOS DE RECONHECIMENTO E CLASSIFICAO DE
PADRES DOS DADOS DE TESTE
Taxa Real de Acerto
Regresso
Logstica
Escore
Quadrtico
Redes
Neurais
Banco de Dados
Sem Agente de
Minerao
80,00% 85,00% 80,00%
Com Agente de
Minerao
85,00% 87,50% 90,00%
Agente Decisor 95,00%
Com base no quadro 4.9, observa-se que com a insero da tcnica de
Anlise Fatorial como pr-processamento de dados, obteve-se um melhor
desempenho dos mtodos de Reconhecimento e Classificao de Padres.
O mesmo pode-se observar com a insero da deciso nebulosa que
incrementou o desempenho final das tcnicas de Reconhecimento e Classificao
de Padres isoladas. Desta forma aps os testes do Sistema Multiagentes de
Reconhecimento e Classificao de Padres sem executados, optou-se por validar a
eficcia do sistema em duas bases de dados reais de problemas de Engenharia de
Potncia.
119
4.2 VALIDAO DO SISTEMA MULTIAGENTES PARA RECONHECIMENTO E
CLASSIFICAO DE PADRES
A arquitetura do Sistema Multiagentes de Reconhecimento e Classificao
de Padres foi aplicada na identificao e classificao de transformadores da rede
eltrica de acordo com o nvel de distoro harmnica total de tenso e na
identificao das quedas de estruturas metlicas, e comparado com resultados dos
trabalhos de Souza (2008), Martins (2010) e Wazen (2011), com o intuito de validar
a eficcia do sistema.
4.2.1 Validao do Agente Minerador de Dados
O Agente Minerador de Dados permite a automao do pr-processamento
de dados sem a necessidade da expertise do especialista. Esse pr-processamento
de dados tem como objetivo:
- Reduzir o volume de dados;
- Reduzir o tempo computacional dos mtodos de Reconhecimento e
Classificao de Padres;
- Agrupar as variveis originais que tm uma determinada associao e
esto nas direes de maior variabilidade;
Todos esses objetivos citados devem ser alcanados sem reduzir
significativamente no desempenho dos mtodos de Reconhecimento e Classificao
de Padres.
Desta forma a medida para avaliar a eficcia do Agente Minerador de Dados
foi a Taxa Real de Acerto dos mtodos de Reconhecimento e Classificao de
Padres antes e depois da aplicao da Anlise Fatorial.
O Agente Minerador de Dados foi aplicado aos dois conjuntos de dados para
validao do Sistema Multiagentes, os resultados sero apresentados dentro de
cada conjunto de dados.
120
4.2.1.1 Caso I Distores Harmnicas de Tenso
Primeiramente foram aplicados os mtodos de Reconhecimento e
Classificao de Padres ao conjunto de dados sem nenhum tratamento, todos os
mtodos aplicados utilizam o mtodo de Lachenbruch (leave-one-out), para obter a
Taxa Real de Acerto, desta forma os resultados obtidos so apresentados nos
Quadros 4.10, 4.11 e 4.12.
QUADRO 4.10 CLASSIFICAO DOS DADOS DAS DISTORES HARMONICAS DE TENSO
PELO MTODO DA REGRESSO LOGSTICA COM TAXA DE ACERTO REAL
Classificao Prevista
Bom Problemtico
Classificao Real
Bom
237 44
*84,34% 15,65%
Problemtico
56 22
71,79% *28,20%
Taxa de Acerto Real 72,14%
*Percentual de Acerto
QUADRO 4.11 CLASSIFICAO DOS DADOS DAS DISTORES HARMONICAS DE TENSO
PELO MTODO DO ESCORE QUADRTICO COM TAXA DE ACERTO REAL
Classificao Prevista
Bom Problemtico
Classificao Real
Bom
180 101
*64,05% 35,94%
Problemtico
26 52
33,33% *66,67%
Taxa de Erro Real 64,63%
*Percentual de Acerto
QUADRO 4.12 CLASSIFICAO DOS DADOS DAS DISTORES HARMNICAS DE TENSO
PELO MTODO DE REDES NEURAIS COM TAXA DE ACERTO REAL
Classificao Prevista
Bom Problemtico
Classificao Real
Bom
273 8
*97,15% 2,85%
Problemtico
53 25
67,94% *32,05%
Taxa de Erro Real 83,01%
*Percentual de Acerto
121
Posteriormente foi aplicado o mtodo da Anlise Fatorial ao banco de dados
referente s variveis independentes das distores harmnicas de tenso obtendo
assim os seguintes resultados desta anlise.
TABELA 4.4 ANLISE FATORIAL DOS DADOS DAS DISTORES HARMONICAS DE TENSO
Nmero de Fatores Autovalores Proporo da Varincia Varincia Cumulativa
1 4,74934 27,93% 27,93%
2 2,30975 13,58% 41,52%
3 1,58098 9,30% 50,82%
4 1,31581 7,74% 58,56%
5 1,13126 6,65% 65,21%
6 1,02187 6,01% 71,22%
7 0,926229 5,44% 76,67%
8 0,807517 4,75% 81,42%
9 0,779209 4,58% 86,01%
10 0,602181 3,54% 89,55%
11 0,551315 3,24% 92,79%
12 0,445736 2,62% 95,41%
13 0,305962 1,80% 97,21%
14 0,215793 1,26% 98,48%
15 0,122075 0,71% 99,20%
16 0,090702 0,53% 99,74%
17 0,044276 0,26% 100,00%
FONTE: O AUTOR
A tabela 4.4, apresenta um resumo das informaes da aplicao do Mtodo
da Anlise Fatorial para os dados das Distores Harmnicas de Tenso. O objetivo
da anlise a obteno de um nmero de fatores m com m < p, sendo p a dimenso
do vetor observado. Esses m fatores so responsveis por explicar a maior parte da
variabilidade das 17 variveis. Neste caso, seis (6) fatores foram extrados, para
determinar o nmero de fatores utilizou-se o mtodo de Kaiser, no qual o nmero de
fatores a ser extrado dado pelo nmero de autovalores da matriz de correlao
que tinham valores maiores que ou iguais a 1, apresentado na figura 4.3. Juntos,
eles respondem por 71,22% da variabilidade dos dados originais.
122
FIGURA 4.3 SELEO DO NMERO DE FATORES DOS DADOS DAS DHTV
FONTE O AUTOR
Na tabela 4.5 so apresentados os carregamentos (pesos) dos fatores
rotacionados pelo mtodo Varimax, as comunalidades e as porcentagens
explicativas.
TABELA 4.5 CARREGAMENTOS FATORIAIS ROTACIONADAOS DAS DISTORES
HARMONICAS DE TENSO
Variveis Fator 1 Fator 2 Fator 3 Fator 4 Fator 5 Fator 6
Superintendncia Regional
0,0419 -0,2127 0,5643 0,0395 -0,1511 0,3304
Tenso Primria
-0,0495 -0,0662 0,8395 0,0407 0,0171 -0,0276
Fases
0,1720 0,2522 0,6763 -0,3494 0,0923 0,0449
Potncia
0,1854 0,0088 -0,7072 0,3451 0,0123 0,1382
Nmero de Consumidores
0,8237 0,4923 -0,0591 0,1626 0,0157 0,0282
Residencial 0/50 kWh
0,8079 -0,0813 -0,0651 -0,0131 0,0075 -0,0097
Residencial 50/100 kWh
0,9466 0,0243 -0,0250 -0,0177 -0,0590 -0,0021
Residencial 100/150 kWh
0,8788 0,2855 -0,0751 -0,0161 -0,0779 -0,0260
Residencial 150/200 kWh
0,6289 0,6568 -0,0934 0,0281 -0,0462 0,0310
Residencial 200/300 kWh
0,2597 0,9010 -0,1007 0,0663 0,0643 -0,0085
Residencial 300/500 kWh
-0,0061 0,8771 -0,0972 0,0611 0,1752 0,0232
Residencial 500/1000 kWh
-0,0902 0,3028 0,0031 0,1522 0,7652 -0,0262
Residencial >1000 kWh
-0,0081 -0,0390 -0,0841 -0,0316 0,8785 -0,0330
Comrcio e Poder Pblico
-0,0658 0,0159 0,0726 0,7465 0,0195 0,1867
Industrial
-0,2306 0,0063 0,1911 -0,2471 -0,1524 -0,0163
Rural
-0,0591 0,0376 -0,0019 0,1836 -0,0456 0,8092
Iluminao Pblica
-0,1113 -0,0246 -0,0051 0,5846 -0,0337 -0,5323
Total da Varincia Explicada (%)
27,93 13,58 9,30 7,74 6,65 6,01
Total da Varincia Acumulada (%)
27,93 41,52 50,82 58,56 65,21 71,22
FONTE: O AUTOR
123
Em relao aos dados referentes as Distores Harmnicas de Tenso
foram identificados seis fatores que representam 71,22% da variabilidade, porm
esse seis fatores esto na direo de maior variabilidade, os fatores obtidos pela
Anlise Fatorial so descritos a seguir:
Fator 1: Consumo Baixo (Varincia Explicada 27,93%)
- Nmero de Consumidores (Comunalidade = 0,9520 ; Peso = 0,8237)
- Residencial 0/50 kWh (Comunalidade = 0,6639; Peso = 0,8079)
- Residencial 50/100 kWh (Comunalidade = 0,9011; Peso = 0,9466)
- Residencial 100/150 kWh (Comunalidade = 0,8666; Peso = 0,8788)
- Residencial 150/200 kWh (Comunalidade = 0,8396; Peso = 0,6289)
- Residencial 200/300 kWh (Comunalidade = 0,8991; Peso = 0,2597)
Fator 2: Fator Consumo Mdio (Varincia Explicada 13,58%)
- Residencial 200/300 kWh (Comunalidade = 0,8138; Peso = 0,9010)
- Residencial 300/500 kWh (Comunalidade = 70,92; Peso = 0,8771)
Fator 3: Fator Operacional (Varincia Explicada 9,30%)
- Superintendncia Regional (Comunalidade = 0,5123; Peso = 0,5643)
- Tenso Primria (Comunalidade = 0,7144; Peso = 0,8395)
- Fases(Comunalidade = 0,6833, Peso = 0,6763)
- Potencia (Comunalidade = 0,6729, Peso = -0,7072)
Fator 4: Fator Comrcio/Poder Pblico/Iluminao Pblica( Varincia Explicada
7,74%)
- Comrcio e Poder Pblico (Comunalidade = 0,6025; Peso = 0,0726)
- Iluminao Pblica (Comunalidade = 0,6393; Peso = 0,5846)
Fator 5: Fator Consumo Alto(Varincia Explicada 6,65%)
- Residencial 500/1000 kWh (Comunalidade = 0,7825; Peso = 0,7652)
- Residencial >1000 kWh (Comunalidade = 0,6025; Peso = 0,8785)
124
Fator 6: Fator Rural(Varincia Explicada 6,01%)
- Rural(Comunalidade = 0,6956; Peso = 0,8092)
A varivel Industrial apresenta uma comunalidade de 0,1743, isso indica que
essa varivel pode ser descartada na anlise visto que no tem varincia explicativa,
significativa para o modelo. Lembrando-se que as medies deste banco de dados
foram realizadas no secundrio de transformadores de distribuio, focando-se na
rede de baixa tenso, onde no se verificam cargas significativas do tipo Industrial.
Com base nos fatores obtidos aps a rotao dos fatores foram calculado os
escores fatoriais e estes so utilizados como as variveis independentes para os
mtodos de Reconhecimento e Classificao de Padres. A partir da nova base de
dados foram aplicados trs mtodos de Reconhecimento e Classificao de
Padres, todos eles utilizando o mtodo de Lachenbruch (leave-one-out), para obter
a Taxa Real de Acerto. Os quadros com as Classificaes e Taxa Real de Acerto
so apresentadas a seguir:
QUADRO 4.13 CLASSIFICAO DOS DADOS DAS DISTORES HARMNICAS DE TENSO
APS A APLICAO DA ANLISE FATORIAL PELO MTODO DA REGRESSO LOGSTICA COM
TAXA DE ACERTO REAL
Classificao Prevista
Bom Problemtico
Classificao Real
Bom
*241 40
85,76% 14,23%
Problemtico
53 25
67,94% *32,05%
Taxa de Acerto Real 74,09%
*Percentual de Acerto
QUADRO 4.14 CLASSIFICAO DOS DADOS DAS DISTORES HARMNICAS DE TENSO
APS A APLICAO DA ANLISE FATORIAL PELO MTODO DO ESCORE QUADRTICO COM
TAXA DE ACERTO REAL
Classificao Prevista
Bom Problemtico
Classificao Real
Bom
*177 104
62,98% 37,02%
Problemtico
13 65
16,67% *83,33%
Taxa de Acerto Real 67,41%
*Percentual de Acerto
125
QUADRO 4.15 CLASSIFICAO DOS DADOS DAS DISTORES HARMNICAS DE TENSO
APS A APLICAO DA ANLISE FATORIAL PELO MTODO DE REDES NEURAIS COM TAXA
DE ACERTO REAL
Classificao Prevista
Bom Problemtico
Classificao Real
Bom
*273 8
97,15% 2,85%
Problemtico
53 25
67,94% *32,05%
Taxa de Acerto Real 83,01%
*Percentual de Acerto
Em todos os casos com a aplicao da Anlise Fatorial apresentou uma
melhora no desempenho dos mtodos de Reconhecimento e Classificao de
Padres, a comparao destes resultados apresentada no quadro 4.16
QUADRO 4.16 COMPARAO DOS MTODOS DE RECONHECIMENTO E CLASSIFICAO DE
PADRES DOS DADOS DAS DISTORES HARMNICAS DE TENSO
Taxa Real de Acerto
Regresso
Logstica
Escore
Quadrtico
Redes
Neurais
Distores
Harmnicas de
Tenso
Sem Agente de
Minerao
72,15% 64,63% 83,01%
Com Agente de
Minerao
74,09% 67,41% 83,01%
Com base no quadro 4.17, pode-se observar que a aplicao da Anlise
Fatorial como pr-processamento da informao teve uma melhora de 1,94% no
mtodo de Regresso Logstica, 2,78% no mtodo de Escore Quadrtico, e no teve
melhora no mtodo de Redes Neurais.
4.2.1.2 Caso II Quedas de Estruturas Metlicas de Linhas de Transio
Primeiramente foram aplicados os mtodos de Reconhecimento e
Classificao de Padres ao conjunto de dados das Quedas de Estruturas sem
nenhum tratamento, todos os mtodos aplicados utilizam o mtodo de Lachenbruch
(leave-one-out), para obter a Taxa Real de Acerto, desta forma os resultados obtidos
so apresentados nos quadros a 4.17, 4.18 e 4.19.
126
QUADRO 4.17 CLASSIFICAO DOS DADOS DAS QUEDAS DE ESTRUTURAS PELO MTODO
DA REGRESSO LOGSTICA COM TAXA DE ACERTO REAL
Classificao Prevista
Queda No Queda
Classificao Real
Queda
*23 21
*52,27% 47,73%
No Queda
16 *121
11,67% *88,32%
Taxa de Acerto Real 79,56%
*Percentual de Acerto
QUADRO 4.18 CLASSIFICAO DOS DADOS DAS QUEDAS DE ESTRUTURAS PELO MTODO
DO ESCORE QUADRTICO COM TAXA DE ACERTO REAL
Classificao Prevista
Queda No Queda
Classificao Real
Queda
*33 11
*75,00% 25,00%
No Queda
13 *124
9,49% *90,51%
Taxa de Erro Real 86,74%
*Percentual de Acerto
QUADRO 4.19 CLASSIFICAO DOS DADOS DAS QUEDAS DE ESTRUTURAS PELO MTODO
DE REDES NEURAIS COM TAXA DE ACERTO REAL
Classificao Prevista
Queda No Queda
Classificao Real
Queda
*23 21
*52,27% 47,72%
No Queda
12 *125
13,20% *86,80%
Taxa de Erro Real 81,76%
*Percentual de Acerto
Posteriormente foi aplicado o mtodo da Anlise Fatorial obtendo assim os
seguintes resultados:
127
TABELA 4.6 ANLISE FATORIAL DOS DADOS DAS QUEDAS DE ESTRUTURAS
Nmero de Fatores Autovalores Proporo da Varincia Varincia Cumulativa
1 1,99686 19,96% 19,96%
2 1,64037 16,40% 36,37%
3 1,44306 14,43% 50,80%
4 1,10751 11,07% 61,87%
5 0,907899 9,07% 70,95%
6 0,829768 8,29% 79,25%
7 0,708422 7,08% 86,33%
8 0,609269 6,09% 92,43%
9 0,384674 3,84% 96,27%
10 0,372167 3,72% 100,00%
FONTE: O AUTOR
A tabela 4.6, apresenta um resumo das informaes da aplicao do Mtodo
da Anlise Fatorial para os dados de Quedas de Estruturas. O objetivo da anlise
a obteno de um nmero de fatores m com m < p, sendo p a dimenso do vetor
observado . Esses m fatores que so responsveis por explicar a maior parte da
variabilidade das 10 variveis. Neste caso, quatro fatores foram extrados, para
determinar o nmero de fatores utilizou-se o mtodo de Kaiser, no qual o nmero de
fatores a ser extrado dado pelo nmero de autovalores da matriz de correlao
que tinham valores maiores que ou iguais a 1, apresentado na figura 4.4. Juntos,
eles respondem por 61,878% da variabilidade dos dados originais.
FIGURA 4.4 SELEO DO NMERO DE FATORES DAS QUEDAS DE ESTRUTURAS
FONTE O AUTOR
128
Na tabela 4.7 so apresentados os carregamentos (pesos) dos fatores
rotacionados pelo mtodo Varimax, as comunalidades e as porcentagens
explicativas.
TABELA 4.7 CARREGAMENTOS FATORIAIS ROTACIONADAOS DAS QUEDAS DE
ESTRUTURAS
Variveis Fator 1 Fator 2 Fator 3 Fator 4 Comunalidades
Tenso 0,1010 0,8056 -0,0351 -0,1184 0,6745
Vento -0,0056 0,6884 -0,3440 0,1907 0,6287
Relevo 0,2159 -0,0419 0,7402 -0,0403 0,5979
Massa de Ar Fria 0,7385 0,0863 0,3223 0,1324 0,6743
Massa de Ar Quente -0,8353 0,0187 0,0158 0,1082 0,7096
Temperatura 0,6598 -0,2628 -0,3092 -0,0555 0,6032
Terreno -0,1927 -0,0689 0,7221 -0,0667 0,5677
Capacidade -0,1958 -0,1844 -0,0243 0,7573 0,6465
Funo 0,1329 0,1106 -0,0758 0,7572 0,6091
Fundao -0,2834 0,6091 0,1385 -0,0729 0,4759
Total da Varincia
Explicada (%)
19,96% 16,40% 14,43% 11,07%
Total da Varincia
Acumulada (%)
19,96% 36,37% 50,80% 61,87%
FONTE: O AUTOR
Em relao aos dados referentes as Quedas de Estruturas foram
identificados apenas quatro fatores que representam 61,87% da variabilidade, porm
esse quatro fatores esto na direo de maior variabilidade, os fatores obtidos pela
Anlise Fatorial so descritos a seguir:
Fator 1: Fator Climtico (Varincia Explicada 19,96%)
- Massa de Ar Fria (Comunalidade = 0,6745; Peso = 0,7385)
- Massa de Ar Quente (Comunalidade = 0,7096; Peso = -0,8353)
- Temperatura (Comunalidade = 0,6032, Peso = 0,6598)
Fator 2: Fator Determinao da Estrutura (Varincia Explicada 16,40%)
- Tenso (Comunalidade =0,6745 ; Peso = 0,8056)
- Vento (Comunalidade = 0,6287; Peso = 0,6884)
- Fundao (Comunalidade = 0,4759; Peso = 0,6091)
129
Fator 3: Fator Geogrfico (Varincia Explicada 14,43%)
- Revelo (Comunalidade = 0,5979; Peso = 0,7402)
- Terreno (Comunalidade = 0,5677; Peso = 0,7221)
Fator 4: Fator Caractersticas da LT (Varincia Explicada 11,07%)
- Capacidade (Comunalidade = 0,6465; Peso = 0,7573)
- Funo (Comunalidade = 0,6091; Peso = 0,7572)
Com base nos fatores obtidos aps a rotao dos fatores foi calculado os
escores fatoriais e estes so utilizados como as variveis independentes para os
mtodos de Reconhecimento e Classificao de Padres. A partir da nova base de
dados foram aplicados trs mtodos de Reconhecimento e Classificao de
Padres, todos eles utilizando o mtodo de Lachenbruch (leave-one-out), para obter
a Taxa Real de Acerto. Os quadros com as Classificaes e Taxa Real de Acerto
so apresentadas nos quadros 4.20, 4.21 e 4.22.
QUADRO 4.20 CLASSIFICAO DOS DADOS DAS QUEDAS DE ESTRUTURAS APS A
APLICAO DA ANLISE FATORIAL PELO MTODO DA REGRESSO LOGSTICA COM TAXA
DE ACERTO REAL
Classificao Prevista
Queda No Queda
Classificao Real
Queda
*36 8
81,81% 18,19%
No Queda
28 *109
21,89% 78,11%
Taxa Real de Acerto 80,11%
*Percentual de Acerto
QUADRO 4.21 CLASSIFICAO DOS DADOS DAS QUEDAS DE ESTRUTURAS APS A
APLICAO DA ANLISE FATORIAL PELO MTODO DO ESCORE QUADRTICO COM TAXA DE
ACERTO REAL
Classificao Prevista
Queda No Queda
Classificao Real
Queda
*39 5
88,63% 11,37%
No Queda
17 *120
14,60% 85,40%
Taxa Real de Acerto 87,84%
*Percentual de Acerto
130
QUADRO 4.22 CLASSIFICAO DOS DADOS DAS QUEDAS DE ESTRUTURAS APS A
APLICAO DA ANLISE FATORIAL PELO MTODO DE REDES NEURAIS COM TAXA DE
ACERTO REAL
Classificao Prevista
Queda No Queda
Classificao Real
Queda
*23 21
52,27% 47,72%
No Queda
12 *125
8,75% 91,24%
Taxa Real de Acerto 81,76%
*Percentual de Acerto
Em todos os casos com a aplicao da Anlise Fatorial apresentou uma
melhora no desempenho dos mtodos de Reconhecimento e Classificao de
Padres, a comparao destes resultados apresentada no quadro 4.23.
QUADRO 4.23 COMPARAO DOS MTODOS DE RECONHECIMENTO E CLASSIFICAO DE
PADRES DOS DADOS DAS QUEDAS DE ESTRUTURAS
Taxa Real de Acerto
Queda de Estruturas
Sem Agente de
Minerao
79,56% 86,74% 81,76%
Com Agente de
Minerao
80,11% 87,84% 81,76%
Com base no quadro 4.23, pode-se observar que a aplicao da Anlise
Fatorial como pr-processamento da informao teve uma melhora de 0,55% no
mtodo de Regresso Logstica, 1,10% no mtodo de Escore Quadrtico, e no teve
melhora no mtodo de Redes Neurais. No quadro, 4.24 apresentado um resumo
da aplicao da tcnica de Anlise Fatorial nos dados de validao.
QUADRO 4.24 RESUMO DA APLICAO DA ANLISE FATORIAL COMO AGENTE MINERADOR
DE DADOS
Taxa Real de Acerto
Queda de Estruturas
Sem Agente de
Minerao
79,56% 86,74% 81,76%
Com Agente de
Minerao
80,11% 87,84% 81,76%
Distores
Harmnicas de
Tenso
Sem Agente de
Minerao
72,15% 64,63% 83,01%
Com Agente de
Minerao
74,09% 67,41% 83,01%
131
Com base no quadro 4.24, pode-se observar que em todos os casos a
aplicao da Anlise Fatorial representou uma melhora ns mtodos de
Reconhecimento e Classificao de Padres. No banco de dados referente s
Quedas de Estruturas, foi reduzido o nmero de variveis de entrada de dez para
quatro. No banco de dados referente s Distores Harmnicas de Tenso, houve
uma reduo de 17 variveis para seis fatores. Em ambos os casos houve uma no
desempenho dos mtodos de Reconhecimento e Classificao de Padres. Desta
forma o Agente Minerador de Dados mostrou-se eficaz visto que houve:
- Reduo do volume de dados
- Agrupamento das variveis originais em fatores
- Melhor desempenho computacional devido reduo do volume de dados;
- Melhor performance dos mtodos de Reconhecimento e Classificao de
Padres
- Uma anlise da correlao entre as variveis e sua importncia na
variabilidade dos conjuntos de dados.
4.2.1 Validao do Decisor
O Agente Decisor responsvel pela comunicao do Sistema Multiagentes
com o Usurio, porm tem um papel fundamental no gerenciamento da sntese dos
resultados apresentados pelos Agentes Especialistas. Para a validao do Agente
Decisor foi utilizado o mtodo de Lachenbruch (leave-one-out) em todo o Sistema
Multiagentes. Os resultados para cada conjunto de dados sero apresentados a
seguir.
4.2.1.1 Caso I: Distores Harmnicas de Tenso
Aps a aplicao do Agente Minerador utilizou-se os resultados dos Agentes
Especialistas, para a criao de uma Lgica Nebulosa a fim de ponderar a
classificao feita pelos Agentes Especialistas com suas respectivas Taxa de Acerto
Real. No banco de dados das Distores Harmnicas de Tenso foi utilizado o
mtodo de Lachenbruch (leave-one-out) em todo o sistema e comparado com o
132
valor da classificao real dos dados, a classificao e a Taxa Real de Acerto do
Agente Decisor apresentado no quadro 4.25.
QUADRO 4.25 CLASSIFICAO DOS DADOS DAS DISTORES HARMNICAS DE TENSO
APS A APLICAO DA LGIA NEBULOSA
Classificao Prevista
Bom Problemtico
Classificao Real
Bom
*277 4
98,57% 1,42%
Problemtico
22 *52
32,46% 67,53%
Taxa Real de Acerto 91,64%
Com base no quadro 4.25, o Agente Decisor apresentou uma Taxa Real de
Acerto de 91,64%, essa Taxa Real de Acerto foi comparada com os resultados das
tcnicas de Reconhecimento e Classificao de Padres isoladamente, com e sem a
aplicao da Anlise Fatorial. Esta comparao apresentada no quadro 4.26
QUADRO 4.26 COMPARAO DOS MTODOS DE RECONHECIMENTO E CLASSIFICAO DE
PADRES DOS DADOS DE DISTORES HARMNICAS DE TENSO
Taxa Real de Acerto
Banco de Dados
Regresso
Logstica
Escore
Quadrtico
Redes
Neurais
Distores
Harmnicas de
Tenso
Sem Agente de
Minerao
79,56% 86,74% 81,76%
Com Agente de
Minerao
80,11% 87,84% 81,76%
Agente Decisor
91,64%
No quadro 4.26, pode-se observar que a aplicao do Agente Decisor no
gerenciamento da sntese dos modelos de Reconhecimento e Classificao de
Padres obteve-se uma melhora mdia de 8,40% em relao as tcnicas Isoladas.
133
4.2.1.2 - Caso II - Quedas de Estruturas Metlicas de Linhas de Transio
No banco de dados das Quedas de Estruturas foi utilizado o mtodo de
Lachenbruch (leave-one-out) em todo o sistema utilizando os resultados dos
Agentes Especialistas e suas respectivas Taxas Real de Acerto para a criao de
uma Lgica Nebulosa e comparado com o valor da classificao real dos dados, a
classificao e a Taxa Real de Acerto do Agente Decisor apresentado no quadro
4.27.
QUADRO 4.27 CLASSIFICAO DOS DADOS DAS QUEDAS DE ESTRUTURAS APS A
APLICAO DA ANLISE FATORIAL PELO MTODO DE REDES NEURAIS COM TAXA DE
ACERTO REAL
Classificao Prevista
Queda No Queda
Classificao Real
Queda
37 7
84,09% 15,90%
No Queda
10 *127
7,29% 92,70%
Taxa Real de Acerto 90,60%
*Percentual de Acerto
Com base no quadro 4.27, o Agente Decisor apresentou uma Taxa Real de
Acerto de 90,60%, essa Taxa Real de Acerto foi comparada com os resultados das
tcnicas de Reconhecimento e Classificao de Padres isoladamente, com e sem a
aplicao da Anlise Fatorial. Esta comparao apresentada no quadro 4.28.
QUADRO 4.28 COMPARAO DOS MTODOS DE RECONHECIMENTO E CLASSIFICAO DE
PADRES DOS DADOS DAS QUEDAS DE ESTRUTURAS
Taxa Real de Acerto
Banco de Dados
Regresso
Logstica
Escore
Quadrtico
Redes
Neurais
Distores
Harmnicas de
Tenso
Sem Agente de
Minerao
72,15% 64,63% 83,01%
Com Agente de
Minerao
74,09% 67,41% 83,01%
Agente Decisor
90,60%
134
No quadro 4.28, pode-se observar que a aplicao do Agente Decisor no
gerenciamento da sntese dos modelos de Reconhecimento e Classificao de
Padres obteve-se uma melhora mdia de 15,76% em relao as tcnicas Isoladas.
Um resumo da aplicao da Lgica Nebulosa no ps-processamento da informao
apresentado no quadro 4.29.
QUADRO 4.29 RESUMO DA APLICAO DA LGICA NEBULOSA COMO AGENTE DECISOR
Taxa Real de Acerto
Queda de Estruturas
Sem Agente de
Minerao
79,56% 86,74% 81,76%
Com Agente de
Minerao
80,11% 87,84% 81,76%
Agente Decisor
90,60%
Distores
Harmnicas de
Tenso
Sem Agente de
Minerao
72,15% 64,63% 83,01%
Com Agente de
Minerao
74,09% 67,41% 83,01%
Agente Decisor
91,64%
Com base no quadro 4.29 pode-se observar que o Agente Decisor consegue
sintetizar e integrar os desempenhos das trs Tcnicas de Reconhecimento e
Classificao de Padres testadas, melhorando assim o desempenho global do
sistema.
Dessa forma, o sistema de deciso nebuloso desenhado consegue inferir
uma classificao final aproveitando as vantagens individuais de cada tcnica para
suprir as deficincias pontuais de alguma classificao errada obtida por uma
determinada tcnica.
4.3 RESULTADOS DA VALIDAO DO SISTEMA MULTIAGENTES PARA
RECONHECIMENTO E CLASSIFICAO DE PADRES
A arquitetura proposta foi aplicada em dois bancos de dados reais de
problemas na Engenharia de Potncia. Souza (2008) e Martins (2010) que utilizam
135
separadamente tcnicas de Reconhecimento e Classificao de Padres no banco
de dados das Distores Harmnicas de Tenso, porm nos dois trabalhos os
bancos de dados foram separados previamente em cinco superintendncias
regionais. A comparao entre a classificao apresentada nos dois trabalhos e do
Sistema Multiagentes para Reconhecimento e Classificao de Padres
apresentado no quadro 4.30.
QUADRO 4.30 COMPARAO DOS RESULTADOS DOS DADOS DAS DISTORES
HARMNICAS DE TENSO
Regional Rough sets
Regresso
Logstica
Escore Quadrtico
Sistema
Multiagentes
Indefinies
Taxa Real
de Acerto
Taxa Real de
Acerto
Taxa Real de
Acerto
Taxa Real de
Acerto
SDC 9,4% 37,90% 56,62% 56,25%
91,64%
SDO 27,4% 62,20% 72,58% 53,96%
SDN 44,4% 65,70% 61,90% 64,51%
SDT 24,3% 71,40% 70,27% 67,56%
SDL 19,5% 79,60% 85,15% 75,00%
Com base no quadro 4.30, tem-se que o Sistema Multiagentes para
Reconhecimento e Classificao de Padres apresentou um resultado superior as
tcnicas aplicadas separadamente. Vale ressaltar que o Sistema Multiagentes
efetuou o Reconhecimento e Classificao de Padres em toda a base de dados,
descartando assim expertise do especialista.
No banco de dados de Quedas de Estruturas o resultado do Sistema
Multiagentes para Reconhecimento e Classificao de Padres foi comparado aos
resultados apresentando por Wazen (2011), que utilizou duas tcnicas de
Reconhecimento e Classificao de Padres. Os resultados das comparaes so
apresentados no quadro 4.31.
QUADRO 4.31 COMPARAO DOS RESULTADOS DOS DADOS DAS QUEDAS DE
ESTRUTURAS
Rough sets
Regresso
Logstica
Sistema Multiagentes
Indefinies
Taxa Real de
Acerto
Taxa Real de
Acerto
Taxa Real de Acerto
Quedas de
Estruturas
76,24% 69,76% 80,11% 90,60%
136
Neste banco de dados o Sistema Multiagentes obteve um resultado melhor
do que das tcnicas aplicadas separadamente por Wazen (2011), o que comprova a
eficcia do Sistema Multiagentes no processo de Minerao de Dados e no
Gerenciamento dos mtodos de Reconhecimento e Classificao de Padres.
137
5 CONCLUSES
Neste trabalho buscou-se apresentar uma viso geral sobre a importncia
dos mtodos de Reconhecimento e Classificao de Padres em problemas reais.
Desta forma destacados a necessidade de mtodos cada vez mais eficientes para
suprir problemas reais de Reconhecimento e Classificao de Padres. Visto que
em muitos casos a aplicao de apenas um mtodo de Reconhecimento e
Classificao de Padres no supre essa necessidade, ento um sistema que
integre vrios mtodos se torna cada vez mais importante.
Com o intuito de utilizar a arquitetura de Sistema Multiagentes para integrar
e gerenciar os mtodos de Reconhecimento e Classificao de Padres foi feito um
estudo sobre as definies e a fundamentao terica dos Sistemas Multiagentes,
bem como as principais vantagens. Foram tambm investigados os principais
desafios enfrentados pela comunidade cientfica na concepo e execuo dos
Sistemas Multiagentes. Podemos destacar que os principais desafios enfrentados
esto relacionados a escolha de design especficos para a criao dos agentes,
problemas relacionados a interoperabilidade e a ontologia, bem como a escolha de
design para a concepo de agentes autnomos. Desta forma foi apresentado o
atual estado da arte sobre as aplicaes dos Sistemas Multiagentes na Engenharia
de Potncia.
A fim de validar a arquitetura proposta foram utilizados dois bancos de dados
contemplando problemas reais de Reconhecimento e Classificao de Padres na
Engenharia de Potncia.
Para uma anlise do banco de dados referente as Distores Harmnicas de
Tenso foi apresentado uma viso geral da questo da qualidade de energia eltrica
bem como seus principais distrbios, sua definies, caractersticas e as principais
normas tcnicas sobre limites para os distrbios da Qualidade de Energia Eltrica.
Para o banco de dados foram utilizadas informaes histricas de medies de
harmnicos de tenso, realizadas nos transformadores do sistema de distribuio da
COPEL. Adicionalmente, foram consideradas na elaborao do modelo, algumas
caractersticas tcnicas e operacionais dos transformadores monitorados. Estas
informaes associaram-se aos dados de consumo, tipo e quantidade de
138
consumidores, tenso de operao e potncia nominal do transformador, tipo de
ligao, dentre outras informaes julgadas importantes.
Para a anlise do banco de das Quedas de Estruturas foram descritas as
informaes gerais sobre linhas de transmisso, considerando as partes que as
compem bem como as principais caractersticas destes componentes. Estas
informaes foram necessrias para identificao da relao das caractersticas com
o problema, levantado e apresentando quais dados foram relevantes para os
estudos relacionados aos esforos adicionais s quais as estruturas esto sujeitas.
No processo de construo da Arquitetura de um Sistema Multiagentes para
Reconhecimento e Classificao de Padres foi necessrio definir a funo de cada
agente inteligente afim de que o Sistema Multiagentes integrasse no somente
mtodos de Reconhecimento e Classificao de Padres, mas que gerenciasse
desde o pr-processamento do banco de dados at ponderao da classificao de
cada mtodo de Reconhecimento e Classificao de Padres, desta forma foram
definidos trs agentes fundamentais na arquitetura: Agente Minerador de Dados,
Agentes Especialistas e Agente Decisor.
Num primeiro momento foi utilizado um Agente Minerados de dados
responsvel pela filtragem dos dados e aplicao da Anlise Fatorial como uma
tcnica de pr-processamento de informao com o intuito de que o Sistema
Multiagentes tivesse a possibilidade de acessar o banco de dados de forma
autnoma, realizando assim uma limpeza de dados, reduo do volume de dados,
porm sem interferir negativamente na performance dos mtodos de
Reconhecimento e Classificao de Padres. Com base nos escores fatoriais
rotacionados pode-se observar que a Anlise Fatorial agrupou as variveis com
mais correlao em fatores com direes de maior variabilidade e tambm
descartando as variveis no so significativas para a variabilidade do modelo.
Os resultados com a aplicao da Anlise Fatorial no pr-processamento
dos dados foi comparado com a aplicao das tcnicas de Reconhecimento e
Classificao de Padres no banco de dados originais, desta forma podendo
comprovar a eficcia da do Agente Minerador de Dados nos dois bancos de dados
em estudo.
Os mtodos de Reconhecimento e Classificao de Padres foram testados
e avaliados antes de serem implementados como Agentes Especialistas. Esses
mtodos foram selecionados por terem apresentados melhores resultados nos
139
bancos de dados de teste e tambm por j terem sidos aplicados nos mesmos
bancos de dados utilizados para validao.
Como a Arquitetura proposta tem como intuito no apenas integrasse os
mtodos de Reconhecimento e Classificao de Padres, mas que gerenciasse a
sntese dos resultados dos Agentes Especialistas. Assim o Agente Decisor teve
como principal objetivo o ps-processamento dos resultados apresentados pelos
Agentes Especialistas.
O Agente Decisor utiliza uma Lgica Nebulosa do modelo Mandani para
ponderar as Taxas Reais de Acerto com a classificao de uma nova observao,
obtendo assim um resultado final que contempla as principais vantagens de cada
mtodo de Reconhecimento e Classificao de Padres, suprindo assim as
deficincias pontuais de cada mtodo.
A aplicao da Lgica Nebulosa foi comparada com os mtodos de
Reconhecimento e Classificao de Padres aplicados separadamente nos bancos
de dados podendo assim comprovar sua eficcia.
De forma individual cada Agente Inteligente apresentou um resultado
satisfatrio, visto assim que o Sistema Multiagentes integrando o Agente Minerador
de Dados os Agentes Especialistas e o Agente Decisor agrega tanto as vantagens
do pr-processamento, do Reconhecimento e Classificao de Padres e do ps-
processamento dos resultados, tendo assim um resultado global melhor do que o
resultado de cada Agente Inteligente agindo separadamente.
Por fim as principais contribuies cientificas deste trabalho so:
Utilizao da Anlise Fatorial como pr-processamento de dados para
os mtodos de Reconhecimento e Classificao de Padres;
Criao de uma Lgica Nebulosa no ps-processamento dos
resultados dos mtodos de Reconhecimento e Classificao de
Padres;
Estruturao da Minerao de dados em um Sistema Multiagentes
para Reconhecimento e Classificao de Padres.
Fica ento como sugestes para trabalhos futuros:
140
Testar a Arquitetura do Sistema Multiagentes de Reconhecimento e
Classificao de Padres em outros problemas de Reconhecimento e
Classificao de Padres.
Utilizar outros mtodos de Reconhecimento e Classificao de Padres como
Agentes Especialistas.
Combinar outras regras dentro do Agente Decisor.
141
6 REFERNCIAS BIBLIOGRFICAS
AGNCIA NACIONAL DE ENERGIA ELTRICA ANEEL. Procedimentos de
Distribuio de Energia Eltrica no Sistema Eltrico Nacional. PRODIST,
mdulo 8, ago. 2007.
AOKI, A.R. Uma Proposta de Arquitetura Multiagentes para Operao de
Sistemas Eltricos. Itajub, 2003. Tese de Doutorado - Programa de Ps-
Graduao em Engenharia Eltrica, Universidade Federal do de Itajub.
AOKI, A.R. Notas de Aula da Disciplina Inteligncia Artificial, Universidade
Federal do Paran, Curitiba, PR, Curso Inteligncia Artificial Aplicada, 2005.
BAKER, P. C.; CATTERSON, V. M.; MCARTHUR, S. D. J.; Integrating an Agent-
based Wireless Sensor Network within an Existing Multi-Agent Condition
Monitoring System. 15th International Conference on Intelligent System
Applications to Power Systems, ISAP 2009 November 8 - 12, 2009, Curitiba, Brazil
CATTERSON, V. M.; RUDD, S. E.; MCARTHUR, S. D. J.; MOSS, G.; On-line
Transformer Condition Monitoring through Diagnostics and Anomaly
Detection. 15th International Conference on Intelligent System Applications to Power
Systems, ISAP 2009 November 8 - 12, 2009, Curitiba, Brazil
CHAVES NETO, A.; Anlise Multivariada Aplicada a Pesquisa: Notas de aula.
Departamento de Estatstica, Universidade Federal do Paran, Curitiba, 1997.
CHIGUTI. Aplicao da Anlise Multivariada na Caracterizao dos Municpios
Paranaenses Segundo suas Produes Agrcolas. Dissertao (Mestrado)
UFPR, 2005.
COPEL Companhia Paranaense de Energia. Disponvel em
http://www.copel.com/pagcopel.nsf
COURY, D. V.; THORP, J. S.; HOPKINSON, K. M.; BIRMAN, K. P.; An agent-based
current differential relay for use with a utility intranet. IEEE Transaction on
Power Delivery, vol. 17, no. 1, pp. 4753, Jan. 2002.
DAVIDSON, E, M,; MCARTHUR, S, D, J,; MCDONALD, J, R,; CUMMING, T,;
WATT, I,; Applying multi-agent system technology in practice: Automated
management and analysis of SCADA and digital fault recorder data. IEEE
Transaction on Power System. vol. 21, no. 2, pp. 559567, May 2006.
DAVIDSON, E. M.; MCARTHUR, S. D. J.; Exploiting Multi-agent System
Technology within an Autonomous Regional Active Network Management
System. 14th International Conference on Intelligent System Applications to Power
Systems, ISAP 2007 November 4 - 8, 2007, Kaohsiung, Taiwan.
142
DIMEAS, A. L.; HATZIARGYRIOU, N. D.; Operation of a multi-agent system for
microgrid control. IEEE Transaction on Power System, vol. 20, no. 3,pp. 1447
1455, Aug. 2005.
DIMEAS, A. L.; HATZIARGYRIOU, N. D.; Agent based control of Virtual Power
Plants. 14th International Conference on Intelligent System Applications to Power
Systems, ISAP 2007 November 4 - 8, 2007, Kaohsiung, Taiwan.
DU, W.; CHEN, Z.; WANG, H. F.; DUNN, R.; Feasibility of online collaborative
voltage stability control of power systems. IET Gener. Transm. Distrib., 2009,
Vol. 3, Iss. 2, pp. 216224.
EDWARDS, D.; SRIVASTAVA, S. K.; CARTES, D. A.; SIMMONS, S.; WILDE, N.;
Implementation and Validation of a Multi-Level Security Model Architecture.
14th International Conference on Intelligent System Applications to Power Systems,
ISAP 2007 November 4 - 8, 2007, Kaohsiung, Taiwan.
ESQUARCINI, R. Classificao e Ranqueamento dos Municpios Paranaenses
Segundo suas Polticas Setoriais Atravs da Anlise Multivariada. Dissertao
(Mestrado) UFPR, 2005.
FERBER, J. Multi-Agent Systems: An Introduction to Distributed Artificial
Intelligence. Addison-Wesley, 1999. 509 p.
FAUSETT, L. V. Fundamentals of Neural Networks - Architectures, Algorithms,
and Applications. Prentice Hall International Editions. USA, New Jersey, 1994.
FAYYAD, U.; PIATETSKY-SHAPIRO, G.; SMYTH, P. From data mining to
knowledge discovery: an overview. Advances in Knowledge Discovery & Data
Mining, 1996 pp. 1-34.
Foundation for Intelligent Physical Agents (FIPA). Disponvel em http://www.fipa.org/.
FRANKLIN, S.; GRAESSER, A.; Is it an agent or just a program?, Proc. 3rd
Int.Workshop Agent Theories, Architectures, and Languages 1996, New York:
Springer-Verlag.
FUCHS, R. D. Transmisso de Energia Eltrica: Linhas Areas Volume 1. Rio
de Janeiro: Livros Tcnicos e Cientficos Editora, 1977.
FUKUI, C.; KUDO, H.; KODA, J.; YABE, K.; TOMITA, Y.; A cooperative protection
system with an agent model. IEEE Transaction on Power Delivery, vol. 13, no. 4,
pp. 10601066, Oct. 1998.
FURTADO, M. E. et al. Ranqueamento de faxinais do estado do paran atravs
da anlise fatorial. Revista Cincias Exatas e Naturais, v. 5, p. 8599, 2003.
GASSER, L.; BOND, A. H. Readings in Distributed Artificial Intelligence. San
Mateo: Morgan Kaufmann, 1988.
143
GEHRKE, O.; BINDNER, H.; Building a test platform for agents in power system
control: Experience from SYSLAB. 14th International Conference on Intelligent
System Applications to Power Systems, ISAP 2007 November 4 - 8, 2007,
Kaohsiung, Taiwan.
GIOVANINI, R.; HOPKINSON, K.; COURY, D. V.; THORP, J. S.; A primary and
backup cooperative protection system based on wide area agents. IEEE
Transaction on Power Delivery, vol. 21, no. 3, pp. 12221230, Jul. 2006.
HGER, U.; LEHNHOFF, S.; REHTANZ, C.; WEDDE, H. F.; Multi-Agent System
for Coordinated Control of FACTS devices. 15th International Conference on
Intelligent System Applications to Power Systems, ISAP 2009 November 8 - 12,
2009, Curitiba, Brazil
HAIR, J. F. et al. Applied Multivariate Statistical Analysis. New York: Prentice
Hall,2009.
HAYKIN, S. Redes Neurais: Princpios e Prtica. 2 Edio, Porto Alegre:
Bookman, 2002.
HILLS, M. Applied Statistics. [S.l.]: Book Review, 1977.
HOPKINSON, K.; WANG, X.; GIOVANINI, R.; THORP, J.; BIRMAN, K.; COURY,
D.; EPOCHS: A platform for agent-based electric power and communication
simulation built from commercial off-the-shelf components, IEEE Transaction on
Power System, vol. 21, no. 2, pp. 548558,May 2006.
HUANG, K.; SRIVASTAVA, S. K.; CARTES, D. A.; SLODERBECK, M.; Intelligent
Agents Applied to Reconfiguration of Mesh Structured Power Systems. 14th
International Conference on Intelligent System Applications to Power Systems, ISAP
2007 November 4 - 8, 2007, Kaohsiung, Taiwan.
IEC Communications Networks and Systems in Substations. 2005, Document
IEC 61850.
IEC Energy Management System Application Program Interface (EMS-API) -
Part 301: Common Information Model (CIM) Base, 2005, document IEC 61970-301.
Java Agent Development Framework (JADE). Disponvel em http://jade.cselt.it/.
JOHSON, R. A.; WICHERN, D. W.; Applied Multivariate Statistical Analysis. 4.
ed. New Jersey: Prentice-Hall, inc., 1998.
KACHIGAN, S. K. Multivariate statistical analysis. New York: Radius Press, 1991.
KAISER, H. F. The varimax criterion for analytic rotation in factor analysis.
Psychometrika, v. 23, p. 187200, 1958.
144
KORBIK, A.; MCARTHUR, S. D. J.; AULT, G. W.; BURT, G. M.; MC-DONALD, J.
R.; Enabling active distribution networks through decentralized autonomous
network management. in Proc. 18th Int. Conf. Electricity Distribution (CIRED), Turin,
June 2005.
KORITAROV, V. S.; Real-world market representation with agents. IEEE Power
and Energy Magazine, vol. 2, no. 4, pp. 3946, Jul. 2004.
LACHENBRUCH, P. A. Discriminant Analysis. New York, Halfner: 1975.
LEE, C.C. Fuzzy Logic in Control Systems: Fuzzy Logic Controller Part I. IEEE
Transactions on Systems, Man, and Cybernetics, Vol. 20, No. 2, 1990a. p. 404-418.
LEE, C.C. Fuzzy Logic in Control Systems: Fuzzy Logic Controller Part II.
IEEE Transactions on Systems, Man, and Cybernetics, Vol. 20, No. 2, 1990b. p. 419-
435.
LIM, I-H.; LEE, S-J.; CHOI, M-S.; CROSSLEY, P.; Multi-Agent System-based
Protection Coordination of Distribution Feeders. 14th International Conference on
Intelligent System Applications to Power Systems, ISAP 2007 November 4 - 8, 2007,
Kaohsiung, Taiwan.
LIM, I-H.; CHOI, M-S.; LEE, S-J.; KIM, T. W.; Intelligent Distributed Restoration by
Multi-Agent System Concept in DAS. 15th International Conference on Intelligent
System Applications to Power Systems, ISAP 2009 November 8 - 12, 2009, Curitiba,
Brazil
LIMA, J. D. A anlise Econmico-financeira de Empresas Sob a tica da
Estatstica Multivariada. Dissertao (Mestrado em Mtodos Numricos em
Engenharia) Setores de Tecnologia e de Cincias Exatas, Universidade Federal do
Paran, Curitiba, 2002.
LO, Y. L.; WANG, C. H.; LU, C. N.; A Multi-agent Based Service Restoration in
Distribution Network with Distributed Generations. 15th International Conference
on Intelligent System Applications to Power Systems, ISAP 2009 November 8 - 12,
2009, Curitiba, Brazil
MAES, P.; Artificial life meets entertainment: Life-like autonomous agents.
Commun. ACM, vol. 38, no. 11, pp. 108114, 1995.
MAMDANI, E.H. Application of Fuzzy Logic to Approximate Reasoning Using
Linguistic Synthesis. IEEE Transactions on Computers, Vol. c-26, No. 12, 1977. p.
1182-1191.
MARQUES, A. F. Aplicao da anlise multivariada na infraestrutura e no
desempenhodas escolas pblicas do ensino fundamental e mdio
pertencentes ao ncleo regionalde educao de paranava. Acta Scientiarum, v.
32, p. 7581, 2010.
145
MARTINS, R.; Classificao de Transformadores de Distribuio de Energia
Eltrica quanto DHTV Usando Rough Sets. Curitiba, 2009. Dissertao de
Mestrado - Programa de Ps-Graduao em Engenharia Eltrica, Universidade
Federal do Paran.
MCARTHUR, S. D. J.; MCDONALD, J. R.; HOSSACK, J. A.; A multi-agent
approach to power system disturbance diagnosis. Autonomous Systems and
Intelligent Agents in Power System Control and Operation (Power Systems), C.
Rehtanz, Ed. New York: Springer-Verlag, Jul. 2003, pp. 7599.
MCARTHUR, S. D. J.; DAVIDSON, E. M.; DUDGEON, G. J. W.; MC-DONALD, J.
R.; Toward a model integration methodology for advanced applications in
power engineering, IEEE Transaction on Power System, vol. 18, no. 3, pp. 1205
1206, Aug. 2003.
MCARTHUR, S, D, J,; STRACHAN, S, M,; JAHN, G,; The design of a multiagent
transformer condition monitoring system. IEEE Transaction on Power System.
vol. 19, no. 4, pp. 18451852, Nov. 2004.
MCARTHUR, S.D.J.; DAVIDSON, E. M.; CATTERSON, V. M.; DIMEAS, A. L.;
HATZIARGYRIOU, N. D.; PONCI, F.; FUNABASHI, T.; Multi-Agent Systems for
Power Engineering ApplicationsPart I: Concepts, Approaches, and Technical
Challenges: IEEE Transactions on Power Systems, vol. 22, n. 4, nov. 2007.
MINGOTI, S. A. Anlise de Dados Atravs de Mtodos de Estatstica
Multivariada: Uma Abordagem Aplicada. Belo Horizonte: Editora UFMG, 2005.
MOMOH, J. A.; ALFRED, K.; XIA, Y.; Framework for Multi-Agent System (MAS)
Detection and Control of Arcing of Shipboard Electric Power Systems. 15th
International Conference on Intelligent System Applications to Power Systems, ISAP
2009 November 8 - 12, 2009, Curitiba, Brazil
MULLER, S. I. M. G. Comparao entre os mtodos de mxima
verossimilhana, distncia mnima e o mtodo de Fisher para o
reconhecimento de padres em imagens coloridas. Curitiba, 1997. 116 f.
Dissertao (Mestrado em Geodsica) Setor de Cincias Geodsicas,
Universidade Federal do Paran.
MLLER, S. I. M. G.; CHAVES NETO, A. Programa de tcnicas integradas para
anlise e avaliao de fornecedores. RNTI - Revista Negcios e Tecnologia da
Informao, v. 2, p. 95104, 2007.
OPERADOR NACIONAL DO SISTEMA ELTRICO ONS. Padres de
Desempenho da Rede Bsica, submdulo 2.2, ago. 2002.
OZERENKO, A.; GYULMALIEV, A.; GAGARIN, S. Factorial analysis in selecting
the zeolite catalyst for 2,6-dimethylnaphthalene synthesis. Coke and
Chemistry, v. 50, p. 200206, 2007.
146
PANDYA, A.S. & MACY, R. B. Pattern Recognition with Neural Networks in C++.
CRC Press, Inc. Florida Atlantic University, USA, Boca Raton, Florida, 1996.
PARK, S.J.; LIM, J.T.; Modelling and control of agent-based power protection
system using supervisors. Proc. Inst. Elect. Eng., Control Theory Appl., vol. 153,
no. 1, pp. 9298, Jan. 2006.
QUEIROZ, J. et al. Geochemical characterization of heavy metal contaminated
area using multivariate factorial kriging. Environmental Geology, v. 55, p. 95105,
008.
RENCHER, A. C. Methods of Multivariate Analysis. New York: Wiley-Interscience,
2002.
ROSA, M.A.; MIRANDA, V.; MATOS, M.; SHEBL, G.; LEITE DA SILVA, A.M.;
Intelligent Agent-based Environment to Coordinate Maintenance Schedule
Discussions. 15th International Conference on Intelligent System Applications to
Power Systems, ISAP 2009 November 8 - 12, 2009, Curitiba, Brazil
RUSSELL, S.; NORVIG, P.; Artificial Intelligence: A Modern Approach.
Englewood Cliffs, NJ: Prentice-Hall, 1995.
SHENG, S.; LI, K. K.; CHAN, W. L.; XIANGJUN, Z.; XIANZHONG, D.; Agent-based
self-healing protection system. IEEE Transaction on Power Delivery, vol. 21, no. 2,
pp. 610618, Apr. 2006.
SILBERSCHATZ, A.; TUZHILIN, A.: On subjective measures of interestingness in
knowledge discovery. Proceedings of the First International Conference on
Knowledge Discovery and Data Mining 1, 1995, p. 275-281.
SOUZA, W. E.; Anlise das Distores Harmnicas de Tenso a partir de
Caractersticas dos Transformadores e de Dados de Consumo. Curitiba, 2008.
Dissertao de Mestrado - Programa de Ps-Graduao em Mtodos Numricos em
Engenharia, Universidade Federal do Paran.
SPEARMAN, C. General intelligence objectively determined and measured.
American Journal of Psychology, v. 15, p. 201293, 1904.
VAN SICKEL, J. H.; LEE, K Y. Distributed Discrete Event and Psuedo Real-time
Combined Simulation for Multi-agent Controlled Power Plants. 15th International
Conference on Intelligent System Applications to Power Systems, ISAP 2009
November 8 - 12, 2009, Curitiba, Brazil
VLACHOGIANNIS, J. G.; HATZIARGYIOU, N. D.; LEE, K. Y.; Ant colony system-
based algorithm for constrained load flow problem. IEEE Transaction on Power
System, vol. 20, no. 3, pp. 12411249, Aug. 2005.
WAZEN, R. N. Proposta de Aplicao da Manuteno Baseada em
Confiabilidade para Linhas de Transmisso da COPEL. Monografia de
Especializao da Universidade Tecnolgica Federal do Paran, 2008.
147
WAZEN, R. N. Avaliao da Suscetibilidade de falhas em Estruturas Metlicas
de Linhas de Transmisso, Curitiba, 2011. Dissertao de Mestrado - Programa de
Ps-Graduao em Engenharia Eltrica, Universidade Federal do Paran.
WIDERGREN, S. E.; ROOP, J. M.; GUTTROMSON, R. T.; HUANG, Z.; Simulating
the dynamic coupling of market and physical system operations. in Proceedings
of the IEEE Power Engineering Society General Meeting, Jun. 2004, pp. 748753.
WOOLDRIDGE, M.; JENNINGS, N. R.; Pitfalls of agent oriented development. in
Proc. 2nd International Conference Autonomous Agents, 1998, pp. 385391.
WOOLDRIDGE, M.; WEISS, G.; Intelligent Agents. Multi-agent Systems,
Cambridge, MA: The MIT Press, Apr. 1999, pp. 351.
ZADEH, L.A. Fuzzy Sets. Information and Control, Vol. 8, 1965. p. 338-353.
ZADEH, L.A. Outline of a New Approach to the Analysis of Complex Systems
and Decision Processes. IEEE Transactions on Systems, Man, and Cybernetics,
Vol. SMC-3, No. 1, 1973. p. 28-44.