Uma instituição financeira possui uma base de dados com o histórico de crediário
oferecido aos seus clientes. Baseado neste histórico, a instituição deseja inferir se um
novo cliente pagará ou não a dívida contraída.
A base de dados possui 2077 exemplos, com 11 atributos cada, de créditos concedidos
aos seus clientes. A base informa ainda se o cliente honrou ou não o pagamento do
empréstimo. Abaixo segue a descrição dos atributos da base:
A partir da base original, foram criadas 3 bases de treinamento, com 1500 exemplos
cada escolhidos aleatoriamente a partir da base original, e 3 bases de testes com 577
exemplos cada, representando, respectivamente, 72,2% e 27,8% do total de cada sub-
grupos de dados. Estas bases estão nos arquivos treino01.txt, treino02.txt, treino03.txt,
teste01.txt, teste02.txt e teste03.txt.
a b <-- classified as
306 0 | a = 0
271 0 | b = 1
II. Com normalização dos atributos de entrada e com 2 números diferentes de
neurônios na camada escondida. Explique a escolha dos números.
Observar que a rede neural está parametrizada para Normalizar os Atributos e não as
Classes, como se pode ver na figura a seguir. A quantidade de neurônios na primeira
rodada desta questão foi feita com a (quantidade de entradas + saídas dividido por dois,
ou seja 6 neurônios escondidos na primeira camada), já na segunda, como indicado na
figura abaixo, a quantidade de neurônios foi aumentada para 8.:
1º. – 6 neurônios
Scheme: weka.classifiers.functions.MultilayerPerceptron -L 0.3 -M 0.2 -N 500 -V 0 -S 0 -E 20 -H a -
B -C -R
=== Summary ===
Correctly Classified Instances 515 89.2548 %
Incorrectly Classified Instances 62 10.7452 %
Kappa statistic 0.7829
Mean absolute error 0.1426
Root mean squared error 0.2927
Relative absolute error 28.6074 %
Root relative squared error 58.6338 %
Total Number of Instances 577
2º. – 8 neurônios
Scheme: weka.classifiers.functions.MultilayerPerceptron -L 0.3 -M 0.2 -N 500 -V 0 -S 0 -E 20 -H 8 -
G -B -C -R
=== Summary ===
Correctly Classified Instances 508 88.0416 %
Incorrectly Classified Instances 69 11.9584 %
Kappa statistic 0.7589
Mean absolute error 0.1456
Root mean squared error 0.3041
Relative absolute error 29.1997 %
Root relative squared error 60.9287 %
Total Number of Instances 577
Com 8 neurônios
Scheme: weka.classifiers.functions.MultilayerPerceptron -L 0.3 -M 0.2 -N 1 -V 0 -S 0 -E 20 -H 8 -B -
C -R
=== Summary ===
Correctly Classified Instances 509 88.2149 %
Incorrectly Classified Instances 68 11.7851 %
Kappa statistic 0.7603
Mean absolute error 0.2112
Root mean squared error 0.3134
Relative absolute error 42.3556 %
Root relative squared error 62.7918 %
Total Number of Instances 577
Os demais resultados foram adicionados apenas na tabela do Excel, mas não serão
apresentados aqui.
Para os itens II, III, IV e V, indique para cada um dos casos o número de neurônio na
camada escondida e explique a sua escolha. Para todos os itens, não varie a taxa de
aprendizagem nem o termo de momento.
Sugestão: Caso queira poderá utilizar a tabela para visualizar os resultados. Planilha e
Excel anexo.
Exemplo do relatório parcial do exercício:
Grupo 01 (Aprendizagem+teste 01)
Configuração
I II III‐a III‐b III‐c IV V VI
Hidden layer # 6 6 6 6 6 6
Classf. Correta em % 53,0% 89,3% 88,0% 90,3% 89,4% 89,8%
Classf. Incorreta em % 47,0% 10,7% 12,0% 9,7% 10,6% 10,2%
MAE (%) 49,6% 14,3% 21,0% 15,2% 14,0% 15,2%
RMSE (%) 50,1% 29,3% 31,6% 28,3% 29,4% 28,5%
RAE (%) 99,5% 28,6% 42,1% 30,4% 28,0% 30,5%
RRSE (%) 100,3% 58,6% 63,2% 56,8% 58,8% 57,1%
Hidden layer # 8 8 8 8 8
Classf. Correta em % 88,0% 88,2% 90,3% 88,2%
Classf. Incorreta em % 12,0% 11,8% 9,7% 11,8%
MAE (%) 14,6% 21,1% 14,9% 14,7%
RMSE (%) 30,4% 31,3% 28,4% 31,0%
RAE (%) 29,2% 42,4% 29,8% 29,4%
RRSE (%) 60,9% 62,8% 56,9% 62,0%