Aprendizado de Máquina

MESTRADO EM
COMPUTAO
APRENDIZADO DE
MQUINA
RELATRIO DE ALGORITMOS:
Carlos Gracioli Neto - IFMT

Alessandro Mundim UNEMAT
Prof. Jos Viterbo
INTRODUO
Objetivos
Bases de Dados (diabetes.arff e ionosphere.arff)
Algoritmos (J48, IBk e SMO)
CONJUNTOS DE DADOS
(DATASETS)
diabetes.arff
768 instncias, sendo descritas por oito atributos numricos, mais a classe.
Ionosphere.arff
351 instncias, sendo descritas por 34 atributos de previso contnuos, mais a
classe.
APLICAO DOS
ALGORITMOS
Todos os algoritmos foram testados com 66% da base de
dados.
J48
verso Java do tradicional algoritmo C4.5 (rvores de deciso)
Configuraes:
Variao do M = 2, 3 e 4
Variao do confidenceFactor = 0,25, 0,50, 0,75 e 1,00
IBk
utiliza os K vizinhos mais prximos para votar uma classe para a instncia de teste.
Uma variante de KNN.
Configuraes:
Variao de N = 1 at 5
APLICAO DOS
ALGORITMOS
SMO
Uma variante de SVM
Tratamento de conjuntos de dados esparsos
Configuraes:
Variao de c = 1, 3 e 5
Kernel = PolyKernel, NormalizePolyKernel, Puk, RBFKernel.
RESULTADOS DATASET
DIABETES.ARFF
J48
Fator de
confiana
0,25
0,50
0,75
1,00
0,25
0,50
0,75
1,00
0,25
0,50
0,75
1,00
N de M
2
2
2
2
3
3
3
3
4
4
4
4
DataSet: diabetes
Algoritmo: (C.4.8) J48
N de
Nmero de
folhas
ns
20
39
22
43
22
43
22
43
20
39
20
39
22
43
22
43
19
37
20
39
20
39
20
39
Tempo de
criao (s)
0,03
0,03
0,44
0,83
0,03
0,03
0,41
0,70
0,05
0,03
0,45
0,62
%
Acurcia
76,24
75,09
75,09
75,09
75,86
75,86
75,86
75,86
74,71
74,71
74,71
74,71
RESULTADOS DATASET
DIABETES.ARFF
Modelo com melhor acurcia
RESULTADOS DATASET
DIABETES.ARFF
Modelo mais generalista
RESULTADOS DATASET
DIABETES.ARFF
IBk
DataSet: diabetes
Algoritmo: KNN (IBk)
Nearest
% Acurcia
Neighbour
1
72,79
2
75,47
3
74,71
4
73,56
5
75,09
RESULTADOS DATASET
DIABETES.ARFF
SMO
DataSet: diabetes
Algoritmo: SMO (SVM)
Kernel
Param. c
%
Acurcia
1.0
79,31
PolyKernel
3.0
78.93
5.0
79.31
1.0
67,81
NormalizePolyK
3.0
72,41
ernel
5.0
73.56
1.0
79,31
3.0
Puk
78,16
5.0
76,63
1.0
68,20
3.0
RBFKernel
68,20
5.0
69,73
Menor tempo
para gera o
modelo.
Maior tempo
para gera o
modelo.
RESULTADOS DATASET
IONOSPHERE.ARFF
J48
Fator de
confiana
0,25
0,5
0,75
1
0,25
0,5
0,75
1
0,25
0,5
0,75
1
N de M
2
2
2
2
3
3
3
3
4
4
4
4
DataSet: ionosphere
Algoritmo: (C4.5) J48
N de
Nmero de
folhas
ns
18
35
18
35
18
35
18
35
18
31
18
31
18
35
18
35
14
27
14
27
16
31
16
31
Tempo de criao
(s)
0,05
0,03
1,00
1,03
0,03
0,03
1,14
1,03
0,03
0,03
0,92
1,02
%
Acurcia
84,87
84,87
84,87
84,87
85,71
88,23
88,23
88,23
84,03
84,03
83,19
83,19
RESULTADOS DATASET
IONOSPHERE.ARFF
Modelo com melhor acurcia
RESULTADOS DATASET
IONOSPHERE.ARFF
Modelo mais generalista
RESULTADOS DATASET
IONOSPHERE.ARFF
IBk
DataSet: ionosphere
Algoritmo: KNN (IBk)
Nearest
% Acurcia
Neighbour
1
80,67
2
84,87
3
78,15
4
79,83
5
76,47
RESULTADOS DATASET
IONOSPHERE.ARFF
SMO
DataSet: ionosphere
Algoritmo: SMO (SVM)
Kernel
Param. c %
1.0
3.0
PolyKernel
5.0
1.0
NormalizePolyKe
3.0
rnel
5.0
1.0
3.0
Puk
5.0
1.0
3.0
RBFKernel
5.0
Acurcia
83,19
84,87
79.83
77,31
84,03
83,19
94,12
93,28
93,28
61,34
74,79
82,35
CONCLUSO DATASETS
O algoritmo SMO tem melhor acurcia que os demais algoritmos;
Com base na anlise de duas bases de dados, uma composta por
atributos numricos e a outra por atributos contnuos, verificou-se
que o algoritmo SMO, derivado do algoritmo SVM, foi o mais
efetivo, com um bom tempo de execuo, utilizando todos os
kernel, com atributos contnuos, mas com atributos numricos,
apenas no PolyKernel.
REFERNCIAS
Definio das bases de dados da ferramenta Weka.
Disponvel em: <http://storm.cis.fordham.edu/~gweiss/datamining/datasets.html>. Acesso em: 22 mar. 2016.
KIRKBY, R.; FRANK, E. WEKA Explorer User Guide for version 34-3. University of Waikato, 2002, 2004. 12 p. Disponvel em:
<http://weka.sourceforge.net/manuals/ExplorerGuide.pdf>. Acesso
em: 23 mar. 2016.

Aprendizado de Máquina

Diunggah oleh

Informasi Dokumen

Judul Asli

Hak Cipta

Format Tersedia

Bagikan dokumen Ini

Bagikan atau Tanam Dokumen

Opsi Berbagi

Apakah menurut Anda dokumen ini bermanfaat?

Apakah konten ini tidak pantas?

Hak Cipta:

Format Tersedia

Aprendizado de Máquina

Diunggah oleh

Hak Cipta:

Format Tersedia

MESTRADO EM

Carlos Gracioli Neto - IFMT

Anda mungkin juga menyukai