Anda di halaman 1dari 17

MESTRADO EM

COMPUTAO
APRENDIZADO DE
MQUINA
RELATRIO DE ALGORITMOS:

Carlos Gracioli Neto - IFMT


Alessandro Mundim UNEMAT
Prof. Jos Viterbo

INTRODUO
Objetivos
Bases de Dados (diabetes.arff e ionosphere.arff)
Algoritmos (J48, IBk e SMO)

CONJUNTOS DE DADOS
(DATASETS)
diabetes.arff
768 instncias, sendo descritas por oito atributos numricos, mais a classe.

Ionosphere.arff
351 instncias, sendo descritas por 34 atributos de previso contnuos, mais a
classe.

APLICAO DOS
ALGORITMOS
Todos os algoritmos foram testados com 66% da base de
dados.
J48
verso Java do tradicional algoritmo C4.5 (rvores de deciso)
Configuraes:
Variao do M = 2, 3 e 4
Variao do confidenceFactor = 0,25, 0,50, 0,75 e 1,00

IBk
utiliza os K vizinhos mais prximos para votar uma classe para a instncia de teste.
Uma variante de KNN.
Configuraes:
Variao de N = 1 at 5

APLICAO DOS
ALGORITMOS
SMO
Uma variante de SVM
Tratamento de conjuntos de dados esparsos
Configuraes:
Variao de c = 1, 3 e 5
Kernel = PolyKernel, NormalizePolyKernel, Puk, RBFKernel.

RESULTADOS DATASET
DIABETES.ARFF
J48

Fator de
confiana
0,25
0,50
0,75
1,00
0,25
0,50
0,75
1,00
0,25
0,50
0,75
1,00

N de M
2
2
2
2
3
3
3
3
4
4
4
4

DataSet: diabetes
Algoritmo: (C.4.8) J48
N de
Nmero de
folhas
ns
20
39
22
43
22
43
22
43
20
39
20
39
22
43
22
43
19
37
20
39
20
39
20
39

Tempo de
criao (s)
0,03
0,03
0,44
0,83
0,03
0,03
0,41
0,70
0,05
0,03
0,45
0,62

%
Acurcia
76,24
75,09
75,09
75,09
75,86
75,86
75,86
75,86
74,71
74,71
74,71
74,71

RESULTADOS DATASET
DIABETES.ARFF
Modelo com melhor acurcia

RESULTADOS DATASET
DIABETES.ARFF
Modelo mais generalista

RESULTADOS DATASET
DIABETES.ARFF
IBk
DataSet: diabetes
Algoritmo: KNN (IBk)
Nearest
% Acurcia
Neighbour
1
72,79
2
75,47
3
74,71
4
73,56
5
75,09

RESULTADOS DATASET
DIABETES.ARFF
SMO
DataSet: diabetes
Algoritmo: SMO (SVM)
Kernel
Param. c
%
Acurcia
1.0
79,31
PolyKernel
3.0
78.93
5.0
79.31
1.0
67,81
NormalizePolyK
3.0
72,41
ernel
5.0
73.56
1.0
79,31
3.0
Puk
78,16
5.0
76,63
1.0
68,20
3.0
RBFKernel
68,20
5.0
69,73

Menor tempo
para gera o
modelo.

Maior tempo
para gera o
modelo.

RESULTADOS DATASET
IONOSPHERE.ARFF
J48

Fator de
confiana
0,25
0,5
0,75
1
0,25
0,5
0,75
1
0,25
0,5
0,75
1

N de M
2
2
2
2
3
3
3
3
4
4
4
4

DataSet: ionosphere
Algoritmo: (C4.5) J48
N de
Nmero de
folhas
ns
18
35
18
35
18
35
18
35
18
31
18
31
18
35
18
35
14
27
14
27
16
31
16
31

Tempo de criao
(s)
0,05
0,03
1,00
1,03
0,03
0,03
1,14
1,03
0,03
0,03
0,92
1,02

%
Acurcia
84,87
84,87
84,87
84,87
85,71
88,23
88,23
88,23
84,03
84,03
83,19
83,19

RESULTADOS DATASET
IONOSPHERE.ARFF
Modelo com melhor acurcia

RESULTADOS DATASET
IONOSPHERE.ARFF
Modelo mais generalista

RESULTADOS DATASET
IONOSPHERE.ARFF
IBk

DataSet: ionosphere
Algoritmo: KNN (IBk)
Nearest
% Acurcia
Neighbour
1
80,67
2
84,87
3
78,15
4
79,83
5
76,47

RESULTADOS DATASET
IONOSPHERE.ARFF
SMO
DataSet: ionosphere
Algoritmo: SMO (SVM)
Kernel
Param. c %
1.0
3.0
PolyKernel
5.0
1.0
NormalizePolyKe
3.0
rnel
5.0
1.0
3.0
Puk
5.0
1.0
3.0
RBFKernel
5.0

Acurcia
83,19
84,87
79.83
77,31
84,03
83,19
94,12
93,28
93,28
61,34
74,79
82,35

CONCLUSO DATASETS
O algoritmo SMO tem melhor acurcia que os demais algoritmos;
Com base na anlise de duas bases de dados, uma composta por
atributos numricos e a outra por atributos contnuos, verificou-se
que o algoritmo SMO, derivado do algoritmo SVM, foi o mais
efetivo, com um bom tempo de execuo, utilizando todos os
kernel, com atributos contnuos, mas com atributos numricos,
apenas no PolyKernel.

REFERNCIAS
Definio das bases de dados da ferramenta Weka.
Disponvel em: <http://storm.cis.fordham.edu/~gweiss/datamining/datasets.html>. Acesso em: 22 mar. 2016.
KIRKBY, R.; FRANK, E. WEKA Explorer User Guide for version 34-3. University of Waikato, 2002, 2004. 12 p. Disponvel em:
<http://weka.sourceforge.net/manuals/ExplorerGuide.pdf>. Acesso
em: 23 mar. 2016.

Anda mungkin juga menyukai