1040 2429 1 SM

Ahmad Yusuf & Handayani Tjandrasa, Prediksi Nilai dengan …
Vol. 4, No. 1 Juni 2014 ISSN 2088-2130
PREDIKSI NILAI DENGAN METODE SPECTRAL

CLUSTERING DAN CLUSTERWISE REGRESSION
Ahmad Yusuf1*), Handayani Tjandrasa1)

1)
Teknik Informatika, Fakultas Teknologi Informasi
Institut Teknologi Sepuluh Nopember
Surabaya, Indonesia
*)
ahmad.yusuf.its@gmail.com
ABSTRAK
Prediksi nilai adalah hal yang terus dikembangkan dalam penggalian data. Regresi linier
merupakan metode dasar dalam memprediksi nilai berdasar variabel-variabel pada data. Salah
satu hal yang mempengaruhi kualitas dari hasil regresi adalah persebaran data latih. Data latih
terkadang membuat persamaan regresi kurang optimal. Hal ini dapat diantisipasi dengan
mengelompokkan data terlebih dahulu kemudian membangun model regresi dari masing-
masing kelompok. Pengelompokan data dilakukan dengan menggunakan algoritma Spectral
Clustering, sedangkan model regresi dibangun dengan algoritma Clusterwise Regression. Hasil
prediksi merupakan hasil perkalian keanggotaan fuzzy data uji dengan persamaan regresi pada
masing-masing kelompok. Metode ini diujicobakan terhadap beberapa dataset yang bervariasi
yang dibandingkan dengan metode regresi linear biasa. Ukuran pengujian yang digunakan
adalah Root Mean Square Error yang menghitung kesalahan dari hasil prediksi. Semakin kecil
nilai RMSE suatu metode maka metode tersebut semakin baik. Berdasar pada uji coba yang
dilakukan, penggunaan metode yang diusulkan mampu memprediksi nilai dengan kesalahan
sekitar 3 sampai 6 persen. Parameter jumlah cluster juga berpengaruh terhadap hasil prediksi
yaitu berbanding terbalik dengan nilai RMSE.
Kata kunci: Clusterwise Regression, Pengelompokan, Penggalian Data, Prediksi, Regresi,

Spectral Clustering.
ABSTRACT
Predicted values are continuously being developed in data mining. Linear regression
is a basic method for predicting the value of variables based on the data. One that affects the
quality of the regression is the spread of the data training. Data training sometimes make less
optimal regression model. It can be anticipated by clustering the data first and then building
the regression model of each cluster. We are using Spectral Clustering for clustering data,
whereas regression model is built with Clusterwise Regression algorithm. The prediction result
is obtained by multiplying fuzzy membership data testing with the result of regression equation
in each group. This method is tested against several variations dataset compared to standard
linear regression methods. Measure of the test used is Root Mean Square Error that computes
the error of the predicted results. The smaller the RMSE value indicates the method is the
better method in predictioning value. Based on experiments performed, the proposed method is
able to predict the score with the error about 3 – 6 percent. Number of clusters as parameter
affects the prediction, which is inversely proportional to the value of RMSE.
Keywords: Clusterwise Regression, Clustering, Data Mining, Prediction, Regression, Spectral

Clustering
1
Jurnal Ilmiah SimanteC Vol. 4, No. 1 Juni 2014
PENDAHULUAN Penelitian ini bertujuan untuk

membangun model yang mampu
Salah satu aplikasi data mining melakukan prediksi nilai dengan metode
adalah prediksi nilai dari sejumlah Clusterwise Regression dan Spectral
variabel data tertentu. Model yang Clustering. Pada penelitian ini dilakukan
umumnya digunakan dalam prediksi pengoptimalan model prediksi dengan
nilai adalah Regresi Linier. Dengan melakukan inisialisasi cluster dalam
regresi akan didapatkan nilai prediksi pemodelan regresi dan melakukan
sesuai dengan variabel-varibel yang pembobotan pada tahap regresi
mempengaruhi pada data. Hanya saja menggunakan metode Clusterwise
permasalahannya kualitas regresi Regression. Hasil algoritma ini nantinya
biasanya tergantung pada model dapat digunakan dalam memprediksi
training. Persebaran data yang tidak nilai dalam berbagai bidang misalnya
merata pada data training dapat pendidikan (prediksi nilai siswa, dsb),
menyebabkan model regresi yang ekonomi (prediksi nilai saham, dsb), dan
dibentuk kurang akurat, sehingga lain-lain.
prediksi yang dihasilkan kurang baik.
Persamaan regresi dapat diperbaiki DATA
dengan mengelompokkan data dalam
membangun model regresi. Dengan data Data masukan pada penelitian
yang lebih seragam diharapkan dapat ini adalah kumpulan data yang berasal
membentuk model regresi yang lebih dari berbagai sumber dimana variabel
baik. Pemodelan regresi dengan yang diprediksi bersifat kontinu. Pada
pengelompokan data selanjutnya disebut penelitian ini digunakan 5 dataset, 2
dengan Clusterwise Regression [1,2]. dataset merupakan data nilai praktikum
Pada metode Clusterwise mahasiswa dan 3 sisanya merupakan
Regression, inisialisasi cluster dilakukan dataset yang bersumber dari uci dataset
secara acak [1]. Hal ini dapat repository [4]. Dataset yang digunakan
menyebabkan komputasi dalam dapat dilihat pada Tabel 1.
pembentukan model regresi cukup besar Dataset 1 dan 2 merupakan nilai
untuk mencapai konvergen. Oleh karena praktikum struktur data yang berisi nilai
itu, sebaiknya dilakukan inisialisasi modul-modul praktikum sebagai nilai
cluster dalam pemodelan Clusterwise prediktor dan satu nilai proyek akhir
Regression selanjutnya. Salah satu cara sebagai variabel respon. Dataset 3, 4,
dalam inisialisasi cluster adalah dengan dan 5 merupakan dataset yang
metode Clustering. bersumber dari uci dataset repository
Algoritma Clustering yang yang bersifat data regresi.
sangat umum digunakan adalah K- Dataset Auto MPG (dataset 3)
Means Clustering. Metode K-means adalah data penggunaan bahan bakar
mudah dalam implementasi serta yang dihitung dengan satuan mpg (miles
memiliki waktu komputasi yang cukup per gallon) [4]. Atribut mpg merupakan
cepat. Tetapi metode ini mempunyai nilai penggunaan bahan bakar yang
kelemahan dalam menganalisis merupakan variabel respon dari dataset
persebaran data serta bergantung pada tersebut. Tujuh atribut lainnya
inisialisasi centroid. K-means hanya merupakan atribut prediktor yang
melihat jarak data ke masing-masing mempengaruhi penggunaan bahan bakar
centroid pada setiap cluster [3]. Salah yang meliputi silinder yang digunakan
satu metode Clustering lain yang pernah kendaraan, tenaga kuda dari kendaraan,
dikembangkan dalam memperbaiki dan sebagainya. Atribut nama mobil
akurasi regresi adalah Spectral tidak digunakan dalam penelitian ini
Clustering. Spectral Clustering karena bernilai string yang berbeda-beda
mengelompokkan data berdasarkan dari setiap record pada Dataset Auto
kesamaan dari tiap data [3]. MPG.
2
Tabel 1 Dataset yang digunakan pada penelitian

No Dataset Jumlah Record Jumlah Atribut Missing Value
1 Nilai Praktikum Struktur 180 6 Tidak Ada
Data Teknik Informatika
ITS 2008/2009
2 Nilai Praktikum Struktur 153 4 Tidak Ada
Data Teknik Informatika
ITS 2010/2011
3 Data Auto MPG - UCI 398 8 Ada
4 Data Housing – UCI 506 14 Tidak Ada
5 Data Computer Hardware – 209 8 Tidak Ada
UCI
Dataset ke-4 adalah dataset nilai yang kurang pada data akan diganti
Housing yang merupakan data nilai dengan rata-rata nilai pada atribut yang
kepemilikan rumah di sebagian wilayah bersesuaian jika atribut tersebut
Boston, Amerika Serikat [4]. Dataset merupakan numerik, dan akan diganti
Housing terdiri dari 13 atribut kontinu dengan modus nilai atribut yang
dan 1 atribut yang bersifat diskrit. bersesuaian jika nominal.
Variabel respon dari dataset ini adalah Pada tahap pra proses juga
nilai median kepemilikan rumah pada dilakukan normalisasi data. Normalisasi
suatu kota dalam satuan 1000 US Dollar data dilakukan untuk menyeragamkan
yang ditunjukkan pada atribut MEDV. interval data. Keseragaman data
Variabel prediktornya merupakan atribut berpengaruh dalam perhitungan matriks-
lainnya antara lain rata-rata kejahatan matriks pada data. Normalisasi yang
pada kota bersangkutan (CRIM), dilakukan merupakan normalisasi
proporsi tanah residential (ZN), proporsi kolom/atribut. Normalisasi dilakukan
bisnis non-retail (INDUS), dan berdasar persamaan 1
sebagainya. xi , j  min( x j )
Dataset Computer Hardware xi, j  (1)
merupakan dataset ke-5 yang digunakan max( xi )  min( x j )
dalam uji coba pada penelitian ini. Dimana merupakan nilai normalisasi
Dataset Computer Hardware data pada baris i dan atribut j, xi,j
merupakan data performa relatif dari cpu merupakan data aslinya, dan min(xj)
[4]. Dataset ini terdiri dari 9 atribut, merupakan nilai minimal dari atribut j,
dimana Atribut PRP merupakan sedangkan max(xj) merupakan nilai
performa relatif CPU yang digunakan maksimalnya. Keluaran dari proses
sebagai variabel respon. Atribut lainnya normalisasi ini berupa data yang
selain Vendor Name dan Model Name memiliki interval 0 sampai 1.
digunakan sebagai variabel prediktor.
Atribut Vendor Name dan Model Name Tahap Clustering
tidak digunakan karena memiliki nilai Clustering merupakan salah satu
string. Variabel prediktor yang metode eksplorasi data yang digunakan
digunakan meliputi cycle time mesin dalam mencari pola yang ada pada
(MYCT), memory minimal (MMIN) suatu dataset. Pada umumnya pola
dan maksimal (MMAX), dan tersebut dapat dilihat dari kesamaan
sebagainya. sifat, karakteristik, atau ciri dari record-
record pada dataset [5,6].
METODE Salah satu metode Clustering
adalah Spectral Clustering. Pada
Tahap Pra Proses Spectral Clustering, pengelompokkan
Pra proses yang dilakukan didasarkan atas kesamaan antara setiap
adalah penanganan missing value. Nilai- data. Kesamaan tersebut dilihat dari
3
keterkaitan antara setiap data. Pada variabel n merupakan jumlah record

Spectral Clustering akan dibentuk pada data masukan.
sebuah graf dari data yang ada. Dimana 5. Normalisasi data dengan matriks k-
verteks dari graf tersebut merupakan eigen sehingga akan terbentuk k
setiap record pada data. Edge-nya kolom yang merepresentasikan setiap
berupa hubungan antar data yang nilai normalisasi eigen pada setiap
biasanya bernilai jarak dari dua record kolomnya.
yang berhubungan [7]. 6. Hasil dari data normalisasi kemudian
Langkah-langkah dalam di-cluster dengan K-Means
melakukan Spectral Clustering adalah Clustering. Data normalisasi
sebagai berikut [3,8]: mewakili masukan data latih. Data
1. Kontruksi graf similaritas dari dataset latih ke-i akan dimasukkan pada
training. verteks pada graf tersebut suatu cluster jika dan hanya jika data
merupakan representasi dari setiap hasil normalisasi ke-i masuk pada
record pada data training. Bobot dari cluster yang sama.
tiap edge merupakan jarak antara satu
verteks dengan verteks lainnya.
Perhitungan jarak antar verteks Mulai
menggunakan persamaan jarak
exponential yang tertulis pada
persamaan 2 [3]. Data Latih
2 Jumlah Cluster (k)
 si  s j
wij  exp( ) (2)
2 2
Setelah itu, bobot dari setiap edge Konstruksi graph similaritas
yang ada dibentuk menjadi matriks
weight. Dengan begitu matriks
weight merupakan representasi graf Konstruski matriks Bobot
similaritas dari dataset.
2. Dari matriks weight dihitung derajat
dari setiap verteks dengan Konstruksi matriks Laplacian
menjumlahkan bobot dari edge yang
terhubung pada verteks yang
bersangkutan. Dari derajat verteks
tersebut dapat dibentuk matriks Konstruksi matriks k-eigen
degree yang merupakan matriks

diagonal yang berisi bobot setiap
verteks. Normalisasi matriks k-eigen
3. Dibentuk normalisasi matriks
Laplacian dengan menggunakan
matriks weight (W) dan matriks Cluster matriks k-eigen dengan K-
Means Clustering
degree (D) yang telah dihitung
sebelumnya. Perhitungan matriks
Laplacian (L) dengan rumus pada Data yang ter-
cluster
persamaan (3) [9].
L  D W (3)
4. Dihitung k eigenvector pertama dari Selesai
matriks Laplacian, dimana k
merupakan parameter jumlah cluster.
Maka terbentuklah matriks k-eigen Gambar 1 Diagram Alir Algoritma Spectral
Clustering
yang merupakan k eigenvector
permata dari matriks Laplacian.
Matriks k-eigen berukuran n x k,
4
2. Masing-asing kelompok dibangun

persamaan regresi linier.
Mulai 3. Masing-masing data latih akan
dihitung nilai kesalahan yang paling
Data yang sudah kecil dari persamaan regresi yang ada
ter-cluster
sesuai dengan persamaan 4.
K
MinZ    X k b k  y k
2
(4)
Pemodelan regresi masing-masing k 1
cluster
4. Ubah keanggotaan kelompok pada
masing-masing data berdasarkan
dengan kesalahan prediksi yang
Hitung kesalahan prediksi data dengan
fungsi regresi
minimal.
5. Ulangi langkah 2 sampai fungsi
objektif yang ditentukan.
Clusterwise Regression akan
Perbarui keanggotaan data
memodelkan n persamaan regresi
dimana n adalah jumlah cluster dengan
meminimalisasi SSE. Pada setiap iterasi
akan dimodelkan n persamaan regresi
Fungsi Objektif
kemudian dihitung nilai kesalahan dan
keanggotaan masing-masing data.
Y
Persamaan regresi, nilai kesalahan, dan
keanggotaan akan diperbarui pada tiap
k model regresi
iterasi hingga mencapai model yang
optimal atau jumlah iterasi tertentu.
Selesei
Tahap Prediksi
Gambar 2 Diagram Alir Algoritma Pada tahap uji masing-masing
Clusterwise Regression data akan dihitung nilai fuzzy
keanggotaannya dengan masing-masing
Tahap Regresi cluster yang ada. Nilai fuzzy
Selanjutnya dari masing-masing keanggotaan (Zi) dari data (x) dihitung
cluster yang dihasilkan akan diproses berdasarkan persamaan fuzzy k-nearest
dengan Clusterwise Regression. Pada neighbor yang ditunjukkan pada
tahap regresi masukan berupa data yang persamaan 5 [10].
telah terkelompokkan dalam k cluster.  
 1 

k
Z  2 / m 1 
Pada tahap tersebut akan dihasilkan k j 1 i , j
x  x  (5)
 j 
model regresi yang dapat digunakan Z i ( x)   
k  1 
pada tahap selanjutnya yaitu tahap uji.  j1  2 / m 1 

Clusterwise Regression  x  xj 
merupakan metode regresi yang dimana k yaitu jumlah tetangga terdekat,
menggunakan lebih dari satu persamaan Zi,j merupakan nilai keanggotaan data
regresi pada tahap latih. Data latih akan ke-j (xj) pada cluster i, dan m
dikelompokkan terlebih dahulu sehingga merupakan parameter bobot. Hasil
masing-masing kelompok akan dibentuk prediksi merupakan pernjumlahan dari
persamaan regresi. perkalian antara bobot masing-masing
Langkah-langkah dari algoritma cluster dan hasil prediksinya [11].
Clusterwise Regression adalah sebagai
berikut [1,2]:
1. Data dibagi menjadi kelompok awal
Q1, Q2, … , Qk
5
Dimana variabel n merupakan jumlah

Tabel 2 Perbandingan RMSE data, dan variabel x merupakan nilai
Clusterwise Regression – Spectral prediksi yang dihasilkan model
Clustering dengan parameter jumlah sedangkan variabel f merupakan nilai
cluster yang bervariasi sebenarnya yang diinginkan.
Dataset Jumlah RMSE
Untuk setiap pasangan data
Cluster Clusterwise
Regression –
masukan dan data keluaran pada setiap
Spectral parameter jumlah cluster akan dihitung
Clustering kesalahan prediksinya menggunakan
Nilai 1 4.428 RMSE. Semakin keci nilai RMSE pada
Praktikum 2 3.566 kesalahan hasil prediksi semakin kecil,
Struktur Data 3 2.526 begitu juga sebaliknya.
Teknik 4 2.872 Hasil uji coba merupakan hasil
Informatika 5 2.879 prediksi dari algoritma Clusterwise
ITS Regression dengan Spectral Clustering
2008/2009 dengan beberapa nilai parameter jumlah
Nilai 1 5.509
cluster.
Praktikum 2 3.828
Struktur Data 3 3.606
Metode Clusterwise Regression-
Teknik 4 3.280 Spectral Clustering menggunakan
Informatika 5 3.300 parameter jumlah Clustering. Pada
ITS ujicoba dilakukan perbandingan
2010/2011 kesalahan RMSE dengan nilai cluster
Data Auto 1 3.873 bervariasi yaitu satu, dua, tiga, empat,
MPG - UCI 2 4.148 dan lima cluster. Hasil uji coba
3 3.623 ditunjukkan pada Tabel 2.
4 2.953 Pada hasil uji coba terlihat
5 2.595 bahwa RMSE terkecil diperoleh pada
Data 1 5.587
parameter jumlah cluster yang berbeda-
Housing – 2 5.749
UCI 3 4.175
beda pada masing-masing dataset. Pada
4 3.211 dataset nilai praktikum struktur data
5 5.054 tahun 2008/2009, nilai RMSE terkecil
Data 1 59.228 dicapai pada parameter jumlah cluster
Computer 2 55.113 sama dengan 5 yaitu sebesar 2.526.
Hardware – 3 55.745 Rentang nilai mahasiswa dari satu
UCI 4 46.553 sampai 100 sehingga nilai kesalahan
5 50.625 relatifnya sebesar 2.53 persen. RMSE
terkecil pada dataset ke 2 yaitu dataset
nilai praktikum struktur data tahun
UJI COBA 2010/2011 dicapai pada parameter
jumlah cluster sama dengan 4 sebesar
Uji coba dilakukan dengan 3,28 atau kesalahan relatifnya 3,28
memprediksi dataset dengan metode persen.
yang diusulkan. Metode Cross Pada data Auto MPG nilai
Validation digunakan dalam pengujian RMSE terkecil diperoleh pada parameter
model yang dihasilkan. 5 cluster yaitu 2,595. Rentang nilai mpg
Untuk mengukur performa yang pada dataset Auto MPG 0 sampai 46.6
dihasilkan, digunakan Root Mean sehingga nilai kesalahan relatifnya 5,57
Squared Error (RMSE) yang persen. Pada dataset Housing nilai
ditunjukkan dengan persamaan 6 [12]. RMSE terkecil diperoleh pada parameter

n
( xi  f i ) 2 jumlah cluster 4 yaitu 3,211 atau
RMSE  i 1
kesalahan relatifnya 6,42 persen
n (6)
(rentang 0-50). Dataset kelima yaitu
Computer Hardware RMSE terkecil
6
dicapai pada parameter jumlah cluster dengan kesalahan relative sekitar 4-5
sama dengan 4 yaitu 46,553. Kesalahan persen. Dataset nilai praktikum yang
relatif pada dataset Computer Hardware memiliki atribut lebih sedikit
sebesar 4,05 persen (0 - 1150). Dari menunjukkan kesalahan relative yang
hasil analisis diatas nilai kesalahan lebih kecil yaitu 2 sampai 3 persen.
relatif yang dicapai dari dataset yang
digunakan sekitar 3 sampai 6 persen. SIMPULAN
Dari perubahan jumlah cluster
secara umum terlihat bahwa semakin Prediksi nilai merupakan salah
besar jumlah cluster maka nilai satu bagian dari penggalian data yang
kesalahan yang dihasilkan semakin kecil terus dikembangkan. Pada penelitian ini
sampai pada titik optimal. Dari kelima diusulkan algoritma Clusterwise
dataset yang diujicobakan menunjukkan Regression dengan Spectral Clustering.
tren yang relatif sama yaitu nilai RMSE Metode usulan mampu melakukan
berbanding terbalik dengan jumlah prediksi nilai yang telah diujicobakan
cluster. Pada beberapa kasus terlihat pada beberapa dataset dengan nilai
nilai RMSE yang lebih besar parameter kesalahan relatif 3 sampai 6 persen.
jumlah cluster tertentu dari jumlah Algoritma Clusterwise Regression
cluster -1 dan jumlah cluster +1. Hal ini dengan Spectral Clustering mampu
dapat terjadi karena hasil Clustering mereduksi kesalahan RMSE dari hasi
yang digunakan selanjutnya dalam prediksi menggunakan Multiple
proses prediksi kurang optimal untuk Regression biasa sebesar 30 sampai 40
dimodelkan persamaan regresi. persen.
Perbandingan nilai RMSE dari Pada metode usulan diperlukan
Multiple Regression (jumlah cluster = 1) masukan jumlah cluster sebagai
dan Clusterwise Regression – Spectral parameter. Parameter jumlah cluster
Clustering dari hasil ujicoba terlihat memberikan pengaruh pada hasil
bahwa nilai RMSE pada hasil prediksi prediksi. Pada ujicoba yang dilakukan
dataset menggunakan metode yang masing-masing dataset akan
diusulkan lebih kecil dibandingkan menghasilkan model optimal pada
dengan RMSE pada hasil prediksi parameter jumlah cluster tertentu
menggunakan Multiple Regression. bergantung pada karakteristik data.
Reduksi kesalahan RMSE yang Jumlah atribut juga mempengaruhi hasil
dihasilkan sekitar 30 hingga 40 persen. prediksi menggunakan metode yang
Hal ini menunjukkan bahwa metode diusulkan. Pada ujicoba yang dilakukan
pada penelitian ini mampu semakin banyak atribut maka nilai
mengoptimalkan performa dari prediksi kesalahannya semakin besar. Hal ini
nilai menggunakan regresi linier. dikarenakan adanya kemungkinan
Pada hasil uji coba nilai atribut-atribut yang tidak relevan dengan
kesalahan relatif paling besar (6 persen) variabel respon.
didapatkan pada dataset Housing.
Dataset Housing memiliki atribut
prediktor dibandingkan dengan dataset DAFTAR PUSTAKA
lainnya yaitu 13 atribut. Hal ini dapat
menyebabkan hasil kurang optimal [1] Lau, Kin-nam., Leung, Pui-lam.,
karena memungkinkan adanya atribut- Tse, Ka-kit. (1998). A
atribut yang tidak relevan. mathematical programming
Berdasarkan hasil uji coba, approach to Clusterwise
semakin banyak atribut prediktor yang Regression model and its
digunakan maka nilai kesalahan extensions. Elsevier European
relatifnya semakin besar secara umum. Journal of Operational Research.
Dataset Auto MPG dan Computer
Hardware memiliki 7 atribut prediktor
7
[2] DeSarbo, Wayne S. (1988). A

Maximum Likelihood Methodology
for Clusterwise Linear Regression.
[3] Trivedi, S., A. Pardos, Z., & N.
Sar, G. (2008). Spectral Clustering
in Educational Data Mining.
[4] UCI Machine Learning Repository,
<URL: http://archive.ics.uci.edu/ml/
>, diakses pada 1 April 2013.
[5] Tan, P.-N., Steinbach, M., &
Kumar, V. (2006). Introduction to
Data Mining. Minnesota: Addison-
Wesley.
[6] Zhang, Z., Wu, X., & S. Yu, P.
(2006). Spectral Clustering for
Multi-type Relational Data.
[7] Y. Ng., A., I. Jordan, M., & Weiss,
Y. (2002). On Spectral Clustering :
Analysis and Algorithm.
[8] Von Luxburg, U. (2007). A
Tutorial on Spectral Clustering.
17(4).
[9] Mohar, B. (1991). The Laplacian
Spectrum of Graphs, In Graph
Theory. 871-898.
[10] Keller, James M., Gray, Michael
R., Givens, James A. Jr. (1985). A
Fuzzy K-Nearest Neighbor
Algorithm. IEEE Transactions on
Systems, Mans, and Cybernetics.
[11] Luo, Zairen., Chou, Eddie Y.
(2006). Pavement Condition
Prediction Using Clusterwise
Regression.
[12] Karagozog'lu, B., & Turkmen, N.
(2007). A software tool to facilitate
design, assessment and evaluation
of courses in an educational
system.

1040 2429 1 SM

Diunggah oleh

Informasi Dokumen

Judul Asli

Hak Cipta

Format Tersedia

Bagikan dokumen Ini

Bagikan atau Tanam Dokumen

Opsi Berbagi

Apakah menurut Anda dokumen ini bermanfaat?

Apakah konten ini tidak pantas?

Hak Cipta:

Format Tersedia

1040 2429 1 SM

Diunggah oleh

Hak Cipta:

Format Tersedia

Ahmad Yusuf & Handayani Tjandrasa, Prediksi Nilai dengan …

Vol. 4, No. 1 Juni 2014 ISSN 2088-2130

PREDIKSI NILAI DENGAN METODE SPECTRAL

Ahmad Yusuf1*), Handayani Tjandrasa1)

Kata kunci: Clusterwise Regression, Pengelompokan, Penggalian Data, Prediksi, Regresi,

Keywords: Clusterwise Regression, Clustering, Data Mining, Prediction, Regression, Spectral

PENDAHULUAN Penelitian ini bertujuan untuk

Tabel 1 Dataset yang digunakan pada penelitian

keterkaitan antara setiap data. Pada variabel n merupakan jumlah record

degree yang merupakan matriks

2. Masing-asing kelompok dibangun

Dimana variabel n merupakan jumlah

[2] DeSarbo, Wayne S. (1988). A

Anda mungkin juga menyukai