Anda di halaman 1dari 6

HDBSCAN Analysis

1 Data
Pada penelitian ini digunakan data harga rumah daerah Jakarta Selatan merupakan. Data
diambil dari kagle, dimana data tersebut diambil dan dikumpulkan dari beberapa website
penjualan seperti rumah123.com. Data harga rumah daerah Jakarta Selatan terdiri dari 7 kolom
dengan jumlah data yaitu 1000 data. Dimana kolom tersebut terdiri dari:
a) HARGA: harga dari rumah.
b) LT: jumlah luas tanah.
c) LB: jumlah luas bangunan.
d) JKT: jumlah kamar tidur.
e) JKM: jumlah kamar mandi.
f) GRS: Garasi
2 Uji Asumsi
2.1 Sampel Representetif
Populasi pada penelitian ini adalah seluruh harga rumah daerah Jakarta Selatan. Penelitian ini
menggunakan populasi sehingga asumsi sampel representatif sudah terpenuhi.
2.2 Uji Multikolinieritas
Uji multikolinieritas pada penelitian ini digunakan nilai korelasi. Berikut uji hipotesis dan
hasil output nilai korelasi:
i. Hipotesis
H0 : ρ xy=0
H1 : ρ xy ≠ 0
ii. Tingkat Signifikasi
α = 5%
iii. Daerah Kritis
Tolak H0 jika: P-value < atau nilai korelasi variabel > r (0,05; 1001) dimana r (0,05; 1001)=0,0619
iv. Statistik Uji
Gambar2.1. Matriks Korelasi
v. Kesimpulan
Dengan tingkat signifikansi sebesar 5% data yang ada menjelaskan bahwa dari hasil statistik
uji terdapat keputusan Tolak H0 (terdapat multikolinieritas) dan Gagal Tolak H0 (tidak ada
multikolinieritas).
Dengan menggunakan uji multikolinieritas diatas dapat diartikan bahwa semua variabel
yang digunakan terdapat kendala multikolinieritas. Sehingga dapat disimpulkkan bahwa asumsi
multikolinieritas pada penelitian ini tidak terpenuhi. Selanjutnya perlu dilakukan penanganan
berupa reduksi factor terhadap variabelvariabel yang diteliti dengan menggunakan analisis
komponen utama.

2.3 Analisis Komponen Utama


Sebelum melakukan analisis komponen utama perlu dilakukan uji Bartlett dan uji KMO.
1) Uji Bartlett

Gambar2.2. Uji Bartlett


i. Hipotesis
H0 : ρ 0 =0 (Tidak terdapat korelasi)
H1 : ρ 0 ≠ 0(Terdapat korelasi)
ii. Tingkat Signifikasi
α = 5%
iii. Daerah Kritis
Jika p-value < α maka tolak H0
iv. Statistik Uji
Diperoleh p-value = 2,22 ×10−16
v. Keputusan
Karena nilai p-value (2,22 ×10−16 ) < α (0,05) maka tolak H0
vi. Kesimpulan
Dengan tingkat kepercayaan 95% diperoleh bahwa terdapat korelasi antar variabel.
2) Uji KMO
KMO bertujuan untuk menguji ketepatan analisis faktor, Berikut merupakan output uji
KMO.

Gambar2.3. Uji KMO


berdasarkan hasil output Rstudio diketahui bahwa nilai KMO yaitu sebesar 0,67. Nilai
tersebut berada di antara nilai 0,5 sampai 1 yang menunjukkan bahwa analisis faktor bisa
digunakan atau layak digunakan.
Untuk menentukan banyaknya komponen yang terbentuk, digunakan nilai eigenvalues.
Komponen dengan nilai eigenvalues lebih dari satu akan dipertahankan, sedangkan
apabila kurang dari satu maka faktor tidak diikutsertakan dalam model. Menurut
Supranto (2004) “ekstraksi faktor dihentikan apabila persentase kumulatif varian paling
sedikit 60% atau 75% dari seluruh variabel asli.”

Gambar2.4. Nilai Eigenvalues


Dapat dilihat bahwa komponen 1 dan 2 mempunyai nilai Eigenvalues lebih dari satu.
Sehingga komponen yang digunakan pada analisis komponen utama ini sebanyak 2
komponen.
2.4 Analaisis Klaster dengan DBSCAN
Analisis yang akan digunakan dalam penelitian ini menggunakan klaster metode DBSCAN.
Metode DBSCAN memerlukan parameter inputan yaitu parameter Epsilon dan MinPts. Adapun
untuk menentukan nilai parameter yang akan digunakan dalam penelitian ini akan ditunjukkan
pada grafik Gambar 2.5.

Gambar 2.5. Grafik kNN displot


Gambar 5.2 merupakan grafik KNN-displot yang digunakan untuk menentukan nilai epsilon
yang akan digunakan dalam klaster DBSCAN. Pada grafik tersebut didapatkan nilai epsilon
sebesar 10000000000, kemudian setelah mendapatkan nilai epsilon akan dilanjutkan dalam
analisis klaster DBSCAN. Kali ini digunakan nilai parameter MinPts sebesar 25.

Gambar 2.6. Jumlah anggota cluster


Gambar 2.7. Cluster plot DBSCAN
Gambar 2.7 merupakan hasil visualisasi klaster DBSCAN dengan menggunakan nilai
parameter Epsilon sebesar 10000000000 dan nilai parameter MintPts sebesar 25. Pada hasil
klaster ini menunjukkun, terdapat 3 klaster dimana pada kelompok klaster 1 sebanyak 820,
klaster 2 sebanyak 25, klaster 3 sebanyak 1 dan sisanya sebanyak 149 yang masuk ke dalam
noise.
2.5 Analaisis Klaster dengan HDBSCAN
Analisis yang dilakukan menggunakan klaster metode HDBSCAN. Metode HDBSCAN
memerlukan parameter inputan yaitu parameter MinPts. Kali ini, digunakan nilai parameter
MinPts sebesar 25.

Gambar 2.8. Jumlah anggota cluster


Gambar 2.9. Dendogram HDBSCAN
Gambar 2.9 merupakan hasil visualisasi klaster DBSCAN dengan menggunakan nilai
parameter MintPts sebesar 25. Pada hasil klaster ini menunjukkun, terdapat 6 klaster dimana
pada kelompok klaster 1 sebanyak 39, klaster 2 sebanyak 391, klaster 3 sebanyak 88, klaster 4
sebanyak 26, klaster 5 sebanyak 46, klaster 6 sebanyak 52, dan sisanya sebanyak 359 yang
masuk ke dalam noise.

Anda mungkin juga menyukai