NIM : 1910912220034
1. Analisis Jalur
Path analysis/analisis jalur adalah teknik analisis statistik multivariat
yang berguna dalam menganalisis hubungan-hubungan struktural dari
sejumlah variabel dari data riset. Analisis jalur adalah perluasan model analisis
regresi, baik regresi linier maupun regresi logistik. Analisis jalur bertujuan
untuk memberikan perkiraaan atau estimasi mengenai besaran dan
signifikansi hubungan-hubungan yang dihipotesiskan kausal antar variabel.
Analisis jalur menjelaskan hubungan kausal variabel dengan bantuan diagram
jalur (path diagram) (1).
Contoh penerapan analisis jalur dapat dilihat pada penelitian oleh
Ihsan, dkk (2020) dengan judul “Pengaruh Sumber Air Bersih, Jamban, Dan
Pola Asuh Terhadap Stunting pada Balita dengan Diare sebagai Variabel
Intervening”. Pada penelitian tersebut, terdapat 3 jenis variabel yang terlibat
di dalam proses analisis, yaitu variabel dependen (stunting), variabel
independen (sumber air bersih, jamban dan pola asuh), serta variabel
intervening (diare) (2).
Dari hasil analisis jalur yang dilakukan, diketahui bahwa kadar E.coli
dalam sumber air bersih berpengaruh secara simultan dan signifikan terhadap
stunting dengan nilai koefisien jalur/beta sebesar 0,391 (β = 0,391). Serta
berpengaruh secara tidak langsung melalui lamanya diare terhadap stunting
dengan nilai koefisien jalur/beta sebesar 0,396 (β = 0,396) (2).
Pola asuh yang tidak higienis dan tidak saniter berpengaruh secara
simultan dan signifikan terhadap stunting pada balita dengan nilai koefisien
jalur/beta sebesar 1,149 (β = -1,149) (2).
Kualitas jamban yang tidak saniter tidak berpengaruh secara simultan
dan signifikan terhadap stunting pada balita dengan nilai dengan nilai
koefisien jalur/beta sebesar 0,172 (β = 0,172). Namun berpengaruh secara tidak
langsung dengan nilai koefisien jalur/beta sebesar 0,556 (β = 0,556) (2).
Lamanya diare berpengaruh secara simultan dan signifikan terhadap
stunting pada balita dengan nilai koefisien jalur/beta sebesar -0,964 (β = -
0,964) (2).
3. Analisis Cluster
Analisis cluster adalah suatu analisis statistik multivariat yang bertujuan
untuk mengetahui struktur data dengan menempatkan kesamaan objek
observasi ke dalam satu kelompok data sehingga dapat dibedakan antar
kelompok satu dengan kelompok yang lain atau dengan cara memisahkan
kasus/obyek ke dalam beberapa kelompok yang mempunyai sifat berbeda
antar kelompok yang satu dengan yang lain. Dalam analisis ini, tiap-tiap
kelompok bersifat homogen antara anggota dalam kelompoknya atau dapat
dikatakan variasi obyek/individu dalam satu kelompok yang terbentuk sekecil
mungkin. Salah satu metode pengelompokkan dalam analisis cluster adalah
metode non-hirarkis, dimulai dengan menentukan terlebih dahulu jumlah
cluster yang diinginkan (dua, tiga atau yang lain). Setelah jumlah cluster
ditentukan, maka proses cluster dilakukan dengan tanpa mengikuti proses
hirarki. Metode ini biasa disebut “K-Means Cluster” (5).
Contoh penerapan analisis cluster dapat dilihat pada penelitian
Rahmayani (2018) dengan judul (Analisis Clustering Tingkat Keparahan
Penyakit Pasien Menggunakan Algoritma K-Means (Studi Kasus Di Puskesmas
Bandar Seikijang)). Pengelompokkan (Clustering) penyakit pasien tersebut
terdiri dari 3 cluster yaitu penyakit berat, penyakit sedang dan penyakit ringan.
Pengelompokkan penyakit menggunakan metode K-Means. Tujuan dari
penelitian ini adalah untuk mengelompokkan tingkat keparahan penyakit
pasien, mengetahui tingkat akurasi dari cluster tingkat keparahan penyakit
pasien, mengetahui penyakit terbanyak yang diderita masyarkat sekitar
puskesmas, dan mengetahui persamaan dalam pengolahan data manual dan
menggunakan software Rapid Miner (4).
Adapun langkah-langkah melakukan clustering dengan metode K-
Means adalah sebagai berikut (4):
1. Menentukan jumlah cluster k yang akan dibentuk.
2. Inisialisasi k pusat cluster dapat dilakukan dengan berbagai cara. Namun
yang paling sering dilakukan adalah dengan cara random. Pusat-pusat
cluster diberikan nilai awal dengan angka-angka random.
3. Alokasikan semua data/ objek ke cluster terdekat. Kedekatan dua objek
ditentukan berdasarkan jarak kedua objek tersebut. Demikian juga
kedekatan suatu data ke cluster.
4. r tertentu ditentukan jarak antara data dengan pusat cluster. Dalam tahap
ini perlu dihitung jarak tiap data ke tiap pusat cluster. Jarak paling antara
satu data dengan satu cluster tertentu akan menentukan suatu data
masuk dalam cluster mana. Untuk menghiutng jarak semua data ke setiap
tiitk pusat cluster dapat menggunakan teori jarak Euclidean yang
dirumuskan sebagai berikut:
Di mana:
D (i, j) = Jarak data ke i ke pusat cluster j
X ki = Data ke i pada atribut data ke k
X kj = Titik pusat ke j pada atribut ke k.
5. Hitung kembali pusat cluster dengan keanggotaan cluster yang sekarang.
Pusat cluster adalah rata-rata dari semua data/ objek dalam cluster
tertentu. Jika dikehendaki bisa juga menggunakan median dari cluster
tersebut. Jadi rata-rata (mean) bukan satu-satunya ukuran yang bisa
dipakai.
6. Tugaskan lagi setiap objek memakai pusat cluster yang baru. Jika pusat
cluster tidak berubah lagi maka proses clustering selesai. Atau, kembali ke
langkah nomor 3 sampai pusat cluster tidak berubah lagi.
Hasil penelitian menunjukkan tingkat keparahan penyakit pasien
Cluster (C0) berada pada penyakit berat dengan pasien sebanyak 47 orang,
cluster (C1) berada pada penyakit ringan dengan pasien sebanyak 82 orang,
dan cluster (C2) berada pada penyakit sedang dengan pasien sebanyak 149
orang. Tingkat keparahan penyakit pasien berada pada penderita penyakit
sedang dengan persentase 53,59%. Penyakit yang paling sering diderita oleh
masyarakat sekitar puskesmas adalah penyakit ISPA, demam berdarah dan
malaria. Dan hasil implementasi menggunakan Software Rapid Miner bernilai
sama dengan pengolahan data secara manual (6).
DAFTAR PUSTAKA