Anda di halaman 1dari 6

1

Pengelompokan Provinsi Di Indonesia Berdasarkan


Jumlah Tenaga Kesehatan
Tahun 2016
Anindya Shafira Putri (06211540000058)[1], Dian Rizky Maulina (06211540000091)[2]
Dr. Bambang Widjanarko O., S.Si., M.Si.
Departemen Statistika, Fakultas Matematika, Komputasi dan Data Sains,
Institut Teknologi Sepuluh Nopember (ITS)
Jl. Arief Rahman Hakim, Surabaya 60111
E-mail : anindyashafira97@gmail.com[1], deemaulina@gmail.com[2]

Pada praktikum ini, peneliti melakukan analisis


Abstrak – Jumlah tenaga kesehatan yang dimiliki multivariat dengan metode pengelompokan (clustering)
Indonesia diakui masih sangat minim jika dibandingkan pada provinsi di Indonesia berdasarkan jumlah tenaga
dengan jumlah penduduk Indonesia secara keseluruhan. kerja tahun 2016. Jumlah tenaga kerja meliputi,
Dimana rasio dokter dengan penduduk Indonesia ketersediaan dokter umum, dokter gigi, perawat, bidan,
berdasarkan data Departemen Kesehatan berkisar satu tenaga kefarmasian, tenaga kesehatan masyarajat,
banding 4000 penduduk. Tenaga kesehatan di Indonesia tenaga kesehatan lingkungan, tenaga gizi dan ahli
tiap tahunnya mengalami peningkatan namun tidak teknologi laboratorium medik. Analisis tersebut
signifikan. Sehingga pada penelitian ini peneliti akan meliputi analisis cluster dengan metode single linkage,
melakukan analisis multivariat dengan metode complete linkage, dan k-means. Hasil pengelompokan
pengelompokan pada provinsi di Indonesia berdasarkan dengan jumlah cluster terbaik (optimum) dinilai
jumlah tenaga kerja tahun 2016. Jumlah tenaga kerja berdasarkan kriteria Pseudo F terbesar dan nilai ICD
meliputi, ketersediaan dokter umum, dokter gigi,
Rate terkecil untuk menentukan metode cluster terbaik.
perawat, bidan, tenaga kefarmasian, tenaga kesehatan
Adanya praktikum ini diharapkan dapat memudahkan
masyarajat, tenaga kesehatan lingkungan, tenaga gizi dan
pemerintah untuk megelompokan provinsi di Indonesia
ahli teknologi laboratorium medik. Analisis tersebut
yang memiliki kesamaan karakteristik di bidang tenaga
meliputi analisis cluster dengan metode single linkage,
kesehatan. Dengan adanya pengelompokan provinsi di
complete linkage, dan k-means. Dari penelitian diketahui
Indonesia yang masih memiliki jumlah tenaga kesehatan
bahwa nilai ICD-rate terkecil dimiliki oleh metode K-
Means yaitu sebesar 0,0885086. Dalam praktikum ini,
rendah akan dapat ditanggulangi dan provinsi di
metode K-Means dengan 3 cluster optimal dipilih untuk Indonesia yang sudah memiliki jumlah tenaga kesehatan
mengelompokan provinsi di Indonesia berdasarkan tinggi dapat mempertahankan dan meningkatkan
jumlah tenaga kesehatan. kualitas pelayanan kesehatannya.
II. TINJAUAN PUSTAKA
Kata kunci- Cluster, Complete Linkage, K-Means, Tenaga
Kesehatan, Single Linkage
A. Analisis Cluster
Analisis cluster merupakan analisis yang digunakan
I. PENDAHULUAN untuk mengelompokkan objek-objek berdasarkan
Jumlah tenaga kesehatan merupakan salah satu ukuran kesamaan karakteristik atau relatif homogen di antara
kualitas pelayanan kesehatan kepada masyarakat di objek-objek tersebut[1]. Dilihat dari apa yang
suatu daerah atau negara. Namun, jumlah tenaga diklasterkan, maka analisis cluster dibagi menjadi dua
kesehatan yang dimiliki Indonesia diakui masih sangat yaitu :
minim jika dibandingkan dengan jumlah penduduk a. Pengelompokan observasi
Indonesia secara keseluruhan. Dimana rasio dokter b. Pengelompokan variabel..
dengan penduduk Indonesia berdasarkan data Secara umun dalam pemilihan analisis cluster
Departemen Kesehatan berkisar satu banding 4000 terdapat dua metode yaitu pengelompokan hierarki dan
penduduk. Tenaga kesehatan di Indonesia tiap tahunnya pengelompokan non-hierarki. Lebih jelasnya adalah
mengalami peningkatan namun tidak signifikan. Hal ini sebagai berikut:
dikarenakan, selain kuantitas yang terbatas juga
B. Metode Hierarki
persebaran tenaga kesehatan yang masih belum merata
Analisis cluster merupakan teknik pengelompokan
dan diikuti dengan rendahnya kualitas tenaga kesehatan
dimana belum diketahuinya asumsi berapa banyak grup
dalam menjalankan tugas sebagai pelayan kesehatan
atau struktur grup yang terbentuk. Pengelompokan
masyarakat.
2

dilakukan berdasarkan kemiripan atau Besaran-besaran dUW dan dVW berturut-turut adalah
ketidakmiripan[2]. jarak antara tetangga terdekat klaster-klaster U dan W
Salah satu teknik clustering yang popular adalah dan juga klaster-klaster V dan W [2]
dilakukan secara hierarki. Dinamakan hierarki sebab E. Metode Non-Hirarki
pengelompokan dilakukan secara bertahap dengan Metode klaster non-hierarki menempatkan obyek
menggabungkan objek yang diamati kemiripannya ke ke dalam kelompok pada jumlah klaster yang telah
dalam suatu cluster berdasarkan karakteristik tertentu. ditentukan. Salah satu metode non hierarki adalah
Terdapat tiga jenis clustering secara hierarki, yaitu metode k-means[2]
Single Linkage, Complete Linkage, dan Average
F. Metode K-Means
Linkage
Prosedur metode k-means adalah dengan
Berikut ini prosedur untuk melakukan pembentukan
mempartisi obyek ke dalam sejumlah klaster yang telah
cluster secara hierarki:
ditentukan oleh peneliti, kemudian secara iteratif
a. Mendapatkan matriks jarak D = {dik} dan
melakukan pemindahan pengamatan pada klaster
menetapkan akan ada sebanyak N cluster yang
sampai beberapa kriteria numerik terpenuhi. Tujuannya
dapat terbentuk, dimana N adalah banyak objek
adalah untuk meminimalkan variabilitas antar objek
yang diamati.
dalam satu kelompok dan memaksimalkan variabilitas
b. Menentukan matriks jarak untuk kedekatan antar
antar kelompok[2]. Hipotesis yang digunakan pada
cluster.
ANOVA yaitu :
c. Menggabungkan cluster yang terbukti memiliki
Hipotesis :
kedekatan.
H0 : variabel tidak berpengaruh signifikan terhadap
d. Mengulang langkah c sebanyak N-1 kali hingga
pengelompokan
diperoleh banyaknya cluster yang terbentuk dan
H1 : variabel berpengaruh signifikan terhadap
seberapa dekat jarak antar cluster tersebut.
pengelompokan
Hasil penggabungan tersebut dapat diuraikan atau
Dengan daerah kritis yaitu tolak H0 jika p-value < α
dijelaskan dengan baik secara visual oleh Dendrogram.
(0.05).
C. Single Linkage
G. Dendogram
Input untuk algoritma single linkageberupa jarak
Dendogram adalah garfik pohon yang terstruktur
atau similarities antara pasangan-pasangan dari objek-
yang digunakan untuk memetakan atau memvisualisasi
objek. Kelompok-kelompok dibentuk dari entities
hasil perhitungan klaster. Hasil pengelompokkan akan
individu dengan menggabungkan jarak paling pendek
disajikan bagik sebagai jarak atau kesamaan atara baris
atau similarities (kemiripan) yang paling besar. Pada
atau kolom tergantung pada ukuran jarak yang dipilih.
awalnya, kita harus menemukan jarak terpendek dalam
D{dik} dan menggabungkan objek-objek yang H. Pseudo F
bersesuaian misalnya U dan V, untuk mendapatkan Salah satu metode alternatif yang digunakan
klaster (UV). Untuk langkah dari algoritma di atas untuk menentukan banyaknya kelompok optimum
jarak-jarak antara (UV) dan cluster W yang lain adalah Pseudo F-statistic yang dirumuskan oleh
dihitung dengan persamaan sebagai berikut. Calinski dan Harabasz. Penelitian oleh Milligan dan
d (UV )W  mindUW , dVW  (1) Cooper (1985) menunjukkan bahwa Pseudo F-statistic
Besaran-besaran dUW dan dVW berturut-turut yang selanjutnya disebut Pseudo F, memberikan hasil
adalah jarak terpendekantara klaster U dan W dan terbaik diantara 30 metode dan merupakan metode
juga klaster-klaster V dan W[2] yang dapat digunakan secara global. Rumus Pseudo F
tertulis pada persamaan (10)[5].
D. Complete Linkage  R2 
Complete linkage memberikan kepastian bahwa  
 c 1
Pseudo F   
semua item-item dalam satu cluster berada dalam jarak
(3)
paling jauh (similaritas terkecil) satu sama lain. 1 R2 
Algoritma aglomerative pada umumnya dimulai  
 nc 
dengan menentukan entri (elemen matriks) dalam D =  
{dik} dan menggabungkan objek-objek yang
bersesuaian misalnya U dan V untuk mendapatkan
cluster (UV). Untuk langkah dari algoritma di atas
jarak-jarak antara klaster (UV) dan cluster W yang lain
dihitung dengan persamaan sebagai berikut.
d(UV )W  maksdUW , dVW  (2)
3

R2 
SST  SSW  (4)
mengabdikan diri dalam bidang kesehatan serta
SST memiliki pengetahuan dan/atau keterampilan melalui
2 pendidikan di bidang kesehatan yang untuk jenis
 
nc c p
SST   x  x k
ij
k
(5) tertentu memerlukan kewenangan untuk melakukan
i 1 j 1 k 1 upaya kesehatan.

 
nc c p 2
III. METODOLOGI PENELITIAN
SSW   x  x j k k
ij
(6)
i 1 j 1 k 1 A. Sumber Data
Dimana, Sumber data yang digunakan dalam laporan ini
R2 : Proporsi jumlah kuadrat jarak antar pusat adalah data sekunder yang diperoleh dari Data dan
kelompok dengan jumlah kuadrat sampel Informasi Profil Kesehatan Indonesia 2016, Maret
terhadap rata-rata keseluruhan 2017, hal. 49 yaitu data tentang Jumlah Tenaga
SST :Total jumlah dari kuadrat jarak terhadap Kesehatan Menurut Provinsi. Data yang digunakan
rata-rata keseluruhan sebanyak 34 provinsi dan 9 variabel jenis tenaga
SSW :Total jumlah dari kuadrat jarak sampel kesehatan.
terhadap rata-rata kelompoknya B. Variabel Penelitian
n : Banyaknya sampel Variabel yang digunakan dalam penelitian ini
c : Banyaknya kelompok adalah sebagai berikut.
nc : Banyaknya data pada kelompok ke-i Tabel 1. Variabel Penelitian
p : Banyaknya variabel Variabel Data
xijk : Sampel ke-i pada kelompok ke-j dan X1 Dokter Umum
X2 Dokter Gigi
variabel ke-k X3 Perawat
k X4 Bidan
x : Rata-rata sampel pada variabel-k
k X5 Tenaga Kefarmasian
xj : Rata-rata sampel pada kelompok ke-j & X6 Tenaga Kesehatan Masyarakat
variabel ke-k X7 Tenaga Kesehatan Lingkungan
X8 Tenaga Gizi
I. ICD-rate X9 Ahli Teknologi Lab Medik
Beberapa macam metode untuk membandingkan
hasil pengelompokan dapat dilakukan berbagai cara C. Langkah Analisis
dan rumusan. Salah satunya dengan menghitung Tahapan yang dilakukan untuk melakukan
performansi cluster dengan menghitung nilai SSB analisis data dalam penelitian ini adalah sebagai
dari hasil pengolahan data dan menghitung berikut.
persebaran (Internal Cluster Dispersion Rate) dalam 1. Melakukan cluster dengan metode Single Linkage.
masing-masing cluster yang telah terbentuk. Semakin 2. Melakukan cluster dengan metode Complete
kecil nilai ICD maka semakin baik hasil Linkage.
pengelompokkannya. Membandingkan metode 3. Melakukan cluster dengan metode K-Means.
cluster yang terbaik dengan ICD didefinisakan 4. Mengelompokkan case sesuai dengan cluster.
persamaan sebagai berikut[4]. 5. Memilih jumlah cluster terbaik untuk tiap metode.
𝑆𝑆𝐵 6. Memilih model cluster terbaik.
ICD-rate = 1 − 𝑆𝑆𝑇 (7)
7. Menarik kesimpulan berdasarkan analisis yang
Dimana: dilakukan.
𝑝 2
𝑆𝑆𝐵 = ∑𝑐𝑗=1 ∑𝑘=1(𝑥̅𝑗𝑘 − 𝑥̅𝑗 )
(8)
IV. ANALISIS DAN PEMBAHASAN
Keterangan:
SST (Sum Square Total) : Total jumlah kuadrat dari A. Analisis Missing Value
jarak sampel terhadap rata-rata keseluruhan. Analisis Cluster dengan menggunakan metode
𝑥̅𝑗𝑘 :rata-rata sampel pada variabel ke-j dan hirarki dapat dilakukan pada data yang tidak
kelompok ke-k mengandung missing value. Apabila terdapat data yang
𝑥̅𝑗 :rata-rata sampel pada variabel ke-j missing maka harus diatasi sebelum dianalisis lebih
c :banyaknya variabel lanjut. Berikut adalah output dari SPSS yang
p :banyaknya kelompok digunakan untuk mendeteksi apakah pada data data
jumlah tenaga kesehatan di Indonesia, terdapat missing
J. Tenaga Kesehatan value atau tidak.
Menurut undang-undang nomor 36 tahun 2014
tentang tenaga kesehatan adalah setiap orang yang
4

Tabel 2. Output Missing Value Pada 3 cluster, Jawa Timur menempati cluster 3
Cases N karena jumlah tenaga kesehatannya yang sudah
Valid 34 memadai dibanding provinsi lain. Pada 4 cluster,
Missing 0 sebanyak 28 provinsi berpindah ke cluster 3 dengan
Total 34
jumlah tenaga kerja yang minim dibawah provinsi
Berdasarkan Tabel 2, diketahui bahwa terdapat 34 Aceh dan Sumatera Selatan dan Jawa Timur yang
jumlah pengamatan dan tidak terdapat missing value
berpindah ke cluster 4 dengan tenaga kesehatan yang
pada data jumlah tenaga kesehatan di Indonesia tahun
2016. Sehingga data dapat dianalisa lebih lanjut. memadai. Pada 5 cluster, Sumatera Selatan berpindah
ke cluster 4 karena memiliki pemerataan jumlah tiap
B. Metode Single Linkage jenis tenaga kesehatan yang lebih baik apabila
Selanjutnya mengelompokkan case pada masing- dibandingkan dengan Aceh, dimana Aceh memiliki
masing variabel kedalam cluster dengan single linkage. jumlah dokter gigi yang minim dibandingkan tenaga
Pada analisa ini dilakukan clustering 2,3,4, dan 5.
kesehatan lain (tidak sebanding). Dan, Jawa Timur
Berikut hasil pengelompokkan.
Tabel 2. Hasil Cluster Single Linkage
berpindah ke cluster 5 dengan jumlah tenaga
Pengelompokan Provinsi kesehata yang memadai.
5 Cluster Cluster 1 Aceh
Cluster 2 Sumut, Jabar, Jateng C. Metode Complete Linkage
Sumbar, Riau, Jambi, Bengkulu, Lampung, Analisis berikutnya adalah mengelompokkan
Bangla, Kep. Riau, Jakarta, DIY,Banten, Bali, case pada masing-masing variabel kedalam cluster
NTT,NTB,Kalbar, Kalteng, Kalsel, Kaltim,
Cluster 3 dengan complete linkage. Pada analisa ini dilakukan
Kalut,Sulut, Sulteng, Sulsel, SulTengg, Gorontalo,
Sulbar, Maluku, Maluku Barat, Papua Barat, clustering 2, 3, 4, dan 5. Berikut hasil
Papua pengelompokkan.
Cluster 4 Sumsel Tabel 4. Hasil Cluster Complete Linkage
Cluster 5 Jatim Pengelompokan Provinsi
4 Cluster Cluster 1 Aceh, Sumsel 5 Cluster Cluster 1 Aceh, Sumsel
Cluster 2 Sumut, Jabar, Jateng Cluster 2 Sumatera Utara, Jabar, Jateng
Sumbar,Riau, Jambi, Bengkulu,Lampung, Bangla, Sumbar,..,Jambi, Banten, NTT,
Kep. Riau,Jakarta, DIY,Banten, Bali, NTT, NTB, Cluster 3
Sulawesi Selatan
Cluster 3 Kalbar, Kalteng, Kalsel, Kaltim, Kalut, Sulut, Bengkulu,..,DKI Jakarta, DIY,
Sulteng, Sulsel, SulTengg, Gorontalo, Sulbar, Cluster 4
Bali, NTB, Kalbar,..,Papua
Maluku, Maluku Barat, Papua Barat, Papua Cluster 5 Jatim
Cluster 4 Jatim Aceh, Sumbar,..,Sumsel, Banten,
Aceh, Sumbar, Riau, Jambi, Sumsel, Bengkulu, 4 Cluster Cluster 1
NTT, Sulawesi Selatan
Lampung, BaBel, Kep.Riau, DKI Jakarta, DIY, Cluster 2 Sumatera Utara, Jabar,Jateng
Banten, Bali, NTT, NTB, Kalbar, Kalteng, Kalsel, Bengkulu,..,DKI Jakarta, Bali, NTB,
3 Cluster Cluster 1
Kaltim, Kalut, Sulut, Sulteng, Sulsel, SulTengg, Cluster 3 Kalbar,..,Sulteng
Gorontalo,Sulbar, Maluku, Maluku Barat, Papua Sulawesi Tenggara,..,Papua
Barat, Papua Cluster 4 Jatim
Cluster 2 Sumut, Jabar, Jateng Aceh, Sumut,..,Sumsel, Banten, NTT,
Cluster 3 Jatim 3 Cluster Cluster 1
Sulsel
Aceh, Sumbar, Riau, Jambi, Sumsel, Bengkulu, Cluster 2 Sumut, Jabar, Jateng, Jatim
Lampung, BaBel, Kep.Riau, DKI Jakarta,DIY, Bengkulu,..,DKI Jakarta, Bali
Banten, Bali, NTT, NTB, Kalbar, Kalteng, Kalsel, Cluster 3
2 Cluster Cluster 1 NTB, Kalbar,..,Papua
Kaltim, Kalut, Sulut, Sulteng, Sulsel, SulTengg, Aceh, Sumbar,..,DKI Jakarta, DIY,
Gorontalo,Sulbar, Maluku, Maluku Barat, Papua 2 Cluster Cluster 1
Banten,..,Papua
Barat, Papua Cluster 2 Sumut, Jabar, Jateng, Jatim
Cluster 2 Sumut, Jabar, Jateng, Jatim
Berdasarkan Tabel 4 menunjukkan
Pada tabel 3, menunjukkan pengelompokan
pengelompokkan untuk 2, 3, 4, dan 5 cluster. Pada 5
untuk 2, 3, 4, dan 5 cluster. Dimana, tiap cluster , pengamatan yang masuk pada cluster 1
pengelompokan tiap cluster terdapat perbedaan adalah Aceh dan Sumatera Selatan. Pada cluster 2
karakteristik. Pada 2 cluster, terdapat 2 karakteristik yaitu Sumatera Utara, Jawa Barat, dan Jawa Tengah.
berbeda yaitu provinsi Sumatera Utara, Jawa Barat, Pada cluster 3 yaitu Sumatera Barat-Jambi, Banten,
Jawa Tengan dan Jawa Timur memiliki jumlah NTT, dan Sulawesi Selatan. Pada cluster 4 yaitu
tenaga kesehatan yang baik karena sebagian besar Bengkulu-DKI Jakarta, DIY, Bali, NTB, Kalimantan
provinsi ini memiliki jumlah lembaga pendidikan Barat-Papua. Dan pada cluster 5 yaitu Jawa Timur.
kesehatan cukup banyak dan layanan kesehatan yang Pada 4 cluster, pengamatan yang masuk cluster 1
cukup baik. Namun, untuk provinsi lain memiliki yaitu Aceh, Sumatera Barat-Sumatera Selatan,
tenaga kesehatan yang minim hal ini disebabkan oleh Banten, NTT, dan Sulawesi Selatan. Pada cluster 2
ketimpangan penyebaran dan mutu/ kualitas dokter. yaitu Sumatera Utara, Jawa Barat, dan Jawa Tengah.
Pada cluster 3 yaitu Bengkulu-DKI Jakarta, Bali,
5

NTB, Kalimantan Barat-Sulawesi Tengah, Sulawesi kesehatan yang cukup memadai (>10.000). Pada 4
Tenggara-Papua. Dan pada cluster 4 yaitu Jawa cluster, provinsi Jawa Timur membentuk cluster 3
Timur. Pada 3 cluster, pengamatan yang masuk ke dimana jumlah tenaga kesehatan pada provinsi
cluster 1 yaitu Aceh, Sumatra Utara-Sumatra Selatan, tersebut sudah sangat memadai yaitu berkisar 39.000.
Banten, NTT, dan Sulawesi Selatan. Pada cluster 2 Pada 5 cluster, sebanyak 9 provinsi berpindah ke
yaitu Sumatera Utara, Jawa Barat, Jawa Tengah, dan cluster 4 membentuk kelompok dengan jumlah
Jawa Timur. Pada cluster 3 yaitu Bengkulu-DKI
tenaga kesehatan > 5.000. Selain itu, provinsi Aceh
Jakarta, Bali, NTB, dan Kalimantan Barat-Papua.
dan Sumatera Selatan membentuk kelompok dengan
Pada 2 cluster, pengamatan yang masuk ke cluster 1
yaitu Aceh, Sumatra Barat-DKI Jakarta, DIY, jumlah tenaga kesehatan berkisar 16.000.
Banten-Papua. Dan pengamatan yang masuk ke E. ANOVA Metode K-Means Cluster
cluster 2 yaitu Sumatra Utara, Jawa Barat, Jawa Tabel 6. ANOVA K-means Cluster
Tengah, dan Jawa Timur Sig.
Variabel
D. Metode K-Means 2 Cluster 3 Cluster 4 Cluster 5 Cluster
Analisis berikutnya adalah mengelompokkan case X1 0 0 0 0
pada masing-masing variabel kedalam cluster dengan X2 0 0 0 0
X3 0 0 0 0
K-Means Cluster. Berikut hasil pengelompokkan. X4 0 0 0 0
Tabel 5. Hasil K-Means Cluster X5 0 0 0 0
Pengelompokan Provinsi X6 0,064 0,005 0,014 0
Bangka, Kep. Riau, Jakarta, DIY, Bali, Kalteng, Kalsel, X7 0 0 0 0
5 Cluster Cluster 1 Kalut,Sulut, Sulteng, Gorontalo, Sulbar, Maluku, X8 0 0 0 0
Maluku Barat, Papua Barat, X9 0 0 0 0
Cluster 2 Sumut, Jabar, Jateng Tabel 6 merupakan ANOVA dari Metode Non
Cluster 3 Aceh, Sumsel
Sumbar, Riau, Jambi, Bengkulu, Lampung, Banten, NTT,
Hierarki K-Means Cluster. Dari tabel, tampak nilai
Cluster 4 signifikansi masing-masing variabel. Apabila alpha
NTB,Kalbar, Kaltim, Sulsel, SulTengg, Papua
Cluster 5 Jatim bernilai < 0,05 maka keputusannya adalah tolak H0.
Bengkulu,Lampung, Bangka, Kep. Riau,Jakarta, DIY,Nilai signifikansi variabel X6 pada K-Means 2
Bali, NTB, Kalbar, Kalteng, Kalsel, Kaltim, Kalut, Sulut,
4 Cluster Cluster 1
Sulteng, SulTengg, Gorontalo, Sulbar, Maluku,
cluster adalah 0,064 atau lebih dari alpha sehingga
Maluku Barat, Papua Barat, Papua X6 tidak berpengaruh signifikan terhadap
Cluster 2 Sumut, Jabar, Jateng pengelompokan 2 cluster. Untuk variabel lain pada
Cluster 3 Jatim cluster 2, 3, 4 dan 5 memiliki nilai signifikansi
Aceh, Sumbar,Riau, Jambi, Sumsel, Banten, NTT,
Cluster 4
Sulsel
kurang dari alpha sehingga keputusannya tolak H0
Aceh, Sumbar, Riau, Jambi, Sumsel, Banten, NTT, yang berarti terdapat perbedaan yang signifikan pada
3 Cluster Cluster 1
Sulsel pengelompokan tiap cluster-nya.
Cluster 2 Sumut, Jabar, Jateng, Jatim
Bengkulu, Lampung, BaBel, Kep.Riau, DKI Jakarta, F. Pseudo F
Cluster 3
DIY, Bali, NTB, Kalbar, Kalteng, Kalsel, Kaltim, Pada tahap ini, dilakukan perhitungan nilai
Kalut, Sulut, Sulteng, SulTengg, Gorontalo,Sulbar, Pseudo F untuk menentukan banyaknya kelompok
Maluku, Maluku Barat, Papua Barat, Papua
Aceh, Sumbar, Riau, Jambi, Sumsel, Bengkulu,
optimum pada setiap metode. Nilai Pseudo F untuk
Lampung, BaBel, Kep.Riau, DKI Jakarta,DIY, Banten, metode single linkage disajikan pada tabel sebagai
2 Cluster Cluster 1 Bali, NTT, NTB, Kalbar, Kalteng, Kalsel, Kaltim, berikut.
Kalut,
Sulut, Sulteng, Sulsel, SulTengg, Gorontalo,Sulbar, Tabel 7. Nilai Pseudo-F Tiap Metode
Maluku, Maluku Barat, Papua Barat, Papua Nilai Pseudo-F
Cluster 2 Sumut, Jabar, Jateng, Jatim Banyak Cluster Single Complete
Pada tabel 5, menunjukkan pengelompokan K-Means
Linkage Linkage
untuk 2, 3, 4, dan 5 cluster. Dimana, tiap 2 116,8183 116,8183 116,8183
pengelompokan tiap cluster terdapat perbedaan 3 62,56969 156,2934 159,6243
4 75,18633 125,6155 129,1459
karakteristik. Pada 2 cluster, terdapat 2 karakteristik 5 55,58525 127,0767 132,6101
berbeda yaitu provinsi Sumatera Utara, Jawa Barat, Banyak cluster optimal berdasarkan Tabel 7, pada
Jawa Tengan dan Jawa Timur memiliki jumlah metode Single Linkage adalah dua claster. Adapun
tenaga kesehatan yang baik dan memadai Namun, provinsi tiap cluster adalah 4 provinsi pada cluster 2
untuk provinsi lain memiliki tenaga kesehatan yang dan 30 provinsi lainnya pada cluster 1. Pada metode
minim hal ini disebabkan oleh ketimpangan Complete Linkage adalah tiga claster. Adapun provinsi
penyebaran dan mutu/ kualitas dokter. Pada 3 cluster, tiap cluster adalah 8 provinsi pada cluster 3, 4 provinsi
sebanyak 23 provinsi berpindah ke cluster 3 dimana pada cluster 2, dan 22 provinsi lainnya pada cluster 1.
jumlah tenaga kesehatan pada cluster tersebut sangat Dan pada metode K-Means adalah 22 provinsi pada
minim yaitu berkisar 1.000-6.000 dan berbeda jika
dibandingkan dengan cluster 1 dengan jumlah tenaga
6

cluster 3, 4 provinsi pada cluster 2 dan 8 provinsi 5. Perhitungan nilai pseudo F pada single linkage
lainnya pada cluster 1. yang optimum didapat pada 2 cluster. Adapun
provinsi pada cluster 2 adalah 4 provinsi dan 30
G. ICD-rate
provinsi lainnya pada cluster 1. Untuk complete
Kriteria pemilihan metode terbaik dapat dilihat
linkage didapat nilai optimum pada 2 claster.
dari nilai ICD-rate. Untuk mendapatkan
Adapun provinsi pada cluster 2 adalah 4 provinsi
pengelompokkan optimal, maka dari ketiga metode,
dan 30 provinsi lainnya pada cluster 1. Dan untuk
yaitu Single Linkage, Complete Linkage, dan K-Means
k-means adalah pada tiga claster. Adapun banyak
akan dibandingkan berdasarkan tingkat kebaikan hasil
provinsi tiap cluster yaitu 22 provinsi pada cluster
pengelompokannya. Kebaikan hasil pengelompokan
3, 4 provinsi pada cluster 2 dan 8 provinsi lainnya
dapat diketahui berdasarkan Internal Cluster
pada cluster 1.
Dispersion Rate. Semakin kecil nilai ICD-rate,
6. Kriteria pemilihan metode terbaik dapat dilihat dari
semakin baik metode tersebut dalam melakukan
nilai ICD-rate. Pada penelitian ini untuk
pengelompokkan. Berikut merupakan nilai ICD-rate
mendapatkan pengelompokkan optimal, maka dari
dari setiap cluster pada setiap metode.
ketiga metode akan dibandingkan berdasarkan
Tabel 13. Nilai ICD-Rate Tiap Metode
tingkat kebaikan hasil pengelompokannya.
Metode Banyak Cluster ICD-Rate
Berdasarkan penelitian didapatkan bahwa nilai
Single Linkage 2 0,2150273 ICD-rate terkecil dimiliki oleh metode K-Means
Complete Linkage 3 yaitu sebesar 0,0885086. Dalam praktikum ini,
0.09022465
metode K-Means dengan 3 cluster optimal dipilih
K-Means 3 0,0885086 untuk mengelompokan provinsi di Indonesia
Berdasarkan Tabel 13, nilai ICD-rate terkecil berdasarkan jumlah tenaga kesehatan.
dimiliki oleh metode K-Means yaitu sebesar B. Saran
0,0885086. Dalam praktikum ini, metode K-Means Pengelompokkan data menjadi beberapa cluster
dengan 3 cluster optimal dipilih untuk mengelompokan perlu memperhatikan beberapa aspek. Sebelum
provinsi di Indonesia berdasarkan jumlah tenaga melakukan clustering lebih dahulu mengecek
kesehatan. satuan yang akan dikelompokkan. Jika satuan tidak
sama perlu dilakukan standardize.
V. KESIMPULAN DAN SARAN
A. Kesimpulan DAFTAR PUSTAKA
1. Dengan pengujian missing value diketahui bahwa [1] Hair, J. F. Jr. 1995. Multivariate Data Analysis
data jumlah tenaga kerja Indonesia 2016 sejumlah with Readings, 4th edition. Madison : Pearson
34 jumlah pengamatan dan tidak terdapat missing Prentice-Hall.
value. [2] Johnson, R. A. dan Wichern, D. W. 2007.
2. Pada analisa cluster dengan single linkage Applied Multivariate Statistical Analysis. New
dilakukan clustering 2,3,4, dan 5. Didapatkan Jersey: Prentice Hall.
bahwa pada 3 cluster pengamatan yang masuk ke [3] Kementerian Kesehatan RI. 2017. “Data dan
cluster 1 adalah provinsi Aceh, Sumatera Barat- Informasi Profil Kesehatan Indonesia 2016”.
Jakarta, DIY, Banten-Papua, cluster 2 adalah Jakarta: KemKes RI.
provinsi Sumatera Utara, Jawa Barat, dan Jawa [4] Orpin, A.R. & Kostylev, V.E. 2006. Towards a
Tengah, dan cluster 3 adalah Jawa Timur. statistically valid method of textural sea floor
3. Dengan metode complete linkage diketahui bahwa characterization of benthic habitats. Marine
pada 2 cluster, pengamatan yang masuk ke cluster Geology 225 : 209-222.
1 ialah Aceh, Sumatra Barat-DKI Jakarta, DIY,
Banten-Papua dan cluster 2 yaitu Sumatra Utara,
Jawa Barat, Jawa Tengah, dan Jawa Timur.
4. Dengan metode k-means dengan cluster 2,3,4,5
diketahui bahwa pada cluster 2 terdapat variabel
yang memiliki nilai signifikansi lebih dari alpha,
yaitu pada variabel X6 sehingga untuk variabel ini
tidak signifikan terhadap cluster 2. Sedangkan
untuk cluser 3,4, dan 5 masing-masing variabel
memiliki nilai signifikansi kurang dari alpha
sehingga semua variabel pada cluster 3,4, dan 5
signifikan terhadap cluster.

Anda mungkin juga menyukai