Kelompok Data

ANALISIS KELOMPOK DAN ANALISIS DISKRIMINAN UNTUK
MENGGOLONGKAN TINGKAT PENGANGGURAN DI PROVINSI

JAWATIMUR BERDASARKAN PENDIDIKAN TERAKHIR YANG
DITEMPUH
Pratiwi, Y; Rahardjo, S dan Susiswo

Jurusan Matematika
Fakultas MIPA Universitas Negeri Malang
ABSTRAK: Pengangguran adalah salah satu isu penting yang perlu

menjadi perhatian dalam pembangunan ekonomi daerah. Dalam
pembangunan dan kegiatan berproduksi, peranan tenaga manusia
banyak ditentukan oleh jumlah dan kualitas tenaga kerja yang
tersedia di berbagai bidang kegiatan. Berbagai bidang dalam
pembangunan sumber daya manusia mencakup bidang kesehatan,
perbaikan gizi, pendidikan dan latihan serta penyediaan lapangan
kerja, sehingga kualitas manusia dapat ditingkatkan.. Oleh karena
itu, indikator pengangguran dalam penelitian ini berdasarkan
pendidikan terakhir yang ditamatkan dan angka buta huruf. Langkah
pertama yang dilakukan adalah menggolongkan kabupaten dan kota
yang ada di jawa timur menggunakan analisis kelompok metode K-
Mean. Langkah kedua menggunakan analisis diskriminan untuk
menentukan persamaan diskriminan dan mengetahui keakuratan
fungsi diskriminan yang terbentuk. Berdasarkan analisis kelompok
didapatkan kelompok 1 beranggotakan 24 dan kelompok 2
beranggotakan 14. berdasarkan analisis diskriminan diperoleh fungsi
diskriminan sebagai berikut.
Kata kunci: analisis kelompok, analisis diskriminan,

pengangguran, K-Mean.
ABSTRACT: Unemployments is an important issue that need a

special attention in a regional economic development. In the
development and production activity, most of the human labor are
determined by the total and the quality of the labor itself in any fields
of activity. There are some fields in the human source development
which cover health, nutritional improvement, education and training,
and providing jobs. By those fields, the quality of human source can
be improved. Therefore, the unemployment indicators in this
research are built upon the final attained education and illiteracy rate.
The first step that should be done is classifying the counties
and cities in East Java by using the cluster analysis of K-Mean. The
second step is using the discriminant analysis to determine the
discriminant equation and detecting the accuracy of discriminant
function that has been made. Based on the cluster analysis, there is
one group consists of 24 counties/cities dan the group two consists of
1
14 counties/cities. The discriminant analysis we get the discriminant
function as follows,
Keywords: cluster analysis, discriminant analysis, unemployment,

K-Mean.
Di tahun 2013 Kamar Dagang dan Industri Indonesia (Kadin) menilai angka
pengangguran di Indonesia sudah cukup tinggi akibat kesenjangan antara
pertumbuhan angkatan kerja dan lapangan pekerjaan. Pertumbuhan tenaga kerja
yang kurang diimbangi dengan pertumbuhan lapangan kerja akan menyebabkan
tingkat kesempatan kerja cenderung menurun.
International Labour Organization (ILO) mendefinisikan beberapa faktor
yang berpengaruh terhadap TPT diantaranya yaitu kependudukan, pendidikan,
upah tenaga kerja, PDRB, banyaknya pekerja di sektor formal dan informal,
infrastruktur, serta sarana dan prasarana yang tersedia di suatu wilayah. Indikator
TPT ini berguna sebagai acuan pemerintah untuk dibukanya lapangan kerja baru
(BPS 2007).
Selama ini hampir semua orang berpendapat, pendidikan diharapkan mampu
mengubah manusia, dari tidak bisa menjadi bisa, dari tidak mampu menjadi
mampu, dari tidak berbudaya menjadi berbudaya. Ekspektasi terhadap dunia
pendidikan di atas tentu bertolak belakang dengan realita pengangguran yang ada
di negara kita. Artinya, terdapat jutaan intelektual dan kaum terdidik yang menjadi
pengangguran terbuka.
Berdasarkan permasalahan di atas supaya diketahui pengangguran di
kota/kab di jawa timur berada pada tingkat pengangguran rendah atau tinggi maka
perlu adanya pengelompokan, sehingga penyuluhan tentang pentingnya
pendidikan demi masa depan yang diharapkan sesuai dengan tingkat
pengelompokkan Kab/Kota. Analisis kelompok adalah termasuk yang sesuai
untuk melakukan pengelompokan dalam kelompok-kelompok berdasarkan
pendidikan terakhir yang ditamatkan. Untuk lebih mempermudah membedakan
antar kelompok maka pengangguran dikelompokkan menjadi 2 yaitu tingkat
pengangguran tinggi dan tingkat pengangguran rendah maka dalam permasalahan
ini digunakan analisis kelompok metode k-mean. Analisis Kelompok dengan
metode K-Mean adalah statistik yang berguna untuk mengelompokkan sejumlah
objek dalam jumlah kelompok yang sudah ditentukan di mana karakteristik objek
hanya dikelompokkan berdasarkan variabel tertentu, tetapi karakteristik latar
belakang objek belum diketahui pasti (Sofyan Yamin dan Heri Kurniawan,
2011:196). Analisis diskriminan merupakan teknik yang akurat untuk
memprediksi seseorang termasuk ke dalam kategori apa, dengan catatan data-data
yang dilibatkan terjamin akurasinya (Bilson Simamora, 2005:143).
METODE PENELITIAN
Data yang digunakan dalam penelitian ini adalah data sekunder yaitu data
yang telah dikumpulkan terlebih dahulu oleh pihak-pihak lain selain peneliti.
Dalam penelitian ini data sekunder diperoleh dari BPS Jawa Timur.
2
Teknik analisis yang digunakan dalam penelitian ini yaitu analisis kelompok
metode k-mean dan analisis diskriminan.
Adapun hubungan antar variabel penelitian adalah sebagai berikut.
Variabel Bebas (X) atau variabel prediktor yang diamati adalah sebagai berikut.
1. X1 = Jumlah penduduk yang tidak atau belum pernah sekolah.
2. X2 = Jumlah penduduk yang tidak tamat Sekolah Dasar (SD).
3. X3 = Jumlah penduduk yang tamat Sekolah Dasar (SD).
4. X4 = Jumlah penduduk yang tamat Sekolah Menengah Pertama(SMP).
5. X5 = Jumlah penduduk yang tamat Sekolah Menengah Atas(SMA).
6. X6 = Jumlah penduduk yang tamat Perguruan Tinggi (PT).
7. X7 = Jumlah penduduk yang Buta Huruf.
Populasi dalam penelitian ini adalah masyarakat pengangguran di kota/kab di
Jawa Timur tahun 2010 yang tercantum dalam hasil Survey Sosial Ekomomi
Nasional. Data pengangguran ini didapat dari BPS Provinsi Jawa Timur.
Sampel dalam penelitian ini adalah masyarakat yang menganggur di kota Malang
tahun 2010.
Teknik dalam pengumpulan data yang menunjang dalam penelitian ini
dilakukan sebagai berikut.
1. Peneliti mengambil data BPS Provinsi Jawa Timur melalui web
www.bps.go.id.
2. Data yang digunakan pada penelitian ini adalah data sekunder. Data
tersebut diperoleh dari pihak yang berwenang di BPS Jawa Timur.
Analisis data dalam penelitian ini menggunakan metode analisis kelompok
dan analisis diskriminan yang dilakukan dengan bantuan program minitab dan
SPSS. Adapun langkah-langkahnya adalah sebagai berikut.
Data
tidak
Uji
asumsi
ya
Proses Pengelusteran dengan metode k-means
Menentukan profil setiap kelompok
tidak
Uji
asumsi
ya
Analisis diskriminan
Validasi
3
Langkah pertama yang dilakukan pada analisis kelompok adalah uji kenormalan
multivariat. Langkah kedua adalah uji multikolinieritas. Multikolinieritas adalah
suatu keadaan dimana terdapat dua variabel atau lebih, saling berkorelasi. Dan
langkah ketiga adalah Dalam analisis kelompok, pengelompokan data atau
permasalahan dibutuhkan suatu ukuran yang dapat menerangkan kedekatan antara
data. Dimana ukuran jarak yang biasa digunakan adalah ukuran jarak Euclidean.
Setelah itu mulai melakukan analisis kelompok.
Analisis kelompok atau biasa dikenal sebagai cluster analysis adalah salah
satu teknik statistik yang bertujuan untuk mengelompokkan objek ke dalam suatu
kelompok sedemikian sehingga objek yang berada dalam satu kelompok akan
memiliki kesamaan yang tinggi dibandingkan dengan objek yang berada di
kelompok lain (Sharma, 1996:185). Langkah pengelompokkan dalam analisis
kelompok terdiri dari 3 langkah yaitu Mengukur kesamaan jarak, membentuk
kelompok secara K-Means, menentukan jumlah kelompok.
Dengan melakukan uji normal multivariat, uji homogen, dan uji
multikolinieritas, kita dapat melakukan analisis diskriminan. Heteroskedastisitas
akan mengakibatkan penaksiran koefisien-koefisien regresi menjadi tidak efisien.
Hasil penaksiran akan menjadi kurang dari semestinya. Asumsi homoekedastisitas
berarti sama(homo) dan sebaran memiliki varian yang sama (Imam
Ghozali,2009:35). Jika nilai Thitung < Tα/2(n-k-1) atau Thitung > Tα/2(n-k-1)
dan nilai signifikan >0.05 maka mengindikasi bahwa sisaaan tersebut tidak
mengalami heteroskedastisitas (nilai tersebut homogen).
Analisis diskriminn merupakan salah satu metode analisis multivariat yang
digunakan untuk mengetahui variabel-variabel ciri yang membedakan tiap-tiap
kelompok yang terbentuk dan bertujuan untuk mengklasifikasikan beberapa
kelompok data yang sudah terkelompokkan dengan cara membentuk kombinasi
linier fungsi diskriminan.
Menurut Dillon (1984) dalam analisis diskriminan dengan p variabel yang
diukur terdapat asumsi-asumsi yang harus dipenuhi untuk mendapatkan
kombinasi linier fungsi diskriminan yang optimal dengan kesalahan klasifikasi
terkecil adalah sebagai berikut:
a. Data berdistribusi normal multivariate
b. Matriks varian kovarians antar kelompok homogen.
Setelah Fungsi diskriminan terbentuk, langkah selanjutnya adalah menilai
validitas analisis diskriminan. Hasil klasifikasi dapat didasarkan pada analisis
sampel ataupun validitas sampel dapat dilakukan dengan cara sebagai berikut.
a. Menghitung diskriminan score
Setelah dibentuk fungsi liniernya, maka dapat dihitung skor diskriminan
untuk tiap observasi dengan memasukkan nilai-nilai variabel penjelasnya.
b. Menghitung cutting score
Cutting score (m) dapat dihitung dengan rumus sebagai berikut :
Keterangan :
: Cutting score
: jumlah anggota grup A
: jumlah anggota grup B
: centroid grup A
4
: centroid grup B
c. Hit Ratio
Setelah semua observasi diprediksi keanggotaannya, kita dapat
menghitung hit ratio. Hit Ratio merupakan nilai yang dapat menjawab:
“Berapa persen objek yang dapat diklasifikasi secara tepat dari jumlah
total objek?” Hit Ratio adalah persentase kasus atau responden yang
kelompoknya dapat diprediksi secara tepat. Rumus hit ratio yang
digunakan adalah:
Dimana:
n = jumlah kasus yang dapat diklasifikasi secara tepat
N = jumlah sampel
Kriteria hit ratio yang baik adalah kalau sama atau melebihi kesempatan
klasifikasi ditambah seperempatnya (Hair et. al., op. cit., hlm. 269-270).
Kalau kesempatan klasifikasi adalah 50%, batas minimal hit ratio adalah
0,50 + (0,25) (0,50) = 0,625 atau 62,5%. Kalau kita memiliki 4 grup,
kesempatan klasifikasi adalah 25%. Dengan cara yang sama, batas
minimal hit ratio adalah 31,25%.
d. Akurasi statistik
Klasifikasi yang dilakukan dengan fungsi diskriminan dapat diuji
keakuratannya dengan menggunakan Press’s Q Statistik. Ukuran
sederhana ini membandingkan jumlah kasus yang diklasifikasikan secara
tepat dengan ukuran sampel dan jumlah grup. Nilai yang diperoleh dari
perhitungan kemudian dibandingkan dengan nilai kritis (critical value).
Press’s Q Statistik dapat ditulis dengan rumus :
[ ]
N : ukuran sampel
n : jumlah kasus yang diklasifikasi secara tepat
K : jumlah grup
HASIL ANALISIS DAN PEMBAHASAN

Uji Kenormalan Multivariat
Pengujian kenormalan ini dengan melihat gambar hasil QQ plot yang
terdapat di dalam software Macro Minitab 16. Hasil dari gambar plot
menunjukkan titik mendekati garis lurus dan hasil dari macro minitab diperoleh t
= 0,736842, hal ini membuktikan bahwa sampel dapat diasumsikan berasal dari
populasi normal multivariat.
Uji Multikolinieritas
Tabel nilai koefisien korelasi sederhana (simple correlation) antar sesama
variabel bebas tidak ada yang melebihi maka data tersebut menunjukkan tidak
terjadinya gejala multikolinieritas.
Jarak Euclidean
Langkah pertama yang digunakan dalam analisis cluster adalah menghitung
jarak Euclidean.
5
Analisis Kelompok (Cluster Analysis)
Setelah menghitung jarak Euclidean. Proses selanjutya adalah melakukan
analisis kelompok dengan menggunakan metode K-Mean. Diperoleh jumlah
anggota pada kelompok 1 dalah 24 dan jumlah anggota pada kelompok 2 adalah
14.
Analisis Diskriminan
Analisis diskriminan bertujuan untuk menghitung fungsi diskriminan yang
dapat digunakan sebagai pembeda kelompok.
1. Uji Normal Multivariat
Uji normal multivariat pada analisis diskriminan sama yaitu dengan melihat
gambar hasil QQ plot pada software Macro Minitab 16. bahwa plot menunjukkan
titik mendekati garis lurus dan hasil dari macro minitab t = 0,74752, hal ini
membuktikan bahwa sampel dapat diasumsikan berasal dari populasi normal
multivariat.
2. Uji Homogenitas
Tahap selanjutnya adalah pengujian kehomogenan suatu data dengan melihat
nilai t hitung lebih besar dari t tabel.
Daerah kritisnya adalah Thitung < Tα/2(n-k-1) = atau Thitung < Tα/2(n-k-1) =
.
karena nilai Thitung dari seluruh variabel penjelasan tidak terletak pada daerah
kritis, maka H0 diterima dan nilai signifikan dari seluruh variabel penjelas >
maka model ini homogen.
3. Uji Multikolinieritas
Untuk menguji multikolinieritas pada analisis diskriminan pada dasarnya
sama dengan analisis kelompok yaitu dapat dilihat dengan menghitung koefisien
korelasi sederhana (simple correlation) antara sesama variabel bebas.
Diperoleh nilai koefisien korelasi sederhana (simple correlation) antar
sesama variabel bebas tidak ada yang melebihi maka data tersebut
menunjukkan tidak terjadinya gejala multikolinieritas.
4. Proses Diskriminan
Dengan metode fisher diperoleh model diskriminan yang terbentuk, yaitu:
5. Validasi
a. Cutting score determination
Diperoleh nilai pembatasnya adalah 0,014. Jika di bawah 0,014 masuk grup 1
(tingkat pengangguran tinggi) dan jika di atas 0,014 masuk grup 2 (tingkat
pengangguran rendah).
b. Hit ratio
Karena hit ratio > batas minimal hit ratio, yaitu 100% > 62,5 %. Sehingga
dapat disimpulkan bahwa model diskiminan yang terbentuk mempunyai tingkat
validasi yang tinggi, yaitu 100%, sehingga dapat disimpulkan bahwa fungsi
diskriminan mampu memprediksi keanggotaan semua Kab/Kota.
c. Akurasi statistik
[ ]
Dengan α=0,05 dan df=1, nilai X2 tabel adalah 3,841. Karena Nilai
sehingga dapat disimpulkan bahwa fungsi diskriminan akurat.
6
PENUTUP
Kesimpulan
Berdasarkan hasil analisis data dan pembahasan yang telah dilakukan, maka
kesimpulan yang dapat diambil adalah sebagai berikut.
1. Berdasarkan analisis kelompok, pengelompokkan 38 kabupaten dan kota di
provinsi Jawa Timur menggunakan metode K-mean dapat dibentuk 2
kelompok, dengan kelompok 1 (tingkat pengangguran tinggi) beranggotakan
24 kab/kota yaitu Pacitan, Ponorogo, Trenggalek, Blitar, Kediri, Malang,
Lumajang, Jember, Banyuwangi, Bondowoso, Situbondo, Probolinggo,
Pasuruan, Nganjuk, Madiun, Magetan, Ngawi, Bojonegoro, Tuban,
Lamongan, Bangkalan, Sampang, Pamekasan, Sumenep. Sedangkan
kelompok 2 beranggotakan 14 kab/kota yaitu Tulungagung, Sidoarjo,
Mojokerto, Jombang, Gresik, Kota Kediri, Kota Blitar, Kota Malang, Kota
Probolinggo, Kota Pasuruan, Kota Mojokerto, Kota Madiun, Kota Surabaya,
Kota Batu.
2. Berdasarkan analisis diskriminan diperoleh fungsi diskriminan sebagai
berikut.
Sehingga dapat disimpulkan jika penambahan angka pada variabel dan ,

maka angka pengangguran di kabupaten dan kota di jawa timur akan
menurun. Tetapi, jika penambahan angka pada variabel , dan
, maka angka pengangguran di kabupaten dan kota di jawa timur akan
meningkat. Dan juga fungsi diskriminan yang diperoleh dari data
pengelompokan memiliki tingkat validasi 100% dengan kata lain Kab/kota
pada kelompok tingkat pengangguran rendah dan tingkat pengangguran
tinggi yang dihasilkan dari analisis kelompok memiliki tingkat akurasi
tinggi.
Saran
Berdasarkan uraian diatas, maka saran yang diajukan dirumuskan sebagai
berikut. Bagi pemerintah di Jawa Timur diharapkan setelah adanya penelitian ini
bisa lebih memperhatikan pendidikan masyarakatnya. Bagi peneliti lain untuk
kasus pengangguran diharapkan menambahkan variabel-varibel yang lebih
bervariasi. Analisis kelompok dan analisis diskriminan dapat digunakan pada
kasus lain seperti: kesehatan, pendidikan, pemilihan operator, dll.
DAFTAR PUSTAKA
Anwar, Desy. 2003. Kamus Lengkap Bahasa Indonesia. Surabaya: Amelia
Ghozali, Imam. 2009. Aplikasi Analisis Multivariate Dengan Program SPSS,
Cetakan IV, Badan Penerbit Universitas Diponegoro, Semarang.
Manurung, Mandala dan Prathama Rahardja, 2004. Uang, Perbankan, dan
Ekonomi Moneter. Jakarta: Penerbit Salemba.
Sadono, Sukirno. 2008. Makroekonomi Teori Pengantar. Jakarta: Rajawali
Grafindo.
Sharma, Subhas. 1996. Applied Multivariate Techniques. New York: John Wiley
and Sons, Inc.
7
Soemartini. 2008. Principal Component Analysis (PCA) Sebagai Salah Satu
Metode Untuk Mengatasi Masalah Multikolinearitas. Jatinangor :
Universitas Padjajaran.
Sofyan Yamin & Heri Kurniawan. (2011). Generasi Baru Mengolah Data
Penelitian dengan Partial Least Square Path Modeling : Aplikasi dengan
Software XLSTAT, SmartPLS, dan Visual PLS. Jakarta : Salemba Infotek
Subri, Mulyadi. 2003. Ekonomi Sumberdaya Manusia: Jakarta: Raja Graindo
Persada.
Suryanto. 1988. Metode Statistika Multivariat. Jakarta: Departemen Pendidikan
dan kebudayaan.

Kelompok Data

Diunggah oleh

Informasi Dokumen

Judul Asli

Hak Cipta

Format Tersedia

Bagikan dokumen Ini

Bagikan atau Tanam Dokumen

Opsi Berbagi

Apakah menurut Anda dokumen ini bermanfaat?

Apakah konten ini tidak pantas?

Hak Cipta:

Format Tersedia

Kelompok Data

Diunggah oleh

Hak Cipta:

Format Tersedia

ANALISIS KELOMPOK DAN ANALISIS DISKRIMINAN UNTUK

MENGGOLONGKAN TINGKAT PENGANGGURAN DI PROVINSI

Pratiwi, Y; Rahardjo, S dan Susiswo

ABSTRAK: Pengangguran adalah salah satu isu penting yang perlu

Kata kunci: analisis kelompok, analisis diskriminan,

ABSTRACT: Unemployments is an important issue that need a

Keywords: cluster analysis, discriminant analysis, unemployment,

Proses Pengelusteran dengan metode k-means

Menentukan profil setiap kelompok

HASIL ANALISIS DAN PEMBAHASAN

Sehingga dapat disimpulkan jika penambahan angka pada variabel dan ,

Anda mungkin juga menyukai