Kelompok Data
Kelompok Data
1
14 counties/cities. The discriminant analysis we get the discriminant
function as follows,
Di tahun 2013 Kamar Dagang dan Industri Indonesia (Kadin) menilai angka
pengangguran di Indonesia sudah cukup tinggi akibat kesenjangan antara
pertumbuhan angkatan kerja dan lapangan pekerjaan. Pertumbuhan tenaga kerja
yang kurang diimbangi dengan pertumbuhan lapangan kerja akan menyebabkan
tingkat kesempatan kerja cenderung menurun.
International Labour Organization (ILO) mendefinisikan beberapa faktor
yang berpengaruh terhadap TPT diantaranya yaitu kependudukan, pendidikan,
upah tenaga kerja, PDRB, banyaknya pekerja di sektor formal dan informal,
infrastruktur, serta sarana dan prasarana yang tersedia di suatu wilayah. Indikator
TPT ini berguna sebagai acuan pemerintah untuk dibukanya lapangan kerja baru
(BPS 2007).
Selama ini hampir semua orang berpendapat, pendidikan diharapkan mampu
mengubah manusia, dari tidak bisa menjadi bisa, dari tidak mampu menjadi
mampu, dari tidak berbudaya menjadi berbudaya. Ekspektasi terhadap dunia
pendidikan di atas tentu bertolak belakang dengan realita pengangguran yang ada
di negara kita. Artinya, terdapat jutaan intelektual dan kaum terdidik yang menjadi
pengangguran terbuka.
Berdasarkan permasalahan di atas supaya diketahui pengangguran di
kota/kab di jawa timur berada pada tingkat pengangguran rendah atau tinggi maka
perlu adanya pengelompokan, sehingga penyuluhan tentang pentingnya
pendidikan demi masa depan yang diharapkan sesuai dengan tingkat
pengelompokkan Kab/Kota. Analisis kelompok adalah termasuk yang sesuai
untuk melakukan pengelompokan dalam kelompok-kelompok berdasarkan
pendidikan terakhir yang ditamatkan. Untuk lebih mempermudah membedakan
antar kelompok maka pengangguran dikelompokkan menjadi 2 yaitu tingkat
pengangguran tinggi dan tingkat pengangguran rendah maka dalam permasalahan
ini digunakan analisis kelompok metode k-mean. Analisis Kelompok dengan
metode K-Mean adalah statistik yang berguna untuk mengelompokkan sejumlah
objek dalam jumlah kelompok yang sudah ditentukan di mana karakteristik objek
hanya dikelompokkan berdasarkan variabel tertentu, tetapi karakteristik latar
belakang objek belum diketahui pasti (Sofyan Yamin dan Heri Kurniawan,
2011:196). Analisis diskriminan merupakan teknik yang akurat untuk
memprediksi seseorang termasuk ke dalam kategori apa, dengan catatan data-data
yang dilibatkan terjamin akurasinya (Bilson Simamora, 2005:143).
METODE PENELITIAN
Data yang digunakan dalam penelitian ini adalah data sekunder yaitu data
yang telah dikumpulkan terlebih dahulu oleh pihak-pihak lain selain peneliti.
Dalam penelitian ini data sekunder diperoleh dari BPS Jawa Timur.
2
Teknik analisis yang digunakan dalam penelitian ini yaitu analisis kelompok
metode k-mean dan analisis diskriminan.
Adapun hubungan antar variabel penelitian adalah sebagai berikut.
Variabel Bebas (X) atau variabel prediktor yang diamati adalah sebagai berikut.
1. X1 = Jumlah penduduk yang tidak atau belum pernah sekolah.
2. X2 = Jumlah penduduk yang tidak tamat Sekolah Dasar (SD).
3. X3 = Jumlah penduduk yang tamat Sekolah Dasar (SD).
4. X4 = Jumlah penduduk yang tamat Sekolah Menengah Pertama(SMP).
5. X5 = Jumlah penduduk yang tamat Sekolah Menengah Atas(SMA).
6. X6 = Jumlah penduduk yang tamat Perguruan Tinggi (PT).
7. X7 = Jumlah penduduk yang Buta Huruf.
Populasi dalam penelitian ini adalah masyarakat pengangguran di kota/kab di
Jawa Timur tahun 2010 yang tercantum dalam hasil Survey Sosial Ekomomi
Nasional. Data pengangguran ini didapat dari BPS Provinsi Jawa Timur.
Sampel dalam penelitian ini adalah masyarakat yang menganggur di kota Malang
tahun 2010.
Teknik dalam pengumpulan data yang menunjang dalam penelitian ini
dilakukan sebagai berikut.
1. Peneliti mengambil data BPS Provinsi Jawa Timur melalui web
www.bps.go.id.
2. Data yang digunakan pada penelitian ini adalah data sekunder. Data
tersebut diperoleh dari pihak yang berwenang di BPS Jawa Timur.
Analisis data dalam penelitian ini menggunakan metode analisis kelompok
dan analisis diskriminan yang dilakukan dengan bantuan program minitab dan
SPSS. Adapun langkah-langkahnya adalah sebagai berikut.
Data
tidak
Uji
asumsi
ya
tidak
Uji
asumsi
ya
Analisis diskriminan
Validasi
3
Langkah pertama yang dilakukan pada analisis kelompok adalah uji kenormalan
multivariat. Langkah kedua adalah uji multikolinieritas. Multikolinieritas adalah
suatu keadaan dimana terdapat dua variabel atau lebih, saling berkorelasi. Dan
langkah ketiga adalah Dalam analisis kelompok, pengelompokan data atau
permasalahan dibutuhkan suatu ukuran yang dapat menerangkan kedekatan antara
data. Dimana ukuran jarak yang biasa digunakan adalah ukuran jarak Euclidean.
Setelah itu mulai melakukan analisis kelompok.
Analisis kelompok atau biasa dikenal sebagai cluster analysis adalah salah
satu teknik statistik yang bertujuan untuk mengelompokkan objek ke dalam suatu
kelompok sedemikian sehingga objek yang berada dalam satu kelompok akan
memiliki kesamaan yang tinggi dibandingkan dengan objek yang berada di
kelompok lain (Sharma, 1996:185). Langkah pengelompokkan dalam analisis
kelompok terdiri dari 3 langkah yaitu Mengukur kesamaan jarak, membentuk
kelompok secara K-Means, menentukan jumlah kelompok.
Dengan melakukan uji normal multivariat, uji homogen, dan uji
multikolinieritas, kita dapat melakukan analisis diskriminan. Heteroskedastisitas
akan mengakibatkan penaksiran koefisien-koefisien regresi menjadi tidak efisien.
Hasil penaksiran akan menjadi kurang dari semestinya. Asumsi homoekedastisitas
berarti sama(homo) dan sebaran memiliki varian yang sama (Imam
Ghozali,2009:35). Jika nilai Thitung < Tα/2(n-k-1) atau Thitung > Tα/2(n-k-1)
dan nilai signifikan >0.05 maka mengindikasi bahwa sisaaan tersebut tidak
mengalami heteroskedastisitas (nilai tersebut homogen).
Analisis diskriminn merupakan salah satu metode analisis multivariat yang
digunakan untuk mengetahui variabel-variabel ciri yang membedakan tiap-tiap
kelompok yang terbentuk dan bertujuan untuk mengklasifikasikan beberapa
kelompok data yang sudah terkelompokkan dengan cara membentuk kombinasi
linier fungsi diskriminan.
Menurut Dillon (1984) dalam analisis diskriminan dengan p variabel yang
diukur terdapat asumsi-asumsi yang harus dipenuhi untuk mendapatkan
kombinasi linier fungsi diskriminan yang optimal dengan kesalahan klasifikasi
terkecil adalah sebagai berikut:
a. Data berdistribusi normal multivariate
b. Matriks varian kovarians antar kelompok homogen.
Setelah Fungsi diskriminan terbentuk, langkah selanjutnya adalah menilai
validitas analisis diskriminan. Hasil klasifikasi dapat didasarkan pada analisis
sampel ataupun validitas sampel dapat dilakukan dengan cara sebagai berikut.
a. Menghitung diskriminan score
Setelah dibentuk fungsi liniernya, maka dapat dihitung skor diskriminan
untuk tiap observasi dengan memasukkan nilai-nilai variabel penjelasnya.
b. Menghitung cutting score
Cutting score (m) dapat dihitung dengan rumus sebagai berikut :
Keterangan :
: Cutting score
: jumlah anggota grup A
: jumlah anggota grup B
: centroid grup A
4
: centroid grup B
c. Hit Ratio
Setelah semua observasi diprediksi keanggotaannya, kita dapat
menghitung hit ratio. Hit Ratio merupakan nilai yang dapat menjawab:
“Berapa persen objek yang dapat diklasifikasi secara tepat dari jumlah
total objek?” Hit Ratio adalah persentase kasus atau responden yang
kelompoknya dapat diprediksi secara tepat. Rumus hit ratio yang
digunakan adalah:
Dimana:
n = jumlah kasus yang dapat diklasifikasi secara tepat
N = jumlah sampel
Kriteria hit ratio yang baik adalah kalau sama atau melebihi kesempatan
klasifikasi ditambah seperempatnya (Hair et. al., op. cit., hlm. 269-270).
Kalau kesempatan klasifikasi adalah 50%, batas minimal hit ratio adalah
0,50 + (0,25) (0,50) = 0,625 atau 62,5%. Kalau kita memiliki 4 grup,
kesempatan klasifikasi adalah 25%. Dengan cara yang sama, batas
minimal hit ratio adalah 31,25%.
d. Akurasi statistik
Klasifikasi yang dilakukan dengan fungsi diskriminan dapat diuji
keakuratannya dengan menggunakan Press’s Q Statistik. Ukuran
sederhana ini membandingkan jumlah kasus yang diklasifikasikan secara
tepat dengan ukuran sampel dan jumlah grup. Nilai yang diperoleh dari
perhitungan kemudian dibandingkan dengan nilai kritis (critical value).
Press’s Q Statistik dapat ditulis dengan rumus :
[ ]
N : ukuran sampel
n : jumlah kasus yang diklasifikasi secara tepat
K : jumlah grup
5
Analisis Kelompok (Cluster Analysis)
Setelah menghitung jarak Euclidean. Proses selanjutya adalah melakukan
analisis kelompok dengan menggunakan metode K-Mean. Diperoleh jumlah
anggota pada kelompok 1 dalah 24 dan jumlah anggota pada kelompok 2 adalah
14.
Analisis Diskriminan
Analisis diskriminan bertujuan untuk menghitung fungsi diskriminan yang
dapat digunakan sebagai pembeda kelompok.
1. Uji Normal Multivariat
Uji normal multivariat pada analisis diskriminan sama yaitu dengan melihat
gambar hasil QQ plot pada software Macro Minitab 16. bahwa plot menunjukkan
titik mendekati garis lurus dan hasil dari macro minitab t = 0,74752, hal ini
membuktikan bahwa sampel dapat diasumsikan berasal dari populasi normal
multivariat.
2. Uji Homogenitas
Tahap selanjutnya adalah pengujian kehomogenan suatu data dengan melihat
nilai t hitung lebih besar dari t tabel.
Daerah kritisnya adalah Thitung < Tα/2(n-k-1) = atau Thitung < Tα/2(n-k-1) =
.
karena nilai Thitung dari seluruh variabel penjelasan tidak terletak pada daerah
kritis, maka H0 diterima dan nilai signifikan dari seluruh variabel penjelas >
maka model ini homogen.
3. Uji Multikolinieritas
Untuk menguji multikolinieritas pada analisis diskriminan pada dasarnya
sama dengan analisis kelompok yaitu dapat dilihat dengan menghitung koefisien
korelasi sederhana (simple correlation) antara sesama variabel bebas.
Diperoleh nilai koefisien korelasi sederhana (simple correlation) antar
sesama variabel bebas tidak ada yang melebihi maka data tersebut
menunjukkan tidak terjadinya gejala multikolinieritas.
4. Proses Diskriminan
Dengan metode fisher diperoleh model diskriminan yang terbentuk, yaitu:
5. Validasi
a. Cutting score determination
Diperoleh nilai pembatasnya adalah 0,014. Jika di bawah 0,014 masuk grup 1
(tingkat pengangguran tinggi) dan jika di atas 0,014 masuk grup 2 (tingkat
pengangguran rendah).
b. Hit ratio
Karena hit ratio > batas minimal hit ratio, yaitu 100% > 62,5 %. Sehingga
dapat disimpulkan bahwa model diskiminan yang terbentuk mempunyai tingkat
validasi yang tinggi, yaitu 100%, sehingga dapat disimpulkan bahwa fungsi
diskriminan mampu memprediksi keanggotaan semua Kab/Kota.
c. Akurasi statistik
[ ]
Dengan α=0,05 dan df=1, nilai X2 tabel adalah 3,841. Karena Nilai
sehingga dapat disimpulkan bahwa fungsi diskriminan akurat.
6
PENUTUP
Kesimpulan
Berdasarkan hasil analisis data dan pembahasan yang telah dilakukan, maka
kesimpulan yang dapat diambil adalah sebagai berikut.
1. Berdasarkan analisis kelompok, pengelompokkan 38 kabupaten dan kota di
provinsi Jawa Timur menggunakan metode K-mean dapat dibentuk 2
kelompok, dengan kelompok 1 (tingkat pengangguran tinggi) beranggotakan
24 kab/kota yaitu Pacitan, Ponorogo, Trenggalek, Blitar, Kediri, Malang,
Lumajang, Jember, Banyuwangi, Bondowoso, Situbondo, Probolinggo,
Pasuruan, Nganjuk, Madiun, Magetan, Ngawi, Bojonegoro, Tuban,
Lamongan, Bangkalan, Sampang, Pamekasan, Sumenep. Sedangkan
kelompok 2 beranggotakan 14 kab/kota yaitu Tulungagung, Sidoarjo,
Mojokerto, Jombang, Gresik, Kota Kediri, Kota Blitar, Kota Malang, Kota
Probolinggo, Kota Pasuruan, Kota Mojokerto, Kota Madiun, Kota Surabaya,
Kota Batu.
2. Berdasarkan analisis diskriminan diperoleh fungsi diskriminan sebagai
berikut.
DAFTAR PUSTAKA
Anwar, Desy. 2003. Kamus Lengkap Bahasa Indonesia. Surabaya: Amelia
Ghozali, Imam. 2009. Aplikasi Analisis Multivariate Dengan Program SPSS,
Cetakan IV, Badan Penerbit Universitas Diponegoro, Semarang.
Manurung, Mandala dan Prathama Rahardja, 2004. Uang, Perbankan, dan
Ekonomi Moneter. Jakarta: Penerbit Salemba.
Sadono, Sukirno. 2008. Makroekonomi Teori Pengantar. Jakarta: Rajawali
Grafindo.
Sharma, Subhas. 1996. Applied Multivariate Techniques. New York: John Wiley
and Sons, Inc.
7
Soemartini. 2008. Principal Component Analysis (PCA) Sebagai Salah Satu
Metode Untuk Mengatasi Masalah Multikolinearitas. Jatinangor :
Universitas Padjajaran.
Sofyan Yamin & Heri Kurniawan. (2011). Generasi Baru Mengolah Data
Penelitian dengan Partial Least Square Path Modeling : Aplikasi dengan
Software XLSTAT, SmartPLS, dan Visual PLS. Jakarta : Salemba Infotek
Subri, Mulyadi. 2003. Ekonomi Sumberdaya Manusia: Jakarta: Raja Graindo
Persada.
Suryanto. 1988. Metode Statistika Multivariat. Jakarta: Departemen Pendidikan
dan kebudayaan.