dengan SPSS
Sanksi Pelanggaran Pasal 113
Undang-Undang Nomor 28 Tahun 2014
tentang Hak Cipta
1. Setiap Orang yang dengan tanpa hak melakukan pelanggaran hak ekonomi
sebagaimana dimaksud dalam Pasal 9 ayat (1) huruf i untuk Penggunaan
Secara Komersial dipidana dengan pidana penjara paling lama 1 (satu) tahun
dan/atau pidana denda paling banyak Rp100.000.000 (seratus juta rupiah).
2. Setiap Orang yang dengan tanpa hak dan/atau tanpa izin Pencipta atau
pemegang Hak Cipta melakukan pelanggaran hak ekonomi Pencipta
sebagaimana dimaksud dalam Pasal 9 ayat (1) huruf c, huruf d, huruf f,
dan/atau huruf h untuk Penggunaan Secara Komersial dipidana dengan
pidana penjara paling lama 3 (tiga) tahun dan/atau pidana denda paling
banyak Rp500.000.000,00 (lima ratus juta rupiah).
3. Setiap Orang yang dengan tanpa hak dan/atau tanpa izin Pencipta atau
pemegang Hak Cipta melakukan pelanggaran hak ekonomi Pencipta
sebagaimana dimaksud dalam Pasal 9 ayat (1) huruf a, huruf b, huruf e,
dan/atau huruf g untuk Penggunaan Secara Komersial dipidana dengan
pidana penjara paling lama 4 (empat) tahun dan/atau pidana denda paling
banyak Rp1.000.000.000,00 (satu miliar rupiah).
4. Setiap Orang yang memenuhi unsur sebagaimana dimaksud pada ayat (3)
yang dilakukan dalam bentuk pembajakan, dipidana dengan pidana penjara
paling lama 10 (sepuluh) tahun dan/atau pidana denda paling banyak
Rp4.000.000.000,00 (empat miliar rupiah).
Mahir Statistik Multivariat
dengan SPSS
Singgih Santoso
Singgih Santoso
ID 718051071
ISBN 9786020477169 (Printed)
vii
Bab 4: Analisis Cluster .................................................................................. 123
4.1. Hal-Hal Pokok tentang Analisis Cluster ...................................................... 125
4.2. Analisis Cluster: K-Means Cluster ................................................................ 130
4.3. Hierarchical Cluster ...................................................................................... 146
4.4. Crosstab dan Grafik untuk Output Cluster ................................................. 158
viii
Bab 1
Pendahuluan
Misalkan ada sebuah restoran yang laris dan selalu dipenuhi pengunjung,
apalagi pada hari sabtu-minggu dan hari libur nasional; sejak buka di siang
hari, restoran tersebut tidak pernah sepi pengunjung, baik mereka yang
datang secara individu, bersama teman maupun keluarga. Pada jam sibuk,
para pengunjung bahkan rela antri untuk mendapatkan menu mereka.
Pertanyaan yang muncul biasanya adalah: apa yang menjadi daya tarik para
pengunjung? Mengapa mereka selalu menyempatkan diri ke tempat tersebut
jika waktunya memungkinkan? Mengapa restoran atau warung makan lain
yang menjual menu masakan yang sama dan ada di sekitar restoran tersebut
tidak selaris restoran ini? Pertanyaan-pertanyaan tersebut cukup kompleks,
dan tidak mudah untuk menjawab dengan satu dua kalimat.
1
Sejumlah (variabel) penyebab dapat dikemukakan, seperti pelayanan yang
memuaskan, letak yang strategis, adanya diskon pada menu-menu tertentu,
suasana restoran yang menyenangkan, harga yang sesuai dengan kualitas,
rasa masakan yang enak, dan sejumlah faktor lainnya. Sedangkan (variabel)
‘akibat’ yang terjadi adalah jumlah pengunjung yang banyak atau loyalitas
pelanggan yang tinggi.
Masakan enak
Suasana nyaman
Harga murah Pengunjung banyak
Menu lengkap
.............. dst
Secara ringkas, dapat dikatakan ada banyak variabel yang terlibat di dalam
kasus ini; pertanyaan kemudian adalah bagaimana hubungan yang ada di
antara variabel-variabel yang cukup banyak tersebut? Apakah harga yang
murah menjadi variabel utama yang berpengaruh pada jumlah pengunjung?
Apakah rasa masakan yang membuat pengunjung demikian banyak? Adakah
hubungan antara lokasi strategis dengan jumlah pengunjung? Demikian
seterusnya ada berbagai kombinasi hubungan yang jika dikembangkan lagi
akan menjadi kompleks.
Jika menggunakan statistik univariat yang hanya menggunakan satu variabel,
maka alat-alat statistik univariat yang selama ini dikenal, seperti uji t atau
ANOVA, jelas tidak memadai untuk menjelaskan hubungan antar variabel
seperti pada kasus diatas. Sebagai contoh, uji t hanya mampu menjelaskan
apakah pengunjung di hari senin berbeda dengan di hari selasa; uji F
(ANOVA) pun hanya mampu menguji perbedaan loyalitas pelanggan antara
pelanggan dari keluarga, pelanggan individu dan pelanggan yang datang
bersama teman. Kedua alat tersebut mempunyai keterbatasan untuk dapat
mengupas sebab-akibat lebih jauh lagi.
Demikian pula dengan alat-alat statistik bivariat; metode seperti korelasi atau
regresi sederhana hanya mampu menjelaskan hubungan dua variabel.
Contoh analisis korelasi dan regresi adalah: apakah ada hubungan antara
loyalitas pelanggan dengan jumlah pengunjung restoran? Apakah ada
hubungan antara letak restoran dengan jumlah pelanggan? Apakah harga
berpengaruh pada naik-turunnya jumlah pengunjung? Serta contoh-contoh
lain yang hanya melibatkan dua variabel dari kasus di atas.
2
Alat-alat statistik univariat dan bivariat tersebut tentu berguna untuk
menjelaskan hubungan antar variabel atau antar grup dalam satu variabel.
Namun semuanya hanya menjelaskan sebagian hubungan yang sifatnya
parsial; tidak mungkin alat-alat itu dapat menjelaskan hubungan yang
kompleks secara komprehensif. Padahal, dalam kenyataannya perilaku
seseorang justru bersifat simultan; loyalitas seorang pelanggan lebih masuk
akal bila dipengaruhi oleh harga murah, rasa masakan yang enak, lokasi yang
strategis dan sejumlah faktor lain yang dipikirkan oleh pelanggan tersebut
secara bersamaan. Jarang seorang pelanggan akan loyal hanya karena
lokasinya yang strategis; ia akan mempertimbangkan juga faktor lain yang
menurutnya relevan dalam pengambilan keputusan belinya.
Dengan demikian, harusnya ada metode statistik yang dapat
mempertimbangkan sekian banyak faktor untuk menjelaskan hubungan
yang terjadi dalam sebuah fenomena sosial atau alam yang kompleks.
Metode itu dinamakan statistik multivariat. Kata ‘multi’ menunjukkan
kemampuan metode tersebut, dan sekaligus juga ciri dari metode itu, untuk
mengolah sekian variabel secara bersama-sama untuk menjawab persoalan
statistik tertentu.
Selain dalam ilmu sosial seperti contoh diatas, statistik multivariat banyak
digunakan dalam bidang ilmu lain yang mengharuskan sejumlah variabel
dianalisis secara simultan. Pada bidang pertanian, pertumbuhan tanaman
tidak dapat dikatakan disebabkan satu faktor saja, misalkan jumlah pupuk
yang diberikan. Selain pupuk, banyak variabel lain yang berpengaruh, seperti
asupan air, sinar matahari, faktor cuaca, kesuburan tanah, ketrampilan
bertani seseorang dan ketrampilan teknis lainnya. Pada bidang kesehatan,
banyak faktor yang secara bersama-sama berdampak pada kesehatan tubuh
manusia, seperti asupan lemak, asupan karbohidrat, asupan vitamin dan
mineral, tingkat stres seseorang, jam tidur setiap hari, dan faktor-faktor
lainnya.
3
Sebagai misal, metode regresi sederhana dan regresi berganda; regresi
sederhana, yang hanya melibatkan satu variabel dependen dan satu variabel
independen, sering digunakan dalam praktek karena proses pencarian
koefisien regresi cukup sederhana. Dengan menambah satu variabel
independen, disebut dengan regresi berganda, proses penghitungan menjadi
kompleks. Jika variabel independen menjadi tiga atau lebih, kemampuan
penghitungan manual menjadi hampir tidak mungkin dilakukan. Demikian
pula dengan banyak metode multivariat lain, seperti analisis faktor, analisis
diskriminan, yang tingkat kompleksitasnya dapat melebihi metode regresi
berganda.
Namun perkembangan teknologi informasi di tahun 1990 an, khususnya di
bidang software statistik, memungkinkan proses penghitungan metode
multivariat dilakukan dengan cepat dan tepat. Software seperti SPSS, Eviews
atau Minitab dapat memproses data multivariat dalam jumlah puluhan
bahkan ratusan dengan hasil yang memuaskan. Bahkan pengembangan
software SPSS sudah merambah pada kegiatan data mining dan neural
network, yang merupakan ‘kelanjutan’ dari multivariat, dengan tingkat
kompleksitas yang lebih tinggi lagi.
Dalam praktek, hampir semua metode multivariat, kecuali regresi berganda
dengan melibatkan hanya dua variabel independen, tidak mungkin
diselesaikan lewat perhitungan manual. Semuanya mengandalkan teknologi
informasi, dalam hal ini adalah software statistik, untuk pengolahan datanya;
apa yang dulu tidak dapat dibayangkan oleh para ahli statistik karena
keterbatasan manusia, menjadi mungkin dan mudah di era informasi
sekarang ini. Karena metode multivariat melibatkan banyak variabel, maka
perhitungannya menjadi jauh lebih kompleks dibandingkan analisis yang
hanya menggunakan satu atau dua variabel. Dalam hal ini, walaupun ada
berbagai teori, seperti teori faktor, teori diskriminan dan sebagainya, dalam
praktek teori-teori tersebut akan sangat sulit diaplikasikan tanpa bantuan
komputer.
4
Banyak tujuan pengolahan data yang sifatnya sederhana dan tidak perlu
melibatkan banyak variabel; satu dua variabel sudah cukup untuk
menyelesaikan masalah tersebut.
Metode univariat untuk parametrik adalah uji t, uji z, dan anova; untuk nonparametrik
adalah uji runs, uji binomial, uji Kolmogorov-Smirnov dan lainnya. Sedangkan metode
bivariat untuk parametrik adalah uji korelasi dan regresi sederhana, dan untuk
nonparametrik adalah uji korelasi Spearman, uji korelasi Kendal dan lainnya.
Data penjualan
merek X di empat Penjualan
kabupaten beda/tidak?
ANOVA
5
Namun demikian, jika kemudian manajer tersebut menemukan adanya
perbedaan penjualan, lalu memutuskan untuk menganalisis lebih dalam lagi,
ia dapat menambah dengan data selain data penjualan. Misalkan manajer
penjualan tersebut sekarang ingin mengetahui apakah kepuasan konsumen,
biaya promosi yang besar dan pertumbuhan penduduk yang cukup pesat di
sebuah daerah mempengaruhi penjualan; untuk itu, ia membutuhkan
banyak variabel, dan metode Anova sudah tidak mungkin menangani tujuan
pengolahan data semacam itu. Ia dapat beralih ke metode statistik
multivariat yang lebih kompleks, seperti metode regresi berganda.
Data penjualan
Data kepuasan Penjualan merek X
konsumen
....dll Regresi ganda
6
1.3. Software Statistik yang Digunakan
Seperti telah dijelaskan, pengembangan teknologi informasi, khususnya di
bidang software, telah memungkinkan pengolahan data dengan berbagai
metode multivariat dilakukan. Saat ini banyak software statistik yang dapat
digunakan untuk hal itu, seperti SPSS, Eviews, Minitab, SAS, Statistica, dan
lainnya. Khusus untuk analisis model struktural (structural equation
modelling/SEM), dapat digunakan software AMOS, Lisrel, atau PLS.
Semua software tersebut, dengan kelebihan dan kekurangan masing-masing,
pada dasarnya sudah sangat memadai untuk mengolah data dan dilengkapi
dengan berbagai metode multivariat ‘standar.’ Perkecualian hanya untuk
Eviews yang memang didesain untuk analisis data ekonomi (makro) dan
lebih powerful pada jenis data panel; hal ini berbeda dengan software SPSS
atau Minitab yang memang lebih tepat digunakan untuk pengolahan data
bidang manajemen dan bisnis.
SPSS dipilih sebagai software yang digunakan untuk pengolahan data
multivariat pada buku ini; pemilihan lebih dikarenakan fakta bahwa SPSS
adalah software statistik terpopuler di dunia, termasuk di Indonesia. SPSS
sejak awal memang berkomitmen mengembangkan prosedur statistik yang
dapat digunakan pada bidang bisnis, mulai dari yang sederhana, cukup
kompleks seperti multivariat, metode SEM (dengan mengakuisisi software
AMOS), sampai aplikasi data mining lewat software Clementine. Keunggulan
lain adalah tampilan SPSS yang sudah ‘setara’ dengan Excel, bahkan dalam
pengolahan grafik-grafik statistiknya sudah melampaui software andalan
Microsoft tersebut; selain itu, penggunaan menu-menu di SPSS sangat user
friendly, lebih mudah dan simpel dibandingkan Minitab yang mengharuskan
pengguna membuka banyak window.
Saat buku ini direvisi, software SPSS terbaru yang dirilis adalah SPSS 24. Namun
demikian, data yang digunakan dalam buku ini bisa diproses dengan SPSS versi
terdahulu (misal SPSS 17, SPSS 18, dan seterusnya); output yang diperoleh praktis
sama, baik menggunakan SPSS versi terdahulu ataupun SPSS versi terbaru (SPSS 24).
Perbedaan yang mungkin timbul dengan yang ditampilkan di buku ini lebih pada beda
tampilan dan format output, namun isi dan interpretasi tidak ada yang berbeda.
Namun sebelum membahas lebih jauh berbagai metode multivariat dan cara
pengolahan datanya dengan SPSS, berikut dijelaskan terlebih dahulu
pemahaman tentang analisis multivariat.
7
1.4. Pengertian Analisis Multivariat
Secara umum, analisis multivariat atau metode multivariat berhubungan
dengan metode-metode statistik yang secara bersama-sama (simultan)
melakukan analisis terhadap lebih dari dua variabel pada setiap obyek atau
orang. Jadi bisa dikatakan analisis multivariat merupakan perluasan dari
analisis univariat (seperti uji t) atau bivariat (seperti metode korelasi dan
regresi sederhana).
Analisis multivariat adalah analisis multi variabel dalam satu atau lebih hubungan.
Analisis ini berhubungan dengan semua teknik statistik yang secara simultan
menganalisis sejumlah pengukuran pada individu atau obyek.
8
TeNTANG pENULIS
Email: singgih.santoso@gmail.com
Catatan:
Untuk melakukan pemesanan buku, hubungi
Layanan Langsung PT Elex Media Komputindo:
Gramedia Direct
Jl. Palmerah Barat No. 33, Jakarta 10270
Telemarketing/CS: 021-53650110/111 ext: 3901/3902
Email: cs@gramediapublishers.com
Layanan online: www.gramediashop.com
387