BUSINESS
STATISTICS
(STAT6124)
PERTEMUAN 3 NORMALITAS..........................................................................................................39
PERTEMUAN 5 KORELASI................................................................................................................65
PERTEMUAN 6 KORELASI................................................................................................................70
7.1 REGRESI....................................................................................................................................................................... 76
7.2 PERSAMAAN REGRESI............................................................................................................................................. 76
7.3 REGRESI SEDERHANA............................................................................................................................................. 77
PERTEMUAN 8 REGRESI...................................................................................................................85
PERTEMUAN 9 ANOVA.......................................................................................................................97
DAFTAR PUSTAKA............................................................................................................................153
iii
PERTEMUAN 1
PENGENALAN STATISTIK
Berdasarkan Applied business statistics making better business decisions 7th (Black,
2013) banyak variasi penggunaan dan aplikasi dalam statistik bisnis, dapat digunakan untuk
kinerja karyawan, rata-rata penjualan, pengumpulan informasi, dan lain-lain. Suatu bisnis
membutuhkan penelitian untuk mendapatkan lebih banyak informasi yang menarik untuk
bisnisnya. Dengan statistika data yang dimiliki akan diolah menjadi informasi yang memiliki arti
dan berguna untuk pengambilan keputusan.
Webster’s Third New International Dictionary (Black, 2013) memberikan definisi
statistik yang komprenhensif sebagai “ilmu yang berkaitan dengan mengumpulkan, menganalisis,
menginterpretasikan, dan menyajikan data numerik”. Menurut (Black, 2013), Statistik bisnis
adalah tentang mengukur fenomena dalam dunia bisnis dan mengatur, menganalisa, dan
mempresentasikan hasil informasi yang berbentuk numerical dalam cara yang lebih baik, dengan
begitu keputusan bisnis yang terinformasi dapat dibuat. Dalam bisnis statistik, hal yang paling
sering dipelajari mengandung variabel, pengukuran, dan data.
Variabel dalam bisnis statistik adalah karakteristik dari setiap entitas yang dipelajari yang
mampu mengambil nilai yang berbeda (Black, 2013). Banyak sekali variabel dalam bisnis,
misalnya produktivitas pekerja, gaji karyawan, harga produk/jasa, pangsa pasar, jumlah penjualan,
dll. Dalam pembelajaran tentang bisnis statistik, variabel – variabel yang digunakan akan
menghasilkan pengukuran yang dapat digunakan dalam analisis.
Data adalah fakta – fakta dan angka – angka yang dikumpulkan, dianalisa dan dirangkum
untuk dipresentasikan dan diperlihatkan hasilnya (Anderson, Sweeney, & Williams, 2011). Data
memiliki berbagai wujud seperti angka tinggi badan, angka penjualan, jumlah produksi, jumlah
mahasiswa, dan lain-lain. Kumpulan data yang lebih berarti atau bermakna setelah melalui suatu
proses pengolahan disebut sebagai informasi, contoh : rata-rata tinggi badan anak SMP yang rutin
berenang adalah 100cm. Memilih dan mengorganisasikan informasi yang menyediakan
pengertian, rekomendasi, dan dasar keputusan akan menjadi sebuah pengetahuan. Contoh: terdapat
perbedaan rata-rata tinggi badan siswa SMP yang rutin berenang dengan yang tidak.
1
2
2. Data Kontinyu
Data kontinyu merupakan data berupa angka yang merupakan hasil dari suatu interval. Maka
dalam data kontinyu seluruh angka memiliki suatu nilai, termasuk data dalam bentuk pecahan
ataupun desimal. Data kontinyu dihasilkan dari sesuatu yang dapat diukur (measured) bukan
dihitung (counted). Contoh data ini adalah jam, detik, suhu, tinggi, berat, volume.
(www.organisasi.org, 2006)
Menurut (Anderson, Sweeney, & Williams, 2011) skala perhitungan menentukan jumlah
dari informasi yang terkandung di dalam data dan mengindikasikan ringkasan data yang paling
tepat dan analisis statistik. Pengukuran merupakan aturan-aturan pemberian angka untuk berbagai
objek sedemikian rupa sehingga angka ini mewakili kualitas atribut. Terdapat empat jenis skala
5
yang dapat digunakan untuk mengukur atribut, yaitu: skala nominal, skala ordinal, skala interval,
dan skala ratio.
1. Skala Nominal
Skala nominal adalah level terendah dari pengukuran data dimana angka yang
merepresentasikan skala nominal dapat digunakan hanya untuk mengklasifikasikan atau
mengkategorikan. Dimana angka yang direpresentasikan tidak menunjukan perbedaan dalam
tingkatan atau level, hanya untuk membedakan antara satu variable dan variable lainnya.
Tipe-tipe variable yang sering menggunakan level nominal adalah jenis kelamin, agama,
etnis, lokasi geografis, dan lain sebagainya.
Contoh dari skala nominal yang sering digunakan adalah
1. Laki-laki
2. Perempuan
Dimana angka 1 pada laki-laki tidak menunjukan bahwa laki-laki lebih baik dibanding
perempuan, sebaliknya pun seperti itu.
(smartstat, 2010)
2. Skala Ordinal
Skala pengukuran untuk sebuah variabel dinamakan skala ordinal jika data menunjukkan sifat
data nominal dan keteraturan atau peringkat data yang bermakna. Skala ordinal adalah skala
pemeringkat dimana angka ditetapkan untuk mengindikasikan relativitas karakter yang
dimiliki. Dengan demikian dapat diketahui apakah suatu objek memiliki sesuatu (karakter)
lebih banyak atau lebih sedikit dari objek lainnya. Skala ordinal mengindikasikan posisi
relatif, misalnya pelajar yang diberi peringkat 1 berarti secara relatif lebih baik dari peringkat
2,3, dst, namun tidak dapat diketahui persisnya apakah antara peringkat 1 dan 2 perbedaannya
tipis ataukah sangat jauh.
3. Skala Interval
Skala interval adalah skala pengukuran yang lebih tinggi tingkatannya dibanding dengan dua
skala sebelumnya dan selalu berbentuk angka. Skala ini menunjukan jajaran nilai antara dua
bilangan. Dalam skala interval jarak numerik pada skala mewakili jarak yang sama pada
karakter yang diukur. Terdapat interval yang konstan / sama antara nilai skala. Sebagai contoh
adalah perbedaan jenis suhu yang dinyatakan dalam derajat antara 50-80o C dikatakan cukup
panas, 80-110o C dikatakan panas, 110-140o C dikatakan sangat panas.
(smartstat, 2010)
6
4. Skala Rasio
Skala pengukuran dinamakan skala rasio jika data memiliki semua sifat-sifat data interval dan
rasio dua nilai yang bermakna. Skala rasio adalah rasio yang tertinggi, yang mana skala ini
memiliki titik absolut (zero point), skala ini dapat digunakan untuk menidentifikasikan atau
mengklasifikasikan, memeringkatkan, dan membandingkan interval atau perbedaan objek.
Dalam skala ini dapat berguna untuk menghitung rasio dari nilai skala. Sehingga bukan saja
dapat diketahui perbedaan antara 2 dan 5 sama dengan perbedaan 16 dan 19, yaitu 3, namun
dapat diketahui bahwa 16 adalah 8 kali lipat dari 2.
c. Skala Stapel
Skala stapel merupakan skala yang dikembangkan oleh Jan Stapel yang menyatakan skala vertikal
antara 5 data titik bawah dan 5 data titik atas dengan 10 kategori yang dinyatakan dalam nilai
negatif dan positif. Skala ini merupakan modifikasi dari skala semantik diferensial. Skala ini
biasanya dinyatakan dalam skala -5 hingga +5, tanpa titik netral atau nol dan responden diminta
memberikan penilaian terhadap suatu objek dengan menunjuk pada kecenderungan angka -5
sebagai kriteria tidak bagus dan angka +5 sebagai sangat bagus.
(www.triyatmoko.wordpress.com, 2009)
9
Menurut Sugiyono (2009:244) analisis data adalah proses mencari dan menyusun data
yang diperoleh dari hasil wawancara, catatan lapangan, dan bahanbahan lain secara sistematis
sehingga mudah dipahami dan temuannya dapat diinformasikan kepada orang lain. Analisis
merupakan tindakan mengolah data hingga menjadi informasi yang bermanfaat dalam menjawab
masalah statistik. Dalam desain riset, perlu direncanakan dengan baik alat analisis yang akan
diterapkan untuk menganalisis data. Tujuan analisis data adalah mendapatkan informasi yang
relevan yang terkandung didalam data tersebut dan menggunakan hasilnya untuk memecahkan
suatu masalah. Metode analisis yang sering digunakan adalah:
Dalam Aplikasinya, metode analisis statistik dapat dibagi menjadi dua (2) kelompok besar, yaitu:
1. Statistik Deskriptif
Analisis deskriptif bertujuan mengubah kumpulan data mentah menjadi mudah dipahami
dalam bentuk informasi yang lebih ringkas. Jadi statistik deskriptif berusaha menjelaskan atau
menggambarkan beberapa karakteristik data, seperti berapa rata-ratanya, seberapa jauh data-data
bervariasi dari rata-ratanya, berapa median data, dan sebagainya.
2. Statistik inferensi
Statistik inferensi bertujuan untuk menyediakan dasar peramalan, dan estimasi yang
digunakan untuk mengubah informasi menjadi pengetahuan.
SPSS adalah software yang memiliki kemampuan analisis yang dirancang untuk
membantu pengolahan data secara statistik. Untuk keseragaman, SPSS yang digunakan dalam
praktikum ini adalah IBM SPSS Statistic 20.
Proses statistik dengan SPSS:
DATA EDITOR
1. Data yang diproses dimasukkan lewat menu DATA EDITOR yang otomatis muncul di layar
saat SPSS dijalankan.
2. Data yang telah diinput kemudian diproses, juga lewat menu DATA EDITOR.
3. Hasil pengolahan data muncul di layar (window) yang lain dari SPSS, yaitu VIEWER Output
SPSS bisa berupa teks / tulisan, tabel, atau grafik.
Pada saat IBM SPSS Statistics 20 (SPSS 20) pertama kali dibuka, selalu tampak tampilan pertama
sebagai berikut.
Window di atas disebut DATA EDITOR dan merupakan window utama pada SPSS. Di dalam
DATA EDITOR inilah akan dilakukan proses utama SPSS yakni menginput data dan selanjutnya
memproses data tersebut.
SPSS DATA EDITOR memiliki dua bagian, yaitu:
DATA VIEW, yaitu tempat untuk menginput data statistik. Inilah yang selalu tampil di
layar.
12
VARIABLE VIEW, yaitu tempat untuk menginput variabel statistik. Bagian ini digunakan
hanya pada saat memasukkan dan mendefinisikan variabel-variabel.
Berikut penjelasan mengenai kolom-kolom pada variable view yang harus diisi untuk
menambahkan variabel baru:
Name
Kolom ini adalah kolom untuk memberikan nama untuk variabel. Jumlah karakter yang
bisa digunakan untuk memberi nama pada sebuah variabel adalah 64 karakter (bit).
Namun untuk membuat sebuah nama dalam bentuk kalimat, gunakan tanda underline
untuk penghubung. Contoh: Data_Penjualan.
Type
Type digunakan untuk mengisi jenis tipe data sesuai dengan data yang ingin dimasukkan.
Dalam SPSS, banyak tipe data yang ditawarkan untuk tiap variable, tetapi untuk
13
keperluan analisis data biasanya yang digunakan adalah tipe data string, numeric dan
date. Berikut penjelasan tipe-tipe data yang ada pada SPSS:
Numeric : Data dalam bentuk angka.
Comma : Data ini berbentuk numerik dan ditandai koma sebagai pembeda ribuan.
Dot : Data ini berbentuk numerik dan ditandai titik sebagai pembeda ribuan.
Scientific Notation : Data ini berbentuk numerik,dan ditandai dengan simbol E.
Date : Data berupa tanggal dan ada sejumlah pilihan type/format tanggal.
Dollar : Data ini berbentuk numerik dan ditandai ($) dengan tanda koma sebagai
pemisah tanda ribuan.
Custom Currency : Bentuk tipe ini digunakan untuk menampilkan format mata uang
yang dibuat melalui kotak dialog Options dari menu edit.
String : Data dalam bentuk karakter /huruf .
Width
Width digunakan untuk menentukan berapa banyak digit yang dapat dimasukkan pada
data tiap sel. Pilihan ini menyediakan masukan antara 1 sampai 255 digit.
Decimals
Untuk menambahkan atau mengurangi decimal pada data berupa angka.
Label
Label adalah keterangan untuk nama variable, yang bisa disertakan atau tidak. Label yang
tidak diisi tidak mempengaruhi proses data. Walaupun demikian, pada input data yang
banyak dan ada kemiripan, penulisan label sangat dianjurkan untuk memperjelas identitas
sebuah variabel.
Values
Values adalah kode yang diberikan jika variabel yang digunakan kategorik. Misalnya kita
ingin menggunakan kode 1 untuk laki-laki dan kode 2 untuk perempuan.
Missing
Data yang dianggap hilang yang tidak akan kita ikutkan dalam analisis. Ada tiga pilihan :
No missing values
Discrete missing values. Angka tertentu yang kita anggap hilang.
Range plus one optinal discrete missing value. Jika ada data hilang dengan range
yang jelas.
14
Columns
Columns adalah lebar tempat nama karakter pada NAME. Besarnya minimal sama
dengan besarnya nilai WIDTH.
Align
Align digunakan untuk mengubah letak tampilan data seperti pada Ms. Word.
Measure
Adalah skala pengukuran dari variabel yang bersangkutan.
Setelah melakukan pengisian VARIABLE VIEW, kita dapat mulai untuk memasukkan data
ke dalam DATA VIEW.
Fitur baru dalam IBM SPSS Statistics 20:
1. Bisa membuka file data lebih dari 1
2. Menu data yang lebih lengkap, seperti fitur :
Spilt File (memisahkan isi file dengan kriteria tertentu)
Select Case (menyeleksi isi file dengan kriteria tertentu)
Sort Case (mengurutkan data)
1. Data Tunggal
Contoh soal:
Pengusaha Wartel Untung Terus mempunyai 15 kios wartel yang tersebar di wilayah Jakarta Barat
dan Jakarta Utara. Sang pemilik ingin melakukan riset tentang usaha yang telah Ia jalankan selama
kurang lebih 2 tahun terakhir. Bantulah pemilik Wartel Untung Terus melakukan analisa data agar
sang pemilik mendapatkan informasi yang jelas mengenai usaha nya tersebut. Berikut ini
merupakan data pendapatan tahunan Wartel Untung Terus di 15 kios selama tahun 2013:
16
Langkah-langkah pengerjaan:
1. Buka IBM SPSS Statistics 20, input data sesuai dengan tabel diatas
2. Pilih menu analyze >> descriptive statistics >> frequencies. Akan muncul windows frequencies.
Kemudian masukkan Pendapatan ke kotak variable. Display frequency tables tetap dicentang.
17
3. Pada menu statistik, pilih sesuai dengan pertanyaan soal, klik continue.
4. Pada menu chart, ada 3 Pilihan, pilih sesuai yang diperlukan (Bisa Bar, Pie dan Histogram khusus
untuk Histogram dicentang bagian with normal curve), klik continue.
18
5. Pada menu format, pada Order by, pilih option: Ascending values (data akan menjadi urut dari
terkecil ke terbesar; artinya akan menempatkan 1 atau pria diurutan pertama output) kemudian,
Continue,OK.
6. Klik Ok
7. Interpretasi Hasil melalui Output yang sudah dihasilkan oleh aplikasi SPSS
19
Inteprestasi data dilakukan dengan cara mengamati hasil output dari aplikasi IBM SPSS, kemudian
dibuat laporan dari hasil inteprestasi data tersebut.
1. Jadi, nilai Mean pada data pendapatan Wartel Untung Terus adalah sebesar 17.4 juta
Jadi, nilai Median pada data pendapatan Wartel Untung Terus adalah sebesar 17
juta Jadi, nilai Modus pada data pendapatan Wartel Untung Terus adalah sebesar 20
juta
2. Jadi, nilai Minimum pada data pendapatan Wartel Untung Terus adalah sebesar 10 juta
Jadi, nilai Maximum pada data pendapatan Wartel Untung Terus adalah sebesar 25 juta
3. Jadi, nilai Varians pada data pendapatan Wartel Untung Terus adalah sebesar 26.686 juta
Jadi, nilai Range pada data pendapatan Wartel Untung Terus adalah sebesar 15 juta
Jadi, nilai Standar Deviasi data pendapatan Wartel Untung Terus adalah sebesar 5.166 juta
4. Jadi, nilai Kurtosis pada data pendapatan Wartel Untung Terus adalah sebesar -1.005
Jadi, nilai Skewness pada data pendapatan Wartel Untung Terus adalah sebesar
0.130
5. Jadi, nilai Quartile 1 pada data pendapatan Wartel Untung Terus adalah sebesar 12
juta Jadi, nilai Quartile 2 pada data pendapatan Wartel Untung Terus adalah sebesar
17 juta Jadi, nilai Quartile 3 pada data pendapatan Wartel Untung Terus adalah
sebesar 20 juta
6. Jadi, nilai Desil 3 pada data pendapatan Wartel Untung Terus adalah sebesar 14.4 juta
Jadi, nilai Percentil 40 pada data pendapatan Wartel Untung Terus adalah sebesar 15.8
juta Jadi, nilai Percentil 85 pada data pendapatan Wartel Untung Terus adalah sebesar 25
juta
20
2. Data Berkelompok
Contoh Soal:
Data berikut menunjukkan data berat badan 30 wanita setelah melahirkan selama bulan Agustus
2014 di RSIA Kurnia Jakarta Selatan (data dalam kg)
Jawab:
k = 1+ 3.3log n
k = 1 + 3.3 log 30
k = 5,87 = 6 (pembulatan selalu ke atas)
l = Xmax - Xmin
k (sebelum pembulatan)
l = (65-48) / 5,87
l = 2.89
l = 3 (pembulatan normal)
2. Buka SPSS. Input data sesuai tabel.
3. Pada Menu Transform, pilih submenu Recode, pilih Into Different Variables. Akan muncul
dialog seperti dibawah ini.
3. Pada kotak dialog Recode Into Different Variables, pindahkan variable Berat_Badan kesebelah
kanan, lalu pada Output Variable, ketik: Data1 sebagai nama variable yang baru. Pilih change dan
kemudian pilih: Old and New Values.
22
4. Input range: 48 through 50 kemudian pada New Value, inputkan Value: 49 sebagai nilai tengah
dari range tersebut. Setelah itu di-add di OldNew, dan seterusnya. Kemudian, klik Continue.
8. Klik Statistics, beri tanda pada ukuran yang diminta, dan klik “Values are group midpoints”,
kemudian klik Continue.
9. Pada menu Chart, pilih jenis chart yang diminta. Klik Continue
Inteprestasi data dilakukan dengan cara mengamati hasil output dari aplikasi IBM SPSS,
kemudian dibuat laporan dari hasil inteprestasi data tersebut.
25
Soal Latihan
1. Seorang manajer sedang melakukan survei terhadap hasil penjualan nugget yang diproduksi
perusahaannya selama setahun ini. Berikut adalah total jumlah bungkus nugget yang diproduksi
setiap bulan (dalam ribuan).
Bulan 1 2 3 4 5 6 7 8 9 10 11 12
Total 12 15 26 31 28 21 36 46 32 18 12 10
Tentukan berikut ini:
a. Nilai mean, median, modus
b. Nilai maksimum dan minimum
c. Nilai simpangan baku dan simpangan ragam
d. Nilai kurtosis dan skewness
e. Kuartil 3
f. Desil 7 dan Persentil 85
2. PT EXIS Indonesia sedang melakukan riset terhadap sejumlah pelanggannya tentang kuota
internet yang digunakan selama 1 bulan. Hal ini menjadi tanggung jawab Ardian sebagai staff
R&D di perusahaan tersebut sehingga untuk melakukan riset Ia mengambil sampel pelanggan
sebagai berikut:
3.2GB 1GB 2GB 2.3GB 3GB 1.5GB 4.5GB 2GB 2.5GB 4GB
1.5GB 1.5GB 5GB 1.5GB 2.5GB 1GB 2GB 3.5GB 1GB 3.2GB
80 75 65 58 78 80
90 95 50 68 74 98
70 80 90 95 75 92
65 79 87 85 64 68
82 81 65 93 80 75
68 70 75 55 58 77
96 67 86 77 70 79
60 75 78 65 70 89
Tentukanlah:
a. Jumlah dan lebar kelas
b. Mean, Median, Modus, Minimum, Maximum,
c. Simpangan baku dan ragam
d. Q1, Q3, P65, D2, D8
4. Berikut adalah hasil sensus penduduk Indonesia tahun 2009 mengenai usia laki-laki dan
perempuan yang resmi menikah untuk pertama kalinya. Sebanyak 10 sampel diambil dari
populasi laki-laki dan perempuan yang berdomisili di Kota Jakarta.
Hasil data sensus pada tahun 2009
Jumlah Laki-laki Jumlah Perempuan
1 30 1 22
2 25 2 20
3 27 3 21
4 35 4 19
5 33 5 25
6 40 6 27
7 27 7 30
8 26 8 28
9 28 9 27
10 30 10 26
11 26 11 25
12 25 12 22
28
13 29 13 19
14 31 14 23
15 33 15 22
Salah satu instrumen yang sering dipakai dalam penelitian ilmiah adalah kuesioner, yang
bertujuan untuk mengetahui pendapat seseorang mengenai suatu hal. Sebuah kuesioner dapat
disusun dengan pertanyaan yang bersifat terbuka (berapa usia anda saat ini, bagaimana pendapat
Anda tentang Universitas Bina Nusantara) atau pertanyaan tertutup seperti (kategori usia anda:
<20 tahun atau > 20 tahun). Salah satu skala yang sering dipakai dalam penyusunan kuesioner
adalah skala likert (lihat pada penjelasan skala likert).
Dalam penelitian kualitatif yang menggunakan instrumen kuesioner sebagai salah satu
alat ukur, ada dua syarat penting yang harus dipenuhi, yaitu keharusan sebuah kuesioner untuk
Valid dan Reliabel (syarat lainnya, yaitu Tingkat ketelitian tidak dibahas pada modul ini).
Suatu kuesioner dikatakan Valid jika pertanyaan pada suatu kuesioner mampu untuk
mengungkapkan sesuatu yang akan diukur oleh kuesioner tersebut. Sedangkan suatu angket
dikatakan reliabel (andal) jika jawaban seseorang terhadap pertanyaan adalah konsisten atau stabil
dari waktu ke waktu.
Menurut Ferdinand (2014) mengatakan bahwa sebuah scale atau instrument pengukuran
data yang dihasilkan terpercaya atau reliable apabila instrument itu secara konsisten memunculkan
hasil yang sama setiap kali dilakukan pengukuran oleh karena itu tujuan dilakukan pengujian
realibilitas menurut Sarjono (2011) adalah untuk mengukur konsistensi dari tidaknya jawaban
setiap responden terhadap item-item pernyataan yang berada di dalam kuesioner yang sudah
disebarkan itu dapat terpecaya atau reliable.
Repeated Measure atau ukur ulang. Disini seseorang akan disodori pertanyaan yang sama
pada waktu berbeda, dan kemudian dilihat apakah dia tetap konsisten dengan jawabannya.
29
30
One short atau sekali saja. Di sini pengukuran hanya sekali dan kemudian hasilnya
dibandingkan dengan hasil pertanyaan lain.
1. Menetapkan sebuah Konstrak, yaitu membuat batasan mengenai variabel yang akan diukur.
Jika ingin diteliti mengenai perilaku konsumen, maka perlu dipertegas dahulu apa yang
dimaksud dengan perilaku konsumen tersebut.
2. Menetapkan faktor-faktor, yaitu mencoba menemukan unsur-unsur yang ada pada suatu
konstrak.
3. Menyusun butir-butir pertanyaan, yaitu mencoba menjabarkan sebuah faktor lebih lanjut
dalam berbagai pertanyaan yang langsung berinteraksi dengan pengisi kuesioner. Dalam
setiap konstrak bisa terdiri dari beberapa faktor, dan setiap faktor bisa terdiri dari beberapa
butir pertanyaan, dengan catatan bahwa bisa juga setiap faktor mempunyai jumlah butir yang
tidak sama satu sama dengan yang lain.
Pengujian validitas dan reliabilitas adalah proses menguji butir-butir pertanyaan yang ada dalam
sebuah kuesioner, apakah isi dari butir pertanyaan tersebut sudah valid dan reliabel.
Contoh :
Marcella akan melakukan penelitian untuk melihat hubungan antara kegiatan promosi yang
dilakukan terhadap tingkat loyalitas pelanggan terhadap perusahaan. Oleh karena itu, Marcella
menyebarkan kuesioner kepada 60 responden dengan 4 butir pertanyaan dalam mengukur tingkat
loyalitas mereka dan 3 butir pertanyaan dalam mengukur efektifitas kegiatan promosi. Berikut
merupakan hasil dari kuesioner:
R L1 L2 L3 L4 P1 P2 P3
R1 4 3 4 5 3 4 5
R2 5 4 5 4 4 5 4
R3 4 4 5 3 2 5 3
R4 5 5 5 3 5 5 3
R5 4 4 4 3 4 4 3
R6 3 5 5 4 4 5 4
R7 2 3 2 3 3 2 3
R8 2 3 2 3 3 2 3
R9 3 5 4 3 3 3 3
R10 4 3 3 2 5 3 2
R11 4 4 4 4 3 4 4
R12 4 3 3 3 4 3 3
R13 5 5 4 3 3 4 3
R14 5 5 3 3 4 3 3
R15 4 4 4 4 4 4 4
R16 4 4 4 4 4 4 4
R17 5 4 5 5 5 5 5
R18 4 4 4 4 3 4 4
R19 3 2 4 3 2 4 3
R20 4 3 4 3 2 4 3
R21 3 4 4 3 3 4 3
R22 4 4 4 5 5 4 5
R23 4 4 4 3 5 4 3
R24 3 5 5 5 5 5 5
R25 4 4 4 3 3 4 3
R26 3 2 3 3 4 3 3
R27 3 3 4 4 4 4 4
R28 2 3 3 2 3 3 2
R29 2 3 3 4 4 3 4
R30 3 3 4 4 3 4 4
R31 3 4 4 5 3 4 5
R32 2 4 4 3 4 4 3
R33 2 4 3 2 4 3 2
R34 2 4 2 4 3 2 4
R35 3 4 4 4 3 4 4
R36 3 3 3 3 4 3 3
R37 4 4 4 3 2 4 3
R38 4 5 4 4 5 4 4
R39 3 3 2 2 2 2 2
R40 3 4 4 3 2 4 3
R41 3 2 3 3 4 3 3
R42 5 4 4 4 4 4 4
R43 4 4 4 4 5 4 4
R44 3 3 4 5 5 4 5
R45 3 4 3 3 3 3 3
R46 4 4 3 3 5 3 3
R47 2 3 4 4 4 4 4
R48 5 5 3 4 4 3 4
R49 3 4 3 5 5 3 5
R50 5 5 4 4 5 4 4
31
32
R51 3 4 4 4 5 4 4
R52 2 3 3 4 4 3 4
R53 3 4 4 3 2 4 3
R54 3 4 4 5 2 4 5
R55 4 5 4 4 5 4 4
R56 3 3 4 5 5 4 5
R57 3 4 5 5 5 5 5
R58 4 4 4 4 3 4 4
R59 5 5 5 5 4 5 5
R60 3 3 3 4 3 3 4
Dari hasil kuesioner tersebut lakukanlah pengujian apakah data tersebut valid dan reliabel.
Untuk melakukan pengujian validitas data di run sekaligus, namun untuk reliabilitas, data
harus di run per variabel tanpa memasukkan nilai skor.
Langkah-langkah :
33
34
6. Masukkan semua kolom (L1 - Skor) ke kotak Items yang ada di sebelah kanan
7. Kemudia pilih menu Statistics, pada bagian Inter-Item, centang Correlations, kemudian klik
Continue untuk kembali ke window utama
8. Klik OK dan akan muncul hasil sebagai berikut.
1. Interpretasi hasil
Seperti telah dijelaskan, pengujian dimulai dengan menguji validitas kuesioner, baru
kemudian reliabilitas kuesioner tersebut.
Hipotesis
35
36
Keputusan
Kesimpulan
Apabila ada butir pertanyaan yang tidak valid, data harus diuji ulang dengan cara membuang
butir yang tidak valid.
Langkah pengujian diulang dari langkah nomor 3, yaitu mencari skor Pada window Compute
Variable, lakukan pengisian dengan isi Target Variable dengan Skor dan pada Numeric
Expression isi semua item kecuali item yang tidak valid.
Setelah uji validitas selesai dilakukan (semua valid), maka baru bisa dilakukan uji reliabilitas
dengan langkah-langkah:
Klik menu Statistics, pada bagian Descriptive for (kiri atas), centang ketiga pilihan
(Item, Scale, Scale if item deleted), kemudian klik Continue untuk kembali ke window
utama.
37
38
Reliability Statistics
Cronbach's N of Items
Alpha
.684 4
Interpretasi Hasil
Hipotesis
Keputusan
Kesimpulan
Uji normalitas dilakukan untuk mengetahui apakah distribusi data mengikuti atau
mendekati distribusi normal atau tidak (Sarjono dan Julianita, 2011: 53). Pada dasarnya uji
normalitas adalah membandingkan antara data yang kita miliki dan data berdistribusi normal yang
memiliki mean dan standar deviasi yang sama dengan data kita. Uji normaltias menjadi hal yang
penting karena salah satu syarat pengujian parametrik adalah data harus berdistribusi normal.
Menurut Budiawan (2012: 58), secara teoritis, semakin besar jumlah sampel, maka data akan
cenderung berdistribusi normal. Uji ini biasanya digunakan untuk mengukur data berskala ordinal,
interval, maupun rasio.
Berikut merupakan Dasar Pengambilan Keputusan (DPK) dalam Uji Normalitas (α dalam
penelitian ini sebesar 5% 0,05) :
Untuk jumlah responden < 50 lihat sig pada table Shapiro Wilk
Contoh soal:
Edwin merupakan mahasiswa Binus University yang sedang skripsi mengenai analisa
pengaruh perubahan logo dan nama produk terhadap brand awareness. Sebagai data
penelitiannya Edwin melakukan penyebaran kuesioner kepada 60 responden. Sebelum
mengolah hasil dari kuesioner, Edwin ingin mengetahui distribusi data dari hasil kueisoner
yang diperoleh. Berikut merupakan hasilnya:
39
40
Langkah-langkah:
41
42
3. Masukkan variabel Logo, Nama, dan Brand Awareness pada kotak Dependent List.
4. Pada menu Plots, centang opsi “Normality plots with tests” dan kosongkan opsi yang lain dan
tekan Continue.
5. Pada bagian Display (kiri bawah), pilihlah opsi Plots dan klik OK.
6. Hasil output:
Tests of Normality
Kolmogorov-Smirnova Shapiro-Wilk
Statistic df Sig. Statistic df Sig.
7. Setelah melakukan analisa pada SPSS hingga mendapatkan hasilnya, kita dapat melanjutkan pada
interpretasi data sebagai berikut:
Hipotesis
43
44
Kesimpulan
1. Fernanda ingin mengetahui mengenai tingkat brand awareness produknya di pasar. Oleh karena
itu, Ia akan melakukan penelitian berdasarkan hasil kuesioner yang akan disebarkan kepada 50
orang responden. Kuesioner yang disebarkan meliputi 2 indikator utama sebagai pengukur
tingkat brand awareness yaitu recall dan recognition.
Berikut merupakan hasil dari kuesioner yang telah disebarkan:
R1 R2 R3 R4
5 4 4 1
5 2 3 4
1 5 2 4
3 2 3 2
1 2 1 4
5 4 5 4
4 4 4 2
1 1 1 3
2 5 2 2
2 4 2 2
5 1 5 4
1 4 1 4
4 4 4 3
2 4 2 4
3 3 3 1
2 3 2 2
2 1 2 2
4 4 4 4
4 3 4 3
3 5 3 4
4 3 4 3
5 2 5 2
2 2 2 3
2 4 2 3
2 4 3 4
2 3 2 3
5 4 5 3
1 1 1 3
4 2 4 4
2 2 2 2
3 4 3 2
2 3 2 2
2 4 2 4
1 2 1 4
2 4 2 3
3 3 3 4
1 3 1 1
3 4 3 2
4 4 4 2
1 4 1 4
4 3 4 3
4 3 4 2
3 1 3 4
3 4 3 3
1 3 1 4
2 5 2 3
3 3 3 2
4 2 4 3
5 2 5 3
3 4 3 2
Data Ordinal Variabel Recognition:
C1 C2 C3 C4
4 4 4 3
3 4 3 2
4 5 2 5
3 3 3 2
1 2 1 1
5 4 5 4
4 4 4 4
1 1 1 1
2 5 2 5
2 4 2 4
5 1 5 1
1 4 1 4
4 4 4 4
2 3 2 4
3 4 3 3
2 3 2 3
2 1 2 1
4 4 4 4
45
46
4 3 4 3
3 5 3 5
4 3 4 3
5 2 5 2
3 2 2 2
2 4 2 4
2 3 3 4
2 3 2 3
5 4 5 4
1 1 1 1
4 2 4 2
2 2 2 2
3 4 3 4
2 3 2 3
3 4 2 4
2 2 1 2
2 4 2 4
3 3 3 3
1 3 1 3
3 4 3 4
4 5 4 4
1 4 1 4
4 3 4 3
4 3 4 3
3 1 3 1
3 4 3 4
1 3 1 3
2 5 2 5
3 3 3 3
4 2 4 2
5 2 5 2
3 4 3 4
Lakukanlah pengujian validitas, reliabilitas dan normalitas dari hasil kuesioner diatas!
P1 P2 P3 P4 P5 P6
Setuju Setuju Setuju Setuju Setuju Setuju
Ragu-ragu Ragu-ragu Ragu-ragu Ragu-ragu Ragu-ragu Ragu-ragu
Sangat
Setuju Setuju Setuju Setuju Setuju
Setuju
Setuju Ragu-ragu Setuju Setuju Setuju Ragu-ragu
Ragu-ragu Ragu-ragu Ragu-ragu Ragu-ragu Ragu-ragu Ragu-ragu
Ragu-ragu Ragu-ragu Setuju Ragu-ragu Ragu-ragu Ragu-ragu
Sangat Tidak Sangat
Setuju Tidak Setuju Setuju Setuju
Setuju Setuju
Sangat Tidak
Sangat Setuju Setuju Setuju Setuju Setuju
Setuju
Ragu-ragu Ragu-ragu Ragu-ragu Tidak Setuju Setuju Ragu-ragu
Setuju Setuju Setuju Ragu-ragu Setuju Setuju
Setuju Setuju Setuju Setuju Setuju Setuju
Ragu-ragu Ragu-ragu Ragu-ragu Ragu-ragu Ragu-ragu Ragu-ragu
Setuju Setuju Setuju Ragu-ragu Setuju Setuju
Setuju Setuju Setuju Setuju Setuju Ragu-ragu
Ragu-ragu Ragu-ragu Ragu-ragu Setuju Ragu-ragu Ragu-ragu
Ragu-ragu Ragu-ragu Ragu-ragu Ragu-ragu Ragu-ragu Setuju
Setuju Setuju Setuju Setuju Setuju Setuju
Ragu-ragu Ragu-ragu Ragu-ragu Ragu-ragu Ragu-ragu Sangat Setuju
Ragu-ragu Ragu-ragu Ragu-ragu Ragu-ragu Ragu-ragu Setuju
Setuju Ragu-ragu Setuju Ragu-ragu Ragu-ragu Setuju
Setuju Ragu-ragu Ragu-ragu Ragu-ragu Ragu-ragu Ragu-ragu
Setuju Setuju Setuju Setuju Setuju Setuju
Ragu-ragu Ragu-ragu Setuju Setuju Ragu-ragu Setuju
Setuju Ragu-ragu Setuju Setuju Ragu-ragu Ragu-ragu
Setuju Setuju Setuju Setuju Setuju Ragu-ragu
Setuju Setuju Setuju Setuju Setuju Setuju
Setuju Setuju Setuju Setuju Setuju Ragu-ragu
Tidak
Tidak Setuju Tidak Setuju Ragu-ragu Tidak Setuju Setuju
Setuju
Sangat Tidak Sangat Tidak Tidak
Setuju Setuju Tidak Setuju
Setuju Setuju Setuju
Sangat Setuju Setuju Setuju Setuju Setuju Sangat Tidak
47
48
Setuju
PERTEMUAN 4
ASUMSI KLASIK
Persamaan regresi perlu meyakinkan linearitasnya dan memenuhi tingkat validitas, ketepatan
dalam estimasi, tidak bias dan konsisten yang diharapkan untuk memenuhi peramalan. Hal ini
membutuhkan uji asumsi klasik dengan menggunakan Uji Normalitas, Uji Multikolinearitas, Uji
Heterokedastisitas, dan Uji Autokorelasi. Namun tidak semua uji asumsi klasik yang dilakukan
diperlukan dalam uji Regresi Berganda.
Uji multikolinearitas digunakan untuk menguji apakah dalam model regresi ditemukan adanya
korelasi yang tinggi atau sempurna antar variabel independen. Hal ini menunjukkan bahwa uji
multikolinearitas dilakukan untuk mengukur tingkat asosiasi hubungan/pengaruh antar variable
bebas dengan menggunakan besaran koefisien relasi (r). Jika antar variabel independen terjadi
multikolinearitas sempurna,maka koefisien regresi variabel tersebut tidak dapat ditentukan dan
nilai standard error menjadi tak terhingga. Dalam hal ini, model regresi linear berganda
mengasumsikan bahwa tidak terdapat korelasi yang signifikan antarvariabel bebasnya.
Contoh soal:
Seorang ekonom di PT. Abadi Jaya ingin mengadakan penelitian tentang apa saja faktor yang
mempengaruhi minat pelanggan dalam membeli sebuah produk. Berikut ini adalah data yang
berhasil dikumpulkan dari hasil survey terhadap 30 orang responden yang merupakan konsumen
produk tersebut.
Minat
Rekomendasi
Iklan di Membeli
Orang Lain
Media Produk
2.25 3.5 3.27
3.75 4.00 2.59
4.00 3.75 3.71
2.50 3.5 4.15
3.35 2.5 3.86
2.55 3.00 2.15
3.75 3.25 4.00
2.25 2.75 3.14
3.00 3.00 2.15
49
50
Langkah-langkah:
7. Input data di atas pada SPSS
51
8. Lakukan uji normalitas terlebih dahulu. Pada menu Analyze, pilih Descriptive Statistics, kemudian
pilih Explore.
9. Masukkan variable Iklan media, Rekomendasi orang lain, dan Minat membeli pada kotak
Dependent List.
10. Pada menu Plots, centang opsi “Normality plots with tests” dan kosongkan opsi yang lain dan
tekan Continue.
52
11. Pada bagian Display (kiri bawah), pilihlah opsi Plots dan klik OK.
Interpretasi hasil
Hipotesis
H0 = Data Iklan di Media berdistribusi normal.
Ha = Data Iklan di Media berdistribusi bebas.
53
NB : Buat juga interpretasi hasil uji normalitas untuk variabel Rekomendasi Orang Lain
dan Minat Membeli Produk.
2. Dari menu utama SPSS, pilih menu Analyze, kemudian submenu Regression, lalu pilih Linear.
Maka akan muncul kotak dialog sebagai berikut.
54
Masukkan variabel yang dipengaruhi (dependen) dan variabel yang mempengaruhi (independen)
ke kotaknya masing-masing.
3. Pilih Statistics. Kemudian Checklist Estimates, Covariance Matrix (meminta matrik korelasi antar
variabel independen), Model Fit (meminta koefisien determinasi R2), Part and Partial correlation
(meminta korelasi parsial dan zero order correlation) dan Colinearity diagnostics (meminta nilai
tolerance dan VIF).
Coefficientsa
Rekomendasi_Or
-,113 ,281 -,077 -,403 ,690 -,005 -,077 -,075 ,934 1,070
ang_Lain
Interpretasi Hasil
Hipotesis
H0 : Tidak terjadi multikolinearitas
Ha : Terjadi multikolinearitas
Dasar Pengambilan Keputusan
Nilai tolerance > 0.10 H0 diterima VIF > 10 H0 ditolak
Nilai tolerance < 0.10 H0 ditolak VIF < 10 H0 diterima
Keputusan
Untuk variabel iklan di media dan rekomendasi orang lain
Nilai tolerance: 0.934 > 0.10 H0 diterima
Nilai VIF : 1.070 < 10 H0 diterima
Kesimpulan
Berdasarkan nilai Tolerance dan VIF terlihat bahwa tidak ada nilai Tolerance di bawah
0.10, yaitu sebesar 0.934, dan begitu juga dengan nilai VIF tidak ada yang di atas 10
yaitu hanya sebesar 1.070. Hal ini menunjukkan tidak ada multikolinearitas.
Untuk mengetahui keadaan dimana terjadinya ketidaksamaan varians dari data pada model regresi,
maka perlu dilakukan uji heteroskedastisitas.
1. Dari menu utama SPSS, pilih menu Analyze, kemudian submenu Regression, lalu pilih Linear.
Maka akan muncul kotak dialog sebagai berikut.
56
Masukkan variabel yang dipengaruhi (dependen) dan variabel yang mempengaruhi (independen)
ke kotaknya masing-masing.
2. Pilih Save kemudian pada bagian Residuals pilih Unstandardized (Untuk memunculkan nilai
residual).
57
3. Setelah muncul nilai residual, dilanjukan dengan analisis korelasi. Pilih menu Analyze
>>Correlate>>Bivariate.
4. Pindahkan variabel independen (dalam kasus ini adalah Iklan di Media dan Rekomendasi Orang
Lain) dan Unstandardized Residuals ke kotak variabel. Kemudian centang Spearman pada
Coefficient Correlation.
5. Klik OK.
Correlations
N 30 30 30
Correlation Coefficient .025 .016 1.000
Unstandardized Residual Sig. (2-tailed) .894 .933 .
N 30 30 30
Interpretasi Hasil
Hipotesis
H0 : Tidak terjadi heterokedastisitas
Ha : Terjadi heterokedastisitas
Dasar Pengambilan Keputusan
Keputusan
Iklan di Media : 0.894 > 0.05 H0 diterima
Rekomendasi Orang Lain : 0.933 > 0.05 H0 diterima
Kesimpulan
Berdasarkan hasil diperoleh nilai sig pada kedua variabel bebas memiliki nilai lebih besar
dari 0.05 sehingga disimpulkan bahwa tidak terjadi masalah heterokedastisitas.
Uji autokorelasi bertujuan untuk menguji apakah dalam suatu model regresi linear ada korelasi
antar kesalahan pengganggu (residual) pada periode t dengan kesalahan periode t-1 (sebelumnya).
Jika terjadi korelasi, maka dinamakan ada problem autokorelasi. Autokorelasi muncul karena
observasi yang berurutan sepanjang waktu berkaitan satu sama lainnya. Autokorelasi sering
muncul pada data time series. Sedangkan pada data cross section, masalah autokorelasi relative
jarang terjadi. Dalam penelitian ini akan digunakan metode pengujian Run Test. Run Test
digunakan untuk menguji apakah antar residual terdapat korelasi yang tinggi. Jika ya, maka terjadi
masalah autokorelasi.
Dalam menentukan ada tidaknya auto korelasi, diperlukan beberapa pertimbangan untuk
menentukan adanya masalah atau tidaknya autokorelasi, yakni:
59
Bila nilai DW berada di antara dU sampai dengan 4 - dU maka koefisien autokorelasi sama
dengan nol. Artinya, tidak ada autokorelasi.
Bila nilai DW lebih kecil daripada dL, koefisien autokorelasi lebih besar daripada nol.
Artinya ada autokorelasi positif.
Bila nilai DW terletak di antara dL dan dU, maka tidak dapat disimpulkan.
Bila nilai DW lebih besar daripada 4 - dL, koefisien autokorelasi lebih besar daripada nol.
Artinya ada autokorelasi negatif.
Bila nilai DW terletak di antara 4 – dU dan 4- dL, maka tidak dapat disimpulkan.
Pertimbangan di atas dilakukan dengan uji Durbin-Watson (DW test) dan biasanya hal ini hanya
digunakan untuk autokorelasi tingkat satu (first order autocorrelation) dan mensyaratkan adanya
intercept dalam model regresi dan tidak ada variable lag di antara variable penjelas.
Masih menggunakan data yang digunakan sebelumnya yaitu mengenai Iklan di Media,
Rekomendasi Orang Lain, dan Minat Membeli Produk. Berikut langkah-langkah melakukan uji
autokorelasi dengan menggunakan Run Test :
1. Pilih menu Analyze >> Nonparametric tests >> Legacy dialogs >>Runs.
2. Pada kotak Test Variable List, isikan Unstandardized Residual (RES_1). Pilih Cut Point Median.
60
Runs Test
Unstandardized
Residual
a
Test Value .06787
Cases < Test Value 15
Cases >= Test Value 15
Total Cases 30
Number of Runs 16
Z .000
Asymp. Sig. (2-tailed) 1.000
a. Median
Interpretasi Hasil
Hipotesis
H0: Tidak terjadi autokorelasi.
Ha : Terjadi autokorelasi.
Dasar Pengambilan Keputusan
Keputusan
1.000 > 0.05 H0 diterima
Kesimpulan
Tidak terjadi autokorelasi pada model regresi.
61
Note:
Uji asumsi klasik adalah persyaratan statistik yang harus dipenuhi pada analisis regresi linear
berganda yang berbasis ordinary least square (OLS). Jadi analisis regresi yang tidak berdasarkan
OLS tidak memerlukan persyaratan asumsi klasik, misalnya regresi logistik atau regresi ordinal.
Demikian juga tidak semua uji asumsi klasik harus dilakukan pada analisis regresi linear, misalnya
uji multikolinearitas tidak dilakukan pada analisis regresi linear sederhana dan uji autokorelasi
tidak perlu diterapkan pada data cross sectional. Ketika asumsi tidak terpenuhi, biasanya peneliti
menggunakan berbagai solusi agar asumsinya dapat terpenuhi atau beralih ke metode yang lebih
advance agar asumsinya dapat terselesaikan.
Uji asumsi klasik juga tidak perlu dilakukan untuk analisis regresi linear yang bertujuan untuk
menghitung nilai pada variabel tertentu. Misalnya nilai return saham yang dihitung dengan market
model, atau market adjusted model. Perhitungan nilai return yang diharapkan dapat dilakukan
dengan persamaan regresi, tetapi tidak perlu diuji asumsi klasik.
62
Soal Latihan
1. Seorang mahasiswi Ilmu Komunikasi sedang melakukan penelitian terkait dengan faktor – faktor yang
mempengaruhi partispasi politik di masyarakat. Dan berikut adalah hasil yang didapatkan dari penelitian
kepada 30 orang responden.
Lakukanlah pengujian asumsi klasik (uji multikolinieritas, uji heterokedastisitas, dan uji
korelasi) untuk data di atas!
2. Serena merupakan salah satu pemilik restoran dan coffeeshop terbaru di wilayah kota Tangerang.
Serena sedang melakukan penlitian, faktor-faktor apa saja yang mempengaruhi para konsumen untuk
kembali ke coffee shop miliknya. Berikut data yang terkumpul:
1 4 3 2 5 2 3
2 3 4 3 5 3 4
3 2 5 5 2 5 2
4 5 2 2 2 2 4
5 2 3 4 4 4 4
6 4 4 2 3 2 3
7 3 4 2 5 2 5
8 5 5 3 2 3 5
9 2 2 4 3 4 3
10 5 3 2 2 2 2
11 4 2 5 4 5 5
12 2 3 5 4 2 2
13 5 3 2 3 5 3
14 5 5 5 5 5 4
15 2 4 4 5 5 5
16 3 2 3 2 3 2
17 2 5 2 3 2 5
18 4 3 5 5 4 5
19 4 2 5 3 2 2
64
20 2 5 2 2 3 3
21 2 3 4 5 5 2
22 5 4 5 5 2 4
23 3 2 5 2 4 5
24 4 5 3 3 2 2
25 5 3 3 5 5 5
26 5 4 2 3 2 3
27 5 2 4 2 2 4
28 4 4 3 5 4 2
29 3 5 2 3 3 5
30 5 3 2 2 2 5
PERTEMUAN
5 KORELASI
Korelasi adalah hubungan (asosiasi) antara variabel-variabel yang diminati, apakah data
sampel menyediakan bukti yang cukup, dengan maksud adakah kaitan atau hubungan antara
tiap-tiap variabel dalam populasi asal sampel, jika ada hubungan, seberapa kuat hubungan antar
variabel tersebut. Keeratan hubungan itu dinyatakan dengan nama koefisien korelasi atau bisa
disebut korelasi saja. Perlu dicatat, bahwa dalam korelasi kita belum menentukan dengan pasti
variabel independent dan dependent-nya seperti yang kita lakukan dalam analisis regresi.
Koefisien Korelasi ialah pengukuran statistic kovarian atau asosiasi antara dua variabel.
Besarnya koefesien korelasi berkisar antara +1 s/d -1. Koefesien korelasi menunjukkan tingkat
kekuatan (strength) hubungan linear dan arah hubungan antara dua variabel acak.
Jika koefesien korelasi positif, maka kedua variabel mempunyai hubungan yang searah.
Artinya jika nilai variabel X tinggi, maka nilai variabel Y akan tinggi pula.
Sebaliknya, jika koefesien korelasi negatif, maka kedua variabel mempunyai hubungan yang
terbalik. Artinya jika nilai variabel X tinggi, maka nilai variabel Y akan menjadi rendah dan
berlaku sebaliknya.
Untuk memudahkan melakukan interpretasi mengenai kekuatan hubungan antara dua variabel
penulis memberikan kriteria sebagai berikut (Sarwono: 2006):
0 : Tidak ada korelasi antara dua variabel
>0 – 0,25 : Korelasi sangat lemah
>0,25 – 0,5 : Korelasi cukup
>0,5 – 0,75 : Korelasi kuat
>0,75 – 0,99 : Korelasi sangat kuat
1 : Korelasi sempurna
Contoh soal: menggunakan data Export, Government Expenditure, dan GDP
Apakah Terdapat hubungan yang signifikan antara Export dengan GDP?
GOVERNMENT
EXPORT GDP
EXPENDITURE
3,52 4,98 3
2,74 3,02 3,97
3,1 3,15 3,58
66
Adalah mengukur keeratan hubungan pada hasil-hasil pengamatan dari populasi yang mempunyai
dua varian saja (bivariate). Perhitungan ini memiliki syarat bahwa populasi asal sampel harus
mempunyai dua varian dan harus berdistribusi normal. Korelasi yang digunakan adalah korelasi
67
pearson (Pearson correlation pada tabel “Correlations”) dimana untuk mengukur korelasi data
interval dan rasio.
2. Untuk melakukan pengujian kolerasi, maka pilihlah menu Analyze – Correlate – Bivariate.
68
Keterangan :
o Pada bagian Statistics merupakan pilihan yang digunakan untuk menampilkan statistik
deskritif ringkas dari data-data yang akan dikolerasi.
o Pada bagian Missing values atau perlakuan kolerasi sehubungan dengan adanya data yang
tidak tersedia pada kasus, SPSS menyediakan 2 alternatif perlakuan :
Exclude cases pairwise, yaitu pasangan yang salah satu tidak ada datanya tidak akan
dimasukkan dalam perhitungan.
Exclude cases listwise, yaitu data yang tidak dimasukkan dalam perhitungan adalah data
yang hilang atau missing data.
69
5. Untuk keseragaman maka yang digunakan adalah pairwise, kemudian tekan Continue – Ok.
Setelah di ok, maka akan muncul result seperti gambar dibawah ini.
Correlations
N 30 30 30
Pearson Correlation ,001 1 -,112
GOVERNMENT_EXPENDI
Sig. (2-tailed) ,996 ,557
TURE
N 30 30 30
Pearson Correlation ,212 -,112 1
Interpretasi Hasil
Hipotesis :
H0 : Tidak terdapat hubungan yang signifikan antara Export dengan GDP
Ha : Terdapat hubungan yang signifikan antara Export dengan GDP
PERTEMUAN
6 KORELASI
Contoh soal : menggunakan data Export, Government Expenditure, dan GDP. Nita ingin
mengetahui apakah terdapat hubungan antara GDP dengan Government Expenditure dan Export
sebagai variabel pengontrol.
Langkah – langkah pengujian dalam spss :
1. Masukkan data seperti contoh sebelumnya.
2. Untuk melakukan pengujian kolerasi, maka pilihlah menu Analyze – Correlate – Partial.
3. Pindahkan variable Government Expenditure dan GDP kebagian Variables dan variable
Export ke bagian Controlling for.
71
Keterangan :
o Pada bagian Statistics merupakan pilihan yang digunakan untuk menampilkan statistik
deskritif ringkas dari data-data yang akan dikolerasi
o Pada bagian Missing values atau perlakuan kolerasi sehubungan dengan adanya data yang
tidak tersedia pada kasus, SPSS menyediakan 2 alternatif perlakuan :
Exclude cases pairwise, yaitu pasangan yang salah satu tidak ada datanya tidak akan
dimasukkan dalam perhitungan.
Exclude cases listwise, yaitu data yang tidak dimasukkan dalam perhitungan adalah data
yang hilang atau missing data
72
5. Untuk keseragaman maka yang digunakan adalah listwise, kemudian tekan Continue – Ok.
Setelah di ok, maka akan muncul result seperti gambar dibawah ini.
Correlations
df 28 0 28
df 28 28 0
Correlation 1,000 -,114
GOVERNMENT_EXPENDIT
Significance (2-tailed) . ,555
URE
df 0 27
EXPORT
Correlation -,114 1,000
Interpretasi Hasil
Hipotesis :
H0 : Tidak terdapat hubungan yang signifikan antara GDP dengan Government Expenditure dan
Export sebagai variabel pengontrol.
Ha : Terdapat hubungan yang signifikan antara GDP dengan Government Expenditure dan Export
sebagai variabel pengontrol.
Dasar Pengambilan Keputusan (DPK)
Keputusan
0.555 > 0.05 H0diterima
0.114 < 0.5 lemah
r = - berlawanan arah
Kesimpulan
Tidak terdapat hubungan yang signifikan antara GDP dengan Government Expenditure dan
Export sebagai variabel pengontrol, dengan sifat hubungan lemah dan berlawanan arah.
74
Soal Latihan
1. Princess adalah Girlband baru yang tenar sejak awal November 2016. Mereka pun ingin mencari
tahu apakah ada hubungan antara penjualan CD (X) dengan jadwal magung yang
merepresentasikan tingkat popularitas mereka (Y). Berikut adalah hasil riset mereka:
X 76 60 51 86 55 93 62 87 62 98 84 55
Y 121 122 149 130 120 109 112 106 144 103 148 120
2. Ingin diketahui seberapa besar kuat hubungan antara Pendapatan seorang nelayan di Cimone
Raya dengan Pengeluarannya (DALAM RIBUAN RUPIAH/BULAN)
Pendapatan (X) :
500;1500;1200;400;500;600;1500;1250;600;700;600;400
Pengeluaran (Y) :
150;200;200;200;300;400;150;100;700;200;150;200
a. Apakah ada hubungan antara Pendapatan seorang nelayan di Cimone Raya dengan
Pengeluarannya?
b. Bagaimana Sifat Hubungannya?
3. BINUS itu saying banget sama mahasiswanya. Karena banyak mahasiswa yang kurang paham
akan mata kuliah SPSS, akhirnya dibuka pelajaran tambahan. BINUS ingin mengetahui apakah
jumlah kelas pelajaran tambahan yang dibuka memiliki hubungan dengan nilai mereka. Berikut
adalah tabelnya
75
a. Apakah ada hubungan antara Durasi Pelajaran tambahan dengan rata rata nilai kelas A
dan kelas B?
b. Bagaimana Sifat Hubungannya antara kelas A dan kelas B?
c. Jadi kesimpulannya, apakah tahun depan perlu bikin kelas tambahan lagi atau tidak?
76
PERTEMUAN
7 REGRESI
7.1 Regresi
Analisis regresi merupakan suatu model matematis yang dapat digunakan untuk
mengetahui pola hubungan antara dua atau lebih variabel. Istilah regresi yang berarti ramalan atau
taksiran pertama kali diperkenalkan Sir Francis Galton pada tahun 1877, sehubungan dengan
penelitiannya terhadap tinggi manusia, yaitu antara tinggi anak dan tinggi orang tuanya. Dalam
penelitiannya, Galton menemukan bahwa tinggi anak dan tinggi orang tuanya cenderung
meningkat atau menurun dari berat rata-rata populasi. Garis yang menunjukkan hubungan tersebut
disebut garis regresi.
Analisis regresi lebih akurat dalam melakukan analisis korelasi, karena pada analisis itu
kesulitan dalam menunjukkan slop (tingkat perubahan suatu variabel terhadap variabel lainnya
dapat ditentukan). Jadi dengan analisis regresi, peramalan atau perkiraan nilai variabel terikat pada
nilai variabel bebas lebih akurat pula. Karena merupakan suatu prediksi, maka nilai prediksi tidak
selalu tepat dengan nilai riilnya, semakin kecil tingkat penyimpangan antara nilai prediksi dengan
nilai riilnya, maka semakin tepat persamaan regresi yang dibentuk.
Dapat disimpulkan bahwa analisis regresi adalah metode statistika yang digunakan untuk
menentukan kemungkinan bentuk hubungan antara variabel variabel, dengan tujuan pokok dalam
penggunaan metode ini adalah untuk meramalkan atau memperkirakan nilai dari suatu variabel
lain yang diketahui.
nilainya akan mempengaruhi nilai variabel lain disebut dengan variabel bebas (independent
variabel), sedangkan variabel yang nilainya dipengaruhi oleh nilai variabel lain disebut variabel
terikat (dependent variabel).
Ada dua jenis Persamaan Regresi Linier, yaitu sebagai berikut :
1. Analisis Regresi Sederhana (simple analisis regresi)
2. Analisis Regresi Berganda (multiple analisis regresi)
Store Purchase
Facility
Image Intention
3.90 3.60 4.00
4.30 3.40 4.00
4.30 3.80 3.60
4.90 3.40 4.60
3.80 4.00 4.20
4.20 4.20 4.20
2.60 2.80 2.80
2.60 2.40 4.75
3.60 3.20 2.75
3.40 4.00 3.50
3.80 4.00 3.25
3.40 3.20 3.25
4.00 3.80 3.80
4.00 3.20 3.40
78
2. Dari menu utama SPSS, pilih menu Analyze, kemudian submenu Regression, lalu pilih Linear.
Maka akan muncul kotak dialog sebagai berikut.
.
80
Masukkan variabel yang dipengaruhi (dependen) dan variabel yang mempengaruhi (independen)
ke kotaknya masing-masing.
3. Pilih Statistics. Kemudian Checklist Estimates, Model Fit, dan Descriptives.
4. Klik Continue dan selanjutnya pilih Plots. Atur seperti gambar dibawah ini.
6. Klik Option, pada Stepping Method Criteria, pilih :Entry .05(uji F yang mengambil standar
angka probabilitas sebesar 5%). Beri tanda pada Include constant in equation (menyertakan
konstanta tetap dipilih). Pada Missing Value, pilih: Exclude cases listwise (data kasus tidak ada
yang hilang). Kemudian Continue.
ANOVAa
Model Sum of Squares df Mean Square F Sig.
1 Regression 7.465 1 7.465 16.312 .000b
Residual 23.796 52 .458
Total 31.261 53
Dasar pengambilan keputusan diambil dari Sig Tabel Anova
a. Dependent Variable: Purchase_Intention
b. Predictors: (Constant), Store_Image
Model Summaryb
Adjusted R Std. Error of
Model R R Square Square the Estimate
1 .489a
.239 .224 .67647
Coefficientsa
Unstandardized Standardized
Coefficients Coefficients
Model B Std. Error Beta t Sig.
1 (Constant) 1.671 .503 3.325 .002
Store_Image .533 .132 .489 4.039 .000
Interpretasi Hasil
Uji Regresi
Hipotesis
H0 : Tidak terdapatpengaruh yang signifikan Store Image terhadap Purchase Intention.
Ha : Terdapat pengaruh yang signifikan Store Image terhadap Purchase Intention.
Dasar Pengambilan Keputusan (DPK)
sig
, maka H0 diterima
Keputusan
0,0< 0,05 Ho ditolak
Kesimpulan
Terdapat pengaruh yang signifikan Store Image terhadap Purchase Intention.
Uji Hubungan
Uji Pearson correlation
r> 0,5 Kuat r = + Searah
r< 0,5 Lemah r = - Berlawanan arah
Keputusan
0,489< 0,5 lemah
r = + searah
84
Kesimpulan
Adanya hubungan yang lemah dan searah antara KualitasPelayanan dan LoyalitasPelanggan.
Persamaan regresi
y = 1.671+ 0.533x
Keterangan : y = Purchase Intention
x = Store Image
o Jika x (Store Image) naik sebesar 1 point maka y (Purchase Intention) akanmengalami
kenaikan sebesar 0.533 point.
o Jika x (Store Image) turun sebesar 1 point maka y (Purchase Intention) akan mengalami
penurunan sebesar 0.533 point.
o Jika x (Store Imagen) = 0 maka y (Purchase Intention) adalah sebesar 1.671 point.
85
PERTEMUAN
8 REGRESI
Seperti yang diuraikan diatas, jika pada Regresi sederhana hanya ada satu variabel dependen (Y)
dan satu variabel independent (X), maka pada kasus Regresi berganda, terdapat satu variabel
dependen dan lebih dari satu variabel independent. Dalam praktek bisnis, regresi berganda justru
lebih banyak digunakan, selain karena banyaknya variabel dalam bisnis yang perlu dianalisis
bersama, juga pada banyak kasus regresi berganda lebih relevan digunakan.
Contoh Soal: Masih menggunakan data Store Image, Facility, dan Purchase Intention. . Apakah
terdapat pengaruh yang signifikan store image dan facility terhadap purchase intention?
(Asumsikan: Uji asumsi klasik telah terpenuhi/memenuhi syarat)
Store Purchase
Facility
Image Intention
3.90 3.60 4.00
4.30 3.40 4.00
4.30 3.80 3.60
4.90 3.40 4.60
3.80 4.00 4.20
4.20 4.20 4.20
2.60 2.80 2.80
2.60 2.40 4.75
3.60 3.20 2.75
3.40 4.00 3.50
3.80 4.00 3.25
3.40 3.20 3.25
4.00 3.80 3.80
4.00 3.20 3.40
3.60 4.00 3.40
4.60 3.60 4.40
4.20 2.60 3.25
4.20 3.20 2.75
86
Langkah-langkah penyelesaian:
1. Masukkan data ke dalam IBM SPSS v.20 seperti gambar berikut.
2. Dari menu utama SPSS, pilih menu Analyze, kemudian submenu Regression, lalu pilih Linear.
Maka akan muncul kotak dialog sebagai berikut.
Masukkan variabel yang dipengaruhi (dependen) dan variabel yang mempengaruhi (independen)
ke kotaknya masing-masing.
4. Klik continue dan selanjutnya pilih Plots. Atur seperti gambar dibawah ini
6. Klik Option, pada Stepping Method Criteria, pilih :Entry .05(uji F yang mengambil standar
angka probabilitas sebesar 5%). Beri tanda pada Include constant in equation (menyertakan
90
konstanta tetap dipilih). Pada Missing Value, pilih: Exclude cases listwise (data kasus tidak ada
yang hilang). Kemudian Continue.
Descriptive Statistics
Mean Std. Deviation N
Purchase_Intention 3.6676 .76800 54
Store_Image 3.7481 .70470 54
Facility 3.4509 .51317 54
Correlations
Purchase_Intention Store_Image Facility
Pearson Correlation Purchase_Intention 1.000 .489 -.167
Store_Image .489 1.000 .004
Facility -.167 .004 1.000
Sig. (1-tailed) Purchase_Intention . .000 .113
Store_Image .000 . .490
Facility .113 .490 .
N Purchase_Intention 54 54 54
Store_Image 54 54 54
Facility 54 54 54
Model Summaryb
Model R R Square Adjusted R Square Std. Error of the Estimate
1 .517a .267 .239 .67013
a. Predictors: (Constant), Facility, Store_Image
b. Dependent Variable: Purchase_Intention
91
ANOVAa
Model Sum of Squares df Mean Square F Sig.
1 Regression 8.358 2 4.179 9.306 .000b
Residual 22.903 51 .449
Total 31.261 53
a. Dependent Variable: Purchase_Intention
b. Predictors: (Constant), Facility, Store_Image
Coefficientsa
Unstandardized Coefficients Standardized Coefficients
Model B Std. Error Beta t Sig.
1 (Constant) 2.542 .793 3.205 .002
Store_Image .533 .131 .489 4.082 .000
Facility -.253 .179 -.169 -1.410 .165
a. Dependent Variable: Purchase_Intention
Uji Signifikansi
Hipotesis
H0 : Tidak terdapat pengaruh yang signifikan Store Image dan Facility terhadap Purchase
Intention.
Ha : Terdapat pengaruh yang signifikan Store Image dan Facility terhadap Purchase Intention.
Dasar Pengambilan Keputusan (DPK)
sig
, maka H0 diterima
Keputusan
0,00 < 0,05 H0 ditolak
Kesimpulan
Terdapat pengaruh yang signifikan Store Image dan Facility terhadap Purchase Intention.
Koefiisien determinasi (R square )
Sebesar 26.7% Purchase Intention dipengaruhi oleh variableStore Image dan Facilitydan sisanya
sebesar 73.3% dipengaruhi oleh faktor lainnya.
92
Persamaan regresi
y = 2.542+ 0.533 x1 - 0.253 x2
Keterangan : y = Purchase Intention
x1= Store Image
x2 = Facility
o Jika x1 (Store Image) naik sebesar 1 satuan dan x2 (Facility) naik 1 satuan maka y (Loyalitas
Pelanggan) akan mengalami kenaikan sebesar 0.28 satuan.
o Jika x1 (Store Image) turun sebesar 1 satuan dan x2 (Facility) turun 1 satuan maka y
(Loyalitas Pelanggan) akan mengalami penurunan sebesar 0.28 satuan.
o Jika x1 (Store Image) dan x2 (Kualitas Produk) = 0 maka y (Facility) adalah sebesar 2.542
point
93
Soal Latihan
1. Manajer HRD perusahaan Nusabakti ingin mengetahui apakah terdapat pengaruh tingkat
kehadiran terhadap prestasi kerja karyawannya. Berikut ini hasil sampel yang diperoleh dari
karyawannya:
27 92 75
28 74 70
29 92 79
30 84 77
2. Aura sedang melakukan penelitian untuk memenuhi tugas akhirnya, ia ingin melakukan
penelitian tentang pengaruh antara motivasi kerja dengan kompensasi terhadap loyalitas
karyawan pada PT. Indomay. Berikut ini merupakan hasil yang diperoleh dari 20 sampel.
yaitu:
Loyalitas
No Motivasi Kerja Kompensasi Karyawan
1 6.67 6.50 9.40
2 8.67 8.00 10.00
3 8.33 7.50 10.00
4 8.33 8.00 8.50
5 6.67 7.00 8.50
6 6.67 7.00 8.30
7 9.00 8.50 9.00
8 8.00 9.00 10.00
9 6.67 7.00 9.30
10 8.00 9.00 10.0
11 6.33 6.50 8.30
12 7.33 7.50 7.00
13 9.00 9.00 8.50
14 8.67 9.50 10.00
15 6.33 6.50 8.00
16 8.00 7.00 7.00
17 9.67 9.50 9.00
18 6.67 7.50 9.00
95
Tentukanlah:
a. Apakah terdapat pengaruh motivasi kerja terhadap loyalitas karyawan?
b. Apakah terdapat pengaruh variable independent terhadap variable dependent?
c. Seberapa besar pengaruhnya variable independent terhadap dependent?
d. Bagaimana korelasi secara keseluruhan dari semua variable?
e. Tuliskan persamaan regresinya berikut interpretasinya!
3. Lahyada adalah toko onlime yang sangat terkenal. Untuk dapat terus menjalankan bisnisnya
maka Lahyada melakukan penelitian mengenai faktor yang mempengaruhi kepuasan belanja
online sehingga hasilnya dapat dijadikan sebagai acuan dalam membangun strategi-strategi
baru demi keberlanjutan bisnis. Berikut data yang berhasil terkumpul:
Kualitas Kepuasan
No Diskon Efisien
Barang Konsumen
1 3.50 3.38 3.47 3.34
2 4.00 3.69 3.57 3.45
3 2.75 3.34 3.10 3.18
4 2.25 2.38 2.34 2.52
5 3.00 2.53 2.52 2.50
6 4.75 3.97 3.78 3.57
7 3.75 4.31 4.10 4.21
8 3.25 3.25 3.07 3.47
9 3.25 2.81 2.57 2.78
10 3.50 2.97 2.94 2.88
11 3.25 3.09 3.35 3.26
12 3.25 3.19 3.47 3.33
13 3.25 3.19 3.11 3.06
14 2.75 3.00 2.77 2.76
15 3.50 3.41 3.21 3.20
16 3.25 3.59 3.47 3.55
17 2.75 3.00 3.20 3.03
96
Tentukanlah:
a. Apakah terdapat pengaruh diskon terhadap kepuasan konsumen?
b. Apakah terdapat pengaruh variable independent terhadap variable dependent?
c. Seberapa besar pengaruhnya variable independent terhadap dependent?
d. Bagaimana korelasi secara keseluruhan dari semua variable?
e. Tuliskan persamaan regresinya berikut interpretasinya!
97
PERTEMUAN
9 ANOVA
ANOVA
Analysis of variance merupakan metode untuk menguji hubungan antara satu variabel
dependen (skala metrik) dengan satu atau lebih variabel independen (skala nonmetrik atau
kategorikal dengan kategori lebih dari dua). Hubungan antara satu variabel dependen dengan satu
variabel independen disebut One Way ANOVA. Pada kasus satu variabel dependen metrik dan
dua atau tiga variabel independen kategorikal sering disebut Two Ways ANOVA dan Three Ways
ANOVA.
ANOVA digunakan untuk mengetahui pengaruh utama (main effect) dan pengaruh
interaksi (interaction effect) dari variable independen kategorikal (sering disebut faktor) terhadap
variable dependen metrik.
1. Homogeneity of variance, yaitu variabel dependen harus memiliki varain yang sama dalam
setiap kategori varaibel independen. Test ini dinamakan Levene’s Testof Homogeneity of
Variance. Pada pengujian Levene Test, hasil yang dikehendaki adalah menerima hipotesis nol
dimana probabilitas < 0.05 yang berarti terdapat kesamaan variance pada grup.
2. Random sampling : untuk tujuan uji signifikansi, maka subjek didalam setiap grup harus
diambil secara random.
3. Multivariate Normality : untuk tujian uji signifikansi, maka variable harus mengikuti
distribusi normal multivariate.
Contoh soal :
Barry adalah seorang petani di suatu desa kecil. Ia memiliki 5 orang anak buah yang
membantunya setiap harinya. Untuk mempermudah pekerjaan anak buahnya ia memutuskan untuk
menggunakan bantuan traktor. Ia membeli 3 jenis traktor, traktor A, traktor B dan traktor C untuk
digunakan. Berikut adalah tingkat kepuasan ke 5 anak buah terhadap ketiga traktor yang ada.
7 4 4
7 5 9
10 8 10
6 7 8
Tabel diatas menunjukkan tingkat kepuasan 5 anak buah nya terhadap ketiga traktor, semakin
tinggi nilai nya menandakan bahwa anak buah nya semakin puas, sebaliknya semakin rendah
menandakan anak buahnya semakin tidak puas akan traktor tersebut.
Berdasarkan data diatas tentukan:
a. Apakah data diatas berdistribusi normal?
b. Apakah data diatas memiliki varians yang sama?
c. Apakah terdapat perbedaan rata-rata tingkat kepuasan anak buah terhadap ketiga jenis
Traktor?
d. Apakah terdapat perbedaan rata-rata tingkat kepuasan anak buah antara traktor A dan Traktor
C menurut Turkey dan Bonferroni?
Langkah Pengerjaan:
1. Masukkan variable kepuasan dan jenis traktor ke dalam variable view. Lalu gunakan value labels
untuk variable jenis traktor
4. Setelah itu pilih Analyze – Compare Means – One Way Anova. Masukkan data kepuasan ke
dependent list dan data jenis traktor ke dalam factor.
Interpretasi Hasil
a. Uji Normalitas ( Lihat yang Shapiro Wilk)
Hipotesis
H0 : Data kepuasan anak buah berdistribusi normal.
Ha : Data kepuasan anak buah berdistribusi acak.
Keputusan
Traktor A : 0,453 > 0,05, maka H 0 diterima
Traktor B : 0,754 > 0,05, maka H0 diterima
Traktor C : 0,787 > 0,05, maka H0 diterima
Kesimpulan
Data kepuasan anak buah dengan Traktor A berdistribusi
normal. Data kepuasan anak buah dengan Traktor B berdistribusi
normal. Data kepuasan anak buah dengan Traktor C berdistribusi
normal.
Keputusan :
0.591 > 0.05 H0 diterima
Kesimpulan
Tidak terdapat perbedaan perbedaan varians pada rata-rata tingkat kepuasan anak buah terhadap
ketiga jenis traktor.
Keputusan :
0.840> 0.05 H0 diterima
0.176< 3.89 H0 diterima
Kesimpulan
Tidak terdapat perbedaan rata-rata tingkat kepuasan anak buah terhadap ketiga jenis traktor.
d. Uji Tukey
Hipotesis
H0 : Tidak terdapat perbedaan rata-rata tingkat kepuasan anak buah antara jenis Traktor A dengan
Traktor C menurut Turkey
Ha : Terdapat perbedaan rata-rata tingkat kepuasan anak buah antara jenis Traktor A dengan Traktor
C menurut Turkey
104
Keputusan :
0.953> 0.05 H0diterima
Kesimpulan
Tidak terdapat perbedaan rata-rata tingkat kepuasan anak buah antara jenis Traktor A dengan
Traktor C menurut Turkey
Uji Bonferroni
Hipotesis
H0 : Tidak terdapat perbedaan rata-rata tingkat kepuasan anak buah antara jenis Traktor A dengan
Traktor C menurut Bonferroni
Ha : Terdapat perbedaan rata-rata tingkat kepuasan anak buah antara jenis Traktor A dengan Traktor
C menurut Bonferroni
Keputusan :
1.0 > 0.05 H0 diterima
Kesimpulan
Tidak terdapat perbedaan rata-rata tingkat kepuasan anak buah antara jenis Traktor A dengan
Traktor C menurut Bonferroni.
105
Soal Latihan
Ekonomi 4 2 5 4 6 3 4 5 5
Bisnis 3 3 3 5 4 3 5 6 4
Eksekutif 4 5 5 6 3 2 4 4 3
2. Seorang guru SD melakukan pendataan atas nilai Ujian Nasional muridnya sebagai berikut:
Apakah terdapat perbedaan rata-rata hasil Ujian Nasional tersebut menurut Bonferroni?
106
3. BINUS Mengajar melakukan survei tentang kualitas pendidikan beberapa sekolah di Jakarta,
dengan hasil evaluasi sebagai berikut:
Jakarta Pusat Jakarta Barat Jakarta Timur Jakarta Selatan Jakarta Utara
Baik Rata-rata Rata-rata Baik Baik
Sangat Baik Buruk Sangat Buruk Baik Sangat Baik
Rata-rata Rata-rata Rata-rata Rata-rata Baik
Sangat Buruk Rata-rata Baik Rata-rata Rata-rata
Chi-square test digunakan untuk menganalisa data kategorikal. Yang berarti data yang
dihitung dibagi menjadi beberapa kategori. Contohnya adalah : jika Anda ingin menguji apakah
menghadiri kelas pengaruh terhadap performa siswa saat ujian. Jika menggunakan skor tes (0-100)
sebagai data, maka data tersebut tidak akan sesuai untuk uji Chi-square. Namun, jika mengubah
data siswa ke dalam kategori "Lulus" dan "Gagal" maka datanya bisa digunakan.
Uji Chi-square atau qai-kuadrat digunakan untuk melihat ketergantungan antara variabel
bebas dan variabel tergantung berskala nominal atau ordinal. Prosedur uji chi-square menabulasi
satu atau variabel ke dalam kategori-kategori dan menghitung angka statistik chi-square. Seperti
sifatnya, prosedur uji chi-square dilkelompokan kedalam statistik uji non-parametrik.
Semua variabel yang akan dianalisa harus bersifat numerik kategorikal atau nominal dan
dapat juga berskala ordinal. Prosedur ini didasarkan pada asumsi bahwa uji nonparametrik tidak
membutuhkan asumsi bentuk distribusi yang mendasarinya. Data diasumsikan berasal dari sampel
acak. Frekuensi yang diharapkan (fe) untuk masing-masing kategori harus setidaknya : Tidak
boleh lebih dari dua puluh (20%) dari kategori mempunyai frekuensi yang diharapkan.
Uji keselarasan atau goodness of fit test digunakan pada data yang memiliki satu variable.
goodness of fit test berfungsi untuk membandingkan frekuensi yang diamati (fo) dengan frekuensi
yang diharapkan (fe).
Uji keselarasan atau goodness of fit test digunakan untuk mengukur seberapa baik distribusi dari
data diamati sesuai dengan distribusi yang diharapkan
chi-square goodness of fit test tepat digunakan ketika kondisi berikut terpenuhi:
Metode pengambilan sampel adalah simple random sampling
Variabel yang diteliti adalah kategoris.
Setidaknya terdapat limaFrekuensi yang diharapkan dari jumlah pengamatan sampel di setiap
tingkat variabel
107
108
Langkah pengerjaan :
1. Input Variabel Program Studi dan peminatan pada Variable View.
4. Kemudian lakukan Weight Cases karena data yang dilampirkan merupakan ringkasan dari
kumpulan data yang didapat sebelumnya. Pilih Data – Weight Cases dan akan tampil layar
sebagai berikut.
110
5. Pilih Weight cases by pemilihan (masukkan pemilihan pada Frequency Variable), kemudian
OK
6. Setelah dilakukan Weight Cases maka dapat dilakukan pengujjian selanjutnya yang di mana
dimulai dengan melakukan uji normalitas. Uji Normalitas dilakukan untuk mengetahui
distribusi data dari variabel yang dianalisa. Pilih Analyze → Descriptive Statistics → Explore.
111
Tests of Normality
Kolmogorov-Smirnova Shapiro-Wilk
Statistic df Sig. Statistic df Sig.
pemilihan .237 1200 .000 .829 1200 .000
a. Lilliefors Significance Correction
*datanya distribusi bebas karena < 0.05
7. Lakukan pengujian Goodness of fit. Pilih Analyze >> Non Parametric tests >> Legacy
Dialogs >> Chi Square. Pindahkan variable Program studi ke Variable List.
Test Statistics
program_stu
di
Chi-
115.893a
Square
df 3
Asymp.
.000
Sig.
a. 0 cells (0.0%) have
expected frequencies less
than 5. The minimum
expected cell frequency is
300.0.
Interpretasi Hasil
Hipotesis
H0 = Tidak terdapat perbedaan kemerataan jumlah pemilih dari keempat Program studi SOBM di
Binus.
Ha = Terdapat perbedaan kemerataan jumlah pemilih dari keempat Program studi SOBM di Binus.
Keputusan
0.000 < 0.05, maka H0 ditolak
Kesimpulan
Terdapat perbedaan kemerataan jumlah pemilih dari keempat Program studi SOBM di Binus
113
Susanti adalah salah satu Staff Marketing dari Bina Nusantara University ia ingin menggetahui
apakah terdapat kemerataan pemilihan mahasiswa baru terhadap program studi SOBM (School of
Business Management) yang ada di BINUS. Program Studi SOBM itu sendiri terdiri dari Management,
International Business Management, International Marketing dan Business Creation. Berdasarkan data
tahun 2015, data peminatan calon mahasiswa terhadap program studi SOBM adalah sebagai berikut:
Calon Mahasiswa/i ini terdiri dari 10 Sekolah Menengah Atas didaerah Tangerang, yang jumlah
calon mahasiswanya adalah 1200. Susanti ingin mengetahui apakah keempat program studi ini di tahun
2016 memiliki tingkat kemenarikan yang merata?
Berikut adalah data calon mahasiwa tahun ini :
Langkah pengerjaan :
3. Input data kedalam Data View. Untuk frekuensi hanya masukkan data pemilihan 2016 (Fo).
115
4. Kemudian lakukan Weight Cases karena data yang dilampirkan merupakan ringkasan dari
kumpulan data yang didapat sebelumnya. Pilih Data – Weight Cases dan akan tampil layar
sebagai berikut.
5. Pilih Weight cases by pemilihan (masukkan pemilihan pada Frequency Variable), kemudian OK.
116
6. Setelah dilakukan Weight Cases maka dapat dilakukan pengujjian selanjutnya yang di mana
dimulai dengan melakukan uji normalitas. Uji Normalitas dilakukan untuk mengetahui distribusi
data dari variabel yang dianalisa. Pilih Analyze → Descriptive Statistics → Explore.
Tests of Normality
Kolmogorov-Smirnova Shapiro-Wilk
Statistic df Sig. Statistic df Sig.
pemiliha
.237 1200 .000 .829 1200 .000
n
a. Lilliefors Significance Correction
7. Lakukan pengujian Goodness of fit. Pilih Analyze >> Non Parametric tests >> Legacy Dialogs
>> Chi Square. Pindahkan variable program studi ke Variable List.
117
8. Lalu pada bagian Expected Values pilih Value kemudian input data pemilihan 2015 (Fe) secara
berurutan :
program_studi
Observed Expected Residual
N N
Management 250 274.3 -24.3
International Business
422 436.2 -14.2
Management
International Marketing 178 396.2 -218.2
Business Creation 350 93.3 256.7
Total 1200
Test Statistics
program_stu
di
118
Chi-
828.607a
Square
df 3
Asymp.
.000
Sig.
a. 0 cells (0.0%) have
expected frequencies less
than 5. The minimum
expected cell frequency is
93.3.
10. Untuk mencari nilai Chisquare hitung dengan menggunakan langkah berikut :
Pilih Transform >> Compute Variable
Ketik X pada Target Variable
Pada Function Group pilih Inverse DF dan pada Function and Special Variables pilih
Idf.Chisq
Pada Numeric Expression akan muncul IDF.CHISQ(?,?). Lalu ? pertama isi dengan
probabilitas, yaitu 0.95 dan ? kedua isi dengan derajat kebebasan, yaitu 3 (dapat dilihat
pada tabel output). Lalu Klik OK
119
Interpretasi Hasil:
Hipotesis
H0 = Tidak terdapat perbedaan kemerataan/keselarasan frekuensi distribusi pemilih program studi
SOBM tahun 2015 dan tahun 2016
Ha = Terdapat perbedaan kemerataan/keselarasan frekuensi distribusi pemilih program studi
SOBM tahun 2015 dan tahun 2016
Dasar Pengambilan Keputusan
Sig > α, maka H0 diterima
Sig < α, maka H0 ditolak
Dan
X2 hitung > X2 tabel, maka H0 ditolak
X2 hitung < X2 tabel, maka H0 diterima
Keputusan
0.000 < 0.05 maka H0 ditolak
828.607 > 7.81 maka H0 ditolak
Kesimpulan
Terdapat perbedaan kemerataan/keselarasan frekuensi distribusi pemilih program studi SOBM
tahun 2015 dan tahun 2016.
120
Chi-square goodness-of-fit test digunakan untuk menganalisis distribusi frekuensi untuk kategori
satu variabel. Namun, goodness-of-fit test tidak bisa digunakan untuk menganalisis dua variabel
secara bersamaan. Karena itu dikenal yang namanya chi-square test of independence yang dapat
digunakan untuk menganalisis frekuensi dari dua variabel dengan beberapa kategori untuk
menentukan apakah kedua variabel independen.
Contoh :
Evantut adalah seorang Personal Trainer di Medal’s Gym. Ia ingin melihat apakah
terdapat hubungan antara umur pengunjung di Medal’s Gym terhadap penawaran Paket Gym
Bulanan dari …… anggota. Paket Gym tersebut terdiri dari :
Paket A : Rp. 199.000
Paket B: Rp. 299.000 + Towel Exercise
Paket C : Rp. 356.000 + Towel Exercise + Free 15 Days
Paket D : Rp. 400.000 + Towel exercise + Free 1 Month
USIA PAKET
A B C D
< 17 Tahun 15 48 34 50
18-35 Tahun 33 39 23 10
36-50 Tahun 36 23 43 18
>50 Tahun 16 17 40 38
Langkah pengerjaan :
1. Input variabel Usia, Paket, dan Frekuensi pada Variable View
4. Kemudian lakukan Weight Cases. Pilih Data – Weight Cases. Pada window yang muncul, pilih
Weight cases by frekuensi (masukkan frekuensi pada Frequency Variable), kemudian OK.
122
5. Setelah dilakukan Weight Cases maka dapat dilakukan pengujjian selanjutnya yang di mana
dimulai dengan melakukan uji normalitas. Uji Normalitas dilakukan untuk mengetahui distribusi
data dari variabel yang dianalisa. Pilih Analyze → Descriptive Statistics → Explore
Tests of Normality
Kolmogorov-Smirnova Shapiro-Wilk
Statistic df Sig. Statistic df Sig.
frekuensi .168 483 .000 .911 483 .000
a. Lilliefors Significance Correction
6. Lakukan pengujian Goodness of fit. Pilih Analyze, Descriptive Statistics, lalu klik Crosstabs.
7. Pada kotak dialog Crosstabs muncul, pindahkan usia ke Row(s) dan paket ke Column(s).
Klik Statistics, Pada kotak dialog Crosstabs: Statistics yang muncul centang Chi-Square.
Klik Cells, kemudian pilih Observed, Expected.
123
Count 36 23 43 18 120
36-50
Expected
Tahun 24.8 31.6 34.8 28.8 120.0
Count
Count 16 17 40 38 111
>50 Tahun Expected
23.0 29.2 32.2 26.7 111.0
Count
Count 100 127 140 116 483
Expected
Total 100.0 127.0 140.0 116.0 483.0
Count
Chi-Square Tests
Value df Asymp. Sig.
(2-sided)
Pearson Chi-Square 66.746a 9 .000
Likelihood Ratio 69.978 9 .000
Linear-by-Linear
.279 1 .598
Association
N of Valid Cases 483
a. 0 cells (0.0%) have expected count less than 5. The
minimum expected count is 21.74.
Interpretasi Hasil :
Hipotesis
H0: Tidak terdapat hubungan antara usia dengan paket Gym
Ha : Terdapat hubungan antara usia dengan paket Gym
126
Kesimpulan
Terdapat hubungan antara usia dengan paket Gym
127
Soal Latihan
1. Setelah melihat perbedaan pengaruh antara ketiga layanan maka Cella pun membuat kuesioner
untuk melihat parameter yang mempengaruhi kenyamanan layanan di layanan mahasiswa maka
dari 110 orang didapat 45 orang menganggap keramahan yang mempengaruhi kenyamanan, 25
beranggapan ketepatan penyelesaiaan yang mempengaruhi kenyamanan, 40 beranggapan
kecepatan layanan yang mempengaruhi kenyamanan. Sedangkan untuk layanan keuangan
sebagai estimasi didapat frekuensinya sebagai berikut:
Parameter kenyamanan Layanan keuangan
Keramahan 55
ketepatan penyelesaian 30
kecepatan 25
2. Seorang dosen memperkirakan bahwa tipikal distribusi grade dari kelasnya adalah 35% grade A,
30% grade B, 25% grade C, dan 10% kurang dari sama dengan (≤) grade D. Pada semester ini,
kelas dosen tersebut berisi 100 mahasiswa.
a. Estimasikan jumlah mahasiswa yang akan memperoleh masing-masing grade berdasarkan
ekspektasi dosen.
b. Di akhir semester, terdapat 25 anak mendapat grade A, 30 anak mendapat grade B, 25 anak
mendapat grade C, dan sisanya mendapat grade kurang dari sama dengan (≤) grade D. Ujilah
normalitas data tersebut!
c. Apakah hasil grade pada akhir semester mengikuti distribusi grade yang diharapkan?
3. Carllim adalah seorang pemilik toko sembako terbesar di Tangerang, sembako yang paling
banyak dibeli dan dibutuhkan adalag Beras. Berikut adalah penjualan beras tahun 2014 di 5 toko
terbesarnya :
TOKO PENJUALAN
Ruko Pasar 9 212
128
Apakah data penjualan beras tahun 2014 memiliki distribusi yang merata di lima toko
terbesarnya ?
4. Toyota yang memiliki berbagai jenis mobil dengan kualitas terbaik harus dapat memenuhi
keinginan konsumen dari berbagi jenis golongan dengan tingkat pendapatan tertentu. Berikut
data hasil penjualan mobil toyota:
Mobil
Pendapatan
Avanza Rush Agya Innova
Lakukanlah pengujian untuk menjawab pertanyaan berikut dengan tingkat kesalahan 10%:
Apakah terdapat hubungan antara tingkat pendapatan dengan penjualan jenis mobil Toyota?
10.3 MANN WHITNEY
Uji Mann Whitney sebanding dengan t – test nonparametrik untuk sampel independen.
Mann Whitney adalah uji non – parametrik yang digunakan untuk mengetahui perbedaan rata –
rata 2 kelompok independen (bebas) yang berasal dari populasi yang sama apabila skala
data variabel terikatnya adalah ordinal atau interval/ratio tetapi tidak berdistribusi normal. Uji
Mann-Whitney merupakan uji nonparametrik yang digunakan untuk menguji apakah dua buah
sampel independen berasal dari populasi yang sama.
Populasi dari sampel pertama berbeda dengan populasi dari sampel kedua sehingga
kedua sampel tersebut bersifat independen. Uji Mann-Whitney menguji parameter populasi dari
masing-masing sampel. Pada dasarnya, parameter yang di uji adalah median populasi. Jika nilai
median dari populasi pertama sama dengan nilai median dari populasi kedua, maka kedua
sampel tersebut berasal dari populasi yang sama. Namun jika nilai median dari populasi pertama
tidak sama dengan nilai median dari populasi kedua, maka kedua sampel tersebut berasal dari
populasi yang berbeda.
Data yang dianalisis pada uji Mann-Whitney berupa ranking dari hasil pemeringkatan
seluruh nilai dari dua sampel. Karena data yang dianalisis berupa ranking, maka data tersebut
termasuk data ordinal.
Pengujian mann whitney dapat dilakukan dengan memenuhi asumsi berikut :
Data yang digunakan tidak berhubungan satu sama lain (Independen)
Populasi tidak harus berdistribusi normal (bebas)
Berskala minimal Ordinal
Jumlah data yang digunakan sedikit (<30)
Contoh :
H&M saat ini menggunakan 2 mesin pembuat baju yaitu mesin 1 berasal dari Jepang dan mesin
2 berasal dari Korea. Kedua mesin itu digunakan untuk memproduksi baju secara massal. Wanda
ingin mengetahui adakah perbedaan kualitas mesin pembuat baju pada industri fashion H&M.
Kedua kualitas mesin pembuat baju tersebut diukur dengan menggunakan instrumen yang terdiri
dari beberapa butir pertanyaan. Skor penilaian dengan kualitas tertinggi 50 dan terendah 0. Data
yang didapatkan peneliti dari hasil kuisioner adalah sebagai berikut.
129
130
1 16 29
2 18 29
3 10 31
4 12 35
5 16 36
6 14 37
7 15 33
8 10 37
9 12 29
10 15 42
11 16 18
12 11 30
13 16 37
14 18 39
15 10 21
16 12 30
17 16 24
18 11 40
19 12 17
20 10 42
131
21 14 23
22 16 37
23 17 36
24 16 18
25 18 37
Langkah-langkah pengerjaan :
1. Input variabel kelas dan nilai pada Variable View. Gunakan Value Label untuk variabel mesin
131
132
Tests of Normality
5. Pilih Analyze >> Nonparametric Tests >> Legacy Dialogs >> 2 Independent Samples. Kemudian pada
window yang muncul, pindahkan variable kualitas ke Test Variable List dan mesin ke group variable.
133
6. Pilih Continue. Pada test-type pilih Mann-Whitney U kemudian OK untuk melihat output.
Ranks
mesin N Mean Rank Sum of Ranks
Test Statisticsa
kualitas
Mann-Whitney U 6,500
Wilcoxon W 331,500
Z -5,955
Asymp. Sig. (2-tailed) ,000
133
134
Interpretasi Hasil :
Hipotesis
H0 : Tidak terdapat perbedaan yang signifikan antara mesin dari korea dan mesin dari jepang
terhadap kualitas baju di H&M
Ha : Terdapat perbedaan yang signifikan antara mesin dari korea dan mesin dari jepang
terhadap kualitas baju di H&M
Dasar Pengambilan Keputusan
Sig > α maka, H0 diterima
Sig < α maka, H0 ditolak
Keputusan (nilai asymps sig)
0.00 < 0,05, maka H0 ditolak
Kesimpulan
Terdapat perbedaan yang signifikan antara mesin dari korea dan mesin dari jepang terhadap
kualitas baju di H&M
135
Soal Latihan
1. Fernando seorang mahasiswa tingkat akhir. Ia ingin melakukan suatu penelitian untuk
mengetahui apakah terdapat perbedaan rata rata tingkat penerimaan fresh graduate di dunia kerja
antara Universitas Bina Nusantara dengan Universitas Trisakti. Berikut hasil data yang telah
diperoleh. Bantulah fernando dalam pengujian ini.
2. Barney diberikan suatu tugas oleh dosen Business Statistics untuk melakukan suatu penelitian di
Bhinneka. Disana Barney ingin melihat apakah terdapat perbedaan rata – rata preferensi
konsumen antara laptop LCD 14 inch dengan laptop LCD 11 inch. Berikut adalah hasil data
yang berhasil diperoleh :
135
136
7 7
6 7
7 1
PERTEMUAN 11
SIGN WILCOXON & KRUSKALL WALLIS
Wilcoxon signed rank test adalah metode nonparametrik yang digunakan untuk
membandingkan 2 sampel data yang berasal dari grup yang sama (2 sampel yang saling
berhubungan). Hal ini dapat dilakukan ketika ingin menyelidiki apakah terjadi perubahan nilai
dari 1 waktu ke waktu lain atau ketika individu diberikan lebih dari 1 kondisi (diberikan
perlakuan yang berbeda).
Pengujian Wilcoxon signed rank dapat dilakukan ketika memenuhi asumsi berikut :
1. Data dari variable dependen minimal berskala ordinal
Contoh: Skala 5 – menjelaskan berapa banyak pelanggan menyukai produk, jika skala 1
menjelaskan bahwa banyak pelanggan yang tidak terlalu banyak menyukai produk.
2. Data berdistribusi bebas harus terdiri dari data yang memiliki kelompok yang berhubungan
3. Sampel yang digunakan adalah sampel yang berhubungan
4. Jumlah sample kecil (<30)
Contoh:
Losaura adalah seorang peneliti ingin mengetahui bagaimana perkembangan asisten laboratory of
business management terhadap kualitas dari seorang asisten setelah diberikan training inti. Peneliti
mengharapkan adanya dampak positif setelah diberikannya training inti. Losaura mengambil
sampel sebanyak 10 asisten.Berikut hasil data yang telah diteliti losaura:
137
138
Yusliana 77 62
139
Langkah-langkah:
1. Input variabel sebelum training inti dan sesudah training inti pada Variable View.
2.
Input data diatas pada Data View.
2. Uji distribusi data, jika data tidak normal maka bisa menggunakan metode non-parametrik
140
5. Pada kolom Test Pairs, masukkan variable sebelum training inti dan sesudah training inti.
Kemudian Test Tipe : Wilcoxon. Abaikan pilihan lain, klik OK.
141
6. Output hasil.
Interpretasi Hasil
Hipotesis
H0 : Tidak terdapat perbedaan kualitas asisten sebelum dan sesudah diberikan training inti
Ha : Terdapat perbedaan kualitas asisten sebelum dan sesudah diberikan training inti
Dasar Pengambilan Keputusan
Sig > α , maka H0 dterima
Sig < α , maka H0 ditolak
Keputusan
0.139 > 0.07 , maka H0 dterima
Kesimpulan:
Tidak terdapat perbedaan kualitas asisten sebelum dan sesudah diberikan training inti
Jika dilihat pada tabel rank, nilai negative lebih sedikit dari pada nilai positif, hal ini mengindikasikan
bahwa rata-rata terjadi penurunan kualitas asisten setelah diberikan training inti.
142
Soal Latihan
1. Sebagai bisnis manufacture bunga plastik yang dijalankan turun temurun, Mawar
Manufacture Company sudah banyak melakukan inovasi dalam proses produksinya. Pada
awal tahun 1990an Mawar Manufacture menggunakan cara manual dalam memproduksi,
namun seiring dengan perkembangan teknologi Mawar Manufacture mulai melalukan
produksi bukan lagi secara manual tapi dengan menggunakan mesin berteknologi tinggi
sehingga mempersingkat proses produksi dan meningkatkan produktivitas pekerjanya.
Mawar Manufacture ingin mengetahui apakah dengan menggunakan mesin yang cangih
benar benar meningkatkan produktivitas karyawannya. Berikut terlampir data produktivitas
karyawan, ada beberapa data pekerja yang tidak lengkap. (Tingkat kepercayaan 91%)
2. Top Nusantara memproduksi berbagai macam permen dan snack. Pada tahun 2010 - 2012
penjualan permen dan snack tidak mengalami kenaikan ataupun penurunan. Pt. Top
Nusantara berencana untuk meningkatkan penjualan dengan menambah frekuensi
advertising. Berikut merupakan data hasil penjualan permen dan snack dalam miliar pada
tahun 2012 dan 2013, apakah ada peningkatan penjualan sebelum dan sesudah penambahan
frekuensi advertising. (α = 15%)
Jan Feb Mar Apr Mei Jun Jul Agus Sep Okt Nov Des Rata-
rata
2012 7 6 6 3 5 4 10 4 5 6 8 15
2013 9 8 6 4 5 5 6 6 6 7 9 14
Kruskal Wallis merupakan salah satu metode non-parametrik yang memiliki tujuan untuk
menentukan apakah terdapat perbedaan yang signifikan antara tiga atau lebih variabel independent
terhadap variabel dependent. Non-parametrik merupakan metode yang tidak didasarkan pada asumsi
distirbusi populasi. Variabel independent merupakan variable yang mempengaruhi variable dependent
atau merupakan variable bebas satu sama lain, sedangkan variable dependent merupakan variable yang
dipengaruhi variable independent atau merupakan variable terikat.
Ciri-ciri data Uji Kruskal-Wallis
1. Data merupakan metode non-parametrik
2. Memiliki jumlah responden minimal 30 atau lebih
3. Variable independent minimal 3 atau lebih (3,4,5,…,dst) kelompok.
4. Variable dependent berskala nominal (interval/ratio) atau Ordinal
5. Data tidak berdistribusi normal
6. Kruskall wallis merupakan nilai distribusi chi-square dengan derajat bebas k-1 maka jumlah
sample harus lebih dari sama dengan 5
7. Setiap katagori memiliki variablilitas yang sama, yaitu bentuk kurve atau sebaran data yang
sama.
Contoh Soal :
Supervisor penjualan untuk Roti Coklat dari Duta Makmur ingin mengetahui apakah ada
perbedaan penjualan Roti Coklat yang nyata di daerah Penjualan JABODETABEK. Untuk itu
144
diambil sampel berupa data penjualan Roti Coklat, masing-masing enam outlet untuk kawasan
JABODETABEK, dengan data sebagai berikut :
2. Klik pada Value di baris data Kota, akan muncul kotak “Value Labels”. Pada Kolom Value,
tulis angka 1 dan pada kolom Label tulis Jakarta, lalu klik “Add”. Lanjutkan sampai Value 5.
145
3. Pada tab “Data View”, di kolom Shift masukkan angka 1 untuk Jakarta, dan pada kolom
Penjualan masukkan hasil copy dari data penjualan Jakarta. Lanjutkan sampai angka 5 dan
data penjualan Depok.
4. Lakukan Uji Normalitas sebagai syarat Uji Kruskal Wallis untuk mengetahui bahwa Data
berdistribusi tidak normal. Langkah melakukan Uji Normalitas :
Klik Analyze – Descriptive Statistics – Explore
7. Hasil Output Uji Normalitas menunjukkan bahwa jumlah data masing-masing variable adalah 6,
maka diambil data pada kolom Shapiro-Wilk. Dari hasil Sig pada Shapiro-Wilk menunjukkan
seluruh data lebih kecil dari α (0.05), sehingga dapat dilanjutkan pengujian Kruskal Wallis.
Tests of Normality
Kota Kolmogorov-Smirnova Shapiro-Wilk
Statistic df Sig. Statistic df Sig.
Jakarta ,313 6 ,068 ,776 6 ,035
Bogor ,390 6 ,005 ,700 6 ,006
Penjualan Tangerang ,318 6 ,057 ,750 6 ,020
Bekasi ,356 6 ,017 ,692 6 ,005
Depok ,348 6 ,022 ,786 6 ,043
8. Kemudian lakukan Uji Kruskal Wallis. Klik Analyze – Nonparametric Tests – Legacy Dialog -
K Independent Samples.
147
9. Kemudian akan muncul kotak dialog “Tests for Several Independent Samples” kemudian
pindahkan variable Penjualan ke kolom Test Variable List dan Kota ke Grouping Variable
sebagai berikut:
10. Kemudian klik Define Range dan isikan nilai Minimum : 1 dan nilai Maximum : 5 (karena
terdiri dari 5 sample) sebagai berikut :
11. Kemudian klik Continue dan klik Ok. Hasil Output dari Kruskal-Wallis Test sebagai berikut :
148
Test Statisticsa,b
Penjualan
Chi-
17,921
Square
df 4
Asymp.
,001
Sig.
a. Kruskal Wallis Test
b. Grouping Variable:
Kota
Ranks
Kota N Mean
Rank
Jakarta 6 20,25
Bogor 6 26,17
Tangerang 6 8,00
Penjualan
Bekasi 6 9,67
Depok 6 13,42
Total 30
149
12. Setelah mendapat Asymp Sig. dan Chi-Square hitung kita memerlukan Chi-Square Tabel
dengan menggunakan tool di spss. Pertama klik Transform dan pilih Compute Variable.
14. Output table Chi-Square akan ada pada data view yaitu 5.99.
150
Interpretasi Hasil
Hipotesis
Ho : Tidak terdapat perbedaan yang signifikan antara penjualan Roti Coklat pada daerah
penjualan JABODETABEK
Ha : Terdapat perbedaan yang signifikan antara penjualan Roti Coklat pada daerah
penjualan JABODETABEK
Soal Latihan
1. Tabel di bawah ini berisi data panjang daun tanaman dari spesies yang sama di empat
taman berbeda. Pada setiap taman, enam tanaman dipilih secara acak. Untuk setiap
tanaman, sepuluh daun dipilih secara acak, dan rata-rata dari sepuluh daun tersebut dicatat
untuk setiap tanaman dari setiap taman. Gunakan test Kruskal-Wallis untuk menentukan
apakah terdapat perbedaan yang signifikan antara distribusi rata-rata panjang daun di
lokasi taman yang berbeda. Gunakan α=0,05.
2. EPA ingin menentukan apakah perubahan suhu di dalam air laut yang disebabkan oleh
pembangkit listrik tenaga nuklir akan memiliki efek yang signifikan pada kehidupan
hewan di wilayah tersebut. Spesimen yang baru menetas dari beberapa spesies ikan dibagi
menjadi empat kelompok secara acak. Kelompok-kelompok tersebut ditempatkan pada
simulasi lingkungan laut yang terpisah dan dengan suhu air yang identic. Enam bulan
kemudian, spesimen-spesimen tersebut ditimbang dan hasilnya ditunjukkan pada table.
Gunakan α=0,10 untuk mengetahui apakah terdapat perbedaan yang signifikan antara
berat spesimen pada suhu yang berbeda.
Suhu
38 F 42 F 46 F 50 F
15.0 16.0 42.0 18.0
17.0 17.0 23.0 18.0
21.0 16.0 21.0 21.0
18.0 16.0 17.0 18.0
19.0 22.0 22.0 21.0
15.0 17.0 23.0 18.0
152
3. Kumbang menyebabkan kerugian jutaan rupiah akibt kerusakan tanaman kapas setiap
tahunnya. Oleh karena itu, tiga bahan kimia dirancang untuk mengontrol populasi
kumbang untuk masing-masing lahan tanaman kupas. Setelah tiga bulan, sepuluh lahan
berukuran sama dipilih secara acak dan persentase kerusakan tanaman kapas dicatat.
Apakah terdapat perbedaan yang signifikan antara distribusi tingkat kerusakan dengan
ketiga perlakuan pada tanaman kapas ?
Black, Ken. 2010. Business for Contemporary Decision Making Statistics 6th edition. Wiley Plus
Setyadharma, Andryan. 2010. Uji Asumsi Klasik dengan SPSS 16.0. Universitas Negeri
Semarang
http://docplayer.info/238136-E-book-statistika-gratis-statistical-data-analyst-uji-asumsi-klasik-
regresi-linear.html
Anderson, D. R., Sweeney, D. J., & Williams, T. A. (2011). Statistics For Business and
Economics 11e. South Western: Cengage Learning.
Black, K. (2013). Applied Business Statistics Making Better Bussiness Decisions 7th Edition.
Singapore: John Wiley & Sons.
Ghozali, I. (2013). Aplikasi Analisis Multivariate dengan Program IBM SPSS 21 Updated PLS
Regresi. Semarang: Badan Penerbit Universitas Diponegoro.
Hidayat, A. (2014, July 17). Kruskall Wallis H. Retrieved Maret 20, 2015, from
www.statistikian.com: http://www.statistikian.com/2014/07/kruskall-wallis-h.html
Kelley, W. M., & Donnelly, R. A. (2009). The Humongous Book of Statistics Problems. USA:
Penguin Group.
Ltd, L. R. (n.d.). Chi Square Goodness of Fit Test in SPSS Statistics. Retrieved Juli 28, 2015,
from www.statistics.laerd.com: https://statistics.laerd.com/spss-tutorials/chi-square-goodness-of-
fit-test-in-spss-statistics.php
Putra, Z. (2012, Februari 23). Konsep Data Klasifikasi Jenis dan Macam Pembagian Data dalam
Statistik. Retrieved July 28, 2015, from http://www.scribd.com:
http://www.scribd.com/doc/101086535/Konsep-Data-Klasifikasi-Jenis-Dan-Macam-Pembagian-
Data-Dalam-Statistika#scribd
153
154
Santosa, P. B., & Ashari. (2005). Analisis Statistik dengan Microsoft Excel & SPSS. Yogyakarta:
Andi.
Santoso, S. (2011). Mastering SPSS Versi 19. Jakarta: PT Elex Media Komputindo.
Sekaran, U., & Bougie, R. (2013). Research Methods for Business. West Sussex: John Wiley &
Sons Ltd.
Suseno, B. (2013, April 18). Analisis chi square. Retrieved July 28, 2015, from Statisti Olah
Data: http://www.statistikolahdata.com/2013/04/analisis-chi-square.html
https://statistics.laerd.com/spss-tutorials/wilcoxon-signed-rank-test-using-spss-statistics.php
Black, K. (2013). Applied Business Statistics: Making Better Business Decisions. Hoboken, NJ:
John Wiley & Sons.
smartstat. (2010, Februari 20). Skala Pengukuran Variabel. Retrieved 5 20, 2016, from
www.smartstat.wordpress.com: https://smartstat.wordpress.com/2010/02/20/skala-
pengukuran-variabel/
www.organisasi.org. (2006, Juni 21). KLASIFIKASI, JENIS DAN MACAM DATA - PEMBAGIAN
DATA DALAM ILMU EKSAK SAINS STATISTIK / STATISTIKA. Retrieved 5 20, 2016,
from www.organisasi.org: http://www.organisasi.org/1970/01/klasifikasi-jenis-dan-
macam-data-pembagian-data-dalam-ilmu-eksak-sains-statistik-statistika.html