I
Tipe Data Statistik
Di dalam praktek data statistik tidak bisa dilepaskan dari data yang berupa
angka, baik itu dalam statistik deskriptif yang menggambarkan data, maupun
statistik inferensi yang melakukan analisis terhadap data. Namun sebenarnya
data dalam statistik juga bisa mengandung data non angka atau kualitatif. Pada
dasarnya data statistik ada empat didasarkan pada tingkat pengukirannya.
Data Nominal. Tipe data yang paling rendah dan hasil pengukurannya adalah
data kategori. Misalnya, nomor KTP, NPM, nomor punggung pemain bola, dan
sebagainya. Di sini, seorang pemain sepak bola misalnya, hanya mempunyai satu
nomor punggung tidak bisa lebih.
Data Ordinal. Pada data ordinal, ada data denga urutan yang lebih tinggi dan
urutan lebih rendah. Misal data tentang sikap seseorang terhadap produk
tertentu. Dalam pengukuran sikap konsumen, ada sikap yang ‘suka’, ‘tidak
suka’, ‘sangat tidak suka’, dan lainnya. Di sini data tidak bisa disamakan
derajatnya, dalam rati ‘suka’ dianggap lebih tinggi dari ‘tidak suka’, namun lebih
rendah dari ‘tidak suka’ dan lainnya. Namun data ordinal tidak bisa dilakukan
operasi matematika, misalnya jika ‘tidak suka’ sebagai 1, ‘suka’ adalah 2, dan
‘sangat suka’ adalah 3, maka tidak bisa dianggap 1+2=3, atau ‘tidak suka’
ditambah ‘suka’ menjadi ‘sangat suka’
Data interval. Data ini selain bisa bertingkat urutannya, juga urutannya tersebut
bisa dikuantitatifkan. Misalnya temretur suatu ruangan bisa bertingkat urutannya
cukup panas (50oC-80oC), panas (80oC-100oC), dan sangat panas (110oC-140oC). Di
sini data mempunyai jarak atau interval yang sama, yaitu 30 oC. Namun data
interval tidak mempunyai nilai nol absolut, sebagai contoh air membeku pada
suhu 0oC. Pernyataan ini bersifat relatif, karena 30oC hanya sebagai tanda saja.
Dalam pengukuran Fahrenheit, air membeku bukan pada 0oF, namun pada 32oF.
Data rasio. Data ini bersifat angka dalam arti sesungguhnya dan bisa
dioperasikan secara matematika (+, -, x, /). Data rasio mempunyai nilai nol yang
absolut. Misalnya suatu perusahaan roti memproduksi sejumlah nol, berarti
memang tidak ada sepotong roti yang diproduksi.
Jenis data yang digunakan dalam penelitian sangat menentukan jenis analisis
data yang akan digunakan. Perhatikan tabel berikut ini,
1
2
Statistik Deskriptif
Statistik deskriptif lebih berhubungan dengan pengumpulan dan peringkasan data, serta
penyajian hasil peringkasan tersebut. Data-data yang bisa diperoleh dari hasil sensus,
survei, atau pengamatan lainnya, umumnya masih acak, ‘mentah’ dan tidak terorganisir
dengan baik. Data tersebut harus diringkas dengan baik dan teratur, baik dalam bentuk
tabel atau persentasi grafis. Sebagai dasar untuk berbagai pengambilan keputusan
(statistik inferensi). Selain tabel dan grafik, untuk mengetahui deskripsi data diperlukan
ukuran yang lebih eksak, yaitu bisa disebut summary statistic (ringkasan statistik). Dua
ukuran penting yang sering dipakai dalam pengambilan keputusan adalah central
tendency (seperti mean, median dan modus) dan dispersi (seperti standard deviasi dan
varians).
Gambar 1-1
Kotak Dialog Frequencies
Pengisian:
Variabel(s). Nama variabel yang akan dibuat tabel. Sesuai kasus, masukkan variabel
Usia Responden (usia).
Klik pilihan Statistics, maka tampak di layar
3
Gambar 1-2
Kotak Dialog Statistics
Percentiles Value. Nama nilai persentile. Untuk keseragaman klik Quartiles dan
Percentile(s). Kemudian pada kotak di samping kanan Percentiles ketik 10, lalu
tekan Add. Sekali lagi ketik 90 pada kotak terdahulu, dan klik lagi tombol Add.
Pengerjaan ini dimaksudkan untuk membuat nilai persentil pada 10 dan 90.
Dispertion. Digunakan untuk melihat menyebaran data. Untuk keseragaman, pilih
keenam jenis pengukuran dispersi.
Central Tendency. Digunakan untuk mengukur pusat data. Pilih Mean dan Median.
Distribution. Digunakan untuk melihat distribusi data. Pilih Skewness dan Kurtosis.
Kemudian tekan Continue untuk kembali ke menu sebelumnya.
Chart Type. Jenis grafik yang akan dipilih. Untuk data kuantitatif (data interval dan
rasio) pilih Histogram dengan juga memilih With normal curve. Kemudian tekan
Continue untuk proses selanjutnya.
Order by. Untuk menentukan susunan data output. Pilih Ascending values (data
ditampilkan dari terkecil ke terbesar).
Abaikan bagian lain dan tekan Continue untuk kembali ke kotak dialog utama. Tekan
OK jika semua pengisian telah selesai
4
Output SPSS dan Analisis
Output:
Analisis:
Histogram
120
100
80
Frequency
60
40
20
Mean = 47.91
Std. Dev. = 16.334
0 N = 1,847
20 30 40 50 60 70 80 90
Usia reponden
5
Analisis:
Output pertama
N Valid atau jumlah data yang diproses (1847 buah), sedangkan data yang hilang
(missing) adalah nol.
Rata-rata usia adalah 47,91 tahun dengan standard error of mean sebesar 0,380.
Dengan tingkat kepercayaan 95% (SPSS sebagaian besar menggunakan angka ini
sebagai standar), rata-rata populasi usia responden menjadi:
Median atau titik tengah data jika semua data diurutkan adan dibagi dua sama
besar.
Penggunaan standar deviasi untuk menilai dispersi rata-rata dari sampel. Untuk
itu, dengan standar deviasi tertentu dan pada tingkat kepercayaan 95%, rata-rata
tinggi badan menjadi
Persentil atau angka persentil. Pensentil 10 artinya rata-rata usia 10% responden
di bawah 28 tahun. Sedangkan persentil 90 artinya rata-rata usia 90% responden di
bawah 72 tahun.
Output pertama
Bagian ini menggambarkan grafik data yang telah dibuat frekuensinya. Terlihat
grafik batang histogram mempunyai kemiripan dengan kurva normal. Artinya
bahwadistribusi data usia tersebut bisa dikatakan normal atau mendekati normal.
Namun pengujian normalitas bisa lebih jelas dilihat pada bagian berikut.
6
Pengisian:
Row. Pilih variabel Jenis Kelamin Responden (Gender).
Column(s). Pilih variabel Suara untuk Bush, Clinton dan Perot (Pres92).
Analisis Output:
7
Pada output ketiga mengukur hubungan diantara kedua variabel, dengan satu variabel
dependen (tergantung), sedangkan yang lain sebagai variabel independen (bebas).
Sebagai contoh besaran korelasi LAMBDA, symmetric atau kedua variabel setara
(bebas), maka besar korelasi adalah 0,015 atau sangat lemah. Angka signifikansi
adalah 0,119 atau di atas 0,05 yang berarti kedua variabel tidak berhubungan secara
nyata.
Contoh lain analisis Lambda dengan melihat angka sig. Jenis kelamin responden
(gender) sebagai variabel dependen dan variabel pres92 adalah variabel indepen.
Oleh karena angka signifikansi adalah 0,119 (lebih besar dari 0,05) manak pres92
tidak bisa digunakan untuk memprediksi gender.
Pertanyaan diskusi. Coba jelaskan arti besaran korelasi yang lain pada output ketiga
dengan pedoman yang sama.
8
Pertemuan
II
Outlier
.
Gambar I2-1
Kotak Dialog Descriptive
Pengisian:
Variabel(s). Nama variabel yang akan diuji. Sesuai kasus, masukkan variabel q1-q20.
Save standardized values as variables. Klik mouse pada kotak pilihan ini.
Kemudian Tekan tombol OK jika semua pengisian telah selesai, maka akan muncul
tampilan seperti di bawah ini. Tampak bahwa setiap variabel sudah mempunyai nilai
z-score, misalnya untuk x1 nilai Z-scorenya adalah Zx1 dan seterusnya.
9
Untuk memudahkan analisis lakukan pengujian ulang dengan memasukkan nilai z-
score dari masing-masing variabel ke dalam Variable(s) pada kotak dialog
Descriptive.
Analisis:
Dikatakan ada data yang outlier apabila ada nilai z-score yang lebih tinggi dari 3.
10
Normalitas
Prosedur ini bertujuan untuk menguji apakah suatu variabel mempunyai distribusi
normal atau tidak.
Gambar I2-2
Kotak Dialog Explore
Pengisian:
Dependent List. Varaibel-variabel yang akan diuji. Dalam kasus ini masukkan
variabel x1-k4.
Display. Pilihan output yang akan ditampilkan, yang bisa berupa output statistik atau
grafik (plot). Oleh karena hanya akan menguji normalitas data, pilih Plots.
Untuk itu klik tombol Plots… hingga tampil di layar seperti berikut.
11
Gambar I2-3
Kotak Dialog Bivariate Correlation Options
12
Analisis:
Nilai Kalmogorov-Smirnov mempunyai signifikansi <0,05, distribusi adalah tidak
normal (simetris).
Nilai Kalmogorov-Smirnov mempunyai signifikansi >0,05, distribusi adalah normal
(simetris).
Pada gambar Q-Q Plot, jika suatu distribusi data normal, data akan tersebar di
sekeliling garis dan mengikuti arah garis diagonal.
Pada gambar Detrended Normal Q-Q Plot, jika suatu distribusi data normal, data
akan terpola di sekitar garis.
Pertanyaan diskusi. Lakukan uji normalitas pada semua variabel. Apakah data
berdistribusi normal?
13
Validitas
Prosedur ini digunakan untuk mengukur sah atau valid tidaknya suatu kuesioner. Suatu
kuesioner dikatakan valid jika pertanyaan pada kuesioner mampu untuk mengungkapkan
sesuatu yang akan diukur oleh kuesioner tersebut. Medote untuk mengkur validitas yang
disediakan SPSS adalah Korelasi Product Moment dan Analisis Faktor.
Gambar I2-4
Kotak Dialog Factor Analysis
Pengisian:
Pada kotak VARIABLES, masukkan semua butir pertanyaan dari x1-x4.
Klik mouse pada pilihan Rotation, dan aktifkan Varimax, kemudian tekan Continue.
Abaikan bagian lain dan tekan OK.
Analisis Output:
Data dikatakan valid apabila nilai loading factor 0,5.
Pertanyaan diskusi. Lakukan uji validitas pada semua variabel. Apakah semua variabel
valid?
14
Reliabilitas
Reliabilitas sebenarnya adalah alat untuk mengukur suatu kuesioner yang merupakan
indikator dari variabel atau konstruk. Suatu kuesioner dikatakan reliebel atau handal
jika jawaban seseorang terhadap pertanyaan adalah konsisten atau stabil dari waktu ke
waktu. Metode yang disediakan dalam SPSS untuk menguji reliabilitas adalah Cronbach
Alpha.
Gambar I2-6
Kotak Dialog Reliability Analysis
Pengisian:
Pada kotak VARIABLES, masukkan butir-butir pertanyaan yang akan diuji. Misalnya
x1-x4.
Pada kotak Model pilih Alpha.
Klik kotak dialog List item labels
Klik mouse pada pilihan Statistics….
Pada bagian Descriptive for aktifkan Scale if item deleted, klik Continue dan OK.
Analisis Output:
Data dikatakan reliabel apabila nila α0,6.
Pertanyaan diskusi. Lakukan uji reliabilitas pada semua variabel. Apakah semua
variabel reliabel?
15
Pertemuan
III
Korelasi
Istilah korelasi benar-benar mengakar pada kosa kata kita. Setiap orang tahu bahwa
merokok dikorelasikan dengan kanker, perilaku pemungutan suara dikorelasikan dengan
pendidikan, dan mengenal orang yang tepat dikorelasikan dengan sukses. Dalam
penggunaan sehari-hari, korelasi hanya sebuah istilah yang tidak jelas yang
mengindikasikan beberapa bentuk hubungan. Di dalam statistik, korelasi mempunyai
definisi yang presisi. Analisis korelasi bertujuan untuk mengukur kekuatan asosiasi linier
antara dua variabel. Korelasi tidak menunjukkan hubungan fungsional. Dengan kata
lain, analisis korelasi tidak membedakan antara variabel dependen dengan variabel
indepenen.
Pada pertemuan ini, kita akan menggunakan prosedur Bivariate Correlation untuk
menghitung koefisien korelasi dan menguji hipotesis nol yang mempunyai koefisien
korelasi 0 dalam populasi. Kita juga akan mengunakan prosedur Partial Correlation
untuk menghitung koefisien korelasi antara dua variabel dengan melakukan kontrol efek
linier pada variabel lainnya.
Selum menghitung koefisien korelasi, saring data Anda dari outlier (yang dapat
menyebabkan hasil yang menyesatkan). Di samping itu data Anda harus menunjukkan
suatu hubungan yang linier.
Contoh-contoh
Anda ingin menentukan apakah ada hubungan antara penjualan dan jumlah rupiah
yang dikeluarkan untuk iklan. Untuk suatu produk tertentu tiap bulan, Anda catat
rupiah yang dikeluarkan untuk iklan dan penjualan dalam rupiah.
Anda ingin menentukan apakah kegemukan berubah seiring dengan usia. Anda ambil
sampel orang dewasa secara acak dan ukur kegemukan mereka dan catat usianya.
Anda ingin mempelajari hubungan antara pendidikan dan gaji pada kategori pekerjan
tertentu. Karena orang telah dibedakan berdasarkan pengalaman kerja, Anda ingin
menentukan koefisien korelasi antara pendidikan dan gaji, untuk mengontrol efek
linier pengalaman kerja.
Peringatan
Jangan pernah menghitung koefisien korelasi untuk untuk variabel-variabel nominal.
Sebagai contoh, tidak ada artinya sebuah korelasi antara nomor KTP dengan
pendapatan.
Sebuah koefisien korelasi tidak menceritakan kepada kita tentang hubungan sebab-
akibat antara variabel-variabel. Hanya karena dua variabel dikorelasikan tidak
berarti bahwa variabel menyebabkan yang lainnya.
Anda ingin menentukan apakah kegemukan berubah seiring dengan usia. Anda ambil
sampel orang dewasa secara acak dan ukur kegemukan mereka dan catat usianya.
16
Biavariate Correlations
Korelasi Bivariate menghitung koefisien korelasi Pearson, Spearman rho, dan Kendall
tau-b dengan tingkat signifikansi tertentu. Korelasi Pearson merupakan ukuran asosiasi
(hubungan) linier. Dua variabel bisa dikaitkan dengan sempurna, tetapi jika hubungan
tidak linier, koefisien korelasi Pearson bukan merupakan statistik yang tepat untuk
mengukur asosiasi tersebut.
17
Gambar 2-1
Kotak Dialog Bivariate Correlation
Pengisian:
Variabel. Pilih dua atau lebih variabel yang akan dikorelasikan. Dalam kasus ini
masukkan semua variabel
Correlation Coefficients. Untuk kuantitatif, variabel terdistribusi secara normal,
pilih koefisien korelasi Pearson. Jika data tidak terdistribusi secara normal atau
kategori, pilih Spearman’s rho dan Kendall’s tau-b. Karena data pada contoh di atas
adalah kuantitatif dan berskala rasio, maka pilih Pearson dan abaikan alat hitung
yang lain.
Test of Significance. Jika arah asosiasi sudah diketahui terlebih dahulu, pilih One-
tailed. Sebaliknya, pilih Two-tailed. Karena belum diketahui korelasi sebelumnya,
maka pilih Two-tailed.
Flag significant correlations. Berkenaan dengan tanda untuk tingkat signifikansi 5%
atau 10% akan ditampilkan pada output atau tidak. Koefisien korelasi signifikan pada
tingkat 5% ditandai dengan asterik tunggal (*), dan pada tingkat 10% ditandai dengan
dua asterik (**).
Kemudian klik mouse pada tombol Options hingga tampil di layar seperti berikut.
18
Gambar 2-2
Kotak Dialog Bivariate Correlation Options
19
Analisis:
Besaran angka. Angka korelasi berkisar antara 0 (tidak ada korelasi sama sekali)
dan 1 (korelasi sempurna). Pedoman sederhana, apabila angka korelasi di atas 0,5
menunjukkan korelasi yang cukup kuat, sedang di bawah 0,5 korelasi lemah.
Koefisien korelasi ditunjukkan pada baris Pearson Correlation.
Tanda korelasi. Tanda korelasi juga berpengaruh pada penafsiran hasil. Tanda
negatif (-) pada output menunjukkan adanya arah hubungan yang berlawanan,
sedangkan tanda positif (+) menunjukkan arah yang sama.
Seperti angka pada output antara tilang dengan motor yang menghasilkan angka -
0,195. Angka tersebut menunjukkan lemahnya korelasi antara pelanggaran (tilang)
dengan jumlah motor (di bawah 0,5). Sedang tanda ‘-‘ menunjukkan bahwa
semakin banyak motor maka semakin sedikit jumlah pelanggaran (tilang), dan
sebaliknya.
Signifikansi hasil korelasi. Angka Sig. (2-tailed) pada output digunakan untuk
menguji bahwa angka korelasi bisa digunakan untuk menjelaskan hubungan dua
variabel (signifikan). Dasar pengambilan keputusan:
Berdasarkan probabilitas.
Jika probabilitas>0.05, H0 diterima
Jika probabilitas<0.05, H0 ditolak
Pada baris Sig. (2-tailed) didapat serangkaian angka probabilitas. Terlihat
bahwa hanya ada satu pasangan data yang berkorelasi secara signifikan, yaitu
antara Mobil dan Tilang (probabilitas 0,015<0,05). Oleh karena itu disimpulkan
bahwa di antara empat variabel, yang berkorelasi secara signifikan hanya
variabel Mobil dengan Tilang.
20
Berdasarkan tanda * yang diberikan SPSS. Signifikan tidaknya korelasi dua
variabel bisa dilihat dari adanya tanda * pada pasangan data yang dikorelasikan
(lihat pilihan flag significant correlation pada proses perhitungan korelasi di
atas). Dengan cara ini diperoleh hasil yang sama.
Jumlah data yang berkorelasi. Informasi ini bisa diperoleh dengan
memperhatikan baris N pada output SPSS. Seperti telah dijelaskan di muka, hal ini
menunjukkan jumlah data yang dikorelasikan berkaitan dengan adanya data yang
hilang (missing value).
Pertanyaan Diskusi. Dengan cara yang sama, bagaimana jika pilihan adalah Exclude
Cases Listwise?
Latihan Kasus
Sebuah studi tentang “konstruksi tubuh” ingin mengetahui korelasi atau hubungan antara
berbagai lingkar bagian-bagian tubuh yang satu dengan lainnya. Karena, secara rata-
rata, orang yang kurus hampir semua lingkar bagian tubuhnya lebih kecil, sedangkan
orang yang lebih gemuk mempunyai hampir semua lingkar bagian tubuh yang lebih besar.
Gunakan file KonstruksiTubuh untuk menganalisis korelasi berikut syarat-syarat yang
harus dipenuhi untuk suatu analisis korelasi.
Sebuah studi tentang “konstruksi” tubuh, anda mungkin ingin tahu bagaimana hubungan
antara dua lingkar jika berat dianggap konstan.
21
Partial Correlations
Prosedur korelasi parsial menghitung koefisien korelasi yang menggambarkan hubungan
linier antara dua variabel sambil mengontrol efek satu atau lebih variabel tambahan.
Korelasi mengukur asosiasi linier. Dua variabel dapat berkaitan sempurna, tetapi jika
hubungan tidak linier, sebuah koefisien korelasi bukan statistik yang tepat untuk
mngukur hubungan tersebut.
22
Gambar 2-3
Kotak Dialog Bivariate Correlation Options
Pengisian:
Variabel. Pilih dua atau lebih variabel yang akan dikorelasikan. Dalam kasus ini
masukkan variabel prestasi dan motivasi.
Controlling for. Variabel yang dikeluarkan atau dikontrol. Dalam kasus ini masukkan
variabel iq.
Test of Significance. Jika arah asosiasi sudah diketahui terlebih dahulu, pilih One-
tailed. Sebaliknya, pilih Two-tailed. Karena belum diketahui korelasi sebelumnya,
maka pilih Two-tailed.
Flag significant correlations. Berkenaan dengan tanda untuk tingkat signifikansi 5%
atau 10% akan ditampilkan pada output atau tidak. Koefisien korelasi signifikan pada
tingkat 5% ditandai dengan asterik tunggal (*), dan pada tingkat 10% ditandai dengan
dua asterik (**).
Kemudian klik mouse pada tombol Options hingga tampil di layar seperti berikut.
Gambar 2-4
Kotak Dialog Bivariate Correlation Options
23
Statistics. Untuk keseragaman abaikan saja. Dalam kasus ini pilih Zero-order
correlations.
Missing Value. Bisa dipilih salah satu dari pilihan berikut:
Exclude cases pairwise. Pasangan yang salah satu missing value (tidak ada
datanya) tidak dimasukkan ke dalam analisis. Misal korelasi antara variabel tilang
dengan motor, maka kasus nomor 7 yang hilang dari tilang mengakibatkan korelasi
hanya untuk 9 data (kasus nomor 7 dihilangkan). Namun untuk korelasi variabel
mobil dan motor, karena ada 2 data yang hilang, maka korelasi hanya 8 data.
Dengan demikian pilihan pairwise mengakibatkan jumlah data tiap korelasi
bervariasi, tergantung jumlah data yang hilang (jika ada).
Exclude cases listwise. Data yang salah satu variabelnya ada missing value (tidak
ada datanya) tidak dimasukkan ke dalam analisis. Di sini jumlah data untuk
seluruh korelasi sama, sehingga yang dibuang adalah kasus yang salah satu
variabelnya terdapat data yang hilang. Dalam kasus di atas, terlihat kasus nomor
5, 7 dan 8 terdapat data yang hilang, maka tiga kasus tersebut dikeluarkan
(exclude), sehingga jumlah kasus (cases) menjadi hanya 10-3=7.
Untuk keseragaman, akan digunakan pilihan Exclude cases pairwise, karena itu klik
pada piliha tersebut. Tekan Continue jika selesai. Kemudian tekan OK untuk
mengakhiri pengisian prosedur analisis.
24
Analisis:
Bagian pertama ouput adalah zero order partial, karena belum dilakukan korelasi
parsial. Sedang bagian output kedua, sudah dikalukan korelasi parsial. Di sini
karena jumlah variabel kontrol adalah satu (iq), maka disebut first-order partial.
Pada zero order partial (tanpa ada variabel kontrol), didapat koefisien korelasi
antara prestasi dengan motivasi sebesar 0,665. Sedangkan angka df adalah derajat
bebas, yaitu n-2, atau karena jumlah data 9, maka df=9-2=7.
Latihan Kasus
Pada contoh kasus “konstruksi” tubuh, ingin diketahui korelasi antar lingkar bagian
tubuh jika berat dianggap konstan. Gunakan file KonstruksiTubuh untuk menganalisis
korelasi parsial berikut syarat-syarat yang harus dipenuhi untuk suatu analisis korelasi.
25
Pertemuan
IV
T Test
Ada tiga bentuk t test yang tersedia:
Independent-sample t test (two sample t test). Membandingkan rata-rata satu variabel
dari dua kelompok sampel. Pada prinsipnya tujuan uji dua sampel adalah ingin
mengetahui apakah ada perbedaan rata-rata (mean) antara dua populasi, dengan
melihat rata-rata dua sampelnya.
Paired-sample t test (dependent t test). Membandingkan rata-rata dua variabel dari
sebuah kelompok sampel. Uji ini digunakan untuk menguji sebuah sampel dengan
subyek yang sama namun mengalami du perlakuan atau pengukuran yang berbeda.
One-sample t test. Pengujian satu sampel dengan cara membandingkan rata-rata
sebuah variabel dengan suatu nilai tertentu untuk diketahui apakah ada perbedaan atau
tidak.
26
One-Samples T Test
Prosedur Independent-Samples T Test menguji apakah rata-rata sebuah variabel tunggal
berbeda dari suatu konstanta spesifik tertentu.
Gambar 1-1
Kotak Dialog One-Sample T Test
27
Pengisian:
Test Variabel(s). Nama variabel yang akan diuji. Dalam kasus ini masukkan variabel
berat.
Test Value. Nilai yang akan diuji, karena akan diuji nilai hipotesis 70 kg, maka ketik
70. Tekan Continue jika pengisian selesai.
Output:
Analisis:
Output pertama
Pada bagian ini terlihat ringkasan statistik dari variabel berat. Rata-rata berat badan
sampel adalah 58,007 kg.
Output kedua
Hipotesis untuk kasus ini:
H0 = rata-rata berat badan sampel sampel tidak berbeda dengan rata-rata berat
badan populasi (70 kg).
H1 = rata-rata berat badan sampel sampel berbeda dengan rata-rata berat badan
populasi (70 kg).
Pengambilan keputusan
Berdasarkan nilai t hitung
Jika t hitung < t tabel, H0 diterima
Jika t hitung > t tabel, H0 ditolak
Keputusan:
T tabel dilihat pada tabel distribusi t dengan tingkat signifikansi 5%, df=n-1= 10-1=9,
maka diperoleh nilai t tabel sebesar 2,262. Oleh karena t hitung (-12,545)<2,262,
maka H0 diterima. Sehingga dapat disimpulkan bahwa rata-rata berat badan sampel
sama dengan rata-rata berat badan populasi. Atau dengan kata lain rata-rata berat
populasi adalah 70 kg
Keputusan:
Karena probabilitas adalah 0,000 < 0,005 maka H0 ditolak, atau berat badan sampel
berbeda dengan rata-rata berat badan populasi.
28
Paired Samples T Test
Prosedur Paired-Samples T Test digunakan untuk menguji apakah dua populasi
mempunyai rata-rata yang sama. Data berupa dua pengukuran dari pasangan orang atau
obyek yang serupa pada hal-hal tertentu.
Contoh-contoh. Kita akan mengobservasi orang yang sama sebelum dan sesudah
perlakuan atau kita akan membedakan antara manajer dan non manajer. Setiap “kasus”
pada data ini mewakili pasangan dari sebuah observasi.
Gambar 1-1
Kotak Dialog Paired-Samples T-Test
29
Pengisian:
Paired Variables. Nama pasangan variabel yang akan diuji. Dalam kasus ini masukkan
variabel sebelum dan sesudah.
Tekan OK jika pengisian selesai.
Output:
Analisis:
Output pertama
Pada bagian pertama terlihat ringkasan statistik dari kedua sampel. Berat badan
rata-rata sebelum minum obat 84,51 kg, sedangkan setelah minum obat berat badan
rata-rata menjadi 83,309 kg.
Output kedua
Bagian kedua output adalah hasil korelasi antara kedua varaibel, yang menghasilkan
angka 0,943 dengan nilai probabilitas jauh di bawah 0,05. Hal ini menyatakan bahwa
korelasi antara berat sebelum dan sesudah minum obat adalah sangat erat dan benar-
benar berhubungan secara nyata.
Output ketiga
Hipitesis:
H0 = Kedua rata-rata berat badan sebelum dan sesudah minum obat adalah sama.
H1 = Kedua rata-rata berat badan sebelum dan sesudah minum obat adalah berbeda.
Pengambilan keputusan
Berdasarkan nilai t hitung
Jika t hitung < t tabel, H0 diterima
Jika t hitung > t tabel, H0 ditolak
Keputusan:
30
T tabel dilihat pada tabel distribusi t dengan tingkat signifikansi 5%, df=n-1= 10-1=9,
maka diperoleh nilai t tabel sebesar 2,262. Oleh karena t hitung (1,646)<2,262, maka
H0 diterima. Sehingga dapat disimpulkan bahwa rata-rata berat badan sebelum
minum dan sesudah minum obat adalah sama. Maka dapat disimpulkan bahwa
penggunaan obat tersebut tidak efektif untuk menurunkan berat badan.
Berdasarkan probabilitas
Jika probabilitas > 0,05, H0 diterima.
Jika probabilitas < 0,05, H1 ditolak.
Keputusan:
Karena probabilitas adalah 0,134 > 0,005 maka H0 diterima, atau rata-rata berat
badan sebelum dan sesudah minum obat relatif sama.
31
Independent Samples T Test
Prosedur indepenent-samples T Test membandingkan rata-rata dua kelompok kasus.
Pada prinsipnya tujuan uji ini adalah untuk mengetahui apakah ada perbedaan rata-rata
dua populasi berdasarkan atau dengan melakukan pengamatan terhadap dua sampel.
Contoh-contoh. Kita akan membanding dua merode pengajaran. Satu kelompok siswa
diajar dengan metode yang satu, sementara kelompok yang lain diajar dengan metode
yang lain. Di akhir perkuliahan akan diuji hipotesis nol bahwa nilai skor rata-rata
populasi adalah sama.
Gambar 1-1
Kotak Dialog Paired-Samples T-Test
32
Pengisian:
Test Variable(s). Nama pasangan variabel yang akan diuji. Dalam kasus ini masukkan
variabel tinggi dan berat.
Grouping Variable. Variabel yang digunakan untuk mengelompokkan. Oleh karena
variabel pengelompokkan ada pada gender, maka masukkan variabel gender.
Gambar 1-2
Kotak Dialog Define Groups
Analisis:
Output pertama
Pada bagian pertama terlihat ringkasan statistik dari kedua sampel.
Output kedua
Contoh untuk tinggi badan
Pertama menganalisis penggunaan F test, untuk menguji apakah ada kesamaan
varians pada data pria dan wanita
Hipotesis:
33
H0 = Varian populasi tinggi badan pria dan wanita adalah sama.
H1 = Varian populasi tinggi badan pria dan wanita adalah tidak sama.
Pengambilan keputusan
Berdasarkan probabilitas
Jika probabilitas > 0,05, H0 gagal ditolak.
Jika probabilitas < 0,05, H0 ditolak.
Keputusan:
Terlihat bahwa F hitung untuk tinggi badan dengan Equal variance assumed adalah
5,475 dengan probabilitas 0,037. Oleh karena probabilitas <0,05 maka H0 ditolak,
atau kedua varian benar-benar berbeda. Sehingga yang digunakan adalah Equal
variance not assumed
Selanjutnya dilakukan analisis dengan memakai t test untuk asumsi varian tidak sama.
Keputusan:
Terlihat bahwa t hitung untuk tinggi badan dengan Equal variance not assumed
adalah 5,826 dengan probabilitas 0,001. Oleh karena probabilitas <0,05 maka H0
ditolak, atau kedua varian benar-benar berbeda. Artinya bahwa pria mempuyai rata-
rata tinggi badan yang lebih dari wanita.
34
Pertemuan
V
One-Way ANOVA
Prosedur Independent-Samples T Test menguji rata-rata dari kelompok sampel yang
lebih dari dua. Sedangkan esensi pengujiannnya sama dengan uji t.
35
Gambar 1-1
Kotak Dialog One-way ANOVA
Pengisian:
Dependent List. Nama variabel dependen yang akan diuji. Dalam kasus ini masukkan
variabel produk.
Factor. Variabel yang digunakan sebagai peneglompok. Masukkan variabel shift.
Tekan Continue jika pengisian selesai.
Gambar 1-2
Kotak Dialog One-way ANOVA: Options
Gambar 1-3
Kotak Dialog One-way ANOVA: Options
36
Post-Hoc merupakan analisis lanjutan dari F test, dengan mengklik mouse pada kotak
dialog One-way ANOVA: Options
Untuk analisi lanjutan pilih Bonferroni dan Tukey. Kemudian tekan Continue.
Kemudian tekan OK untuk mengakhiri prosedur.
Output:
37
Analisis:
Output pertama
Pada bagian pertama terlihat ringkasan statistik dari keempat sampel. Sebagai
contoh deskripsi dari kelompok kerja shif 1:
Rata-rata produktivitas adalah 35,58 unit
Produk minimum adalah 32 unit dan maksimum adalah 32 unit dan maksimum 39 unit.
Dengan tingkat kepercayaan 95% atau signifikansi 5%, rata-rata produk ada pada
range 33,88 unit sampai 37,29 unit.
Demikian juga untuk data ynag lain. Uji ANOVA ingin melihat apakah rata-rata
keempat sampel berasal dari populasi yang sama, dengan asumsi varian keempat
sampel adalah sama.
Output kedua
Analisis ini ingin menguji berlaku tidaknya asumsi untuk ANOVA, yaitu apakah
keempat sampel mempunyai varian yang sama.
Hipotesis:
H0 = Varian populasi adalah sama.
H1 = Varian populasi adalah tidak sama.
Pengambilan keputusan
Berdasarkan probabilitas
Jika probabilitas > 0,05, H0 diterima.
Jika probabilitas < 0,05, H0 ditolak.
Keputusan:
Terlihat bahwa Levene test hitung adalah 1,173 dengan probabilitas 0,331. Oleh
karena probabilitas > 0,05 maka H0 diterima, atau keempat varian populasi adalah
sama. Hal ini menyalahi asumsi ANOVA bahwa semua varian populasi harus sama!
Output ketiga
Setelah keempat varian terbukti sama, baru dilakukan uji ANOVA untuk menguji
apakah keempat sampel mempunyai rata-rata yang sama.
Hipotesis:
H0 = Keempat rata-rata populasi adalah sama.
H1 = Keempat rata-rata populasi adalah tidak sama.
Berdasarkan probabilitas
Jika probabilitas > 0,05, H0 diterima.
Jika probabilitas < 0,05, H0 ditolak.
Keputusan:
38
Terlihat bahwa F hitung adalah 44, 861 probabilitas 0,000. Oleh karena probabilitas <
0,05 maka H0 dtolak, atau rata-rata produksi keempat kelompok shift tersebut
memang berbada.
Output keempat
Setelah diketahui bahwa ada perbedaan yang signifikan di antara keempat kelompok
shift yang berbeda dan mana yang tidak berbeda? Masalah ini akan dibahas pada
analisis Bonferroni dan Tukey dalam post hoc test berikut.
Sebagai contoh, lihat baris pertama hasil uji Tukey-HSD yang menguji perbedaan
antara Shift 1 dan Shift 2.
Hipotesis:
H0 = Keempat rata-rata populasi adalah sama.
H1 = Keempat rata-rata populasi adalah tidak sama.
Berdasarkan probabilitas
Jika probabilitas > 0,05, H0 diterima.
Jika probabilitas < 0,05, H0 ditolak.
Keputusan:
Terlihat bahwa bahwa nilai probabilitas adalah 0,001. Oleh karena probabilitas<0,05,
maka H0 ditolak. Atau dengan kata lain perbedaan rata-rata produktivitas Shift 1 dan
Shift 2 benar-benar nyata.
Catatan: Hasil uji signifikansi dengan mudah dapat dilihat pada output dengan ada
atau tidaknya tanda ‘*’ pada kolom ‘Mean Difference’. Jika tanda * ada di angka
Mean Difference atau perbedaan rata-rata, perbedaan tersebut nyata atau signifikan.
Jika tidak ada tanda *, maka perbedaan tidak signifikan.
Jika hasil tes Tukey dan Bonferroni untuk menguji kelompok mana saja yang memiliki
perbedaan nyata, maka dalam Homogenous Subset justru akan dicari grup/subset
mana saja yang mempunyai perbedaan rata-rata yang tidak berbeda secara signifikan.
Sebagai contoh pada subset 3, terlihat grup dengan anggota kelompok kerja shift 2
dan 3. Dengan kata lain, dapat dikatakan bahwa kedua kelompok ini tidak punya
perbedaan yang signifikan satu dengan yang lain.
39
Gambar 1-1
Kotak Dialog Univariate
Pengisian:
Dependent Variable. Nama variabel dependen yang akan diuji. Dalam kasus ini
masukkan variabel produk.
Fixed Factor(s). Variabel yang digunakan sebagai pengelompok. Oleh karena
variabel pengelompok ada gender dan shift, maka masukkan kedua variabel tersebut
sebagai Fixed Factor(s). Tekan OK jika pengisian selesai.
Output:
40
Output pertama
Bagian pertama adalah ringkasan data yang diproses.
Output kedua
Uji ini bertujuan untuk mengetahui apakah ada hubungan yang signifikan antara dua
faktor, dalam kasus ini akan diuji apakah data interaksi antara kelompok kerja shift
dengan kelompok gender.
Terlihat bahwa F hitung adalah 0,634 dengan probabilitas 0,598. Oleh karena
probabilitas>0,05, maka H0 diterima atau tidak ada interaksi antara kelompok
kerja shift dengan kelompok gender.
41
Pertemuan
VI
Linieritas
Prosedur ini digunakan untuk melihat apakah spesifikasi model yang digunakan sudah
benar atau tidak. Apakah fungsi yang digunakan dalam suatu studi empiris sebaiknya
berbentuk linier, kuadrat atau kubik.
Gambar I2-2
Kotak Dialog Explore
42
Pengisian:
Dependent List. Varaibel-variabel yang akan diuji. Dalam kasus ini masukkan
variabel x1-k4.
Display. Pilihan output yang akan ditampilkan, yang bisa berupa output statistik atau
grafik (plot). Oleh karena hanya akan menguji normalitas data, pilih Plots.
Untuk itu klik tombol Plots… hingga tampil di layar seperti berikut.
Gambar I2-3
Kotak Dialog Bivariate Correlation Options
43
Analisis:
Nilai Kalmogorov-Smirnov mempunyai signifikansi <0,05, distribusi adalah tidak
normal (simetris).
Nilai Kalmogorov-Smirnov mempunyai signifikansi >0,05, distribusi adalah normal
(simetris).
Pada gambar Q-Q Plot, jika suatu distribusi data normal, data akan tersebar di
sekeliling garis dan mengikuti arah garis diagonal.
Pada gambar Detrended Normal Q-Q Plot, jika suatu distribusi data normal, data
akan terpola di sekitar garis.
44
Regresi
Analisis Regresi digunakan terutama untuk tujuan peramalan, di mana dalam
model tersebut ada variabel dependen (tergantung) dan variabel independen
(bebas). Di dalam analisis regresi, selain mengukur kekuatan hubungan antara
dua variabel atau lebih, juga menunjukkan arah hubungan antara variabel
dependen dan independen. Dalam praktek, regresi sering dibedakan antara
regresi sederhana dan regresi berganda. Disebut regresi sederhana (simple
regression) jika hanya ada satu variabel independen, sedangkan disebut regresi
berganda (multiple regression) jika ada lebih dari satu variabel independen.
Gambar 1-1
Kotak Dialog Linier Regression
45
Pengisian:
Independent (s). Nama variabel terikat (dependent). Dalam kasus ini masukkan
variabel AF, JA, EM, RE, dan DT.
depenent(s). Nama variabel bebas (independent). Dalam kasus ini masukkan
variabel KE
Kemudian klik mouse pada tombol Statistics… hingga tampil di layar seperti berikut.
Gambar 1-2
Kotak Dialog Linier Regression: Statistics
Kemudian klik mouse pada tombol Plots… hingga tampil di layar seperti berikut.
Gambar 1-3
Kotak Dialog Linier Regression: Plots
46
Untuk menguji asumsi klasik heteroskedastisitas. Masukkan variabel SRESID pada
kotak pilihan Y dan masukkan variabel ZPRED pada kotak pilihan X.
Untuk menguji asumsi normalitas. Aktifkan pilihan Histogram dan Normal
probability plot pada kotak pilihan Standardized Residual Plots. Tekan Continue
dan abaikan pilihan yang lainnya.
47
48
Analisis:
Uji Autokorelasi (untuk data time series). Ada tidaknya autokorelasi pada
persamaan regresi bis adiuji dengan Uji Durbin Watson Test (DW Test). Lihat
output pertama ada kolom Durbin-Watson. Pengambilan keputusan ada tidaknya
autokorelasi:
du<DW<(4-du), berarti tidak ada autokorelasi.
DW<dl, berarti ada autokorelasi positif.
DW>(4-dl), berarti ada autokorelasi negatif.
dl<DW<du atau (4-dl)<DW<(4-du), maka tidak dapat disimpulkan.
Hasil analisis menunjukkan nilai DW sebesar 1,660, nilai ini dibandingkan dengan
DW Tabel pada tingkat kepercayaan 5%, jumlah sampel 100 dan jumlah variabel
bebas 5, maka akan diperoleh dl=1,5710 dan du 1,7804.
Kesimpulan, karena nilai DW diantara dl dan du berarti tidak dapat disimpulkan.
Uji Linieritas. Untuk melihat apakah antara variabel bebas dan terikat
mmepunyai pengaruh secara linier, maka perlu diuji linieritas, yang salah satunya
bisa digunakan Uji Durbin-Watson. Keputusan, apabila nilai DW menunjukkan
adanya autokorelasi positif, maka pengaruh antara variabel bebas dan terikat tidak
linier.
Uji Heteroskedastisitas. Uji ini bertujuan untuk mengetahui apakah dalam model
regresi terjadi ketidaksamaan varians dari residual antara satu pengamatan dengan
pengamatan yang lain. Jika varian antara satu pengamatan dengan pengamatan
yang lain tetap, maka disebut homoskedastisitas, jika berbeda disebut
heteroskedastisitas. Untuk menguji heteroskedastisitas bisa dilihat dari scatter
plot antara *SRESID dan *ZRESID. Hasil analisis menunjukkan bahwa data menyebar
secara acak, sehingga dapat disimpulkan terjadi heteroskedastisitas.
Uji Multikolinieritas. Uji ini bertujuan untuk menguji apakah ada korelasi antar
variabel bebas. Pengujian bisa dilakukan dengan mengamati nilai VIF. Apabila
VIF>10 maka persamaan regresi terdapat multikolinieritas.
49
dependen. Oleh karena itu banyak peneliti yang menggunakan Adjusted R square.
ANOVA. Dari uji ANOVA atau F test, diperoleh F hitung adalah 14,829 dengan
tingkat signifikansi 0.000. Oleh karena probabilitas jauh lebih kecil dari 0,05,
maka model regresi bisa dipakai untuk memprediksi KE.
Coefficiens. Tabel ini menggambarkan persamaan regresi:
KE = -1,394 + 0,262AF + 0,760RE + 0,312DT - 0,353JA + 0,09EM.
Konstanta sebesar -1,394 menyatakan jika tidak ada AF, RE, DT, JA, dan EM, maka
KE adalah -1,394
Koefisien regresi sebesar 0,262 menyatakan bahwa setiap penembahan (karena
tanda +) 1% AF akan meningkatkan KE sebesar 0,262%, Namun sebaliknya jika AF
turun 1% maka KE juga kan turun sebesar 0,262%. Jadi tanda + hanya menunjukkan
arah hubungan yang searah.
Uji t. Digunakan untuk menguji signifikansi koefisien regresi dari variabel AF, RE,
DT, JA, dan EM. Di sini akan diberikan contoh pengujian koefisien regresi dengan
mengamati angka probabilitas.
Pengambilan keputusan
Jika probabilitas > 0,05, H0 diterima.
Jika probabilitas < 0,05, H0 ditolak.
Keputusan.
Terlihat pada kolom Sig. adalah 0,00, atau probailitas jauh di bawah 0,05. Maka
H0 ditolak, atau koefisien regresi signifikan, atau RE benar-benar berpengaruh
secara signifikan terhadap KE.
50