Anda di halaman 1dari 170

Belajar Statistika dari Nol dengan SPSS

Statistika adalah ilmu yang sangat penting.


Dengan statistika, kita bisa mengolah data
dan mengekstrak informasi dari data tersebut.

om
Dengan menggunakan alat bantu software SPSS,

t.c
belajar statistika menjadi lebih mudah.

po
gs
lo
Buku ini menjelaskan bagaimana belajar statistika

Edy Winarno ST, M.Eng, Ali Zaki, & SmitDev Community

.b
menggunakan alat bantu SPSS. Anda akan

do
in
dipandu mulai dari pemahaman dasar-dasar

a-
statistika. Selanjutnya, Anda akan mengenal

ak
statistik deskriptif, probabilitas, dan statistik

st
pu
parametrik.

Cara Praktis untuk Pemula Menguasai Statistika dan SPSS


Kelompok ISBN 978-602-02-3130-3
Apl. Perkantoran
Keterampilan
Tingkat Pemula
Tingkat Menengah
PT ELEX MEDIA KOMPUTINDO Tingkat Mahir
Kompas Gramedia Building Jenis Buku
Jl. Palmerah Barat 29-37, Jakarta 10270 Referensi
Telp. (021) 53650110-53650111, Ext 3214 Tutorial 121140224
Webpage: http://elexmedia.co.id Latihan

cover.indd 1 21/01/2014 14:53:13


Belajar Statistika dari Nol
dengan SPSS

om
t.c
po
gs
lo
.b
do
in
a-
ak
st
pu
Sanksi Pelanggaran Pasal 72
Undang-Undang Nomor 19 Tahun 2002
Tentang HAK CIPTA

1. Barangsiapa dengan sengaja dan tanpa hak melakukan perbuatan


sebagaimana dimaksud dalam Pasal 2 Ayat (1) atau Pasal 49 Ayat (1) dan
Ayat (2) dipidana dengan pidana penjara masing-masing paling singkat 1
(satu) bulan dan/atau denda paling sedikit Rp1.000.000 (satu juta rupiah),
om
atau pidana penjara paling lama 7 (tujuh) tahun dan/atau denda paling
t.c
banyak Rp5.000.000.000 (lima miliar rupiah).
po

2. Barangsiapa dengan sengaja menyiarkan, memamerkan, mengedarkan, atau


menjual kepada umum suatu ciptaan atau barang hasil pelanggaran hak cipta
gs

atau hak terkait sebagai dimaksud pada Ayat (1) dipidana dengan pidana
lo

penjara paling lama 5 (lima) tahun dan/atau denda paling banyak


.b

Rp500.000.000 (lima ratus juta rupiah).


do
in
a-
ak
st
pu
Belajar Statistika dari Nol
dengan SPSS

Edy Winarno ST, M.Eng


Ali Zaki
SmitDev Community

PENERBIT PT ELEX MEDIA KOMPUTINDO


Belajar Statistika dari Nol dengan SPSS

Edy Winarno ST, M.Eng


Ali Zaki
SmitDev Community
2014, PT Elex Media Komputindo, Jakarta
Hak cipta dilindungi undang-undang
Diterbitkan pertama kali oleh
Penerbit PT Elex Media Komputindo
Kelompok Gramedia, Anggota IKAPI, Jakarta 2014

nkfadli@elexmedia.co.id

121140224
ISBN: 978-602-02-3130-3

Dilarang keras menerjemahkan, memfotokopi, atau memperbanyak sebagian


atau seluruh isi buku ini tanpa izin tertulis dari penerbit.

Dicetak oleh Percetakan PT Gramedia, Jakarta


Isi di luar tanggung jawab percetakan
Kata Pengantar

Statistika adalah ilmu yang sangat penting. Dengan statistika, kita bisa
mengolah data dan mengekstrak informasi dari data tersebut. Dengan
menggunakan alat bantu seperti software SPSS, belajar statistika menjadi
lebih mudah.
Buku ini menjelaskan bagaimana belajar statistika dengan SPSS. Anda akan
dipandu mulai dari pemahaman dasar-dasar statistika. Selanjutnya, Anda
akan mengenal statistik deskriptif, probabilitas, dan statistik parametrik.
om
Penulis menyadari bahwa buku ini tidak luput dari kesalahan dan masih jauh
t.c
dari sempurna. Untuk itu, penulis membuka diri untuk segala bentuk
po

tanggapan dan pertanyaan pembaca berkaitan dengan buku ini. Untuk


berkonsultasi secara langsung dengan penulis, silakan layangkan email ke
gs

winarno@smitdev.com atau ali@smitdev.com.


lo
.b
do

Semarang, Desember 2013


in
a-
ak
st

Edy Winarno ST, M.Eng


pu

Ali Zaki
SmitDev Community

v
Daftar Isi

Kata Pengantar ........................................................ v


Daftar Isi ................................................................. vi

Bab 1 Pendahuluan .................................................. 1


1.1 Taksonomi Statistik ................................................................................................ 2
1.2 Dasar-Dasar di Statistik ......................................................................................... 2
1.3 Menginstal dan Mengenal Antarmuka SPSS ........................................................ 6
1.4 Membuka dan Menyimpan File di SPSS ........................................................... 16

Bab 2 Distribusi Frekuensi dan Statistik Deskriptif


Lainnya ........................................................ 19
2.1 Distribusi Frekuensi ............................................................................................. 20
2.2 Tendensi Sentral dari Data Tidak Berkelompok................................................. 22
2.2.1 Mean ................................................................................................................... 23
2.2.2 Median ................................................................................................................... 24
2.2.3 Modus (Mode) .......................................................................................................... 24
2.2.4 Pengukuran Posisi .................................................................................................... 25
2.3 Persebaran Data Tidak Berkelompok .................................................................. 25
2.3.1 Range ................................................................................................................... 25
2.3.2 Deviasi Rata-Rata Populasi ...................................................................................... 26
2.3.3 Variansi Populasi dan Standar Deviasi ................................................................... 26
2.4 Tendensi Sentral Data Kelompok ........................................................................ 27
2.4.1 Mean Kelompok ........................................................................................................ 28
2.4.2 Median Kelompok ...................................................................................................... 28
2.4.3 Modus Kelompok ...................................................................................................... 28
2.5 Skewness .............................................................................................................. 29
2.6 Statistik Deskriptif dengan SPSS ........................................................................ 30

Bab 3 Pengenalan Probabilitas .............................. 53


3.1 Pembagian Probabilitas........................................................................................ 53
3.2 Aturan-Aturan Probabilitas ................................................................................... 54
3.2.1 Aturan Perkalian ........................................................................................................ 55

vi
3.2.2 Teorema Bayes.......................................................................................................... 57
3.2.3 Menghitung Total Kemungkinan Kejadian ............................................................... 57
3.2.4 Permutasi................................................................................................................... 58
3.2.5 Kombinasi .................................................................................................................. 58
3.3 Distribusi Probabilitas Diskrit.............................................................................. 59
3.3.1 Distribusi Binomial.................................................................................................... 59
3.3.2 Tabel Binomial .......................................................................................................... 61
3.3.3 Distribusi Poisson ..................................................................................................... 61
3.4 Menggunakan SPSS untuk Mencari Nilai Probabilitas Binomial
dan Poisson ......................................................................................................... 63
3.5 Distribusi Probabilitas Normal ............................................................................ 67
3.5.1 Standar Deviasi ......................................................................................................... 68
3.5.2 Distribusi Normal Standar........................................................................................ 68
3.5.3 Ringkasan Masalah di Distribusi Probabilitas Normal ........................................... 72
3.5.4 Mengetahui Nilai Z dari Sebuah Data di SPSS..................................................... 72
3.6 Sampling dan Distribusi Sampling dari Mean................................................... 75
3.6.1 Probabilitas Sampling ............................................................................................... 75
3.6.2 Error Sampling dan Error Nonsampling ................................................................. 76
3.6.3 Distribusi Sampling dari Mean ................................................................................ 76
3.6.4 Teorema Batas Sentral ............................................................................................. 79
3.6.5 Estimasi Interval........................................................................................................ 80
3.6.6 Estimasi Proporsi Populasi ...................................................................................... 80
3.6.7 Menentukan Ukuran Sampel .................................................................................... 82
3.7 Panduan Lengkap Perhitungan Probabilitas Multi Distribusi dengan Compute
Variable ................................................................................................................ 84
3.7.1 Probabilitas Normal .................................................................................................. 95
3.7.2 Probabilitas Distribusi T........................................................................................... 99
3.7.3 Probabilitas Distribusi Chi Square ........................................................................ 102
3.7.4 Probabilitas Distribusi F ......................................................................................... 104
3.8 Mengecek Normalitas Variabel Random secara Grafis .................................... 107

Bab 4 Statistik Parametrik.................................... 127


4.1 Pengujian Hipotesis Sampel Besar ................................................................... 127
4.1.1 Level Signifikansi .................................................................................................... 128
4.1.2 Pengujian Satu Sampel Satu Sisi ......................................................................... 130
4.1.3 Pengujian Satu Sampel Dua Sisi .......................................................................... 131
4.1.4 Uji Hipotesis Populasi Independen ........................................................................ 132
4.2 Pengendalian Kualitas Statistik .......................................................................... 132
4.2.1 Grafik Pengendalian Kualitas .................................................................................. 133
4.2.2 Grafik X Bar............................................................................................................ 133
4.2.3 Grafik R ................................................................................................................. 135
4.2.4 Grafik P ................................................................................................................. 135
4.2.5 Membuat X Bar Chart dengan SPSS ................................................................... 136
4.2.6 Membuat P Chart dengan SPSS ........................................................................... 142

vii
4.3 T-Test .............................................................................................................. 146
4.3.1 Asumsi Distribusi T................................................................................................ 147
4.3.2 One-sample t-test.................................................................................................... 147
4.3.3 Independent two-sample t-test............................................................................... 148
4.3.4 Independent-Samples T Test dengan SPSS ......................................................... 149
4.3.5 Paired Sample T Test ............................................................................................ 154

Tentang Penulis .................................................... 157

om
t.c
po
gs
lo
.b
do
in
a-
ak
st
pu

viii
BAB Pendahuluan
1

Statistika adalah sebuah ilmu yang sangat menarik, dan diperlu-


kan oleh banyak kalangan. Statistika adalah ilmu yang berkaitan
dengan pengolahan data. Istilah 'statistika' (bahasa Inggris:
statistics) berbeda dengan 'statistik' (statistic). Tapi, pada buku ini
pengertian statistika atau statistik dianggap sama, karena
relevansinya tidak terlalu penting bagi pembaca pada umumnya.
Statistika merupakan ilmu yang berkenaan dengan data, sedang
statistik adalah data, informasi, atau hasil penerapan algoritma
statistika pada suatu data.
Statistik sangat luas cakupannya, kita akan belajar dari dasar
hingga menengah mengenai statistik menggunakan alat bantu
SPSS. Statistik banyak diterapkan dalam berbagai disiplin ilmu,
baik ilmu-ilmu alam (seperti astronomi dan biologi) maupun ilmu-
ilmu sosial (termasuk sosiologi dan psikologi), dan dapat pula di
bidang bisnis, ekonomi, dan industri.
Statistika juga digunakan dalam pemerintahan untuk berbagai
macam tujuan; sensus penduduk merupakan salah satu prosedur
yang paling dikenal. Aplikasi statistika lainnya yang sekarang
popular adalah prosedur jajak pendapat atau polling (misalnya
dilakukan sebelum pemilihan umum), serta hitung cepat atau
quick count. Di bidang komputasi, statistika dapat pula diterapkan
dalam pengenalan pola maupun kecerdasan buatan.

1
1.1 Taksonomi Statistik
Statistik secara garis besar dapat dibagi menjadi 4 jenis, yaitu:
 Statistik Deskriptif.  Statistik Inferensial.
 Probabilitas.  Statistik Relasional.

Gambar 1.1 Taksonomi Statistik

Statistika deskriptif akan menampilkan dan menggambarkan data


numerik memakai angka dan grafik. Misalnya, grade siswa di kelas
bisa dideskripsikan dengan memakai nilai rata-rata dan grafik.
Statistik inferensial digunakan untuk memperkirakan parameter
populasi menggunakan sampel statistik, misalnya rata-rata umur
di kelas, bisa digunakan untuk mengestimasi rata-rata umur siswa
yang ada di sekolahan. Di buku ini tidak akan dijelaskan semua
item, karena tentu akan memakan banyak halaman, tapi akan
dijelaskan dari awal statistika deskriptif, probabilitas, dan sebagian
dari statistika parametrik.

1.2 Dasar-Dasar di Statistik


Statistik dipakai di berbagai bidang, dari mulai yang berkaitan
dengan dunia teknis hingga sosial. Di antara bidang yang meng-
gunakan statistik adalah:
 Bisnis dan ekonomi.  Pendidikan.
 Ilmu alam dan ilmu  Politik.
sosial.
 Ilmu fisika.

2
Ada beberapa istilah yang perlu dipahami tentang statistik, seperti
populasi dan sampel. Berikut ini beberapa artinya:
 Populasi: Keseluruhan yang dipelajari, misalnya siswa yang
ada di sekolah.
 Sampel: Subset atau bagian dari populasi, seperti siswa di
satu kelas tertentu.
 Parameter: Karakteristik dari populasi, seperti umur rata-
rata siswa yang ada di sekolah.
 Statistik: Karakteristik dari sampel, seperti umur rata-rata
siswa yang ada di kelas.
Statistik adalah sebuah ilmu yang berkaitan dengan pengumpulan,
pengaturan, penyajian, analisa, dan interpretasi data numerik ber-
kaitan dengan proses pengambilan keputusan.

Gambar 1.2 Sampel adalah bagian dari populasi

Ketika melakukan sampling, biasanya Anda melakukan secara


acak/random karena itu disebut random sampling, di mana setiap
item di populasi memiliki kemungkinan yang sama untuk dipilih.
Ketika melakukan pengukuran, ada beberapa istilah yang perlu
dipahami:
 Variabel: sebuah nilai atau aktivitas yang bisa beragam/
bervariasi, misalnya nilai pada tes, atau bagaimana pe-
rasaan seseorang.
 Variabel kuantitatif: variabel yang bisa dinyatakan dengan
angka, misalnya nilai ujian 80 atau suhu 20 derajat celcius.

3
 Variabel kualitatif: variabel yang tidak dijelaskan dengan
angka, misalnya nilai B, atau perasaan “bahagia”.
Pengukuran ditinjau dari jenis datanya adalah pengukuran diskrit
dan kontinu:
 Pengukuran diskrit: Nilainya terbatas, misalnya angka
yang ada di sumbu X, jumlah cacat produksi di pabrik, dan
sebagainya.
 Pengukuran kontinu: pengukuran bisa diasumsikan meng-
gunakan ukuran yang tidak terputus, misalnya berat
minuman 12,1 ons, atau berat badan orang 60,35 kg.

Gambar 1.3 Contoh grafik dengan data diskrit

Gambar 1.4 Contoh grafik dengan data kontinu

4
Ketika melakukan pengukuran data, ada beberapa jenis skala pe-
ngukuran atau bisa dibilang tipe data yang perlu dipahami, yaitu:
 Nominal atau Kategorikal.
Digunakan untuk membedakan beberapa kategori untuk
variabel kualitatif. Jadi, kategori tertentu diberi angka
tertentu, dan kategori lainnya diberi angka berbeda. Jadi
dengan kata lain, angka di sini hanya berperan sebagai
label saja. Contohnya jenis kelamin atau nama suku.
 Ordinal atau Rank.
Angka digunakan sebagai angka, di mana angka bisa di-
urutkan dan dibedakan mana yang lebih besar dan yang
lebih kecil. Tapi tidak bisa dibandingkan secara langsung
menggunakan pembagian atau perkalian. Contohnya,


om
tingkat kepuasan pelanggan atau kecantikan seseorang.
t.c
Interval.
po

Angka dipakai untuk pengukuran parametrik, di mana ada


gs

interval dan ada angka nol-nya, tapi angka nol di sini tidak
lo

menunjukkan hilangnya parameter tersebut. Misalnya


.b

adalah pengukuran suhu celcius dan fahrenheit. Karena 0


do

derajat celcius atau 0 derajat fahrenheit bukan berarti tidak


in

adanya panas di benda tersebut. Karena nilai 0 nya tidak


a-

absolut, maka tidak bisa dibandingkan memakai proporsi.


ak

 Rasio.
st
pu

Angka digunakan untuk mengukur, dan memiliki nilai nol


absolut. Misalnya, temperatur kelvin di mana angka 0
derajat menunjukkan tidak adanya panas sama sekali,
begitu juga dengan kecepatan mobil, karena kecepatan nol
artinya mobil tidak berjalan sama sekali.
Angka rasio ini bisa dibandingkan dan dioperasikan, misal-
nya kecepatan 40 km/jam adalah dua kali dari kecepatan
20 km/jam. Nilai rasio bisa dibandingkan dan dikalikan.
Beberapa kesimpulan sejauh ini tentang statistik adalah:
 Statistik adalah karakteristik dari sampel.
 Sampel adalah bagian dari populasi.

5
 Parameter adalah karakteristik dari populasi.
 Populasi adalah cakupan total dari sesuatu yang dipelajari.
 Data diskrit hanya mengizinkan nilai genap atau terbatas
pada sumbu X-nya.
 Data kontinu mengasumsikan semua value bisa asosiasi-
kan dengan nilai yang tidak terputus.
 Variabel kuantitatif, artinya bisa dinyatakan dengan angka.
 Statistik inferensial berguna untuk mengestimasi parameter
populasi.

1.3 Menginstal dan Mengenal Antarmuka


SPSS
Sebelum bisa dipakai, Anda terlebih dahulu harus menginstal
SPSS. Caranya sebagai berikut:
1. Klik dua kali pada file installer IBM SPSS Statistics.
2. Di halaman pertama, ada penjelasan Licensed Materials
dari SPSS. Klik Next.

Gambar 1.5 Penjelasan bahwa SPSS adalah licensed material

3. Muncul halaman yang menyambut kedatangan Anda di


dalam program wizard instalasi SPSS ini. Klik Next untuk
menuju tahap selanjutnya.

6
om
Gambar 1.6 Jendela Welcome di instalasi SPSS
t.c
po

4. Muncul jendela Software License Agreement, klik I accept


gs

the terms in the license agreement, klik Next.


lo
.b
do
in
a-
ak
st
pu

Gambar 1.7 Klik I accept the terms in the license agreement

5. Isikan username dan organisasi (opsional) pada bagian


Customer information.

7
Gambar 1.8 Isian Customer information

6. Bahasa standar adalah English, Anda bisa mengeset


bahasa lainnya, kalau perlu dengan memilih pada Help
Language, tapi kalau tidak perlu langsung bisa lanjut
dengan klik Next.

Gambar 1.9 Opsi Help language

7. Di Assistive Technology, Anda bisa menentukan apakah


mau menginstal Assistive Technlogy atau tidak. Kalau
tidak, pilih No dan klik pada tombol Next.

8
Gambar 1.10 Pemilihan apakah mau menginstal
Assistive Technology atau tidak

8. Tentukan lokasi instalasi di Destination Folder.

Gambar 1.11 Penentuan lokasi instalasi di Destination folder

9. Di Ready to install the program, klik Install untuk memulai


instalasi.

9
Gambar 1.12 Klik Install di Ready to install the program

10. Berikutnya muncul License IBM SPSS Statistics, dan klik


OK untuk menjalankan wizard IBM SPSS.

Gambar 1.13 License SPSS Statistics

11. Muncul wizard Product Authorization, klik License my


product now.

10
Gambar 1.14 License my product now

12. Di halaman Enter Codes, ada textbox yang bisa diisikan


serial number Anda. Klik Next.

Gambar 1.15 Memasukkan kode di Enter codes

11
13. Muncul konfirmasi kode, klik Next lagi.

Gambar 1.16 Konfirmasi kode

14. Kalau lisensi tak ada masalah, klik Finish.

Gambar 1.17 Status licensing sudah oke

15. Untuk menjalankan, ketik SPSS di search box Windows.

12
Gambar 1.18 Mencari SPSS di search box

16. Kemudian cari di Apps dan pilih IBM SPSS Statistics,


kemudian tekan Enter.

Gambar 1.19 IBM SPSS Statistics

17. Ketika dijalankan pertama kali, ada konfirmasi Unicode


Mode, klik Use Unicode encoding.

Gambar 1.20 Klik Use Unicode encoding

13
18. Muncul jendela start up, klik Cancel untuk menutup jendela
ini. Kalau tidak mau menampilkan jendela ini, cek pada
Don’t show this dialog in the future.

Gambar 1.21 Klik Dont show this dialog in the future

19. Tampilan dari antarmuka SPSS seperti berikut ini.

Gambar 1.22 Tampilan antarmuka SPSS

14
20. Ada jendela Output yang menampilkan output SPSS.

Gambar 1.23 Output SPSS

21. Di jendela utama, Anda dapat klik pada Variable View


untuk menampilkan view variabel yang dipakai untuk
menampilkan variabel.

Gambar 1.24 Klik pada Variable View

15
1.4 Membuka dan Menyimpan File di SPSS
Untuk membuka file SPSS yang sudah ada, Anda bisa memanfaat-
kan fasilitas Open dari SPSS dengan cara seperti berikut:
1. Klik pada File > Open > Data.

Gambar 1.25 Klik pada File > Open > Data

2. Muncul jendela Open Data, pilih file yang akan dibuka.

Gambar 1.26 Jendela Open data

16
3. Maka, isi dari file tersebut terlihat di jendela kerja SPSS.

Gambar 1.27 File terlihat di jendela kerja SPSS

4. Kalau untuk menyimpan, klik pada File > Save As untuk


menyimpan.

Gambar 1.28 Klik File > Save as untuk menyimpan

17
5. Kemudian tentukan nama file untuk menyimpan di jendela
Save Data As.

Gambar 1.29 Menentukan nama untuk menyimpan data

18
BAB Distribusi Frekuensi
2 dan Statistik Deskriptif
Lainnya

Misalnya seorang penjaga gudang mencatat berapa sak gandum


keluar dari gudang selama 15 hari kerja, maka diperoleh distribusi
data seperti berikut.
76
88
66
73
53
97
64
82
77
57
93
85
70
76
68

Akan dilakukan statistika deskriptif untuk memperoleh insight


mengenai data ini. Pertama, data ini perlu diurutkan lebih dahulu.
Anda bisa mengurutkan secara manual atau menggunakan fitur
sort dari Excel.

19
53
57
64
66
68
70
73
76
76
77
82
85
88
93
97

2.1 Distribusi Frekuensi


Atribut deskripsi pertama adalah Range atau jangkauan data. Ini
adalah nilai data tertinggi dikurangi nilai data terendah, atau dalam
kasus ini adalah 97 dikurangi dengan 53, yaitu 44.
Berikut, kita akan mencari distribusi frekuensi. Distribusi frekuensi
akan membagi data menjadi kelompok numerik, kemudian me-
nampilkan jumlah kemunculan dari data-data di tiap group.
Pengelompokkan ini biasa disebut kelas. Batas kelas menampilkan
batas bawah dan batas atas dari kelas. Lebar kelas menyatakan
jarak antara batas atas dan batas bawah ini.
Tiap kelas bersifat eksklusif, artinya satu nilai hanya bisa masuk di
kelas tertentu saja. Selain itu, kelas juga harus bersifat inklusif,
artinya semua data harus masuk ke kelas.
Data biasanya dirangkum dalam beberapa kelas, misalnya 5-15
kelas. Lebar kelas juga harus jelas, misalnya 5, 10, 100, 500, dan
sebagainya. Formula untuk mengetahui lebar kelas adalah:
Lebar Kelas = Range / Jumlah Kelas
Batas kelas biasanya digenapkan, misalnya batas kelas 50 sampai
59, biasanya memiliki batas asli 49,5 sampai 59,5. Nilai yang
sama seperti batas atas, biasanya menjadi anggota kelas
berikutnya.

20
Kumulatif
Frekuensi Lebih Kurang
Relatif dari dari
Batas (Frekuensi batas batas
Kelas Batas Real Tally Frekuensi dibagi n) bawah atas
50-59 49,5-59-5 II 2 0,13 15 0
60-69 59,5-69,5 III 3 0,20 13 2
70-79 69,5 - 79,5 IIII 5 0,33 10 5
80-89 79,5-89,5 III 3 0,20 5 10
90-99 89,5- 99,5 I I 2 0,13 2 13
n (total) 15 0 15

Anda bisa membuat diagram batang dari frekuensi seperti berikut.

Gambar 2.1 Diagram batang dari frekuensi

Anda juga bisa membuat membuat diagram garis poligon.

Gambar 2.2 Diagram garis poligon

21
Anda juga bisa memplot data kumulatif lebih dari batas bawah.

Gambar 2.3 Diagram plot data kumulatif lebih dari batas bawah

Atau, diagram plot kumulatif kurang dari batas atas.

Gambar 2.4 Diagram kumulatif kurang dari batas atas

2.2 Tendensi Sentral dari Data Tidak


Berkelompok
Tendesi sentral (central tendency) menentukan bagian tengah dari
data, biasanya mengacu pada nilai tertentu. Mean adalah salah
satu contoh untuk mengukur tendensi sentral. Parameter-
parameter populasi direpresentasikan dengan huruf kapital,
sementara statistik dari sampel dilambangkan dengan huruf kecil.

22
2.2.1 Mean
Pertama, kita akan membahas data-data yang tidak terkelompok,
misalnya data-data tunggal. Contohnya, ada data sederhana
jumlah sak gula yang terjual dalam seminggu (7 hari) seperti
berikut: 3, 7, 7, 4, 1, 8, 5.
Maka, ini bisa dihitung mean dari sampel dengan rumus berikut.

X
x
n
Dimana X bar (X dengan garis di atasnya) adalah mean dari
sampel, serta x adalah variabel yang dihitung dengan n adalah
jumlah data. Pada contoh di atas, rata-ratanya adalah (3 + 7+ 7
+4+ 1+ 8+ 5)/7 = 35/7 = 5.

Kalau untuk populasi dari mean, tandanya adalah ikon dengan


ukuran populasi adalah N.
Ketika data punya beberapa nilai duplikat, dan ada beberapa yang
punya bobot tertentu, Anda dapat menggunakan pembobotan.
Rumusnya adalah frekuensi dikali bobot, lalu dibagi dengan jumlah
bobot total.
Jumlah deviasi nilai-nilai data dengan mean selalu menghasilkan
nilai nol. Atau dengan kata lain memiliki tampilan seperti berikut.

 (x  )  0
Misalnya, kalau ada 3 nilai: 1,3, dan 8. Maka rata-ratanya adalah
(1+8+3)/3 atau 12/3 = 4. Maka jumlah standar deviasi adalah:
= (1-4) + (3-4) + (8-4)
= -3 + (-1) + 4
=0
Ketika menggunakan mean, Anda harus berhati-hati karena mean
memiliki kekurangan sebagai media untuk mengukur tendensi
sentral, karena mudah dipengaruhi oleh sedikit nilai yang ekstrim.
Misalnya, ada 10 nilai rendah, lalu ada satu nilai ekstrim yang
tinggi bisa meningkatkan nilai mean.

23
2.2.2 Median
Median adalah nilai tengah dari data ketika diurutkan. Median bisa
dianggap sebagai urutan tengah secara geometri, sementara mean
adalah urutan tengah secara aritmetik. Jadi, media ini tidak di-
tentukan oleh besar atau kecilnya data, tapi selalu ada di tengah.
Untuk menentukan median, Anda bisa mengurutkan data, lalu
tentukan posisi median dengan menggunakan rumus.
n
 0,5
2
Kalau nilainya pecahan, artinya nilainya ada di antara dua nilai,
karena itu harus dijumlahkan kedua nilai tersebut, baru dibagi
menjadi dua.
Misalnya kalau ada 7 nilai (3, 7, 7, 4,1, 8, dan 5).
Pertama, Anda harus mengurutkannya terlebih dahulu:
1,3,4,5,7,7,8.
Urutan datanya adalah jumlah data dibagi dua, ditambahkan
setengah. Jadi (7/2) + ½ : 4
Nilai keempat dari urutan adalah 5.
Jadi mediannya adalah 5.

2.2.3 Modus (Mode)


Modus adalah nilai yang paling sering muncul. Dari contoh di atas,
bisa terlihat bahwa nilai 7 adalah modusnya, karena muncul 2 kali.
Nilai Kemunculan
1 1
3 1
4 1
5 1
7 2
8 1

Beberapa data tidak memiliki modus yang tunggal, tapi memiliki


dua atau tiga modus. Pada umumnya, modus ini memang tidak
menggambarkan sentralitas data, tapi mengetahui angka yang
paling sering muncul tetap merupakan informasi yang penting.

24
2.2.4 Pengukuran Posisi
Salah satu pengukuran posisi yang sudah dijelaskan adalah
median. Tapi, selain median ada beberapa pengukuran lagi. Misal-
nya kuartil yang membagi data menjadi empat bagian.
 Kuartil pertama atau Q1 adalah posisi data seperempat
pertama.
 Kuartil kedua atau Q2 adalah posisi data di tengah (yaitu
median).
 Kuartil ketiga atau Q3 adalah posisi data seperempat
terakhir, atau tiga per empat data.
Lokasi:
 Q1 = (n/4)+.5
 Q2 = (n/2)+.5
 Q3= (3n/4)+.5
Kadang ada istilah antarkuartil yang merupakan jarak antara Q3
dan Q1. Ada juga istilah persentil yang membagi data menjadi
100.

2.3 Persebaran Data Tidak Berkelompok


Persebaran data mengacu kepada penyebaran atau variabilitas
data. Mengetahui persebaran data sangat penting, karena ini bisa
menghasilkan informasi tambahan terhadap data. Misalnya, ada
seorang yang punya nilai rata-rata B, satu orang karena semuanya
B, satunya karena A dan C nya sama.
Contohnya, masih data 3, 7, 7, 4, 1, 8, 5 dengan rata-rata adalah
5.

2.3.1 Range
Range adalah nilai tertinggi dibagi nilai terendah, ini menjelaskan
total jangkauan seluruh data. Misalnya, nilai tertinggi adalah 8,
sementara nilai terendah adalah 1, maka range adalah 8 -1 atau 7.

25
2.3.2 Deviasi Rata-Rata Populasi
Deviasi rata-rata menjelaskan jumlah absolut dari nilai dikurangi
rata-rata dibagi dengan jumlah data.
Misalnya untuk data di atas, bisa dibuat tabel seperti berikut.
X µ x-µ |x-µ|
3 5 -2 2
7 5 2 2
7 5 2 2
4 5 -1 1
1 5 -4 4
8 5 3 3
5 5 0 0
Jumlah 14

Gunakan rumus berikut untuk menghitung deviasi rata-rata dari


sampel.
 | x  |
N
Misalnya untuk contoh data di atas, adalah 14 dibagi dengan 7,
maka hasilnya adalah 2.

2.3.3 Variansi Populasi dan Standar Deviasi


Variansi populasi ( 2) menjumlahkan variasi dari mean, rumusnya
adalah.

2  
( X   )2
N
Contohnya untuk data di atas, adalah.
2
X µ x-µ (x-µ)
3 5 -2 4
7 5 2 4
7 5 2 4
4 5 -1 1
1 5 -4 16
8 5 3 9
5 5 0 0
Jumlah 38
38 dibagi dengan 7, hasilnya adalah 5,4.
Untuk standar deviasi, adalah akar kuadrat dari variansi, yaitu akar
kuadrat dari 5,4 atau sekitar 2,3.

26
Untuk variansi sampel, simbolnya adalah s2 sementara standar
deviasi adalah s.
Rumusnya adalah.

 (x  x)
2

S 2

n 1
Standar deviasi dapat digunakan sebagai ukuran variasi data.
Aturan standarnya adalah data pada umumnya berbentuk normal
dengan bentuk seperti bel.
Untuk data yang simetris, kira-kira 68,26% data akan berada di
dalam cakupan satu standar deviasi dari meannya, dan 95,44%
data akan berada di antara dua standar deviasi dari meannya.
Jadi kalau ada populasi dengan rata-rata populasi µ = 500, dan
standar deviasi = 100, maka 95,44 % datanya ada di antara 300
dan 700. Yaitu dengan jarak mean +- 2 (2 x standar deviasi).

Gambar 2.5 Cakupan data dalam persen untuk


standar deviasi di antara mean

2.4 Tendensi Sentral Data Kelompok


Ketika sebuah data tidak tersedia, atau volumenya tidak gampang
diatur secara bijian, Anda perlu menggunakan pengelompokan.
Contohnya, data pertama tadi seperti berikut.

27
Frekuensi Nilai
Batas Kelas (f) Tengah (x) fx
50-59 2 54,50 109
60-69 3 64,50 193,5
70-79 5 74,50 372,5
80-89 3 84,50 253,5
90-99 2 94,50 189
Σf 15 Σfx= 1117,5

2.4.1 Mean Kelompok


Mean kelompok dapat dihitung dengan rumus fx dibagi dengan n.
Untuk data di atas, maka mean kelompok adalah 1.117, 5 dibagi
dengan 15 yang hasilnya adalah 74,5.

2.4.2 Median Kelompok


Ini sama seperti median biasa, hanya saja karena menggunakan
kelompok, maka rumus mediannya dihitung seperti berikut.

n
 CFb
L 2 (i )
f
Dimana L adalah atas bawah dari kelas median. CFb adalah
frekuensi relatif sebelum frekuensi median. Dan i adalah interval
kelas.
Misalnya untuk data di atas, n/2 adalah 15/2 atau 7,5.
Maka, digunakan rumus di atas adalah.
69,5 + 5 = 74,5
Sehingga, diperoleh median adalah 74,5.

2.4.3 Modus Kelompok


Modus Kelompok adalah titik tengah dari kelas yang memiliki
frekuensi paling tinggi. Pada contoh data di atas, modusnya adalah
74,5. Modus dan median ini memiliki nilai yang sama, karena
distribusi di data ini adalah normal.

28
2.5 Skewness
Distribusi data selain ada yang normal, ada juga yang tidak
simetris. Data yang tidak simetris ini disebut data yang skew, yang
berarti data memiliki kecondongan.
Skewness pada data memiliki dua variasi, yaitu data yang negatif
dan data yang positif. Kalau skew negatif, maka mean akan
menjadi ukuran terkecil dari tendensi sentral.

Gambar 2.6 Skew negatif

Sementara kalau skew positif, mean akan menjadi yang terbesar di


tendensi sentral.

Gambar 2.7 Skew positif

29
Tingkat kecondongan sebuah kurva bisa diukur menggunakan
koefisien kecondongan dari Pearson. Ini bisa diterapkan pada data
sampel atau data populasi.
Apabila data skew positif, maka mean akan menjadi lebih besar
daripada median, dan pengukuran koefisiennya positif. Ketika data
skew negatif, maka mean lebih kecil daripada median, dan
koefisiennya negatif. Distribusi normal memiliki koefisien pearson
bernilai nol.
Rumus koefisien skewness seperti berikut ini.

3(mean  median)
Skewness 
s tan dar _ deviasi

2.6 Statistik Deskriptif dengan SPSS


Berikut, contoh penggunaan SPSS untuk statistik deskriptif, yang
digunakan untuk memperoleh gambaran data dengan lebih jelas.
1. Buka SPSS.
2. Klik pada Variable View untuk memasukkan variabel.

Gambar 2.8 Klik pada Variable View untuk memasukkan variabel

30
3. Masukkan nama variabel, misalnya “Gandum” untuk
menjelaskan nama variabel jumlah gandum yang terjual
dari gudang.

Gambar 2.9 Memasukkan nama variabel

4. Otomatis diberi tipe numeric dengan width 8, dan desimal


2 oleh SPSS. Anda bisa mengedit lagi ini.

Gambar 2.10 Tipe numerik

5. Untuk mengganti tipe data, letakkan pointer mouse di


Type, kemudian klik pada tombol elipsis yang muncul.

31
Gambar 2.11 Klik pada tombol elipsis yang muncul

6. Muncul Variable Type, di mana Anda bisa memasukkan


dan mengganti tipe variabel serta nilai desimal.

Gambar 2.12 Jendela Variable Type

7. Ganti nilai desimal menjadi 0 di Decimal Places.

Gambar 2.13 Penggantian nilai desimal menjadi nol

32
8. Isikan label untuk data tersebut, kalau perlu isikan di
kolom Label.

Gambar 2.14 Pengisian label

9. Atur perataan data di alignment, apakah ke kiri, kanan,


atau tengah.

Gambar 2.15 Pengaturan data

10. Klik pada Data View, hingga terlihat tampilan data view
seperti berikut.

33
Gambar 2.16 Tampilan data view

11. Masukkan data-data ke dalam kolom Gandum tersebut,


misalnya data seperti berikut.
76
88
66
73
53
97
64
82
77
57
93
85
70
76
68

12. Anda bisa meng-copy paste dari sumber data atau meng-
isikan secara manual.

34
Gambar 2.17 Menyalin data

13. Kemudian klik menu Analyze > Descriptive Statistics >


Frequencies untuk mencari tahu frekuensi data.

Gambar 2.18 Klik pada Frequencies

14. Pilih nama variabel yang baru dibuat, dan masukkan ke


kanan dengan klik pada panah kanan.

Gambar 2.19 Pemilihan nama variabel di sebelah kanan

35
15. Maka, variabel tersebut masuk ke sebelah kanan.

Gambar 2.20 Variabel masuk ke sebelah kanan

16. Klik tombol Statistics.

Gambar 2.21 Klik pada tombol Statistics

17. Muncul jendela Frequencies: Statistics seperti berikut ini.

Gambar 2.22 Jendela Frequencies: Statistics

36
18. Cek pada item-item yang ingin ditampilkan, seperti kuartil,
tendensi sentral, dan standar deviasi.

Gambar 2.23 Pengecekan pada item yang ingin ditampilkan

19. Klik Charts kalau mau membuat chart.

Gambar 2.24 Klik Charts

20. Cek pada Histogram > Show normal curve on histogram.


Kemudian klik Continue.

37
Gambar 2.25 Klik Show normal curve on histogram

21. Klik Format untuk memformatnya.

Gambar 2.26 Klik pada Format untuk memformatnya

22. Klik OK untuk memproses.

Gambar 2.27 Klik pada tombol OK untuk memproses

38
23. Muncul jendela output. Klik dua kali untuk mengaktifkan
opsi ini.

Gambar 2.28 Klik dua kali untuk mengaktifkan opsi

24. Anda bisa melihat jendela output menghasilkan output


yang diprosesnya.

Gambar 2.29 Jendela output menghasilkan output

25. Di bagian Statistics, Anda bisa melihat jumlah data, serta


atribut-atribut deskriptif lain yang dipilih, seperti mean,
median, modus, variansi, standar deviasi, skewness, range,
nilai di persentil-persentil tertentu.

39
Gambar 2.30 Range di persentil tertentu

26. Di tabel berikutnya, ada frekuensi dari tiap kemunculan


data, persentasenya dan nilai kumulatif dari persentase
tersebut.

Gambar 2.31 Tabel frekuensi dari kemunculan tiap-tiap data

40
27. Di bawahnya ada histogram berisi chart jenis bar, beserta
dengan diagram normal yang ada.

Gambar 2.32 Diagram normal

28. Untuk menyimpan output-an ini, klik pada File > Save di
jendela output.

Gambar 2.33 Klik File > save di jendela output

29. Isikan nama file di kotak teks Filename.

41
Gambar 2.34 Pengisian nama file di kotak teks File name

30. Maka, nama yang disimpan akan sama seperti nama di


title bar.

Gambar 2.35 Nama di title bar terlihat sesuai dengan


nama yang disimpan

31. Anda bisa mengedit output yang sudah dibuat. Misalnya


untuk mengganti teks, klik dua kali pada item yang ingin
diganti.

42
Gambar 2.36 Klik dua kali pada nama yang ingin diganti

32. Klik pada teks yang ingin dibuat, maka muncul formatting
toolbar, dan kotak bisa diubah.

Gambar 2.37 Kotak diubah

33. Masukkan teks baru dengan mengetikkannya pada kolom


tersebut.

43
Gambar 2.38 Memasukkan teks baru dengan
mengetikkan teks di keyboard

34. Anda bisa menambahkan yang lain sesuai dengan


kebutuhan.

Gambar 2.39 Pengeditan median

35. Klik di sembarang tempat untuk menutup jendela editing


ini.

44
Gambar 2.40 Klik di sembarang tempat untuk menutup jendela editing

36. Di grafik, Anda juga dapat mengeditnya. Caranya dengan


klik dua kali pada chart tersebut.

Gambar 2.41 Klik dua kali pada chart

37. Maka chart menjadi memiliki arsiran garis miring.

45
Gambar 2.42 Chart memiliki arsiran garis miring

38. Muncul jendela chart editor untuk mengedit chart ini.

Gambar 2.43 Jendela chart editor untuk mengedit chart

46
39. Klik pada salah satu objek yang ingin diedit, misalnya
diganti warnanya. Kemudian pilih warna baru di palet yang
muncul di jendela Properties.

Gambar 2.44 Pengeditan pada palet yang muncul

40. Maka, warna pada objek yang terpilih akan berubah.

Gambar 2.45 Warna pada objek terpilih berubah

47
41. Anda juga bisa mengedit dan mengganti jenis style pada
teks. Pilih di combobox yang ada.

Gambar 2.46 Pemilihan di combobox jenis font

42. Kalau jenis font diubah, Anda bisa langsung melihat


hasilnya di bagian chart.

Gambar 2.47 Teks berubah di sebelah kanan chart

48
43. Anda bisa mengeksplorasi data untuk melihat deskripsi
atau penggambaran datanya dengan klik pada Analyze >
Descriptive Statistics > Explore.

Gambar 2.48 Explore untuk mengeksplorasi Descriptive statistics

44. Klik pada tombol panah kanan untuk mengambil variabel


ke Dependent List.

Gambar 2.49 Memasukkan ke Dependent list

45. Klik tombol Plots.

Gambar 2.50 Klik pada tombol Plots

49
46. Tentukan apa yang mau ditampilkan di Explore: Plots.

Gambar 2.51 Menentukan apa yang mau ditampilkan

om
47. Muncul tampilan pertama, yang menentukan data, dan
t.c
mengecek apakah ada data yang hilang.
po
gs
lo
.b
do

Gambar 2.52 Pengecekan data


in
a-

48. Di Descriptives, Anda bisa melihat mean, dan batas untuk


ak

95% confidence interval untuk mean. Kemudian atribut lain


st

seperti median, variansi, dan standar deviasi.


pu

Gambar 2.53 Descriptives menjelaskan deskripsi data

50
49. Di stem & leaf, Anda bisa melihat plot stem & leaf untuk
data ini.

Gambar 2.54 Plot stem & leaf

50. Di diagram tukey box plot, Anda bisa melihat data quartil
pertama di batas bawah box, mean berupa garis, dan batas
atas box yang menunjukkan kuartil ketiga.

Gambar 2.55 Diagram box plot tukey

51. Anda dapat menyimpan file, klik pada File > Save As.

51
Gambar 2.56 File > Save As

52. Isikan nama file di File name, dan klik Save.

Gambar 2.57 Pengisian nama file di File name untuk menyimpan data

53. Maka, nama file data yang disimpan, muncul di title bar.

Gambar 2.58 Nama file data yang disimpan muncul di title bar SPSS

52
BAB Pengenalan Probabilitas
3

Probabilitas berkaitan dengan kemungkinan terjadinya sesuatu,


dan berhubungan erat dengan ketidakpastian. Teori probabilitas ini
menjadi dasar bagi statistik inferensial nantinya. Dan kegunaannya
sangat banyak, karena berkaitan dengan estimasi parameter
populasi menggunakan sampel statistik.
Data-data yang dipakai untuk mengukur probabilitas, lazimnya
diperoleh dari sebuah eksperimen. Eksperimen sendiri merupakan
proses berulang yang menghasilkan hasil akhir berupa peng-
ukuran. Hasil pengkuran ini disebut event.

3.1 Pembagian Probabilitas


Ada beberapa jenis probabilitas. Pertama adalah probabilitas
klasik. Di mana tidak diperlukan eksperimen untuk menentukan
hasil, karena dengan mudah dapat diketahui. Contohnya, kalau
kepingan koin ditos, maka probabilitas salah satu sisi terbuka
adalah setengahnya.
Di probabilitas klasik, setiap event memiliki kesempatan yang
sama untuk terjadi. Untuk menghitung probabilitas event A atau
P(A), rumus yang digunakan adalah:
P (A) = jumlah A terjadi / total kemungkinan
P (A) = A/N
Misalnya, kalau dadu memiliki enam kemungkinan, kemungkinan
event munculnya dadu nomor dua adalah:
P (A) = 1/6

53
Jenis kedua adalah probabilitas relatif. Probabilitas relatif me-
merlukan eksperimen untuk mengukur data yang akan dijadikan
dasar pengukuran probabilitas.
Jadi rumusnya adalah:
P (A) = pengamatan event A / ukuran sampel
A
P( A) 
N
Misalnya, disurvei dari 100 orang mahasiswa di sebuah perguruan
tinggi, 5 orang memiliki kendaraan roda empat. Jadi, kemungkin-
an seorang memiliki kendaraan roda empat adalah:
P (A) = 5/100
P (A) = 5%
Karena probabilitas relatif ini selalu berdasarkan pada pengamatan
sampel, dan karena populasi selalu berubah, maka nilai
probabilitas ini selalu berubah dengan konsisten.
Ketiga adalah probabilitas subjektif. Ini adalah jenis probabilitas
yang berbeda dengan probabilitas sebelumnya, karena probabilitas
jenis klasik dan relatif adalah probabilitas empiris yang berdasar-
kan data nyata. Sementara probabilitas subjektif hanya berdasar-
kan pendapat pribadi saja.
Misalnya, ketika perkembangan ekonomi membaik, seorang
pengusaha memprediksi bahwa penjualan akan naik sekitar 10%,
sementara pengusaha yang lain memprediksi bahwa penjualan
akan bisa naik sampai 25%.

3.2 Aturan-Aturan Probabilitas


Ketika bicara mengenai probabilitas, ada beberapa rule atau
aturan yang harus dipahami.
Pertama, range probabilitas adalah 0 • P (A) • 1. Artinya,
probabilitas hanya di antara 0 dan 1, tidak mungkin negatif atau
lebih dari satu. Kalau ada event tertentu, misalnya event A, maka
~
selain event A tersebut disebut komplemen A ( A ).
~
P (A) = 1 – P ( A )

54
Misalnya P (A) = 0,3
Maka:
~
P ( A ) = 1 – 0,3
~
P ( A ) = 0,7
Misalnya, ada sebuah data yang menjelaskan pengaruh antara
pemberian pupuk merek X pada tanaman dengan hasil panennya
seperti berikut.
Pupuk (kg) 5 7 2 6 10 4 6 5 3 8
Panen (ton) 50 80 25 50 90 30 60 60 40 80

Maka, data di atas bisa dibuat plot seperti berikut.


Panen
≤ 50 > 50
Pupuk

≤5 4 1 5
>5 1 4 5
Total 5 5 10

Probabilitas dua event bisa ditambahkan dengan memakai be-


berapa aturan berikut. Pertama untuk menambahkan probabilitas
A dan B, Anda bisa menambahkannya dengan rumus berikut:
P (A atau B) = P (A) + P (B) – P (A dan B)
Di mana P (A dan B) ini adalah interseksi atau irisan di mana
beberapa kejadian overlap dan lazim terjadi dalam eksperimen.
Misalnya:
P (>5 atau >50) = (P > 5) + P ( > 50) – P (> 5 dan > 50)
P (>5 atau >50) = 5/10 + 5/10 – 4/10
P (>5 atau >50) = 6/10 = 3/5
Jika event yang dikombinasi tidak memiliki interseksi atau salinan
yang sama, maka tidak perlu ada irisan yang diperhitungkan.

3.2.1 Aturan Perkalian


Sebuah event A dan B dikatakan independen apabila apa yang
terjadi di event A tidak mempengaruhi probabilitas dari event B.
Persilangan antara event A dan B ini merepresentasikan berapa
sering kedua hal tersebut terjadi.

55
Probabilitas atau kemungkinan terjadi persilangan (intersection) ini
disebut probabilitas gabungan atau joint probability.
Jadi, kalau ada 2 event yang independen, maka probabilitas
gabungannya adalah perkalian dari kedua probabilitas tersebut.
Jadi, kalau A dan B adalah event yang independen, maka:
P (A dan B) = P (A) x P(B)
Misalnya, melakukan tos atau pelemparan koin, adalah event
independen, yang muncul di tos pertama tidak akan mem-
pengaruhi yang muncul di tos kedua.
Misalnya, kemungkinan di tos pertama muncul atas, dan tos kedua
muncul atas adalah seperti berikut (A= atas):
P (A dan A) = P (A) x P (A)
= ½*½

Jadi, kalau dilakukan tos ketiga, peluang untuk mendapatkan sisi
atas di tos ketiga adalah:
=½*½*½
= 1/8
Adapun jika event A dan B adalah event yang dependen, di mana
kalau event A terjadi, akan mempengaruhi kejadian event B, maka
rumusnya tidak sekedar dikalikan saja, tapi perlu dimodifikasi
sedikit.
P (A dan B) = P (A) x P (B | A)
P (B|A) adalah probabilitas B diboboti oleh kejadian event A
Misalnya, untuk panen dan pupuk sebelumnya:
≤ 50 > 50 Total
≤5 4 1 5
>5 1 4 5
Total 5 5 10

Maka P (pupuk > 5 dan panen > 50 | pupuk > 5)


= 5/10 * 4/5
= 0,4 = 40%

56
3.2.2 Teorema Bayes
Teorema bayes digunakan untuk mencari probabilitas dari event
kondisional. Rumus teorema bayes ini adalah:
P (A | B ) = P (A dan B) / P (B)
P( A)  P ( B | A)
~ ~
P( A) P ( B | A)  P ( A )  P ( B | A )
Misalnya kalau ingin diketahui probabilitas panen > 50 ketika
pupuk > 5
P (> 50 | > 5) = ( P (>50 )x P (> 5 | > 50 )) / P (> 5)
P( 50)  P(  5 | 50)
= ~ ~
P( 50) P(  5 | 50)  P ( 5 0 )  P( 5 | 5 0 )
5 4

= 10 5
5 4 5 1
  
10 5 10 5
20 / 50 20 / 50
= 
20 / 50  5 / 50 25 / 50
= 0, 8 = 80 %

3.2.3 Menghitung Total Kemungkinan Kejadian


Ketika kejadian lebih kompleks, perhitungan untuk menghitung
total kemungkinan event/kejadian juga lebih kompleks. Anda bisa
menggunakan faktorial.
Misalnya, ada seorang ingin mengunjungi 6 toko, maka rutenya
adalah faktorial 6.
N ! = 6 ! = 6 x 5 x 4 x3 x2 x1
Selain itu, bisa digunakan juga aturan permutasi dan kombinasi.
Rumus permutasi seperti berikut:
N!
N PR 
( N  R )!

57
Adapun kombinasi seperti berikut:

N!
N CR 
( N  R)!( R!)

3.2.4 Permutasi
Permutasi adalah susunan unsur-unsur yang berbeda dalam urutan
tertentu. Pada permutasi urutan diperhatikan. Jadi AB • BA.
Sehingga, permutasi k unsur dari n unsur, di mana k • n adalah
semua urutan yang berbeda, yang mungkin dari k unsur yang
diambil dari n unsur yang berbeda. Banyak permutasi k unsur dari
N!
n unsur ditulis N Pr , Prk atau P (n,r) P ( n, r )  .
( N  r )!
Permutasi siklis (melingkar) dari n unsur adalah (n-1)!
Misalnya, ada 6 orang duduk mengelilingi sebuah meja yang ber-
bentuk lingkaran. Berapa banyak cara agar mereka dapat duduk
mengelilingi meja makan dengan cara yang berbeda?
Jawab :
Banyaknya cara agar 6 orang dapat duduk mengelilingi meja
makan dengan urutan yang berbeda, sama dengan banyak per-
mutasi siklis (melingkar) 6 unsur yaitu:
(n-1)! = (6-1)!
= 5!
= 5 x 4 x3 x2 x1 = 120

3.2.5 Kombinasi
Kombinasi adalah susunan unsur-unsur dengan tidak memperhati-
kan urutannya. Dalam kombinasi, AB = BA. Dari suatu himpunan
dengan n unsur dapat disusun himpunan bagiannya dengan untuk
k • n. Setiap himpunan bagian dengan k unsur dari himpunan
dengan unsur n disebut kombinasi r unsur dari n yang dilambang-
kan dengan N Cr , Crn atau C(n,r). Rumusnya adalah:

58
N!
C ( n, r ) 
( N  r )!r!
Contoh, misalnya ada himpunan A, seperti berikut:
A  {x | x  5, x  c}
Tentukan banyak himpunan bagian dari himpunan A yang
memiliki 2 unsur!
Jawab:
A  {x | x  5, x  c} = {0,1,2,3,4,5}
n(A)=6
Banyak himpunan bagian dari A yang memiliki 2 unsur adalah C
(6, 2).
6!
C(6,2)=  15
(6  2)!2!

3.3 Distribusi Probabilitas Diskrit


Sebuah variabel acak (random) adalah event numerik di mana
nilainya ditentukan secara acak. Eksperimen seperti melempar
koin, atau pola pembelian konsumen berdasarkan jenis kelamin
adalah contoh variabel acak.
Variabel acak sendiri ada 2 jenis, yaitu diskrit dan kontinu. Diskrit
artinya nilainya terbatas, seperti angka integer bukan pecahan
yang bisa diplot ke sumbu x.
Sementara, variabel acak kontinu bisa diukur terus-menerus tanpa
terputus. Distribusi probabilitas akan mencatat semua nilai
probabilitas yang berkaitan dengan variabel random.

3.3.1 Distribusi Binomial


Distribusi Binomial adalah suatu distribusi probabilitas yang dapat
digunakan ketika proses sampling dapat diasumsikan sesuai
dengan proses Bernoulli. Misalnya, dalam perlemparan sekeping
uang logam sebanyak 5 kali, hasil setiap ulangan mungkin muncul
sisi atas atau sisi bawah.

59
Begitu pula, bila kartu diambil berturut-turut, kita dapat memberi
label “berhasil” bila kartu yang terambil adalah kartu merah atau
“gagal” bila yang terambil adalah kartu hitam. Ulangan-ulangan
tersebut bersifat bebas dan peluang keberhasilan setiap ulangan
tetap sama, yaitu sebasar ½.
Distribusi probabilitas binomial memiliki beberapa karakteristik
berikut:
 Eksperimen terdiri dari trial yang fix.
 Bisa didefinisikan sebagai sukses atau gagal, tiap set hasil
bisa dihitung dan direpresentasikan sebagai event
independen.
 Probabilitas sukses dan probabilitas gagal harus sesuai
dengan rumus P (sukses) = 1 – P (gagal).
Contoh distribusi binomial ini, misalnya melempar koin, meng-
hitung produk defek, dan melihat respon marketing. Untuk me-
nentukan distribusi binomial, Anda bisa menggunakan rumus:

n!
P( x)  p xqn x
x!(n  x)!
n = jumlah trial
x = jumlah sukses
p = kemungkinan sukses
q = kemungkinan gagal (1-p)
Misalnya, kalau melempar koin, kemungkinan mendapatkan satu
bagian atas dengan menggunakan dua lemparan adalah:
n=2
x = 1 (atas)
p = 0,5
q = 0,5
Maka:
P (x) = bisa dihitung = 2x 0,5 x 0,5 = 0,5

60
3.3.2 Tabel Binomial
Untuk memudahkan mencari probabilitas binomial, biasanya buku
-buku statistik sudah dilengkapi dengan tabel binomial, di mana
Anda bisa mencari probabilitas x dengan tingkat probabilitas ter-
tentu, dan dengan jumlah trial tertentu.
Misalnya, contoh berikut adalah tabel untuk eksperimen trial
dengan n = 2, dan beberapa probabilitas yang berbeda-beda.

Gambar 3.1 Contoh tabel distribusi binomial

Misalnya, kalau probabilitas ditemukan komponen cacat dalam


produksi adalah 5% (0,05), maka kemungkinan mendapatkan 2
dari 2 defek adalah 0,0025 (lihat kolom kedua) atau sekitar 0,25%.
Contoh lain distribusi binomial adalah permainan yang memakai
dadu. Apabila dadu itu fair, dan tidak condong ke salah satu, maka
kalau misalnya dilempar 235 kali, maka kemungkinan muncul
angka 6 adalah:
235/6 = 39,17
Tapi, kenyataannya angka 6 muncul 51 kali. Ingin diuji apakah
dadunya fair atau tidak untuk mengkalkulasi probabilitas muncul-
nya 51 di n = 235.
Hasilnya, probabilitas memperoleh 51 atau lebih adalah 0,018.
Jadi, untuk level signifikansi 5%, hasil ini sukar terjadi.
Kemungkinan dadu itu tidak fair lagi.

3.3.3 Distribusi Poisson


Distribusi poisson mirip dengan distribusi binomial, hanya saja P
(x) lebih kecil. Distribusi poisson didefinisikan hanya memakai
satu karakteristik, yaitu nilai mean. Contoh event yang berkaitan
dengan waktu, seperti jumlah pengunjung yang datang tiap 5
menit, atau jumlah produk yang diproduksi tiap satu jam adalah
contoh data yang mengikuti distribusi poisson.

61
Sebuah distribusi poisson bisa ditentukan menggunakan formula,
atau melihat di tabel saja.
Rumusnya adalah:

 xe 
P( X ) 
X!
Sebuah distribusi poisson, biasa dipakai untuk mengira-ngira
distribusi binomial. Misalnya, pada proses produksi seperti penge-
cekan produk error dan lain sebagainya. Ini akan menghemat
biaya dan waktu dibandingkan melakukan eksperimen untuk
distribusi binomial.
Kedua distribusi ini memiliki skewness yang mirip, jika jumlah trial
cukup besar (n • 30) dan kemungkinan kejadian (p) cukup kecil,
misalnya np atau nq < 5.
Nilai mean untuk poisson sebagai perkiraan dari binomial adalah:
µ = np
Di mana n adalah jumlah trial, dan p adalah probabilitas event.
Misalnya, kalau 4 dari 40 produk yang dibeli konsumen akhirnya
dikembalikan, maka ini adalah contoh distribusi binomial dengan:
P (sampel) = 4/40
Kalau Anda menentukan distribusi total dengan menggunakan
formula binomial, maka ini akan menjadi 40 kali kerja ekstra
keras. Karena itu, Anda dapat mengugnakan pendekatan poisson
dengan mean sampel adalah 0,10.
Tinggal cari di tabel dengan n • 30 dan np < 5 (40x 0,1 = 4).
Formula ini akan mengampilkan kemungkinan return 0 adalah 0,
9048.

Gambar 3.2 Tabel distribusi Poisson

62
3.4 Menggunakan SPSS untuk Mencari Nilai
Probabilitas Binomial dan Poisson
Berikut ini, contoh bagaimana membuat distribusi binomial dan
poisson menggunakan SPSS:
1. Buka SPSS.
2. Klik pada Variable View.
3. Masukkan varibel dengan nama “r” dan ganti Decimals
menjadi 0.

Gambar 3.3 Penggantian Decimals menjadi 0

4. Kemudian masukkan nilai sesuai dengan jumlah data yang


ingin di-generate, misalnya 10. Anda dapat menambahkan
sesuai keinginan Anda.

Gambar 3.4 Memasukkan jumlah data yang ingin di-generate

63
5. Klik pada Transform > Compute Variable.

Gambar 3.5 Klik pada Transform > Compute Variable

6. Muncul jendela Compute Variable. Isikan nama variabel


binomial di Target Variable. Kemudian isikan Numeric
Expression dengan PDF BINOM (jumlah data,
probabilitas).

Gambar 3.6 Pengisian target variable dan numeric expression

7. Maka, distribusi binomial dengan nilai n=r dan probabilitas


sesuai yang diisikan.

64
Gambar 3.7 Pengisian probabilitas

8. Anda juga bisa membuat jenis Binomial Komulatif untuk


menambahkan komulatif binomial, Transform > Compute
Variable, kemudian mengisikan nama target variabel
“Binomial_komulatif” dan gunakan Numeric Expression 1-
CD BINOM r-1, n, probabilitas.

Gambar 3.8 Pengisian binomial komulatif

65
9. Maka, hasil binomial komulatif seperti berikut ini.

Gambar 3.9 Binomial komulatif

10. Untuk poisson, klik pada Transform > Compute Variable.


Dan isikan nama Poisson di Target Variable. Dan gunakan
ekspresi numerik PDF POISSON (n, probabilitas).

Gambar 3.10 Pengisian nama variabel yang dibuat dan ekspresi


untuk membuat distribusi poisson

66
11. Hasilnya, maka distribusi binomial dan poisson sudah
dibuat. Penjelasan lebih detail tentang fungsi-fungsi di
Compute Variable akan dijelaskan di akhir bab ini.

Gambar 3.11 Distribusi binomial dan poisson sudah dibuat

3.5 Distribusi Probabilitas Normal


Distribusi probabilitas lainnya adalah distribusi normal. Distribusi
probabilitas normal memiliki beberapa karakteristik, yaitu:
 Kontinu: Nilai sumbu x bersifat kontinu, bisa tidak terbatas.
 Simetris di mean-nya, di mana setengah dari mean adalah
cerminan dari setengah mean lainnya.
 Bentuknya seperti bel, hanya ada satu puncak, yaitu di
atas mean, median, dan modus. Mean, median, dan modus
bernilai sama.
 Asimptotik, di mana ekor dari distribusi mendekati sumbu
x, tapi tidak pernah benar-benar menyentuh sumbu x.
 Variabel yang berkaitan dengan ukuran, seperti gaji, berat,
dan kecerdasan, biasanya terdistribusi secara normal.

67
Gambar 3.12 Contoh sebuah kurva distribusi normal

3.5.1 Standar Deviasi


100% dari hasil percobaan selalu ada di bawah kurva normal. Satu
standar deviasi, kira-kira mencakup 34% dari semua data
keseluruhan, dua sisi dari mean. Kurva yang datar biasanya lebih
menyebar.
Misalnya, ada 2 data rata-rata dengan rata-rata omzet 1 juta rupiah
per bulan, tapi yang satu dengan = 400 ribu rupiah, sementara
yang satu dengan = 100 ribu rupiah.

3.5.2 Distribusi Normal Standar


Disribusi normal standar bisa memiliki mean yang bisa bermacam-
macam tidak terbatas, dan juga dengan standar deviasi yang tidak
terbatas. Karena itu, tabel yang digunakan nanti juga bisa banyak.
Untuk itulah dibuat distribusi normal, dimana mean-nya di-
standarisasi ke 0 dan standar deviasinya 1.
Ini menggnakan tabel z. Di mana jarak dari standar deviasi disebut
Z, probabilitas distribusi berkaitan dengan nilai z mengikuti
distribusi probabilitas normal.
Misalnya, ada sebuah data di mana rata-rata µ = 1.800 dan
standar deviasi = 400.

68
Maka, bisa diambil nilai-nilai berikut:
A
µ±1
1.800 ± 1 (400)
1.800 ± 400
68,26% data di antara 1.400 dan 2.200
B
µ±2
1.800 ± 2 (400)
1.800 ± 800
95,44 % data di antara 1.000 dan 2.600
C
µ±3
1.800 ± 3 (400)
1.800 ± 1.200
99,74% data antara 600 dan 3.000

Gambar 3.13 Persentase cakupan data dari chart


dengan distribusi normal

69
Untuk menyederhanakan dan menyeragamkan, bisa digunakan
nilai z. Tabel Z akan menampilkan probabilitas atau area di bawah
kurva. Rumusnya mencari nilai Z adalah:

X 
Z=

Misalnya, kalau mau melihat data sebelumnya, ditanyakan berapa
probabiltias mendapatkan nilai antara 1.800 dan 2.200 adalah:

X 
Z=

= (2.200 – 1.800 )/400 = 400/400
=1
Lalu lihat tabel, untuk 1,00 nilainya adalah 0,3413.
Jadi, kemungkinan nilai antara 1.800 dan 2.200 untuk dengan
rata-rata 1800 dan standar deviasi 400 adalah 34,13%.

Gambar 3.14 Tabel Z

Gambar 3.15 Area antara 1.800 dan 2.200

70
Misalnya, berapa nilai antara 1.200 dan 2.004, Anda bisa mencari
nilai z untuk kedua nilai 1200 dan 2004. Di mana masing-masing
adalah -1,5 dan 0,51. Kalau dilihat di tabel, maka persentase total
adalah .433 + .195 atau sekiar 62,82 % data ada di antara nilai
1.200 dan 2.004.

Gambar 3.16 Contoh range antara dua nilai


di distribusi normal standar

Sebelumnya, sudah dijelaskan tentang distribusi poisson, distribusi


poisson dapat digunakan untuk mendekati distribusi binomial jika
n • 30 dan np < 5 atau nq < 5. Distribusi normal juga dapat
digunakan untuk mendekati distribusi binomial jika n • 30 dan np
serta nq • 5.
Misalnya, ada 40 pelanggan membeli barang di toko, dan data
lampau menunjukkan bahwa 25% pelanggan akan membeli lagi.
Berapa probabilitas adanya 12 penjualan lagi.
Cek dulu bahwa n = 40 lebih dari 30, selain itu np dan nq juga
lebih dari 5.
Karena:
np = 40 x 0,25= 10
Dan:
nq = 40 x 0,75 = 30
Mean dan standar deviasi dihitung menggunakan rumus berikut:
µ = np
= 40 x 0.25 = 10
Sementara standar deviasi:
= akar kuadrat dari npq
= 2,7386

71
Karena nilai 12 adalah nilai diskrit, maka dikonversi ke nilai
kontinu dulu. Misalnya, dikonversi ke batas bawah 11,5, maka
rumusnya seperti berikut:
Z = 11,5 -10 / 2,7386
= 0,55 => ,2088 atau 20,88%
Dan lebih dari 12 artinya 50% - 20,88%
= 29,12 %

3.5.3 Ringkasan Masalah di Distribusi Probabilitas


Normal
Masalah pertama adalah range diketahui, dan diminta untuk me-
nentukan probabilitas untuk range. Maka caranya adalah:
1. Cari Z terlebih dahulu dengan menggunakan formula Z =
(x-µ)/ .
2. Tentukan z di margin dari tabel z.
3. Tentukan di tabel untuk mencari probabilitas.
Sementara, kalau diketahui probabilitas dan diminta untuk men-
cari range, Anda bisa melakukan cara berikut:
1. Cari probabilitas dari tabel z.
2. Lihat dari marjin tabel untuk mencari z.
3. Cari range untuk x dengan menggunakan rumus µ± z .

3.5.4 Mengetahui Nilai Z dari Sebuah Data di SPSS


Di SPSS, pada tahapan descriptives, sebenarnya Anda bisa
melihat nilai z dari sebuah nilai tertentu z, dengan cara seperti
berikut:
1. Jalankan SPSS.
2. Buka data Gandum.sav sebelumnya.

72
Gambar 3.17 Membuka file yang berisi gandum terjual

3. Klik Analyze > Descriptive statistics > Descriptives.

Gambar 3.18 Pilih Descriptives

4. Muncul jendela Descriptives, pindahkan variabel ke


sebelah kanan.

Gambar 3.19 Memindahkan variabel ke sebelah kanan

73
5. Yang penting adalah cek pada Save standardized values
as variable.

Gambar 3.20 Cek pada Save standardized values as variables

6. Maka, di jendela output muncul informasi, tapi tidak ada


nilai z di sini.

Gambar 3.21 Tidak ada nilai z di output

7. Tapi, lihat jendela data, maka otomatis muncul satu kolom


yang berisi nilai z dari data Anda.

74
Gambar 3.22 Otomatis muncul data z di tampilan kolom

3.6 Sampling dan Distribusi Sampling dari


Mean
Statistik inferensial menggunakan sampel untuk mengestimasi
parameter populasi. Di subbab ini, dijelaskan bagaimana mean
dari sampel ( x ) digunakan untuk memprediksi mean populasi (µ).
Berikut ini beberapa alasan kenapa menggunakan data sampel,
dan bukan menggunakan data populasi:
 Biaya untuk menyensus semua populasi sangat mahal.
 Waktu untuk melakukan sensus tidak selalu tersedia.
 Beberapa pengukuran bisa merusakkan item yang diukur,
misalnya mengukur waktu hidup lampu dilakukan sampai
lampu tersebut mati.
 Sampel bisa diandalkan untuk mendapatkan hasil yang
diinginkan.

3.6.1 Probabilitas Sampling


Probabilitas sampling adalah kemungkinan sebuah item terpilih.
Ada beberapa metode probabilitas sampling. Pertama adalah
sampel acak sederhana:

75
1. Tiap anggota populasi memiliki kemungkinan yang sama
untuk dipilih.
2. Misalnya, letakkan identitas seperti nama, serial number,
dan lain sebagainya ke sebuah wadah, dan Anda bisa
mengambil untuk memilihnya.
Yang kedua adalah sampel acak sistematis:
1. Scanning item dilakukan tiap beberapa interval periode.
2. Informasi di awal interval atau akhir interval biasanya
memiliki kemungkinan lebih besar untuk terpilih.
Yang ketiga adalah sampel random bertingkat:
1. Populasi dibagi menjadi subkelompok yang homogen dan
sampling dilakukan di tiap subgroup.
2. Tipe ini bisa lebih representatif dibandingkan sampel acak
sederhana.

3.6.2 Error Sampling dan Error Nonsampling


Error sampling terjadi karena ada sampel yang tidak representatif
yang digunakan di sensus. Sementara Error nonsampling terjadi
karena metode pengumpulan sensus data yang salah. Error non
sampling yang tinggi bisa membuat sensus kurang akurat di-
bandingkan dengan sampling.

3.6.3 Distribusi Sampling dari Mean


Distribusi sampling dari mean terdiri dari semua mean sample
yang bisa diambil dari populasi N. Ini penting. Mengambil satu
sampel, adalah tinggal memilih satu dari banyak kemungkinan
sampel. Distribusi sampling ini adalah kunci utama untuk mem-
buat prediksi yang akurat di statistik inferensial.
Misalnya, anggota populasi A, B, C, D, dan E masing-masing
memiliki jumlah anak 1,2,3,4, dan 5. Distribusi sampling dari
mean, mean-nya, dan standar deviasi untuk 3 sampel dari 5
sampel ini diperlihatkan seperti berikut:
Distribusi populasi N = 5

76
Gambar 3.23 Frekuensi populasi

x
µ= = (1+2+3+4+5)/5
N
µ= 3
Standar deviasi sekitar:
= 1,414
Kalau misalnya di sampel 3 dari 5 orang tersebut, maka didapat
data berikut:

Gambar 3.24 Sampling 3 dari 5

77
Distribusi sampling dari mean seperti berikut:

Gambar 3.25 Distribusi frekuensi sampel

Kalau diplot jadi berikut:

Gambar 3.26 Plot frekuensi dari mean

 x 30
µx =  3
N 10
 1,414
x
=   0,82
n 3

78
3.6.4 Teorema Batas Sentral
Distribusi sampling dari semua mean akan selalu normal, ketika
distribusi populasi juga normal. Teorema batas sentra (central limit
theorem) juga bisa diaplikasikan ke populasi yang skew jika
jumlah sampelnya besar (n • 30).
Hubungan antara parameter populasi dan distribusi sampling, ter-
lihat seperti gambar berikut ini.

Gambar 3.27 Hubungan antara distribusi populasi


dan distribusi sampling

Karena distribusi sampling selalu normal, apapun skewness dari


populasi, distribusi mean sampel ini bisa digunakan untuk mem-
prediksi satu dari mean sampel yang ada.
Prosedur prediksi akan sama dengan mencari Z di bab
sebelumnya. Yang lazim adalah mean sampel diketahui, dan yang
ingin dicari adalah mean dari distribusi sampel.
Ini juga diterapkan ke mean populasi, karena mean populasi dan
sampel dianggap sama. Perkiraan mean populasi bisa akurat
karena standar deviasi dari distribusi sampling ini sangat kecil jika
sampel ditambahkan.
Tapi, kalau sampel terlalu banyak, akurasi juga akan sedikit
menurun. Kalau denominator x bukan n, tapi akar kuadrat dari n.
Jadi, kalau n • 30, Anda bisa melakukan estimasi titik tertentu dari
parameter populasi.

79
 Sampel mean digunakan untuk memperkirakan mean
populasi.
 Standar deviasi sampel untuk standar deviasi populasi.
Ketika n < 30 dan tidak diketahui, maka digunakan distribusi t
untuk menggantikan distribusi z. Beberapa software statistik
menggunakan kalkulasi interval dan distribusi t, berapapun ukuran
sampelnya.

3.6.5 Estimasi Interval


Estimasi interval adalah sebuah range. Range untuk µ disebut
confidence interval, standar deviasi dari distribusi sampel disebut
standar error dari mean.
Berikut ini 2 confidence interval untuk µ:
Confidence inteval 95%
Z untuk 0,95/2 = 0,475 = > 1,96


x  1,96
n
Sementara untuk 99%
Z untuk 0,99/2 = 0,4950 => 2,58

x  2,58
n
Ketika standar deviasi populasi tidak diketahui, maka standar
deviasi dari sampel digunakan sebagai estimasi dari standar
deviasi populasi, ini kalau ukuran sampel besar.

3.6.6 Estimasi Proporsi Populasi


Proporsi populasi adalah rata-rata populasi yang memiliki sifat
tertentu. Proporsi populasi dapat dinyatakan sebagai pecahan,
desimal, atau persentase. Proporsi sampel dinyatakan sebagai:

x
p
n

80
Proporsi populasi digunakan untuk mengukur sifat-sifat seperti
pilihan konsumen terhadap produk tertentu, dan proporsi part
yang lolos inspeksi. Eksperimen yang dilakukan haruslah
memenuhi syarat kondisi binomial atau pendekatan normal dari
kondisi binomial.
Estimasi interval kepercayaan untuk proporsi populasi bisa meng-
gunakan rumus berikut:

p  z p
Dimana:

p (1  p )
p 
n
Di mana p adalah proporsi sampel. n adalah ukuran sampel, di
mana harus > 30. Dan z adalah interval kepercayaan yang di-
inginkan.
Contohnya, ada 100 customer dan 80 di antaranya merasa puas
dengan layanan. Maka, kita bisa menghitung proporsi populasi
untuk interval kepuasan 95%.
Maka, bisa dicari dengan cara seperti ini:
x
p
n
80 = 0,8
p
100
Karena n = 100, n • 30 jadi sudah memenuhi syarat.
Sementara z untuk 95% adalah 1,96
np = 100 x 0,8 = 80 • 5
nq = 100 x 0,2 = 20 • 5

p (1  p )
p 
n
0,8(1  0,8)

100
 0,0016  0,04

81
Cakupan adalah:

p  z p
0,8 ± 1,96(0,04)
0,8 ± 0,0784
0,722 <-> 0,878

3.6.7 Menentukan Ukuran Sampel


Ukuran sampel dalam eksperimen sangat penting, karena kalau
ukuran sampel kekecilan, nanti hasilnya tidak optimal. Tapi,
menggunakan sampel yang terlalu besar juga tidak optimal,
karena membutuhkan banyak biaya.
Berikut ini, tiga faktor yang penting untuk menentukan ukuran
sampel yang cukup:
 Variansi populasi ( 2)
Variansi populasi yang besar artinya ukuran sampel yang
besar diperlukan untuk memperoleh hasil yang baik. Jika
variansi tidak diketahui, Anda bisa mengestimasinya
dengan survei pendahuluan.
 Tingkat kepercayaan (z)
Anda bisa memakai tingkat kepercayaan 90%. Semakin
tinggi tingkat kepercayaan (degree of confidence), maka
sampel yang dibutuhkan makin besar.
 Jumlah error yang bisa diterima (E)
Sedikit error bisa diterima untuk ukuran sampel yang besar.
Berikut ini rumus untuk menentukan ukuran sampel ketika meng-
estimasi mean dari populasi.

 z 
2

n 
 E 
Misalnya ada data rata-rata dari 49 pembelian adalah 7500 rupiah,
lalu standar deviasi 700 rupiah. Dengan jumlah n = 49. Kira-kira
berapa jumlah sampel yang diperlukan untuk menurunkan error
sampling menjadi 100 rupiah dengan tingkat kepercayaan 99%.

82
Diketahui bahwa:

Rata-rata ( x ) adalah 7500


Z untuk 0,99 adalah 2,58
adalah 700
n = 49
Maka n baru bisa dihitung dengan cara seperti berikut:

 z 
2

n 
 E 
2
 2,58 x700 
n 
 100 
n  18,06 2
n  327
Cek jawaban ini dengan menghitung level kepercayaan meng-
gunakan sampel baru.


xZ
n
700
x  2,58
327
x  99,87
Dimana 99,87 < 100 (diterima)
Karena interval diterima, maka survey bisa dilakukan dengan
sampel baru sejumlah 327. Ketika menentukan ukuran sampel
baik untuk mean dan proporsi, jawaban yang kurang dari 30 harus
digenapkan sampai 30, karena ukuran formula sampel digenapkan
ke 30. Ukuran sampel saat mengestimasi proporsi populasi seperti
berikut:
2
Z
n = p (1  p ) 
E

83
3.7 Panduan Lengkap Perhitungan
Probabilitas Multi Distribusi dengan
Compute Variable
Di tutorial kali ini, kita akan mendemokan penghitungan beberapa
jenis probabilitas dari berbagai jenis distribusi. Baik yang sudah
dijelaskan, atau akan dijelaskan di belakang. Dijadikan satu
karena menggunakan akses compute variable yang sama.
1. Klik pada Variable View, kemudian buat beberapa jenis
variabel dan biarkan tipe data standar Numeric, nanti
Width dan Decimals bisa diedit sambil jalan.

Gambar 3.28 Klik pada Variable View

2. Klik pada Transform > Compute Variable.

Gambar 3.29 Transform > Compute Variable

84
3. Pertama, lihat beberapa fungsi untuk mengakmodasi ber-
bagai variasi yang ada di jendela Compute Variable ini.
Semua fungsi di SPSS ini ada di box Function Group.
Memilih salah satu fungsi di sini akan menampilkan
submenu di kotak Functions and Special Variables.

Gambar 3.30 Kotak Function group di bagian kanan

4. Anda dapat memilih PDF & Noncentral PDF untuk men-


dapatkan daftar fungsi Probability Dencity Functions.

Gambar 3.31 Fungsi Probability Density Function

85
5. Kalau memilih Inverse DF, Anda bisa mendapatkan menu-
menu tentang Inverse Functions for Cumulative
Probabilities.

Gambar 3.32 Fungsi Inverse Functions for Cumulative Probabilities

6. Kalau memilih Random Numbers, maka akan ditampilkan


list Random Number Generators, untuk meng-generate
nomor acak bagi beberapa jenis distribusi.

Gambar 3.33 Fungsi Random numbers generator

86
7. Klik Significance untuk menyediakan akses ke fungsi-
fungsi yang diperlukan untuk menghitung significance
(atau sering disebut nilai p), yang berkaitan dengan
distribusi f dan chi square.

Gambar 3.34 Fungsi Significance

8. Kalau mengklik Statistical, akan terlihat beberapa fungsi


rutin yang digunakan untuk perhitungan statistik.

Gambar 3.35 Fungsi Statistical

87
9. Kalau klik Arithmetic, Anda bisa melihat daftar fungsi
aritmetika, aljabar, dan transendental yang mungkin perlu
ditambahkan ke perhitungan Anda.

Gambar 3.36 Fungsi Arithmetic

10. Misalnya, ada data nilai x yang sederhana, yaitu 5, 10, 15,
dan 20. Tuliskan data ini di variabel.

Gambar 3.37 Pengisian data di kolom x

11. Pertama, hitung binomial P (x) • 5, P (x) • 10, P (x) • 15,


P (x) • 20, dengan nilai n = 23 dan probabilitas 0,37.
12. Klik pada CD & Noncentral CDF, lalu klik Cdf.Binom,
maka muncul tanda ??? sebagai parameter CDF.BINOM.
Tanda tanya pertama adalah untuk x, yang kedua untuk n,
dan ketiga untuk p.

88
P (X•x) = CDF.BINOM (x,n,p)
Ini untuk distribusi binomial dengan probabilitas sukses p
dan jumlah trial n.

Gambar 3.38 Halaman Compute Variable untuk Binom

13. Set Target Variable ke Binomial, dan set n=23 dan p=0.37.
Komanya memakai titik, karena SPSS memakai standar
barat di mana koma pemisah desimal ditulis memakai titik.

Gambar 3.39 Koma desimal ditulis menggunakan titik

89
14. Klik OK, muncul konfirmasi Change existing variable, klik
OK.

Gambar 3.40 Konfirmasi change existing variable

15. Output akan menghasilkan berapa probabilitas untuk P


(x•5), P (x•10), P (x•15), dan P (x•20) untuk n = 23 dan
p = 0,37.

Gambar 3.41 Hasil nilai Binomial dari variabel x

16. Untuk melebarkan nilai, Anda bisa mengatur variabel


Binomial ke 4 desimal, dan juga variabel p juga diatur ke 4
desimal.

90
Gambar 3.42 Penggantian nilai desimal untuk binomial dan P

17. Salin hasil binomial dengan cara menyeleksi, lalu klik


kanan dan pilih menu Copy.

Gambar 3.43 Klik menu Copy

18. Kemudian letakkan di sel pada kolom P, lalu klik kanan,


klik Paste.

91
Gambar 3.44 Klik kanan dan paste di kolom P

Misalnya, kita ingin menghitung kebalikannya, yaitu mencari x


untuk probabilitas komulatif yang diketahui, misalnya 0,0938.
Karena SPSS tidak memiliki fungsi inverse, Anda bisa memakai
command syntax. Ini sekaligus mendemokan bagaimana meng-
gunakan sintaks dan perhitungannya.
1. Klik pada File > New > Syntax.

Gambar 3.45 File > New > Syntax

2. Isikan kode berikut, pertama mendeklarasikan variabel,


kemudian meng-compute cd.binom (x,n, psukses).
Compute n = 10 .
compute psukses = 0.37.
compute obs= 4.
compute counter = 1.
loop if (counter le obs).
compute X=0.
compute prob = cdf.binom(X,n,psukses).
Loop If (prob LT p).

92
Compute X = X + 1.
Compute prob = cdf.binom(X,n,psukses).
End loop.
End loop.
Compute InvBinom=X.
Execute.

Gambar 3.46 Mengetikkan sintaks secara manual

3. Akhir dari tiap baris selalu diakhiri dengan tanda titik.


Untuk menjalankan, klik pada Run > All.

Gambar 3.47 Run > All untuk menjalankan sintaks ini

4. Maka, kebalikan dari binomial tersebut dapat dilihat di


kolom InvBinom.

93
Gambar 3.48 InvBinom menampilkan kebalikan binomial
yang sama seperti kolom x

Berikutnya adalah PDF.Binom yang digunakan untuk menghitung


probabilitas dari P(X=x) untuk distribusi binomial.
1. Klik pada Function group PDF & Noncentral PDF.
2. Klik pada Pdf.binom.

Gambar 3.49 Pdf.binom (???)

3. Ini digunakan untuk menghitung P (X=x) = Pdf.Binom


(x,n,p). Fungsi ini sama seperti frekuensi komulatif.

94
3.7.1 Probabilitas Normal
Seperti telah dijelaskan sebelumnya, karakteristik utama dari
distribusi normal adalah dua parameter, yaitu mean µ dan standar
deviasi . Sehingga, untuk menghitung frekuensi kumulatif untuk
nilai x tertentu di file data, Anda perlu memasukkan mean dan
standar deviasi ini. Misalnya, kalau diketahui data µ = 6,25 dan
standar deviasi = 3,5.
Sama seperti distribusi binomial, Anda bisa mengakses fungsi
Cumulative Frequency Distribution untuk distribusi normal dengan
mean dan standar deviasi.
Klik pada Compute variable, lalu pilih Cdf & Noncentral CDF.
Kemudian klik pada Cdf.Normal. Kalau nilai x dimasukkan, maka
akan dihitung probabilitas P(-•<X<x) di mana x merepresentasikan
nilai data yang digunakan.
1. Buka jendela Compute Variable.
2. Klik CDF & NonCentral CDF. Pilih CDF.normal.

Gambar 3.50 Pilih CDF normal

3. Isikan x, mean, dan standar deviasi.

95
Gambar 3.51 Pengisian x, mean, dan standar deviasi

4. Untuk menghitung probabilitas dari bentuk p (a < X < b)


memakai SPSS, Anda bisa memakai ekspresi numerik.
Cdf.Normal (b, µ, ) – Cdf.normal (a, µ, )
5. Tambahkan nilai desimal untuk variabel Normal, dan copy
paste ke variabel p. Tapi sebelumnya, ganti nilai Decimals
untuk Normal menjadi 4.

Gambar 3.52 Penentuan decimals menjadi 4

6. Untuk meng-copy, klik kanan sel-sel di kolom Normal,


kemudian klik Copy.

96
Gambar 3.53 Klik menu Copy untuk menyalin di kolom Normal

7. Kemudian klik kanan di kolom P, dan klik menu Paste.

Gambar 3.54 Klik menu Paste untuk menyalin ke folder p

8. Maka, nilai tersebut tersalin di p. Sekarang, kita akan


mengembalikan ke dist normal dengan melakukan inverse.

Gambar 3.55 Data sudah tersalin ke kolom p

97
9. Misalnya untuk mencari nilai x untuk P (-• < X < x) = p.
Anda bisa menggunakan Idf.Normal dengan p sudah
diketahui, rata-rata µ = 6,25 sudah diketahui dan standar
deviasi = 3,5 juga sudah diketahui. Buka Compute
Variable, kemudian pilih Inverse DF > Idf.Normal. Isikan
parameter p, lalu mean/rata-rata, dan standar deviasi.

Gambar 3.56 Pengisian mean, rata-rata, dan standar deviasi

10. Maka di Inverse Normal, akan terlihat nilai x lagi.

Gambar 3.57 Hasil inverse normal

98
3.7.2 Probabilitas Distribusi T
Parameter yang dibutuhkan untuk distribusi t adalah derajat
kebebasan atau degree of freedom:
df = n – 1
Cara menghitung probabilitas untuk distribusi t mirip dengan
langkah-langkah untuk menghitung distribusi normal dan
binomial. Fungsi distribusi frekuensi kumulatif untuk distribusi t
dengan df = n -1 dapat dibuka menggunakan Compute Variable,
kemudian memilih CDF & Non Centarl CDF dan memilih Cdf.T.
Ini akan menghitung hasil P (-• < T < x).
Langkah-langkahnya seperti ini:
1. Buka Compute Variable, dan pilih CDF & NonCentral CDF
dan klik Cdf.T.

Gambar 3.58 Klik pada CDF.T

2. Klik pada masukkan parameter pertama berupa kolom x,


dan yang kedua df atau degree of freedom, misalnya 3.
Maka, hasilnya ditampilkan di kolom t.

99
Gambar 3.59 Kolom t menampilkan degree of freedom

3. Ganti Decimals untuk t menjadi 4.

Gambar 3.60 Mengganti nilai Decimals dari kolom t

4. Maka, hasilnya terlihat lebih jelas desimalnya.

100
Gambar 3.61 Hasil desimal t menjadi lebih tinggi

5. Untuk mencari inverse-nya, klik pada Inverse DF.


Kemudian pilih Idf.T.

Gambar 3.62 Idf.T

6. Isikan kolom t untuk hasil dan df-nya. Kemudian tekan


Enter.

101
Gambar 3.63 Klik df untuk enter

3.7.3 Probabilitas Distribusi Chi Square


Parameter yang digunakan untuk distribusi 2 (chi square) adalah
degree of freedom (df), yang rumusnya adalah df = n-1. Fungsi
Cdf.Chisq akan menghasilkan nilai P ( - • < 2 < x).
Berikut cara menggunakan probabilitas distribusi chi square:
1. Klik pada Compute Variable.
2. Kemudian klik pada CDF & Non Central CDF.
3. Pilih CDF.Chisq, lalu pilih parameter pertama kolom x, dan
yang kedua adalah nilai df. Target diisikan di Chi.

Gambar 3.64 Pemilihan nilai df

102
4. Klik OK, maka hasilnya akan ditampilkan.

Gambar 3.65 Nilai ditampilkan

5. Untuk mengembalikan nilai x kalau nilai P sudah diketahui


pada distribusi Chi square, Anda bisa mengembalikan
dengan menggunakan InverseChi yang merepresentasikan
nilai 2 dari distribusi 2.

Gambar 3.66 Fungsi Inverse Chi

103
6. Maka hasilnya bisa dilihat di kolom InvChi.

Gambar 3.67 InvChi mengembalikan nilai x dari


nilai p (x) yang sudah diketahui

3.7.4 Probabilitas Distribusi F


Ketika bekerja dengan distribusi F, parameter perlu ditentukan
untuk distribusi, yaitu dua degree of freedom. dfN untuk numerator
dan dfD untuk denominator. Misalnya, untuk contoh dimisalkan dfN
= 3 dan dfD = 5.
Anda bisa menghitung probabilitas fungsi F dengan CDf.F, di
mana ini akan mengembalikan probabilitas P (-• < F < x).
1. Ganti nama kolom F menjadi ProbF.

Gambar 3.68 Ganti nama kolom F menjadi probF

104
2. Isikan target Variable ke ProbF, isikan fungsi CDF &
Noncentral CDF, dan klik pada Cdf.F, lalu masukkan x,
dfN, dan dfD.

Gambar 3.69 Pengisian DFN dan DFD

3. Hasilnya muncul di kolom ProbF.

Gambar 3.70 Hasilnya muncul di kolom ProbF

105
4. Ganti nilai Decimals dari ProbF dengan nilai 4.

Gambar 3.71 Ganti nilai decimals dari kolom variabel ProbF menjadi 4

5. Adapun untuk mencari inverse x kalau diketahui p(x)


untuk distribusi F. Anda bisa menggunakan Inverse DF >
idf.F. Isikan target variabel ke InvF.

Gambar 3.72 Inverse Df ke Inv.df

6. Kemudian klik pada tombol OK, maka hasilnya ditampil-


kan di kolom InvF.

106
Gambar 3.73 Hasil ditampilkan di InvF

3.8 Mengecek Normalitas Variabel Random


secara Grafis
Misalnya, Anda punya beberapa nilai data yang ingin dicek secara
grafis, apakah set data tersebut terdistribusi secara normal. Anda
bisa memakai tool yang biasa disebut plot probabilitas normal.
Berikut ini cara mengecek normalitas data, apakah mengikuti
distribusi normal atau tidak dengan menggunakan cara manual
dan otomatis.
1. Isikan data yang akan dicek distribusi normalnya, misalnya
seperti berikut, letakkan dalam variabel x.

Gambar 3.74 Pengisian data yang akan dicek ke distribusi normalnya

107
2. Pertama, sort atau urutkan dulu data, caranya klik pada
Data > Sort cases.

Gambar 3.75 Menu untuk mengurutkan data > sort cases

3. Di jendela Sort Cases, Anda bisa mencari tahu variabel


yang akan di-sort dan klik pada tombol Sort Order.
Masukkan variabel x yang sudah dibuat sebelumnya.

Gambar 3.76 Memasukkan variabel x

108
4. Kalau variabel x sudah dimasukkan, klik pada tombol OK.

Gambar 3.77 Variabel x sudah dimasukkan untuk diurutkan

5. Hasilnya, akan seperti berikut.

Gambar 3.78 Hasil pengurutan

6. Masukkan variabel baru dengan klik pada Edit > Insert


Variable.

109
Gambar 3.79 Edit > Insert Variable

7. Beri nama variabel i, dan letakkan sebelum variabel x.

Gambar 3.80 Pengisian variabel bernama i

8. Maka di data view, terlihat kolom i masih kosong.

110
Gambar 3.81 Pemberian isi dari angka 1 sampai angka 12

9. Beri isinya dengan angka 1 sampai 12.

Gambar 3.82 Mengisikan angka 1 sampai 12

111
10. Berikutnya, tentukan posisi plot menggunakan pendekatan
Blom, yang menggunakan formula berikut di Compute
Variable:
i  0,375
p
n  0,25
11. Klik pada Transform > Compute Variable.

Gambar 3.83 Transform > Compute Variable

12. Buat perhitungan untuk menghitung nilai p tersebut, dan


masukkan ke target variable ‘p’.

Gambar 3.84 Compute variable untuk menghitung p

13. Maka kelihatan hasil perhitngan untuk p.

112
Gambar 3.85 Hasil perhitungan untuk p

14. Sesuaikan nilai desimal untuk variabel yang terhitung ke 4


tempat.

Gambar 3.86 Penyesuaian nilai desimal ke 4 tempat

15. Maka, kolom p berisi empat nilai desimal.

113
Gambar 3.87 Kolom p berisi empat nilai desimal

16. Walaupun tidak wajib, Anda bisa menstandarisasi nilai x


memakai mean dan standar deviasi. Cara menampilkan
nilai Z observasi (sesuai data) adalah melalui Analyze >
Descriptive Statistics > Descriptives.

Gambar 3.88 Klik Analyze > Descriptive Statistics

114
17. Muncul Descriptives, dan masukkan x ke kotak variable di
sebelah kanan.

Gambar 3.89 Klik pada kolom x

18. Kalau variable (s) sudah berisi x, cek pada Save


standardized values as variables.

Gambar 3.90 Cek pada Save standardized values as variables

19. Maka hasilnya akan ditampilkan di kolom Zx.

115
Gambar 3.91 Kolom Zx

20. Langkah berikutnya adalah dengan menghitung standar


normal yang dimasukkan dalam variabel Ze yang dihitung
dengan menggunakan rumus:
Ze = Idf.Normal (p,0,1)
21. Klik pada Transform > Compute Variable.

Gambar 3.92 Transform > Compute Variable

22. Hitung dengan compute variable IDF.normal (p,0,1) dan


letakkan di target variable Ze.

116
Gambar 3.93 Pengisian target variable ze

23. Hasil akhir perhitungan nilai seperti berikut, tinggal mem-


plot Zx dan Ze.

Gambar 3.94 Hasil perhitungan untuk mengecek


apakah data berdistribusi normal

24. Ubah nilai desimal pada Ze dan Zx dengan 4 decimals.

117
Gambar 3.95 Pengubahan nilai desimal

25. Beri label pada zx dengan nilai observed yang berdasarkan


observasi atau pengamatan. Serta beri label pada ze nilai
expected yang didapat berdasarkan rumus.

Gambar 3.96 Pemberian label

26. Tampilan data menjadi lebih lebar.

Gambar 3.97 Tampilan data menjadi lebih lebar

118
27. Baru buat plot Zx dan Ze yang juga dianggap diagram QQ
plot untuk mengecek normal atau tidak. Klik pada Graphs
> Legacy Dialogs > Scatter/Dot.

Gambar 3.98 Menu untuk membuat grafik scatter/dialog

28. Kemudian pilih tipe Simple Scatter.

Gambar 3.99 Pemilihan tipe simple scatter

29. Muncul jendela Simple Scatterplot untuk memasukkan


variabel yang akan di-plot.

119
Gambar 3.100 Memunculkan jendela scatter plot

30. Masukkan Ze sebagai sumbu x dan Zx sebagai sumbu Y.

Gambar 3.101 Memasukkan sumbu x dan sumbu y

120
31. Klik Titles, dan isikan judul di Title > Line1.

Gambar 3.102 Judul di Title > Line1

32. Klik Continue, kembali ke Simple Scatter plot, klik OK


untuk menutup jendela ini dan membuat plot Scatter plot.

Gambar 3.103 Membuat scatter plot

121
33. Hasil plot seperti berikut ini.

Gambar 3.104 Hasil plot sudah dibuat

34. Untuk memudahkan melihat scatter, Anda bisa me-


nambahkan reference line y = x. Klik dua kali pada gambar
grafik di output, dan klik tombol Add a reference line from
Equation.

Gambar 3.105 Klik pada tombol Add a reference line from equation

122
35. Di jendela Reference Line, isikan Y = 1x di Custom
Equation.

Gambar 3.106 Klik di Custom Equation

36. Muncul reference line.

Gambar 3.107 Reference line sudah dibuat

123
37. Kalau dilihat data berdistribusi secara random di sekitar
reference line. Ini artinya data normal.

Gambar 3.108 Plot mendekati garis referensi secara random

38. Selain cara manual di atas, Anda juga bisa menggunakan


fasilitas wizard untuk menampilkan plot qq normal. Klik
pada Analyze > Descriptive Statistics > QQ Plots.

Gambar 3.109 Analyze > QQ Plots

39. Di jendela QQ Plots, klik pada tombol panah kanan untuk


memasukkan variabel X.

124
Gambar 3.110 Variabel X dimasukkan ke variables di QQ Plots

40. Langsung muncul tampilan plot yang sama seperti yang


dibuat dengan cara manual sebelumnya.

Gambar 3.111 Hasil pembuatan qq plots dengan cara wizard

###

125
126
BAB Statistik Parametrik
4

Statistik parametrik terdiri dari banyak hal, di bab ini dijelaskan


beberapa hal penting seputar statistik parametrik. Statistika
parametrik adalah ilmu statistika yang mempertimbangkan jenis
sebaran/distribusi data, yaitu apakah data menyebar normal atau
tidak.
Pada umumnya, jika data tidak menyebar normal, maka data
harus dikerjakan dengan metode statistika non-parametrik, atau
setidak-tidaknya dilakukan transformasi agar data mengikuti
sebaran normal, sehingga bisa dikerjakan dengan statistika
parametrik.
Contoh metode statistika parametrik: uji-z (1 atau 2 sampel), uji-t
(1 atau 2 sampel), korelasi pearson, perancangan percobaan (1 or
2-way ANOVA parametrik), pengendalian kualitas statistik, dan
lain sebagainya.

4.1 Pengujian Hipotesis Sampel Besar


Di sampel besar (n>30), test menggunakan z bisa diterima.
Standar deviasinya kadang diketahui dan kadang tidak diketahui.
Adapun sampel jumlah kecil (n<30) biasa memakai tes distribusi t.
Contoh pengujian hipotesis untuk sampel besar antara lain:
 Masalah quality control atau pegendalian kualitas pada
parameter sebuah pabrik.

127
 Riset pemasaran, seperti proporsi pelanggan yang me-
nyukai produk baru.
 Isu politik, seperti proporsi pemilih yang menyukai
kandidat tertentu.
Berikut ini beberapa hal penting dalam pengujian hipotesis:
 H0 atau hipotesis nol, menyatakan nilai tertentu yang di-
hipotesiskan untuk parameter populasi, seperti mean.
 H0 menyatakan bahwa tidak ada perbedaan statistik
antara parameter µ dan nilai satistik X . Misalnya, sebuah
pemilik toko ingin mengetahui apakah ada rata-rata pem-
belian pelanggan dari sebuah toko yang dulunya punya
mean 7,75 pembelian per bulan sekarang berkurang,
karena 49 sampel yang diambil terakhir memiliki mean 7,5
pembelian saja per bulan.
H0 menyatakan bahwa rata-rata pembelian tidak berkurang dari
7,75. Atau kalau dinyatakan dalam bentuk matematis seperti
berikut:
H0: µ • 7,75
H0 akan ditolak jika perbedaan antara µ yang dihipotesiskan dan
x besar, dan sering terjadi. Arah dari ketidaksamaan adalah lebih
besar atau sama dengan • karena ini mengindikasikan mean tidak
berkurang. Maka, alternatif hipotesis adalah mean di bawah 7,75.

4.1.1 Level Signifikansi


Untuk menentukan menerima atau menolak hipotesis, digunakan
level signifikansi. Level signifikan 0,01 mengindikasikan bahwa
sampel statistik paling tidak perbedaan tidak lebih dari 1% dari
parameter yang dihipotesiskan. Atau dengan kata lain error
maksimal adalah 1%. Level signifikansi ini menjadi batas dari
sampel statistik, lebih dari ini, H0 akan ditolak.
Ketika membuat hipotesis ada 2 kemungkinan error, yaitu error
tipe 1 ( ) dan error tipe 2 ( ). Error tipe alfa nilainya sama seperti
level signifikansi, ini mengukur resiko menolak hipotesis nol yang
benar.

128
Kalau memutuskan untuk menolak hipotesis nol tentang rata -rata
pembelian 7,75 membuat munculnya error tipe 1, yaitu menerima
ada penurunan, padahal tidak ada penurunan. Error tipe 1 untuk
marketing biasanya 0,05 dan 0,01 untuk pengendalian kualitas.
Tipe error 2 atau tipe beta digunakan untuk menerima hipotesis
nol yang salah.
H0 True H0 False
Menerima H0 Benar Error Tipe 2
Menolak H0 Error Tipe 1 Benar

Untuk memutuskan apakah menerima atau menolak hipotesis,


digunakan tes statistik. Tes statistik yang akan menentukan
validitas dari hipotesis nol. Contohnya termasuk x dan p .

Pertama, digunakan asumsi bahwa hipotesis nol benar. Untuk level


signifikansi 0,01, nilai z = -2,33, artinya • 1% dari sampel ada di
belakang -2,33 standar deviasi untuk level signifikansi 0,01.
Hipotesis alternatif lain menunjukkan pada bagian penolakan di
masalah one tail ini di kiri, karena owner mempertimbangkan
mean 7,5 yang menyatakan mean populasi sudah menurun.

Gambar 4.1 Kurva normal menunjukkan z = -2,33


untuk level signifikansi 1%

Secara garis besar, berikut ini 5 langkah pengujian hipotesa:


1. Tentukan hipotesis nol dan hipotesis alternatifnya.
Tentukan kondisi yang akan dites, apakah >, < atau •.
Kemudian jadikan itu H1. Tentukan kondisi kebalikannya,
dan jadikan H0.
2. Pilih level signifikansi berdasarkan error tipe 1.

129
3. Tentukan test statistik yang relevan, seperti x atau p .
4. Tentukan aturan pengambilan keputusan menggunakan
grafik dari nilai kritis z. Terima hipotesis nol jika tes
statistik z tidak melebihi nilai kritis z. Kalau terjadi
kebalikannya, maka tolak hipotesis nol.
5. Ambil keputusan berdasarkan aturan tersebut.
Atau sederhananya, kalau tes statistik jauh lebih ekstrim
dibandingkan nilai kritis, maka tolak hipotesis nol.

4.1.2 Pengujian Satu Sampel Satu Sisi


Misalnya, untuk uji di atas, owner toko ingin mencari tahu apakah
rata-rata pembelian bisa kurang dari <7,75 karena sampling baru
dengan n = 49 menunjukkan bahwa mean cuma 7,5. Owner ingin
tipe 1 error adalah 1%.
Maka, menggunakan 5 tahapan pengujian hipotesa di atas, bisa
dicari tanda seperti berikut:
1. H0: µ • 7,75 dan H1: µ <7,75.
2. Tipe I error 1%.
3. Tes statistiknya x .
4. Jika Z kurang dari -2,33, maka reject hipotesis nol.
x 7 ,5  7 ,75  25  25
Z       2 ,5
 70 70 10
49 7
n
Karena Z lebih kecil dari 2,33, maka H0 di-reject atau ditolak.
Contoh lain seperti berikut:
Misalnya, ada sebuah part mesin yang harus diproduksi dengan
berat kurang dari atau sama dengan 30 mg. Tapi ketika disampel
dengan n = 36 part, ternyata mean-nya adalah 30,025 mg. Ketika
diketahui standar deviasi sampel adalah 0,065 mg, dan error 0,01,
maka bisa diuji hipotesis seperti berikut:
1. H0 : µ • 30 dan H1: µ • 30.
2. = 0,01.
3. Menggunakan jenis tes x .

130
4. Nilai kritis untuk 0,01 adalah z = 2,33. Jika tes di bawah
2,33, maka tolak H0.
5. Anda bisa menghitung nilai Z:
x 30,025  30 0,025
Z    2,315
 0,65 0,0108
n 36
Maka H0 diterima, karena 2,315 < 2,33, jadi part tak terlalu berat.

4.1.3 Pengujian Satu Sampel Dua Sisi


Pengujian dua sisi (two tail), memperhatikan perubahan, tidak
peduli apakah dari sisi kanan dan kiri. Misalnya, owner toko tidak
peduli apakah rata-ratanya naik atau turun, yang penting apakah
ada perubahan atau tidak.
Jadi, kalau untuk contoh di atas, bisa diuji apakah nilai akan
berubah atau tidak.
H0: µ = 7,75
H1: µ • 7,75
Untuk hipotesis dua arah ini, hipotesis alternatif tidak menyatakan
arah perubahan. Kalau menggunakan level signifikansi 0,01, maka
error alfa harus dibagi 2 antara 2 ekor grafik.
Statistik tes tetap ± 250 dan nilai kritis berubah ke ± 2,58. Anda
bisa menerima hipotesis 0, jika z = -2,50, jika nilai tidak diluar -
2,58. Jika mean sampel 7,5 tidak cukup rendah untuk menyata-
kan bahwa populasi tidak sama dengan 7,75. Jadi intinya,
perbedaannya masih bisa diterima, jadi H0 tidak ditolak.

Gambar 4.2 Ilustrasi tes dua sisi

131
4.1.4 Uji Hipotesis Populasi Independen
Dua buah variabel disebut independen jika kemunculan satu
variabel tidak mempengaruhi kemunculan variabel lainnya.
Misalnya, ada dua buah toko, dan dilihat rata-rata penjualannya
seperti berikut, dari ukuran sampel yang berbeda:
 Toko satu diambil 50 sampel dan memiliki mean 7,5
penjualan per orang, dan standar deviasi 1.
 Toko kedua diambil 32 sampel dan memiliki mean 7,4
penjualan per orang, dan standar deviasi 0,8.
Maka, dapat dilakukan langkah-langkah pengujian hipotesis
seperti berikut ini:
1. H0: µ1 = µ2 dan H1: µ1 • µ2.
2. Karena klaim ini berkaitan dengan dunia marketing, maka
digunakan level signifikansi 0,05.
3. Gunakan tes x untuk mencari nilai z:
x1  x2
Z
S12 S 22

n1 n2
90  100  10
Z   2,71
15 2
20 2
5,625  8

40 50
4. Nilai kritis untuk 0,025 (karena 2 sisi) adalah ± 1,96.
5. Karena H0 = -2,71 dan di luar -1,96, maka Anda bisa
menolak H0 dan menyatakan bahwa penjualan di dua toko
tidak sama.

4.2 Pengendalian Kualitas Statistik


Salah satu penggunaan statistik adalah untuk mengendalikan
kualitas proses produksi. Meningkatnya kompetisi di proses
produksi membuat penggunaan statistik sangat penting. Sebuah
proses produksi lazim mengalami variasi. Ada 2 jenis variasi
dalam proses produksi, yaitu variasi random (acak), dan variasi
yang memang disengaja.

132
Variasi random terjadi secara acak, berjalan dengan seiringnya
waktu berjalan. Sementara variasi sengaja dilakukan karena ada
kejadian yang disengaja, seperti penggantian material, kondisi
lingkungan, penyesuaian peralatan, dan lain sebagainya.

4.2.1 Grafik Pengendalian Kualitas


Sebuah grafik pengendalian kualitas bertugas mengukur nilai atau
statistik proses selama beberapa waktu tertentu. Ada nilai statistik
tertentu sebagai nilai batas atas (upper limit) dan nilai batas bawah
(lower control limit), untuk mengecek apakah proses masih ter-
kontrol atau tidak.
Grafik pengendalian kualitas mengukur rata-rata/mean dari
ukuran, berat, atau temperatur yang diukur lebih tinggi atau lebih
rendah dari batas atas dan batas bawah. Ketika data ada di antara
batas atas atau batas bawah, maka data tersebut dikatakan berada
dalam kontrol atau in control.
Ada beberapa jenis grafik kontrol:
1. Grafik x digunakan untuk mengukur rata-rata data
apakah di luar atau di dalam kontrol.
2. Grafik range, mengukur apakah range variasi dalam
ukuran seperti berat, temperatur, dan lainnya terlalu besar
atau tidak.
3. Grafik p , mengukur apakah proporsi dari beberapa atribut
berada dalam kontrol atau tidak.

4.2.2 Grafik X Bar


Estimasi interval berdasarkan teorema batas sentral merupakan
dasar teoritis untuk pembuatan chart x . Cara untuk menghitung
batas atas dan batas bawah tergantung pada interval kepercayaan.
Interval kepercayaan yang dipakai biasanya 99,74 %, 95 % dan
90%. UCL (upper control limit), batas kontrol atas dapat dihitung
seperti berikut:
s
UCL  x  3
n

133
Untuk batas kontrol bawah, LCL (lower control limit), dapat
dihitung dengan cara seperti berikut:
s
LCL  x  3
n
Di mana x adalah mean dari mean sampel. Dan s adalah rata-rata
dari standar deviasi sampel. Badan seperti American Society For
Testing And Materials (ASTM) juga menyediakan beberapa faktor
kontrol untuk memudahkan menghitung UCL dan LCL meng-
gunakan rumus seperti berikut:

UCL  x  A2 R LCL  x  A2 R
Di mana nilai A2 tergantung kepada ukuran sampel:
Ukuran sampel (n) A2 D3 D4
2 1,880 0 3,267
3 1,023 0 2,575
4 0,729 0 2,282
5 0,557 0 2,115

A2 adalah faktor yang digunakan untuk merelasikan interval


kepercayaan dari mean ke mean dari range. Dan R adalah mean
dari range sampel.
Misalnya, ada data panjang dari part yang harusnya berukuran 50
mm dengan n = 4.
Sampel Berat Part x Range
1 51 50 50 49 50 2
2 54 49 51 50 51 5
3 49 49 50 48 49 2
Total untuk N = 3 150 9

x
 x  150  50 R
R  9 3
N 3 N 3
Kalau menggunakan interval kepercayaan 99,74%, maka UCL dan
LCL bisa dihitung dengan cara seperti berikut.

1. UCL = x  A2 R = 50 + 0,729(3)
UCL = 50 + 2,187 = 52,187

134
2. LCL = x  A2 R
LCL =50- 2,187
= 47,813
Maka, kalau diplot terlihat seperti berikut:

Gambar 4.3 Grafik pengendalian kualitas

4.2.3 Grafik R
Grafik range mengukur variasi untuk range sampel dengan interval
kepercayaan tertentu. ASTM telah membuat rumus yang me-
mudahkan untuk menghitung UCL dan LCL:

UCL = D4 R

LCL = D3 R

Di mana Anda bisa mengambil variabel D dari tabel yang sudah


dijelaskan di atas. Untuk data sebelumnya, UCL dan LCL-nya
seperti berikut:

UCL = D4 R = 2,282 (3) = 6,846

LCL = D4 R =0(3)= 0

4.2.4 Grafik P
Grafik P megukur proporsi dari beberapa atribut (misalnya item
yang cacat dari produksi) yang merupakan hasil dari proses ter-
tentu. Ini mengukur atribut kualitatif (seperti tingkat defektif) dan
bukannya tingkat kuantitatif seperti berat atau suhu.

135
Misalnya, ada data tentang proporsi cacat produk dari sebuah
pabrik dengan n = 150, memiliki data seperti berikut:
Tanggal Cacat Proporsi Cacat
1 9 0,06
2 0 0,00
3 6 0,04
4 9 0,06
5 12 0,08
6 3 0,02
7 6 0,04
8 12 0,08
9 6 0,04
10 15 0,10
11 0 0,00
12 12 0,08
13 3 0,02
14 9 0,06
15 6 0,04

Beberapa rumus untuk menghitung grafik p ini adalah:

total _ defek
p
total _ sampel
Dalam contoh di atas:

108
p  0,048
2250
p (1  p )
UCL dan LCL = p  3
n

0,48(1  0,48)
0,480  3
150
-0,0044 sampai + 0,1004

4.2.5 Membuat X Bar Chart dengan SPSS


Misalnya, ada data diameter 20 sampel sebuah produk, di mana
tiap sampel terdiri dari 5 produk.

136
Anda bisa membuat grafik pengukuran kualitas seperti berikut:
1. Buka SPSS, dan klik tab Variable untuk membuat 2
variabel baru. ID dengan tipe Nominal dan Diameter
dengan tipe Scale.

Gambar 4.4 Tab Variable untuk membuat variabel baru

2. Masukkan ID dengan nomor sampel, dan diameter untuk


tiap diameter di sampel tersebut. Seperti berikut, sampai
total 100 data (20x5).

137
Gambar 4.5 Pemasukan 100 data

3. Untuk memplot, klik pada Analyze > Quality Control >


Control Charts.

Gambar 4.6 Menu untuk membuat control charts

138
4. Pilih jenis X-bar, R, s pada kotak Control Charts. Klik
tombol Define.

Gambar 4.7 Pemilihan jenis X-bar, R dan s

5. Muncul jendela untuk mendefinisi data yang akan diplot.

Gambar 4.8 Halaman untuk mendefinisikan data


yang akan diplot di X-bar, R, S

6. Masukkan Diameter ke Process Measurement, dan ID


pada Subgroups Defined by. Klik Titles kalau mau
memasukkan judul ke dalamnya.

139
Gambar 4.9 Memasukkan diameter di Titles

7. Isikan judul pertama di Line 1. Isikan judul kedua


(opsional) di Line 2. Kalau mau memasukkan subjudul,
klik pada Subtitle. Klik Continue.

Gambar 4.10 Mengisikan judul

8. Klik pada Control Rules kalau mau menerapkan rule


terhadap data. Kalau tidak, langsung klik Continue.

Gambar 4.11 Rule terhadap data

140
9. Klik OK untuk mulai membuat chart.

Gambar 4.12 Klik OK untuk mulai membuat chart

10. Maka, grafik pertama yang muncul adalah grafik mean.


Lengkap dengan UCL, LCL, dan rata-ratanya.

Gambar 4.13 Grafik mean

11. Kemudian di bawahnya ada grafik range.

141
Gambar 4.14 Grafik range yang dibuat

4.2.6 Membuat P Chart dengan SPSS


Jenis grafik pengendalian kualitas adalah p untuk menggambar-
kan proporsi. Cara untuk membuat p chart ini, seperti berikut:
1. Buka SPSS dan buat 2 variabel dengan nama ID dan
Defek. Yang menyatakan jumlah defek dari sampel dengan
n = 50 selama 15 hari di sebuah pabrik.

Gambar 4.15 Membuat dua variabel ID dan Defek

2. Isikan dengan data defek dari sampel produk dengan n =


50 selama 15 hari seperti berikut.

142
No Jumlah No Jumlah
1 5 16 6
2 3 17 4
3 3 18 3
4 2 19 4
5 2 20 5
6 1 21 9
7 2 22 2
8 4 23 3
9 1 24 4
10 4 25 5
11 2 26 10
12 4 27 5
13 4 28 3
14 5 29 4
15 11 30 3

3. Klik Analyze > Quality Control > Control Charts.

Gambar 4.16 Klik pada Analyze > Quality Control > Control Charts

4. Pilih p np untuk jenis Attribute Charts, dan pilih Cases are


subgroups dan klik Define.

143
Gambar 4.17 Pemilihan jenis Control Charts di Cases are subgroups

5. Muncul kotak dialog p np seperti berikut.

Gambar 4.18 Kotak dialog p np

6. Masukkan kolom Defek ke Number nonconforming. Dan


masukkan Subgroups labeled by ke ID.

144
Gambar 4.19 Pengisian variabel untuk number nonconforming

7. Klik Options untuk menentukan opsi jumlah sigma.

Gambar 4.20 Pengisian jumlah sigma

8. Klik control rules untuk mengatur apa yang ingin dikontrol.


Untuk memilih semua kontrol, klik pada Select all control
rules.

Gambar 4.21 Select all control rules

145
9. Klik OK, maka chart akan langsung dibuat. Lengkap
dengan batas bawah LCL dan batas atas LCL.

Gambar 4.22 Tampilan chart langsung dibuat

10. Di bagian Rule Violations, terdapat ID dari item-item yang


melanggar.

Gambar 4.23 Tabel yang menampilkan id dari rule yang dilanggar

4.3 T-Test
Test t adalah tes untuk menguji statistik yang mengikuti distribusi
student t jika ada hipotesis nol. Test t bisa dipakai untuk menentu-
kan apakah dua set data berbeda secara signifikan atau tidak.

146
Test T biasa digunakan ketika statistik mengikuti distribusi normal
dan jika nilai ukuran di statistik tes diketahui. Ketika nilai ukuran
tidak diketahui dan diganti oleh estimasi berdasarkan pada data,
maka statistik tes (dalam berapa batas tertentu) akan mengikuti
distribusi student T.
Di antara penggunaan test t adalah:
1. Pengujian satu sampel untuk mengetes apakah populasi
memiliki nilai tertentu di hipotesis nol.
2. Pengujian dua sampel untuk mengetahui apakah mean
dari dua populasi sama.
Tes ini bisa dikerjakan secara independen atau tidak.

4.3.1 Asumsi Distribusi T


Kebanyakan statistik t menggunakan rumus:
T = z/s
Di mana z adalah nilai indeks normal seperti telah dijelaskan
sebelumnya, sementara s adalah standar deviasi normal.
Berikut ini beberapa asumsi yang mendasari tes t:
 Z mengikuti distribusi standar normal.
 s2 mengikuti distribusi 2 distribution dengan derajat
kebebasan p, di mana p adalah konstanta positif.
 Z dan s independen.
Selain itu, populasi yang ingin dibandingkan harus mengikuti
distribusi normal, Anda bisa menggunakan tes seperti Shapiro–
Wilk atau Kolmogorov–Smirnov, atau bisa juga menggunakan plot
QQ yang sudah dijelaskan sebelumnya.

4.3.2 One-sample t-test


Untuk mengetes apakah mean populasi sama dengan nilai µ0 ter-
tentu, Anda bisa memakai rumus mencari nilai t seperti berikut:
x  0
t
s
n

147
Di mana x adalah mean sampel, s adalah standar deviasi dari
sampel dan n adalah ukuran sampel.
Derajat kebebasan (degree of freedom) yang digunakan di tes ini
adalah n-1. Walaupun populasi induknya tak perlu dibuat normal,
distribusi dari populasi dari mean sampel x dianggap normal.

4.3.3 Independent two-sample t-test


Pertama adalah ukuran sampel sama, dan variansi sama. Ini bisa
dilakukan jika kondisi seperti berikut:
 Ukuran kedua sampel sama (n), atau bisa juga partisipan
dari kedua kelompok sama.
 Diasumsikan dua distribusi memiliki variansi yang sama.
Nilai test t bisa digunakan menggunakan rumus berikut:
X1  X 2 1
t . Di mana: SX 1 X 2  ( SX 12  SX 22 )
SX 1 X 2 . 2 / n 2
Di mana SX 1 X 2 adalah kuadrat dari standar deviasi. Denominator
dari t adalah error standar dari perbedaan antara dua mean. Untuk
pengujian signifikansi, dof adalah 2n-2 di mana n adalah jumlah
partisipan untuk tiap group.
Kedua adalah ukuran sampel tidak sama, dan variansi sama. Tes
ini digunakan jika kedua diasumsikan memiliki varansi sama. Nilai
t-nya bisa dihitung menggunakan cara berikut:

X 1  X 2 . Di mana: SX X  (n1  1) SX 12  (n2  1) SX 22


t
n1  n2  2
1 2
1
SX 1.
n1  n2
Formula di atas, adalah generalisasi ketika kedua sampel memiliki
ukuran yang sama.
Ketiga adalah ketika ukuran sampel bisa sama atau bisa tidak, tapi
variansi tidak sama.
Tes ini sering disebut Welch’s tes dan dipakai ketika variansi dari
dua populasi tidak diasumsikan sama. Di mana ukurannya bisa
sama atau tidak. Nilai statistik t untuk mengetes apakah mean
populasi berbeda bisa dihitung dengan rumus seperti berikut:

148
X1  X 2 s12 s22
t . Di mana: s x1 x 2  
s x1 x 2 n1 n2
Di sini s2 adalah estimator variansi dari dua sampel ni = jumlah
partisipan di group i, i=1 atau 2.

4.3.4 Independent-Samples T Test dengan SPSS


SPSS memudahkan Anda menghitung uji T yang bisa Anda lihat
contohnya seperti berikut:
1. Buat variabel-variabel ID, perawatan, umur, kondisiAwal,
dan KondisiAkhir seperti terlihat di gambar berikut.

Gambar 4.24 Pembuatan 5 variabel

2. Isikan data-data seperti berikut, yaitu data fiktif perlakuan


penderita penyakit kronis di umur tertentu hingga umur
kematian, kondisi awal, dan kondisi akhir di mana yang
satu bagian memakai treatment, dan yang satu hanya efek
placebo (sugesti) saja. Untuk placebo, nilai di kolom
perawatan = 0, sementara untuk perawatan medis, nilainya
1. Yang ingin dites pertama adalah apakah tipe perawatan
berpengaruh terhadap panjang umur pasien, diasumsikan
umur ketika kena penyakit adalah sama.
ID Perawatan Umur KondisiAwal KondisiAkhir
1 0 52 6 6
5 0 77 9 6
6 0 60 7 9
9 0 61 6 7
11 0 59 6 7
15 0 69 6 6
21 0 67 6 11
26 0 56 6 11
31 0 61 6 9
35 0 51 6 4
39 0 46 7 8

149
41 0 65 6 6
45 0 67 8 8
2 0 46 7 16
12 1 56 6 10
14 1 42 4 6
16 1 44 6 11
22 1 27 6 7
24 1 68 12 11
34 1 77 5 7
37 1 86 6 7
42 1 73 8 11
44 1 67 5 7
50 1 60 6 8
58 1 54 7 8

3. Masukkan ke dalam tab Data.

Gambar 4.25 Memasukkan data ke tab Data

4. Klik pada menu Analyze > Compare Means > Independent


Samples T Test. Kita akan menguji apakah perawatan
dengan placebo sama dengan perawatan medis tertentu,
ditinjau dari umur pasien sampai meninggalnya. Data di
sini hanya sekedar ilustrasi saja, jadi tidak valid secara
nyata dalam kehidupan.

150
Gambar 4.26 Klik menu Compare means > Independent samples t test

5. Muncul jendela Independent-Samples T Test.

Gambar 4.27 Jendela Independent samples t test

6. Masukkan Umur ke Test Variable(s) dan Grouping


Variable ke Perawatan. Klik Define groups di Grouping
Variable, untuk menentukan pengelompokkan dari data di
kolom perawatan.

Gambar 4.28 Klik Define groups di Grouping variable

151
7. Klik pada Use specified values. Dan tentukan pe-
ngelompokkan berdasarkan data nol (0) dan data satu (1).

Gambar 4.29 Pengisian dasar pengelompokkan

8. Kembali ke jendela Independent-Samples T Test, klik


Options.

Gambar 4.30 Klik Options untuk mengatur opsi t test

9. Tentukan interval kepercayaan di Confidence interval.

Gambar 4.31 Penentuan tingkat kepercayaan 95%

152
10. Klik OK kalau sudah di jendela Independent Samples T
Test.

Gambar 4.32 Independent samples t test

11. Pertama, menampilkan statistik group untuk tiap pe-


rawatan, mean, standar deviasi, dan error-nya.

Gambar 4.33 Menampilkan Group Statistics

12. Berikutnya, data diuji seperti berikut.

Gambar 4.34 Data uji independent samples test

13. Dari tabel di atas, nilai t = 0,058 dan nilai signifikansi 2 tail
adalah 0,955, maka kesimpulannya tidak bisa dikatakan
ada perbedaan antara 2 perawatan ini.

153
4.3.5 Paired Sample T Test
Berikutnya adalah paired sample t test, di mana data yang akan
diuji perbedaannya adalah data yang berhubungan, misalnya
kondisi sebelum perawatan dan sesudah perawatan.
Cara melakukan paired sample t test seperti berikut ini:
1. Klik pada Analyze > Compare Means > Paired–Samples T
Test.

Gambar 4.35 Menu untuk mengakses paired samples t test

2. Klik pada KondisiAwal, dan klik pada panah untuk me-


masukkan sebagai Variable1.

Gambar 4.36 Klik pada kondisi awal

154
3. Kemudian klik pada KondisiAkhir dan klik untuk
memasukkan ke variable dua dari pair 1.

Gambar 4.37 Memasukkan variabel KondisiAkhir ke pair 1

4. Klik Options kalau mau mengatur level signifikansi, dan


klik OK untuk menghitung t test-nya.

Gambar 4.38 Klik Options untuk menghitnug level signifikansi

5. Hasilnya, di bagian atas muncul paired samples statistics


yang berisi data statistik dari pair.
6. Di bagian bawah, hasil ditampilkan pada Paired Samples
Test.

155
Gambar 4.39 Paired samples test

7. Dari situ, terlihat bahwa nilai sig yang diperoleh adalah


0,002, ini kurang dari 0,05. Artinya memang ada per-
bedaan signifikan antara kedua data paired ini.

156
Tentang Penulis

Edy Winarno ST, M.Eng


Penulis adalah staf pengajar di Universitas Stikubank Semarang. Pendidikan
terakhirnya adalah Master of Engineering (M.Eng.) Computer & Informatics
System di Teknik Elektro Universitas Gadjah Mada (UGM). Selain mengajar,
penulis juga berkecimpung di dunia blogging dan sedikit melakukan
entrepreneurship.
Ali Zaki
Penulis adalah seorang pekerja TI di bidang pemrograman, multimedia, dan
web. Saat ini menjadi outsourcee untuk sebuah perusahaan konsultan TI di
Jakarta. Penulis bekerja secara remote melalui SOHO di rumahnya di
Semarang. Di sela-sela aktivitasnya, penulis juga aktif melakukan penulisan
buku di komunitas SmitDev. Beberapa karya buku penulis telah diterbitkan
oleh Elex Media Komputindo.
SmitDev Community
SmitDev merupakan lembaga komunitas yang menjadi wadah bagi para
praktisi teknologi informasi dan komputer. Salah satu aktivitas SmitDev saat
ini adalah melakukan penulisan buku komputer dan mempersembahkan
karya buku bagi kalangan pengguna dan peminat bidang teknologi informasi
dan komunikasi di tanah air.
Pembaca dapat menyampaikan saran, tanggapan, dan pertanyaan melalui
layanan forum interaksi pembaca yang tersedia di http://www.smitdev.com,
atau melalui email info@smitdev.com.

157
Catatan:
 Untuk melakukan pemesanan buku, hubungi
Layanan Langsung PT Elex Media Komputindo:
Gramedia Direct
Jl. Palmerah Barat No. 33, Jakarta 10270
Telemarketing/CS: 021-53650110/111 ext: 3901/3902
Email: author@gramediapublishers.com

158
Belajar Statistika dari Nol dengan SPSS
Statistika adalah ilmu yang sangat penting.
Dengan statistika, kita bisa mengolah data
dan mengekstrak informasi dari data tersebut.
Dengan menggunakan alat bantu software SPSS,
belajar statistika menjadi lebih mudah.

Buku ini menjelaskan bagaimana belajar statistika

Edy Winarno ST, M.Eng, Ali Zaki, & SmitDev Community


menggunakan alat bantu SPSS. Anda akan
dipandu mulai dari pemahaman dasar-dasar
statistika. Selanjutnya, Anda akan mengenal
statistik deskriptif, probabilitas, dan statistik
parametrik.

Cara Praktis untuk Pemula Menguasai Statistika dan SPSS


Kelompok ISBN 978-602-02-3130-3
Apl. Perkantoran
Keterampilan
Tingkat Pemula
Tingkat Menengah
PT ELEX MEDIA KOMPUTINDO Tingkat Mahir
Kompas Gramedia Building Jenis Buku
Jl. Palmerah Barat 29-37, Jakarta 10270 Referensi
Telp. (021) 53650110-53650111, Ext 3214 Tutorial 121140224
Webpage: http://elexmedia.co.id Latihan

cover.indd 1 21/01/2014 14:53:13