BAB I
PENGETAHUAN DASAR STATISTIK
1.1 PengertianStatistika
Pada awalnya “statistik” berasal dari kata state yang berarti himpunan angka-angka,
kemudian berkembang bahwa setiap angka disebut statum dan lambat laun menjadi stato sampai
akhirnya menjadi kata statistik. Selanjutnya statistic diartikan sebagai besaran dalam sampel yang
dapat memberikan informasi mengenai suatu gejala atau fenomena. Besaran sampel ini
digunakan untuk menaksir parameter populasi. Parameter adalah ukuran-ukuran yang dikenakan
pada populasi.
Dalam perkembangan selanjutnya ada perbedaan pengertian antara statistic dan statistika.
Jika statistik adalah seperti yang dijelaskan di atas maka statistika adalah sekempulan konsep
dan metode untuk mengumpulkan data, menyajikan data, menganalisis data dan menarik
kesimpulan dalam situasi ada ketidak pastian dan variasi dari sekumpulan data.Variasi sering
ditimbulkan oleh perbedaan alat ukur, kesalahan operator yang melakukan pengukuran, metode
pengukuran atau bahan baku objek yang diukur berbeda. Sementara ketidakpastian sering terjadi
karena suatu sebab yang seringkali tidak bias diramalkan sebelumnya, atau karena gejala alam
yang fluktuasinya tidak bisa dipelajari.
1.2 Jenjang Keilmuan Statistika
Menurut jenjang keilmuannya statistika dibagi atas dua bagian yaitu statistika deskriptif
dan statistika inferensia. Statistika deskriptif sering disebut sebagai statistika deduktif yang
membahas tentang bagaimana merangkum sekumpulan data dalam bentuk yang mudah
dibaca dan cepat memberikan informasi, yang disajikan dalam bentuk table, grafik, nilai
pemusatan dan nilai penyebaran. Dalam statistika deskriptif belum dilakukan analisis sehingga
kesimpulan yang dapat ditarik sangat terbatas, yaitu hanya terbatas pada nilai pemusatan dan
penyebaran saja. Statistika inferensial disebut juga statistika induktif karena dapat
menganalisis dan mengambil kesimpulan dengan metode tertentu tentang suatu fenomena
berdasarkan sampel.
1. Data Kuantitatif
Data kuantitatif adalah data yang berbentuk bilangan atau dinyatakan dalam
bentuk angka. Dilihat dari nilainya, kita kenal ada 2 macam data kuantitatif.
a. Data diskrit yaitu data hasil menghitung/membilang
Contoh : UNISLA memiliki 20 ruang belajar.
b. Data kontinyu yaitu data hasil mengukur
Contoh : Data berat badan, tinggi badan, dll.
2. Data Kualitatif
Data kualitatif adalah data yang dinyatakan dalam bentuk sifat/atribut
(bukanangka). Misalkan profesi (guru, mahasiswa), jenis kelamin (laki-laki, perempuan),
agama, dll.
1.4.4 SkalaPengukuran
Dalam operasional, terdapat beberapa cara pengukuran data, misalkan untuk menjawab
pertanyaan “apakah anda menyukai mata pelajaran statistika?” maka jawabannya dapat diukur
sepanjang skala tidak suka, suka dan sangat suka. Jika hendak mengukur berat suatu benda, maka
dapat dilakukan dengan timbangan yang mempunyai skala gram atau kilogram. Dua skala dalam
contoh tadi, yaitu skala untuk mengukur tingkat kesukaan dan skala untuk mengukur berat, jelas
merupakan skala yang berbeda. Ada beberapa skala yang bias digunakan yaitu:
a) Skala Nominal, yaitu skala yang hanya mempunyai cirri-ciri dapat membedakan atau
mengklasifikasikan objeksaja. Misalkan :suatu produk dapat dikelompokkan cacat dan
tidak cacat, jenis kelamin (laki-laki, perempuan), jenis pekerjaan (PNS, ABRI, Swasta,
Wiraswasta).
b) Skala Ordinal, yaitu mempunyai ciri-ciri dapat membedakan dan juga mempunyai
urutan (order), dimana setiap klasifikasi objek atau kategori pengukuran mempunyai
hubungan satu dengan yang lain. Misalkan klasifikasi sangat senang lebih tinggi
daripada senang, klasifikasi senang lebih tinggi dari pada tidak senang.
c) Skala Interval, yaitu skala pengukuran yang mempunyai ciri dapat membedakan,
mempunyai urutan dan interval yang sama, tetapi tidak mempunyai nilai nol mutlak.
Misalnya temperature: temperature 00 C tidak berarti tidak ada temperature/suhu.
d) Skala Rasio, yaitu skala yang mempunyai keempat ciri-ciri di atas yaitu dapat
membedakan, mempunyai urutan, mempunyai jarak (interval) dan mempunyai nilai nol
sejati. Pengertian nol sejati berarti jika suatu benda beratnya adalah nol maka benda
tersebut tidak mempunyai berat. Contoh rasioa dalah skala untuk mengukur berat,
panjang, isi dan sebagainya.
3
MODUL STATISTIKA I
BAB II
PENYAJIAN DATA
2.1 Distribusi Frekuensi
Distribusi frekuensi adalah pengelompokan data ke dalam beberapa kategori yang
menunjukkan banyaknya data setiap kategori, dan setiap data tidak dapat dimasukkan ke dalam
dua atau lebih kategori. Beberapa istilah yang perlu dipahami pada daftar distribusi frekuensi data
berkelompok, diantaranya adalah:
a) Kelas, yaitu kelompok dari data-data.
b) Batas Kelas adalah nilai-nilai ujung yang terdapat pada suatu kelas. Nilai ujung bawah pada
suatu kelas disebut batas bawah kelas dan nilai ujung atasnya disebut batas atas kelas. Batas
bawah kelas adalah nilai terendah dalam suatu interval kelas, sedangkan batas atas kelas
adalah nilai tertinggi dalam suatu interval kelas.
c) Tepi Kelas adalah nilai batas antara kelas yang memisahkan nilai antara kelas yang satu
dengan kelas lainnya. Nilai tepi kelas ada dua macam yaitu:
Tepi bawah = batas bawah – 0,5 Tepi atas = batas atas + 0,5
d) Panjang Kelas/Interval Kelas merupakan selisih antara tepi atas dengan tepi bawah kelas.
Setiap kelas mempunyai interval kelas yang sama. Interval kelas ditentukan sebagi berikut:
e) Titik Tengah Kelas/ Nilai Tengah Kelas merupakan nilai yang dianggap mewakili kelas itu.
Titik tengah kelas ditentukan sebagai berikut:
Interval kelas =
3) Langkah ke tiga adalah melakukan penturusan atau pentabulasian dari data mentah yang
sudah diurutkan ke dalam kelas interval yang sudah dihasilkan pada langkah ke dua.
Ketentuan dalam menyusun distribusi frekuensi adalah:
a) Tidak ada kelas yang tumpang tindih
4
MODUL STATISTIKA I
CONTOH:
Berikut ini adalah data perusahaan dan harga sahamnya yang diperoleh dari Indopos tanggal 28
Juni 2007. Data diambil dari 20 saham perusahaan di Bursa Efek Jakarta.
Perusahaan Harga Per 11. Central Protein 650
Lembar Saham Prima
(Rp) 12. Jababeka 215
1. Bakrie Plantation 1.580 13. Total 750
2. Bank Panin 1200 14. Telkom 9750
3. Bukit Asam 6600 15. Berlian 2050
4. Bumi Resource 2175 16. BCA 5350
5. Energy Mega 3600 17. Bank Mandiri 3150
6. Budi acid 310 18. Bank Niaga 840
7. Tunas Baru 580 19. Bhakti Investama 1280
8. Indofarma 290 20. Indofood 2075
9. Kimia Farma 365
10. Sentul city 530
Apabila anda tertarik menjadi investor pada pasar saham, apakah dengan data di atas , anda sudah
dapat menentukan pilihan ? Untuk membantu anda, statistik deskriptif memberikan bantuan
pemecahan dengan membuat distribusi frekuensi. Langkah-langkah membuat distribusi
frekuensinya adalah sebagai berikut:
5
MODUL STATISTIKA I
Langkah pertama : mengurutkan harga saham di BEJ pada tgl 28 Juni 2007
Perusahaan Harga Per 11. Bhakti Investama 1280
Lembar Saham 12. Bakrie Plantation 1580
(Rp) 13. Berlian 2050
1. Jababeka 215 14. Indofood 2075
2. Indofarma 290 15. Bumi Resource 2175
3. Budi Acid 310 16. Bank Mandiri 3150
4. Kimia Farma 365 17. Energi Mega 3600
5. Sentul City 530 18. BCA 5350
6. Tunas Baru 580 19. Bukit Asam 6600
7. Central Protein 650 20. Telkom 9750
Prima 750
8. Total 840
9. Bank Niaga 1200
10. Bank Panin
Interval Kelas =
= = 1589,17 ≈ 1590
Setelah diketahui bahwa jumlah kelas adalah 6 dan interval kelas 1590 sehingga dapat dibuat
kelas dengan interval sebagai berikut:
6
MODUL STATISTIKA I
Data mentah setelah dituruskan dalam interval kelas akan menjadi data berkelompok.
Setelah data dikelompokkan, maka anda akan lebih mudah menentukan kelompok saham mana
yang akan anda pilih. Karena setiap kelas mempunyai karakteristik yang sama, maka tidak ada
perbedaan antara memilih saham Bank Panin dibandingkan dengan saham Bank Niaga atau
Kimia Farma. Namun demikian, perusahaan dengan kelas berbeda akan mempunyai karakteristik
yang berbeda pula, misalnya Bank Niaga dan bank BCA, walaupun kedua perusahaan memiliki
bidang usaha yang sama, harga saham BCA jauh lebih baik dibandingkan dengan harga saham
Bank Niaga.
7
MODUL STATISTIKA I
Dari frekuensi relative di atas, dapat diketahui lebih mudah berapa prosentase kelasnya. Kelas
pertama 60%, kedua 20%, ketiga 5%, keempat 5%, kelima 5% dan keenam 5%. Apabila investor
ingin membeli saham pada kisaran harga R p 215 – Rp 1804, maka ada 60% perusahaan yang bisa
dipilih, demikian seterusnya.
3.2.2 Frekuensi Kumulatif
Frekuensi kumulatif menunjukkan seberapa besar jumlah frekuensi pada tingkat kelas
tertentu. Frekuensi kumulatif diperoleh dengan menjumlahkan frekuensi pada kelas tertentu
dengan frekuensi kelas selanjutnya. Frekuensi kumulatif dibedakan dalam dua bentuk yaitu:
a) Frekuensi kumulatif kurang dari (fk ≤)
Merupakan penjumlahan dari mulai frekuensi kelas terendah sampai kelas tertinggi dan
jumlah akhirnya merupakan jumlah data (n).
b) Frekuensi kumulatif lebih dari (fk ≥)
Merupakan pengurangan dari jumlah data (n) dengan frekuensi setiap kelas dimulai dari
kelas terendah.
CONTOH:
Berikut ini adalah frekuensi kumulatif terhadap harga saham di BEJ tgl 28 Juni 2007.
Kelas ke- Interval Frekuensi (f) Frek kumulatif Frek Kumulatif lebih
kurang dari (fk ≤) dari (fk ≥)
1 215 – 1804 12 12 20
2 1805 – 3394 4 16 8
3 3395 – 4984 1 17 4
4 4985 – 6574 1 18 3
5 6575 – 8164 1 19 2
6 8165 – 9754 1 20 1
8
MODUL STATISTIKA I
3.3.1 Histogram
Histogram merupakan bentuk diagram yang mudah dipahami. Histogram merupakan
diagram balok, karena frekuensi disajikan dalam bentuk balok. Histogram menghubungkan
antara tepi kelas interval pada sumbu horizontal (X) dan frekuensi setiap kelas pada sumbu
vertical (Y).
CONTOH:
Berdasarkan data harga saham di BEJ, berikut disajikan dalam bentuk table dan dalam bentuk
grafik histogram.
Kelas Interval Batas Batas Atas Tepi Bawah Tepi Atas Kelas f
ke- Bawah Kelas Kelas
Kelas
1 215 – 1804 215 1804 215 - 0.5 = 214.5 1804 + 0.5 = 12
2 1805 – 3394 1805 3394 1805 - 0.5 = 1804.5 4
3 3395 – 4984 3395 4984 1804.5 3394 + 0.5 = 1
4 4985 – 6574 4985 6574 3395 – 0.5 = 3394.5 1
5 6575 – 8164 6575 8164 3394.5 4984 + 0.5 = 1
6 8165 – 9754 8165 9754 4985 – 0.5 = 4984.5 1
4984.5 6574 + 0.5 =
6575 – 0.5 = 6574.5
6574.5 8164 + 0.5 =
8165 – 0.5 8164.5
=8164.5 9754 + 0.5 =
9754.5
8
6
4
2
0
Dengan melihat grafik histogram di atas, terlihat bahwa frekuensi harga saham dari 20
perusahaan memiliki kurva condong ke kiri. Frekuensi dimulai dari yang besar, kemudian
9
MODUL STATISTIKA I
menurun. Grafik menunjukkan bahwa harga saham dari sebagian besar perusahaan berada pada
kisaran Rp 214,5 sampai Rp 1804,5
3.3.2 Poligon
Polygon hampir sama dengan histogram, perbedaannya histogram menggunakan balok,
sedangkan polygon menggunakan garis yang menghubungkan titik-titik yang merupakan
koordinat antara nilai tengah kelas dengan jumlah frekuensi pad kelas tersebut.
CONTOH:
Berdasarkan pada data harga saham 20 perusahaan di BEJ, berikut akan disajikan dalam bentuk
table dan grafik polygon.
Kelas ke- Interval Nilai tengah kelas Frekuensi
1 215 – 1804 (215 + 1804)/2 =1009.5 12
2 1805 – 3394 1805 + 3394)/2 = 2599.5 4
3 3395 – 4984 3395 + 4984)/2 = 4189.5 1
4 4985 – 6574 4985 + 6574)/2 = 5779.5 1
5 6575 – 8164 6575 + 8164)/2 = 7369.5 1
6 8165 – 9754 8165 + 9754)/2 = 8959.5 1
8
6
4
2
0
1009,5 2599,5 4189,5 5779,5 7369,5 8959,5
Nilai tengah interval kelas harga saham
CONTOH:
Berdasarkan kasus pada harga saham di BEJ, berikut akan disajikan dalam bentuk kurva ogif
positif dan ogif negative.
20
15
10
0
214,5 1804,5 3394,5 4984,5 6574,5 8164,5 9754,5
Tepi atas kelas interval harga saham
20
15
10
0
214,5 1804,5 3394,5 4984,5 6574,5 8164,5 9754,5
Tepi bawah kelas interval harga saham
Latihan:
1. Data sangat diperlukan dalam setiap penelitian, dan data didistribusikan pada setiap kelas,
mengapa kelas diperlukan? Coba jelaskan!
2. Sebutkan berapa jenis distribusi yang Saudara ketahui, dan coba jelaskan satu per satu peran
setiap jenis distribusi tersebut!
3. Di bawah ini dikemukakan hasil pengamatan penjualan terhadap suatu perusahaan selama
100 hari, data tersebut dianggap mewakili penjualan perusahaan tersebut sepanjang tahun.
Data yang diamati adalah sebagai berikut:
11
MODUL STATISTIKA I
25 18 30 15 27 20 22 37 11 52
45 37 23 36 44 35 13 40 23 64
54 26 36 10 39 28 35 33 43 70
30 43 24 39 30 17 29 24 16 57
46 21 45 22 38 53 42 33 46 69
60 31 24 35 48 37 12 38 24 54
33 18 39 19 23 69 34 26 59 75
59 42 48 52 54 48 51 43 40 53
48 56 63 55 47 68 46 78 44 61
79 47 49 46 58 45 58 41 50 68
12
MODUL STATISTIKA I
BAB III
UKURAN PEMUSATAN
Ukuran pemusatan adalah nilai tunggal yang mewakili suatu kumpulan data dan
menunjukkan karakteristik dari data. Ukuran pemusatan menunjukkan pusat dari nilai data.
3.1 Rata-rata Hitung
Rata-rata hitung merupakan nilai yang menunjukkan pusat dan nilai data dan
merupakan nilai yang dapat mewakili dari keterpusatan data. Rata-rata hitung merupakan
nilai yang diperoleh dengan menjumlahkan semua nilai data dan membaginya dengan jumlah
data.
3.1.1 Rata-rata Hitung Populasi
Rata-rata hitung populasi merupakan nilai rata-rata dari data populasi. Rata-rata hitung
populasi dihitung dengan cara:
∑
Jawab:
∑
= 75
Jadi rata-rata hitung nilai kredit dari lima bank terbesar di Indonesia pada tahun 2006
adalah Rp 75 trilun.
3.1.2 Rata-rata Hitung Sampel
Rata-rata hitung sampel merupakan nilai rata-rata dari data sampel. Rata-rata hitung
sampel dihitung dengan cara:
∑
̅=
CONTOH:
Pada tahun 2007 di BEJ tercatat 350 emiten. Misalkan dari seluruh emiten, sebanyak 37
perusahaan mengumumkan akan membagikan dividen untuk tahun buku 2006. Dari 37 emiten
tersebut, 9 perusahaan diambil laporan kinerja keuangannya. Data kinerja keuangan dari 9
perusahaan tersebut adalah sebagai berikut:
No. Nama Perusahaan Laba Bersih (Rp Total Aset (Rp
miliar) miliar)
1 PT. Indosat 436 22.598
2 PT. Telkom 7.568 42.253
3 PT. Aneka Tambang 123 2.508
4 PT. Astra Agro Lestari 180 2.687
5 PT. Bimantara Citra 392 4.090
6 PT. Alfa Retailindo 25 603
7 PT. H.M. Sampoerna 1480 10.137
8 PT. Mustika Ratu 15 287
9 PT. Astra Graphia 65 796
Dari data di atas, hitnglah rata-rata sampel untuk laba bersih dan total aset!
Jawab:
∑
̅̅̅ =
= = 1.142,67
Jadi rata-rata hitung laba bersih dari 9 perusahaan sampel yang membagikan dividen adalah Rp
1.142,67 miliar.
3.1.3 Rata-rata Data Berkelompok
Data berkelompok adalah data yang sudah dikelompokkan dalam bentuk distribusi
frekuensi. Rata-rata hitung untuk data berkelompok dirumuskan sebagai berikut:
∑
̅
Dimana: ̅̅̅ : rata-rata hitung data berkelompok x : nilai tengah masing-masing kelas
f : frekuensi masing-masing kelas n: jumlah total data
k : jumlah kelas/kategori
CONTOH:
Berikut adalah data yang sudah dikelompokkan dari 20 saham pilihan pada bulan Juni 2007.
Buatlah nilai rata-rata untuk harga saham pilihan tersebut!
14
MODUL STATISTIKA I
Jadi rata-rata harga saham pilihan untuk 20 perusahaan adalah Rp 490,7 / lembar.
3.2 Median
Median merupakan salah satu ukuran pemusatan. Median merupakan suatu nilai yang
berada ditengah-tengah data, setelah data tersebut diurutkan. Dapat dikatakan bahwa median
adalah nilai yang membagi data menjadi dua bagian yang sama. Dengan kata lain, 50% data
terletak di bawah median dan 50% data terletak di atasnya.
3. Nilai median terletak pada data ke-5 yaitu pada laba bersih sebesar Rp 180 miliar.
CONTOH:
Carilah nilai median untuk data berikut : 7, 3, 4, 8, 6, dan 2.
1. Langkah pertama menentukan letak median yaitu (n+1)/2 = (6+1)/2 = 3,5
2. Langkah kedua mengurutkan data : 2, 3, 4, 6, 7, 8
3. Letak median 3,5 terletak antara urutan letak 3 dan 4. Nilai mediannya adalah = 5.
Dimana: L = tepi bawah kelas yang memuat median f = frekuensi dimana kelas median
berada
n = jumlah total frekuensi i = besarnya interval kelas
Cf = frekuensi kumulatif sebelum kelas median berada
CONTOH:
Hitunglah median untuk data berkelompok di bawah ini.
Interval Frekuensi Tepi Bawah Frek
Kelas kumulatif
160 – 303 2 159,5 2
304 – 447 5 303,5 7
448 – 591 9 447,5 16
592 – 735 3 591,5 19
736 – 879 1 735,5 20
Penyelesaian:
1. Menentukan letak kelas median yaitu n/2. Karena data ada 20 (n = 20) maka letak median
20/2 = 10.
2. Berdasarkan pada kolom frekuensi kumulatif nilai 10 terletak pada kelas ke 3 dengan
interval 448 – 591.
3. Melakukan interpolasi nilai median dengan rumus:
16
MODUL STATISTIKA I
= 447,5 + 48 = 495,5
Jadi nilai median data tersebut adalah 495,5.
3.3 Modus
Modus adalah nilai pengamatan yang paling sering muncul. Kelebihan modus adalah
mudah ditemukan, dapat digunakan untuk semua skala pengukuran, serta tidak dipengaruhi oleh
nilai ekstrim. Namun modeus juga mempunyai kelemahan di antaranya kadang kala sekumpulan
data tidak mempunyai modus, sehingga semua data dianggap modus. Kelemahan lain kadangkala
sekumpulan data memiliki modus lebih dari satu. Oleh sebab itu, sebagai alah satu alat ukur,
modus relative jarang digunakan dibandingkan dengan rata-rata hitung dan median. Cara mencari
nilai modus:
1. Untuk data tidak berkelompok, maka modus adalah nilai yang sering muncul atau
frekuensi yang paling banyak.
2. Untuk data berkelompok, maka modus diperoleh dari rumus sebagai berikut:
Modus = L +
Penyelesaian :
1. Menentukan kelas modus yaitu kelas atau interval dengan frekuensi yang paling sering
muncul. Frekuensi paling banyak adalah 9, maka nilai modus berada pada kelas 448-591.
2. Melakukan interpolasi nilai modus dengan rumus:
Modus = L +
= 447,5 +
= 447,5 + x 144
17
MODUL STATISTIKA I
= 447,5 + 57,6
= 505,1
Jadi modusnya adalah 505,1 yaitu nilai/data yang paling sering muncul.
3.4 Ukuran Letak
Pada sub bab ini akan dibahas tentang ukuran letak yaitu ukuran yang menunjukkan pada
bagian mana data tersebut terletak pada suatu data yang sudah diurutkan. Ukuran letak yang
dibahas meliputi kuartil, desil dan persentil.
3.4.2 Kuartil
Kuartil adalah ukuran letak yang membagi data yang telah diurutkan menjadi 4 bagian
sama besar, atau setiap bagian dari kuartil sebesar 25%. Kuartil 1 (K1) membagi data sebelah kiri
sebesar 25% dan sebelah kanan 75%. Kuartil 2 (K2) membagi data menjadi dua bagian yang
sama yaitu sisi kanan dan sisi kiri sebanyak 50%. Kuartil 3 (K3) membagi data sebelah kiri
sebesar 75% dan sebelah kanan sebesar 25%.
Rumus mencari letak kuartil untuk data tidak berkelompok dan data berkelompok adalah
sebagai berikut:
18
MODUL STATISTIKA I
NKi =L +
NKi =L +
3.4.3 Desil
Desil adalah ukuran letak yang membagi data yang telah diurutkan atau data berkelompok
menjadi 10 bagian sama besar atau setiap bagian dari desil sebesar 10%. Desil membagi data (n)
menjadi 10 bagian yang sama. D1 adalah kelompok data 10% pertama, D2 untuk data 20% dari
data pertama dan seterusnya sampai D9 yaitu kelompok data dari pertama sampai 90% dari urutan
data.
Rumus mencari letak desil untuk data tidak berkelompok dan berkeompok adalah:
Untuk jumlah data genap, maka letak desil berupa pecahan atau tidak ada nilai yang pas
pada letak tersebut, maka untuk menghitung nilai desil menggunakan rumus sebagai berikut:
NDi =L +
Dimana:
NDi = nilai kuartil ke-i dimana i = 1, 2, 3 Cf = frekuensi kumulatif sebelum kelas
kuartil
L = tepi bawah kelas dimana letak kuartil berada Fk = frekuensi pada kelas kuartil
n = jumlah data atau frekuensi total Ci = interval kelas kuartil
CONTOH:
Hitunglah D2, D5 dan D9 dari data yang sudah dikelompokkan pada kasus 20 saham pilihan di
BEJ!
21
MODUL STATISTIKA I
Penyelesaian:
1. Menentukan letak desil D2 = (2 x 20) / 10 = 4
D5 = (2 x 20) / 10 = 10
D9 = (3 x 20) / 10 = 18
2. Mencari nilai desil
NDi =L +
3.4.4 Persentil
Percentil merupakan ukuran letak yang membagi data yang telah diurutkan atau data yang
berkelompok menjadi 100 bagian yang sama besar, atau setiap bagian dari desil sebesar 1%.
Percentil membagi data (n) menjadi 99 bagian yang sama. P 1 adalah kelompok data 1% pertama,
P2 untuk data 2% dari data pertama, dan seterusnya sampai P 99 yaitu kelompok data dari pertama
sampai 99% dari urutan data.
Rumus mencari letak persentil untuk data tidak berkelompok dan data berkelompok
adalah sebagai berikut:
Rumus Ukuran Letak
Ukuran Letak
Data Tidak Berkelompok Data Berkelompok
Percentil 1 (P1) [1(n + 1)]/100 1n/100
Percentil 2 (P2) [2(n + 1)]/100 2n/100
Percentil 3 (P3) [3(n + 1)]/100 3n/100
… … …
Percentil 99 (P99) [99(n + 1)]/100 99n/100
22
MODUL STATISTIKA I
Untuk jumlah data genap, maka letak persentil berupa pecahan atau tidak ada nilai yang
terletak pada persentil tersebut, maka untuk menghitung nilai persentil menggunakan rumus
sebagai berikut:
NP = NPB + [(LP – LPB) / (LPA - LPB)] X (NPA - NPB)
Dimana:
NP : nilai Persentil
NPB : nilai Persentil yang berada di bawah letak Persentil
LP : letak Persentil
LPB : letak data Persentil yang berada di bawah letak Persentil
LPA : letak data Persentil yang berada di atas letak Persentil
NPA : nilai Persentil yang berada di atas letak Persentil
CONTOH:
Persaingan antara kereta api eksekutif dengan penerbangan untuk jurusan Jakarta-Surabaya dan
Jakarta-Yogyakarta semakin terasa. Oleh sebab itu, PT. KAI merencanakan akan mendiskon 25%
jenis tiket dengan harga tertinggi dan akan meningkatkan 35% jenis tiket dengan harga terendah.
Cobalah hitung mulai harga berapa yang harus di diskon dan sampai harga berapa harus
dinaikkan?
No. Jenis Kereta Harga (Rp Ribuan)
1 Taksaka 150
2 Sembrani 185
3 Bima 200
4 Gumarang 225
5 Argo Dwipangga 230
6 Argo Bromo Anggrek Pagi 250
7 Argo Bromo Anggrek Malam 260
8 Argo Bromo Anggrek Siang 285
Penyelesaian:
1. Pengertian 25% dari harga tertinggi adalah P75 yang diperoleh dari 100% - 25%.
Sedangkan untuk harga terendah 35% terendah adalah P35.
2. Menentukan letak persentil
Letak P75 = [75(n+1)]/100 = [75(8+1)]/100 = 6,75
Letak P35 = [35(n+1)]/100 = [35(8+1)]/100 = 3,15
3. Karena letak persentil berupa pecahan, maka nilai persentil dicari dengan menggunakan
rumus sebagai berikut.
NP = NPB + [(LP – LPB) / (LPA - LPB)] X (NPA - NPB)
Nilai percentil 75% (P75) untuk letak percentil 6,75 adalah
23
MODUL STATISTIKA I
Untuk mencari nilai persentil data berkelompok ada beberapa langkah yang harus
dilakukan:
1. Menentukan letak persentil dalam data yang sudah terdistribusi frekuensinya
2. Menentukkan nilai persentil dengan melakukan interpolasi dengan rumus sebagai berikut:
NPi =L +
NP85 =L +
24
MODUL STATISTIKA I
= 591,5 + 48 = 639,5
P85 mempunyai nilai Rp 639,5 maka harga saham di atasnya termasuk dalam 15% harga
saham tertinggi. Dan saol harga saham yang dinyatakan adalah Rp. 675, maka perusahaan
tersebut termasuk ke dalam kelompok ini.
Latihan :
1. Berikut disajikan data: 24 25 20 28 33 30 35 33 25 25
Tentukan:
a. Rata-rata hitungnya
b. Median
c. Modus
2. Wawancara dilakukan terhadap 140 orang pedagang pada pasar tradisional, untuk
mengetahui keuntungan yang dibawa pulang setelah dagangan habis terjual. Hasil
wawancara adalah seperti pada tabel berikut:
Tabel Distibusi Keuntungan Pedagang Pasar Tradisional
No Keuntungan Jumlah Pedagang
1. 50.000-74.000 3
2. 75.000-99.000 16
3. 100.000-124.000 25
4. 125.000-149.000 46
5. 150.000-174.000 35
6. 175.000-199.000 13
7. 200.000-224.000 2
Tentukanlah:
a. Rata-rata hitung data di atas
b. Modus data di atas
c. Median data di atas
3. Berikut dikemukakan sebuah distribusi yang belum lengkap, menyangkut hasil penjualan
mingguan dari para penjual sayur di kota Lamongan. Distribusi penjualannya dikemukakan
seperti pada tabel berikut:
Tabel Penjualan Pedagang Sayuran
No Penjualan Mingguan Jumlah Pedagang
1. ... -- ... 13
2. ... -- ... 18
3. ... -- ... 22
4. ... -- ... 34
5. ... -- ... 21
6. ... -- ... 15
7. ... -- ... 11
8. ...-- 499.990 6
Tentukan:
25
MODUL STATISTIKA I
a. Bila batas bawah kelas pertama dimulai dengan penjualan Rp. 100.000,-. Lengkapilah
seluruh batas kelas tersebut dengan interval kelas Rp. 50.000,-
b. Hitunglah D6
c. Hitunglah P10
26
MODUL STATISTIKA I
BAB IV
UKURAN KERAGAMAN
Ukuran keragaman adalah suatu ukuran baik parameter atau statistic untuk mengetahui seberapa
besar penyimpangan data dengan nilai rata-rata hitungnya.
4.1 Ukuran Keragaman untuk Data yang Tidak Dikelompokkan
4.1.1 Jarak (Range)
Jarak atau kisaran nilai (Range) merupakan perbedaan antara nilai terbesar dan terkecil
dalam suatu kelompok data baik data populasi atau sampel. Semakin kecil ukuran jarak
menunjukkan karakter yang lebih baik, karena data mendekati nilai pusat.
Jarak (Range) = Nilai Terbesar – Nilai Terkecil
CONTOH:
Berikut adalah laju inflasi dari Negara Indonesia, Malaysia dan Thailand. Hitunglah jarak (Range)
– nya! Apa komentar anda?
Laju Inflasi (%)
Tahun
Indonesia Thailand Malaysia
2002 10 2 2
2003 5 2 1
2004 6 3 2
2005 17 6 4
2006 6 3 3
Penyelesaian :
Nilai Indonesia Thailand Malaysia
Tertinggi 17 6 4
Terendah 5 2 1
Jarak 17 – 5 = 12 6–2=4 4–1=3
27
MODUL STATISTIKA I
Varians dapat dibedakan antara varians populasi dan varians sampel. Varians populasi adalah
deviasi kuadrat dari setiap data terhadap rata-rata hitung semua data dalam populasi. Varians
populasi dapat dirumuskan sebagai berikut:
∑ ∑
ingat bahwa
∑ ∑
∑
√
CONTOH:
Hitunglah standar deviasi dari pertumbuhan ekonomi negara maju !
Jawab:
Diketahui pada contoh sebelumnya bahwa σ2 untuk negara maju adalah 0,24. Maka nilai standar
deviasinya dapat dihitung sebagai berikut:
28
MODUL STATISTIKA I
∑
√ √ √
Jadi standar deviasi data pertumbuhan ekonomi negara maju adalah 0,49.
Varians Sampel
Varians Sampel adalah deviasi kuadrat dari setiap data rata-rata hitung terhadap semua data
dalam sampel, dimana sampel adalah bagian dari populasi. Varians sampel dirumuskan sebagai
berikut:
∑ ̅ ∑
̅
∑ ̅
√
CONTOH:
Hitunglah varians sampel dan standar deviasi pertumbuhan ekonomi negara maju dari tahun
1994-2001 dengan sampel untuk data tahun yang ganjil saja.
Tahun Pertumbuhan Ekonomi (%) Negara
Maju
1995 2,6
1997 3,2
1999 2,0
2001 2,1
Penyelesaian :
Xi Xi - ̅ (Xi - ̅ )2
2,6 0,1 0,01
3,2 0,7 0,49
2,0 -0,5 0,25
2,1 -0,4 0,16
29
MODUL STATISTIKA I
∑ ∑ ̅
CONTOH :
Berikut adalah data yang sudah dikelompokkan dari harga saham pilihan pada bulan Juni 2007 di
BEJ. Hitunglah range dari data tersebut!
Kelas Interval Jumlah Frekuensi
1 160 - 303 2
2 304 – 447 5
3 448 – 591 9
4 592 – 735 3
5 736 – 879 1
Penyelesaian :
Range = batas atas kelas tertinggi – batas bawah kelas terendah
= 879 – 160 = 719
4.2.2 Varians dan Standar Deviasi Data Berkelompok
Varians untuk data berkelompok hampir sama dengan varians data tunggal, namun
dikalikan dengan frekuensi setiap kelasnya. Varians data berkelompok dirumuskan sebagai
berikut:
∑ ̅ ∑
̅
∑ ̅
√
CONTOH:
Hitunglah varians dan standar deviasi dari data harga saham pilihan pada bulan Juni 2007 di BEJ.
Interval Nilai F fi.xi xi - ̅ (xi - ̅ )2 fi (xi - ̅ )2
tengah(xi)
160 – 303 231,5 2 463 -259,2 67184,64 134369,28
304 – 447 375,5 5 1877,5 -115,2 13271,04 66355,2
448 – 591 519,5 9 4675,5 28,8 829,44 7464,96
592 – 735 663,5 3 1990,5 172,8 29859,84 89579,52
736 – 879 807,5 1 807,5 316,8 100362,24 100362,24
Jumlah 20 9814 398131,2
∑
̅
31
MODUL STATISTIKA I
Tentukan:
a. Simpangan rata-rata dari data tersebut
b. Simpangan baku dari data tersebut
c. Hitunglah variannya
32
MODUL STATISTIKA I
BAB V
DISTRIBUSI PELUANG
5.1 Pengertian
Distribusi peluang : sebuah daftar dari keseluruhan hasil suatu percobaan kejadian
yang disertai dengan nilai probabilitas masing-masing hasil.
CONTOH 1:
Ada tiga orang nasabah yang akan menabung di bank. Terdapat dua bank di Jl. Meruya Jakarta
Barat, yaitu BCA dan BNI. Ketiga orang tersebut bebas memilih bank tempatnya akan menabung,
bisa di BCA semua, di BCA dan BNI, atau di BNI semua. Berikut adalah kemungkinan dari
pilihan ketiga orang tersebut.
Kemungkinan Nasabah Jumlah
Pilihan 1 2 3 Pilihan BNI
1 BCA BCA BCA 0
2 BCA BCA BNI 1
3 BCA BNI BCA 1
4 BCA BNI BNI 2
5 BNI BCA BCA 1
6 BNI BCA BNI 2
7 BNI BNI BCA 2
8 BNI BNI BNI 3
Dari 8 kemungkinan tersebut, kita dapat menyusun distribusi peluangnya sebagai berikut:
Jml BNI dipilih Jumlah Total Distribusi peluang
nasabah frekuensi Kemungkinan
0 1 8 1/8 0,125
1 3 8 3/8 0,375
2 3 8 3/8 0,375
3 1 8 1/8 0,125
Jumlah total distribusi peluang 1,000
Distribusi peluang variable acak X adalah himpunan nilai peluang dari variable acak X.
Variable acak X adalah sebuah ukuran yang merupakan hasil suatu percobaan atau kejadian yang
terjadi secara acak.
Variable acak ada 2:
a. Variable acak diskrit
33
MODUL STATISTIKA I
Variable acak diskrit adalah ukuran hasil dari percobaan yang bersifat acak dan
mempunyai nilai tertentu yang terpisah dalam suatu interval. Variable acak diskrit
biasanya dalam bentuk bilangan bulat dan dihasilkan dari perhitungan.
b. Variable acak kontinyu
Variable acak kontinyu mempunyai nilai yang menempati pada seluruh interval hasil
percobaan. Variable acak kontinyu biasanya dihasilkan dari pengukuran dan bukan
perhitungan.
5.2 Rata-rata Hitung, Varian dan Standar Deviasi dari Distribusi Peluang
5.2.1 Rata-rata Hitung
Nilai rata-rata hitung digunakan sebagai nilai untuk mewakili nilai-nilai peluang yang ada
pada distribusi peluang. Nilai rata-rata hitung juga merupakan nilai harapan (Expected Value)
yang dilambangkan E(X).
CONTOH 2:
Hitunglah nilai rata-rata hitung pada kasus pilihan tiga nasabah atas BNI pada contoh 1!
Penyelesaian:
X P(X) X. P(X)
0 0,125 0,000
1 0,375 0,375
2 0,375 0,750
3 0,125 0,375
Jumlah 1,500
Nilai rata-rata hitung = 1,500 menunjukkan bahwa dari 3 orang nasabah yang akan menabung,
maka 1,5 orang akan memilih BNI. Namun karena orang tidak dalam pecahan, maka bisa
didekatkan dengan 2 orang.
34
MODUL STATISTIKA I
Dimana:
√ √
5.3 Distribusi Peluang Penting
5.3.1 Distribusi Binomial
Distribusi peluang binomial menggambarkan data yang dihasilkan oleh suatu percobaan
yang dinamakan percobaan Bernoulli. Ciri – cirri percobaan Bernoulli adalah sebagai berikut:
1. Setiap percobaan atau kegiatan hanya menghasilkan dua kejadian, yaitu sukses dan gagal.
2. Peluang terjadinya sukses pada setiap kejadian dari serangkaian kejadian adalah konstan.
3. Antara kejadian satu dan lainnya saling bebas.
Distribusi peluang Binomial dapat dinyatakan sebagai berikut:
35
MODUL STATISTIKA I
Dimana:
P(X = x) : nilai peluang Binomial
p : peluang sukses suatu kejadian dalam setiap percobaan
q : peluang gagal suatu kejadian yang diperoleh dari q = 1- p
x : banyaknya peristiwa sukses suatu kejadian untuk keseluruhan percobaan
n : jumlah total percobaan
Rata-rata, varian dan standar deviasi distribusi Binomial adalah:
Rata-rata = np
Varians = n p q = n p (1 - p)
Standar deviasi = √
CONTOH 4:
PT. Moena Jaya Farm (MJF) mengirim buah semangka ke Hero Supermarket. Dengan jaminan
kualitas yang baik, maka 90% semangka yang akan dikirim lolos seleksi oleh Hero Supermarket.
PT. MJF setiap hari mengirim 15 buah semangka dengan berat antara 5-6Kg.
a. Berapa peluang 15 buah diterima?
b. Berapa peluang 10 buah diterima?
Penyelesaian:
a. Peluang 15 buah diterima semua.
n = 15 p = 0,9
x = 15 q = 0,1
36
MODUL STATISTIKA I
37
MODUL STATISTIKA I
= = 0,0019
-∞ µ = Md = Mo ∞
Beberapa karakteristik dari distribusi probabilitas dan kurva normal adalah:
1. Kurva berbentuk lonceng dan memiliki satu puncak yang terletak di tengah. Nilai rata-rata
hitung sama dengan median dan modus. Nilai µ = Md = Mo yang berada ditengah
membelah kurva menjadi dua bagian yaitu setengah di bawah nilai µ = Md = Mo dan
setengah di atas nilai µ = Md = Mo.
2. Distribusi peluang kurva normal berbentuk kurva simetris. Apabila kurva dilipat menjadi
dua bagian dengan nilai tengah rata-rata sebagai pusat lipatan, maka kurva akan menjadi
dua bagian yang sama.
3. Kurva distribusi normal menurun di kedua arah yaitu ke kanan untuk nilai positif tak
terhingga dan ke kiri (∞) untuk nilai negative tak terhingga (∞). Dengan demikian, kedua
ekor kurva tidak pernah menyentuh nol, hanya mendekati nilai nol.
4. Luas daerah yang terletak di bawah kurva normal tetapi di atas sumbu mendatar sama
dengan 1. Luas daerah tersebut terdiri dari setengah di sebelah kiri nilai tengah (µ) dan
setengah di sebelah kanan nilai tengah (µ).
Distribusi peluang normal mempunyai persamaan matematik yang sangat tergantung pada
nilai tengah (µ) dan standar deviasinya (σ). Oleh karena itu, distribusi normal dari suatu variable
acak X yang nilainya terletak -∞ sampai ∞ dinyatakan dengan lambang X ~ N(X; µ,σ) dan dibaca
nilai variable acak X terdistribusi secara normal dengan nilai tengah (µ) dan standar deviasi (σ).
38
MODUL STATISTIKA I
Bila X suatu pengubah acak normal dengan nilai tengah µ dan standar deviasi σ., maka
persamaan kurva normalnya adalah:
N(X; µ,σ) =√ , untuk -∞ < X< ∞
Dimana: Z = skor Z
X = nilai dari suatu pengamatan atau pengukuran
µ = nilai rata-rata hitung
σ = standar deviasi
apabila Z disubstitusikan pada bentuk distribusi normal umum, maka distribusi peluang
normal standar adalah
√
CONTOH 7:
PT. Work Electric yang berkantor pusat di Bandung memproduksi bohlam lampu. Bohlam yang
diproduksi dapat hidup hingga 900 jam dengan standar deviasi 50 jam. Untuk kepentingan
promosi, PT. Work Electric ingin mengetahui peluang keyakinan bahwa bohlam lampunya dapat
hidup pada kisaran antara 800 - 1.000 jam.
Penyelesaian:
Z1 = = -2 Z2 = =2
39
MODUL STATISTIKA I
Bila nilai X adalah distribusi acak Binomial dengan nilai tengah µ = np dan standar
deviasi σ = npq, maka nilai Z untuk distribusi normal standart adalah:
Z =
√
Untuk mengubah pendekatan dari binomial ke normal, maka diperlukan factor koreksi.
Factor koreksi adalah sebesar 0,5 yang dikurangkan dan ditambahkan pada data yang diamati.
Factor koreksi ini diperlukan untuk mentransformasi dari binomial menuju normal yang
merupakan variable acak kontinyu.
CONTOH 8:
Sebuah survey telah dilakukan oleh perusahaan alat elektronik yang mensinyalir bahwa 20% dari
penduduk yang memiliki telepon yang sangat menyukai warna telepon yang putih dibandingkan
dengan warna lain yang tersedia. Hitunglah peluang akan terdapat sejumlah langganan baru yang
menggunakan telepon berwarna putih antara 170 hingga 185 langganan, dari rencana
pemasangan saluran telepon yang baru sebanyak 1000 buah.
Penyelesaian:
µ = np = 1000 x 0,2 = 200
q = 1 – p = 1 – 0,2 = 0,8
Xi terletak antara 169,5 dan 185,5 maka
Z1 = = -2,41
√
Z2 = = -1,14
√
40
MODUL STATISTIKA I
BAB VI
UJI HIPOTESIS
Dalam statistik, hipotesis dapat diartikan sebagai pernyataan statistik tentang parameter
populasi. Statistik adalah ukuran-ukuran yang dikenakan pada sampel ( x = rata-rata; s =
simpangan baku; s2 = varians; r = koefisien korelasi), dan parameter adalah ukuran-ukuran yang
dikenakan pada populasi ( = rata-rata; σ = simpangan baku; σ2 = varians; ρ = koefisien korelasi).
Dengan kata lain, hipotesis adalah taksiran terhadap parameter populasi melalui data-data sampel.
Dalam statistik dan penelitian terdapat dua macam hipotesis penelitian, yaitu hipotesis nol
dan alternatif. Pada statistik, hipotesis nol diartikan sebagai tidak adanya perbedaan antara
parameter dengan statistik, atau tidak adanya perbedaan antara ukuran populasi dan ukuran
sampel. Dalam penelitian, hipotesis nol juga menyatakan “tidak ada”, tetapi bukan tidak adanya
perbedaan antara populasi dan data sampel, tetapi bisa berbentuk tidak adanya hubungan antara
satu variabel dengan variabel lain, tidak adanya perbedaan antara satu variabel atau lebih pada
populasi/sampel yang berbeda, dan tidak adanya perbedaan antara yang diharapkan dengan
kenyataan pada satu variabel atau lebih untuk populasi atau sampel yang sama. Selanjutnya
hipotesis alternatif adalah lawannya hipotesis nol, yang berbunyi adanya perbedaan antara data
populasi dengan data sampel. Sedangkan test hipotesis adalah prosedur yang digunakan
selanjutnya untuk menerima H0 serta menentukan apakah sampel observasi/pengamatan memiliki
perbedaan dari hasil yang diharapkan.
Contoh 1.
Sebelum tahun 1993, pendaftaran mahasiswa unisla dilakukan dengan pengisian formulir secara
manual. Pada tahun 1993, PSA unisla memperkenalkan sistem pendaftaran "ON-LINE".
Seorang Staf PSA ingin membuktikan pendapatnya “bahwa rata-rata waktu pendaftaran dengan
sistem ON-LINE akan lebih cepat dibanding dengan sistem yang lama” Untuk membuktikan
pendapatnya, ia akan membuat hipotesis awal, sebagai berikut :
Hipotesis Awal : rata-rata waktu pendaftaran SISTEM "ON-LINE" sama saja dengan
SISTEM LAMA.
Staf PSA tersebut akan mengambil sampel dan berharap hipotesis awal ini ditolak, sehingga
pendapatnya dapat diterima!
Contoh 2 :
Manajemen PERUMKA mulai tahun 1992, melakukan pemeriksaan karcis KRL lebih intensif
dibanding tahun-tahun sebelumnya, pemeriksaan karcis yang intensif berpengaruh positif
terhadap penerimaan PERUMKA. Untuk membuktikan pendapat ini, hipotesis awal yang
diajukan adalah :
Manajemen berharap hipotesis ini ditolak, sehingga membuktikan bahwa pendapat mereka benar!
41
MODUL STATISTIKA I
PENJELASAN
Hipotesis Awal yang diharap akan ditolak disebut : Hipotesis Nol ( H0 )
Hipotesis Nol juga sering menyatakan kondisi yang menjadi dasar pembandingan.
Dalam pengujian hipotesis kebanyakan digunakan kesalahan Tipe I yaitu berapa persen kesalahan
untuk menolak hipotesis nol (H0) padahal H0 benar. Tingkat kesalahan ini selanjutnya dinamakan
Level of Significan.
II. Tentukan nilai tabel sesuai dengan jenis pengujian dan α nya (nilai kritis tabel)
III. Carilah mana daerah penerimaan dan penolakan H0 tersebut sesuai dengan tabel yang
ditunjukkan pada α tertentu.
IV. Hitunglah test statistiknya apakah dilakukan pengujian dengan Z, t, F atau pengujian
lainnya.
V. Buatlah keputusan apakah harus menerima atau menolak hipotesa
VI. Kesimpulan apakah yang dapat diperoleh dari no. 5 tersebut.
Daerah penolakan dan penerimaan untuk pengujian 2 sisi (two tailed test) dan pengujian 1
sisi (one tailed test) adalah sbb:
43
MODUL STATISTIKA I
a) Pengujian 2 sisi
H0 ditolak H0 ditolak
1-α
H0 diterima H0 diterima
α/2 α/2
-Zα/2 0 Zα/2
H0 diterima bila -Zα/2 ≤ Zhitung ≤ Zα/2
H0 ditolak bila Zhitung > Zα/2 atau Zhitung < -Zα/2
b) Pengujian 1 sisi
Jika H1 : > 0
H0 ditolak
1-α
H0 diterima
H0 diterima
α
0 Zα
H0 diterima bila Zhitung < Zα dan H0 ditolak bila Zhitung > Zα
Jika H1 : < 0
H0 ditolak
1-α
H0 diterima H0 diterima
-Zα 0
H0 diterima bila Zhitung > -Zα dan H0 ditolak bila Zhitung < -Zα
Contoh:
Pabrik „DUNLOP‟ menyatakan bahwa rata-rata pemakaian ban radial G tahan sampai 50 bulan
dengan standar deviasi 5 bulan. Untuk menguji hipotesa (pernyataan) tersebut maka lembaga
44
MODUL STATISTIKA I
konsumen mengambil sebanyak 100 random sampel ban G 800 dan setelah diuji ternyata rata-
rata pemakaian 40 bulan. Ujilah dengan α = 5%, apakah pernyataan pabrik tersebut benar bahwa
rata-rata pemakaian 50 bulan?
Jawab
I. H0 : = 50 bulan H1 : ≠ 50 bulan
II. α = 5% Z1/2 α = Z1/2 (0,05) = 1,96
III. Daerah penerimaan H0 berada antara -1,96 ≤ Zhitung ≤ 1,96
Daerah penolakan H0 berada Zhitung > 1,96 atau Zhitung < -1,96
IV. Tes
V. t Statistik
x 0 40 50
Zhitung = = -20
/ n 5 / 100
VI. Keputusan
2,5% 2,5%
95%
Daerah Penerimaan H0
6.2.1.2 Uji Hipotesis Mean Populasi untuk Sampel Kecil (n <30) dengan distribusi t
Untuk menguji meanpopulasi yang didasarkan pada pengamatan random sampelyang
jumlahnya relatif kurang dari 30, ataupun pengujian terhadap bila dalam random sampel
tersebut yang kita peroleh adalah nilai-nilai statistiknya seperti nilai x , s, s2 sehingga dari nilai-
nilai itulah dapat disimpulkan apakah ada perbedaan yang cukup berarti antara x random sampel
dengan (mean populasi) pada α tertentu.
Statistik uji yang digunakan adalah:
x 0
thitung =
s/ n
dimana: x = rata-rata sampel
0 = taksiran awal nilai rata-rata populasi
s = standar deviasi sampel
n = jumlah sampel
Daerah penolakan dan penerimaan H0 untuk uji 2 sisi dan uji 1 sisi adalah sbb:
45
MODUL STATISTIKA I
a. Pengujian 2 sisi
Gambar Kurva Distribusi t
H0 ditolak H0 ditolak
1-α
H0 diterima H0 diterima
α/2 α/2
H0 ditolak
1-α
H0 diterima H0 diterima
0 tα; (n-1)
H0 diterima bila thitung < tα df (n-1) dan H0 ditolak bila thitung > tα df (n-1)
Jika H1 : < 0
H0 ditolak
1-α
H0 H0
diterima diterima
-tα; (n-1) 0
H0 diterima bila thitung > -tα df (n-1) dan H0 ditolak bila thitung < -tα df (n-1)
Contoh:
Berdasarkan hasil sensus ekonomi yang baru saja dilakukan diperoleh informasi bahwa rata-rata
keuntungan perusahaan industri kecil di Kabupaten ABC mencapai Rp 22 juta per tahunnya.
Untuk memperoleh keyakinan yang lebih pasti, maka Bappeda setempat melakukan pula
penelitian dengan memilih sebanyak 8 sampel industri kecil pada daerah tersebut, dan diperoleh
rata-rata keuntungan Rp 19,25 juta dengan standar deviasi Rp 1,9 juta. Ujilah dengan α = 5%
46
MODUL STATISTIKA I
apakah benar bahwa taksiran rata-rata keuntungan industri tersebut lebih kecil dari Rp 22 juta
pertahun?
Jawab
I. H0 : = 22 juta H1 : < 22 juta
II. α = 5% tα df (n-1) = t0,05 df (8-1) = 1,895
III. H0 diterima bila thitung > -t0,05 df (7) atau thitung > -1,895
H0 ditolak bila thitung < -t0,05 df (7) atau thitung < -1,895
IV. Test Statistik
x 0 19,25 22
thitung = = -4,09
s/ n 1,9 / 8
V. Keputusan
5%
95%
Daerah Penerimaan H0
-4,09 -1,895 0
H0 ditolak karena thitung < -t0,05 df (7) atau -4,09 < -1,895
VI. Kesimpulan
Keuntungan rata-rata industri kecil di Kabupaten ABC sebesar Rp 22 juta ternyata terlalu
besar, karena kenyataannya lebih kecil dari Rp 22 juta per tahun.
47
MODUL STATISTIKA I
V. Keputusan
2,5% 2,5%
95%
Daerah Penerimaan H0
-1,96 0 1,96 2
Tolak H0 karena Zhitung > 1,96 atau 2 > 1,96
VI. Kesimpulan
Proporsi yang menonton film Minggu siang antara pria dan wanita tidak sama.
48
MODUL STATISTIKA I
H1 : 1 ≠ 2
atau
: 1 > 2 atau 1 < 2 (uji 1 sisi)
II. Carilah nilai kritis pada α tertentu sesuai dengan jenis pengujian apakah 1 sisi atau 2 sisi
III. Tentukan daerah penerimaan dan penolakan H0 tersebut
a) Pengujian 2 sisi
H0 diterima bila -Zα/2 ≤ Zhitung ≤ Zα/2
H0 ditolak bila Zhitung > Zα/2 atau Zhitung < -Zα/2
b) Pengujian 1 sisi
H1 : 1 > 2 H0 diterima bila Zhitung < Zα
H0 ditolak bila Zhitung > Zα
H1 : 1 < 2 H0 diterima bila Zhitung > -Zα
H0 ditolak bila Zhitung < -Zα
IV. Test Statistik
x1 x 2 12 22
Z hitung = dimana σd =
d n1 n2
s12 s 22
Jika varian populasi tidak diketahui maka σd =
n1 n2
Ujilah dengan α = 8%, apakah rata-rata kadar vitamin A yang terkadung dalam obat merek X dan
Y sama?
Jawab
I. H0 : X = Y
H1 : X
≠ Y
nx n y 35 40
VI.
VII. \Keputusan
4%
4%
92%
Daerah Penerimaan H0
Contoh:
50
MODUL STATISTIKA I
Data di bawah ini menunjukkan hasil ujian mereka pada waktu sebelum dan sesudah training.
51
MODUL STATISTIKA I
29 73 81
30 79 86
Untuk menguji apakah terdapat perbedaan yang signifikan terhadap data-data nilai sebelum dan
sesudah adanya training maka dapat dibuat langkah-langkah sebagai berikut:
I. Ho : Tidak terdapat perbedaan yang signifikan antara hasil sebelum dan sesudah adanya
training
H1 : Terdapat adanya perbedaan yang signifikan antara hasil sebelum dan sesudah adanya
training (2 sisi)
II. Tentukan nilai kritis sesuai dengan derajat kepercayaan dan model pengujian 1 sisi atau 2 sisi
III. Tentukan daerah penerimaan dan penolakan Ho
IV. Tentukan nilai test statistik
d 0
ZHitung =
sd
d
d
n
s
s d = standar deviasi dapat dicari melalui : s d
n
d 2
d n
2
s =
n 1
No X1 X2 d d2
1 68 65 -3 9
2 75 76 1 1
3 80 88 8 64
4 73 79 6 36
5 69 78 9 81
6 90 94 4 16
7 75 75 0 0
8 70 72 2 4
9 73 69 -4 16
10 87 89 2 4
11 84 89 5 25
12 90 92 2 4
13 72 69 -3 9
14 71 73 2 4
52
MODUL STATISTIKA I
15 74 75 1 1
16 71 78 7 49
17 69 75 6 36
18 71 76 5 25
19 82 93 11 121
20 87 79 -8 64
21 82 89 7 49
22 87 95 8 64
23 69 65 -4 16
24 71 82 11 121
25 86 86 0 0
26 75 86 11 121
27 72 79 7 49
28 74 80 6 36
29 73 81 8 64
30 79 86 7 49
Total 114 1.138
d
d 114 =3,80
n 30
d 2
1.138
d n
2
1.138
30
s=
n 1 30 1
s= 24,303 = 4,929
s 4,929
sd = 0,899
n 30
Bila model pengujian 2 sisi
I. Ho : 1 = 2 artinya yang diperoleh sebelum dan sesudah training sama saja (tidak
terdapat perbedaan yang signifikan)
H1 : 1 ≠ 2 artinya hasil yang diperoleh sebelum dan sesudah adanya training berbeda
(terdapat perbedaan yang signifikan)
II. Bila α = 5%, maka nilai kritis Z adalah Z1/2α = Z1/2(0,05) = Z0,025 = 1,96
III. Ho diterima bila -1,96 ≤ ZHitung ≤ 1,96
Ho ditolak bila ZHitung > 1,96 atau ZHitung < -1,96
IV. Test statistik
d 0 3,80 0
ZHitung = = 4,22
sd 0,899
V. Keputusan
53
MODUL STATISTIKA I
2,5% 2,5%
95%
Daerah Penerimaan H0
H1 : 2 > 1 (Karena ada keyakinan bahwa dengan adanya training akan memberikan
hasil yang baik)
II. Bila α = 5%, maka nilai kritis Z adalah Zα = 1,65
III. Ho diterima bila ZHitung < 1,96
Ho ditolak bila ZHitung > 1,96
IV. Test statistik
d 0 3,80 0
ZHitung = =4,22
sd 0,899
V. Keputusan
H0 ditolak
1-α = 95%
H0 diterima
α
0 1,96 4,22
Tolak Ho karena ZHitung > 1,96 atau 4,22 > 1,96
VI. Kesimpulan
Hasil ujian yang diperoleh karyawan sesudah adanya training memang lebih baik daripada
sebelum diadakannya training
6.2.3.3 Uji Hipotesis Perbedaan Antara 2 Sampel Mean untuk Sampel Kecil (n < 30)
Pengujian hipotesis ini digunakan jika kedua sampel (n 1 + n2) kurang dari 30. statistik uji
yang digunakan adalah sbb:
x1 x2
t hitung =
(n1 1) s12 (n2 1) s 22 1 1
n1 n2 2 n1 n2
Daerah penerimaan dan penolakan Ho untuk pengujian 2 sisi dan pengujian 1 sisi adalah sbb:
54
MODUL STATISTIKA I
1. Pengujian 2 sisi
H0 diterima bila -tα/2 df (n1 + n2 -2) ≤ thitung ≤ tα/2 df (n1 + n2 -2)
H0 ditolak bila thitung > tα/2 df (n1 + n2 -2) atau thitung < -tα/2 df (n1 + n2 -2)
2. Pengujian 1 sisi
H1 : 1 > 2 H0 diterima bila thitung < tα df (n1 + n2 -2)
H0 ditolak bila thitung > tα df (n1 + n2 -2)
H1 : x ≠ y
II. Bila α = 5%, maka nilai kritis adalah t α/2 df (n1 + n2 -2) = t0,05/2 df (12 + 12 -2)
= t0,0025 df (22) = 2,074
III. Ho diterima bila -2,074 ≤ thitung ≤ 2,074
Ho ditolak bila thitung > 2,074 atau thitung < -2,074
IV. Test Statistik
t hitung = x1 x 2 = 23.600 24.800 = - 0,85
(n1 1) s (n2 1) s
2 2
1 1 (12 1)3200 (12 1)3700
2 2
1 1
1 2
n1 n2 2 n1 n2 12 12 2 12 12
V. Keputusan
2,5% 2,5%
95%
Daerah Penerimaan H0
55
MODUL STATISTIKA I
Perbedaan rata-rata daya tempuh antara ban merek X dan merek Y tidak signifikan pada α =
5%.
6.2.4 Uji Hipotesis Perbedaan 2 Macam Sampel Proporsi
Pengujian ini digunanakn bila terdapat 2 macam random sampel dimana proporsi yang
berbeda. Secara umum hipotesa yang dapat dibuat adalah :
I. Ho : π1 = π2
H1 : π1 ≠ π2 (Uji 2 sisi)
Atau
π1 > π2 atau π1 < π2 (Uji 1 sisi)
II. Tentukan α
III. Daerah penerimaan dan penolakan Ho
a) Pengujian 2 sisi
H0 diterima bila -Zα/2 ≤ Zhitung ≤ Zα/2
H0 ditolak bila Zhitung > Zα/2 atau Zhitung < -Zα/2
b) Pengujian 1 sisi
H1 : π1 > π2 H0 diterima bila Zhitung < Zα
H0 ditolak bila Zhitung > Zα
H1 : π1 < π2 H0 diterima bila Zhitung > -Zα
H0 ditolak bila Zhitung < -Zα
IV. Test Statistik
p1 p 2 n1 p1 n2 p2
Zhitung = dimana
1 1 n1 n 2
1
n1 n2
V. Keputusan apakah menerima atau menolak Ho
VI. Kesimpulan yang dapat diambil
Contoh:
Pada tanggal 2 Pebruari 1987 dari sebanyak 200 pemilih memperlihatkan bahwa 120 pemilih
tersebut menyukai calon X sebagai lurahnya, namun pada bulan berikutnya dari sebanyak 300
pemilih ternyata yang menyukai calon X sebagai lurahnya sebanyak 150 pemilih. Ujilah dengan
α = 5% apakah popularitas calon X tersebut telah berubah dalam 2 masa pemungutan suara
tersebut?
Jawab
n1 = 200 n2 = 300
120 150
p1 = = 0,6 p2 = =0,5
200 300
n1 p1 n2 p 2 (200 x0,6) (300 x0,5)
=0,54
n1 n 2 200 300
I. Ho : π1 = π2
H1 : π1 > π2 (Uji 1 sisi)
56
MODUL STATISTIKA I
V. Keputusan
H0 ditolak
1-α = 95%
α
H0 diterima
0 1,64 2,298
H0 ditolak karena Zhitung > 1,64 atau 2,298 > 1,64
VI. Kesimpulan
Popularitas calon X semakin menurun dalam 2 masa pemungutan suara tersebut.
Latihan:
1. Selama tahun 2008 dan 2009 diketahui bahwa hasil penjualan suatu unit produk terjual rata-
rata 260 unit per bulan tiap distributor, dengan α= 15 unit. Lalu dilakukan pengamatan
terhadap 150 penjual pada beberapa pasar dan hasilnya diketahui rata-rata terjual 275 unit per
bulan. Jika tigkat keyakinan terhadap hasil penjualan tersebut 96%. Apakah penjualan sudah
dapat dikatakan meningkat?
2. Berdasarkan hasil data historis diketahui bahwa pengeluaran masyarakat secara rata-rata
terhadap pembersih perkakas dapur Rp. 50.000 untuk suatu merk. Maka timbul keraguan
manager apakah pengeluaran masyarakat yang menjadi pendapatan perusahaan tersebut masih
dapat dipertahankan. Lalu dilakukan survei dengan hasil wawancara terhadap 150 orang
anggota masyarakat, dan hasil survei dalam ribuan rupiah yaitu sebagai berikut (X i = titik
tengah pengeluaran; fi = jumlah anggota masyarakat).
Xi : 15 25 35 45 55 65 75 85 95
fi : 10 18 25 28 33 17 10 7 2
Untuk α= 0,05 apakah pendapatan perusahaan dari pembersih itu masih dianggap sama dengan
waktu yang lalu?
57
MODUL STATISTIKA I
BAB VII
UJI HIPOTESIS ASOSIATIF
Hipotesis asosiatif merupakan dugaan adanya hubungan antar variabel dalam sampel.
Untuk itu dalam langkah awal pembuktiannya, maka perlu dihitung terlebih dahulu koefisien
korelasi antar variabel dalam sampel, baru koefisien yang ditemukan itu diuji signifikansinya.
Jadi menguji hipotesis asosiatif adalah menguji koefisiensi korelasi yang ada pada seluruh
populasi dimana sampel diambil. Bila penelitian dilakukan pada seluruh populasi maka tidak
diperlukan pengujian signifikansi terhadap koefisien korelasi yang ditemukan. Hal ini berarti
peneliti tidak merumuskan dan menguji instrumen statistik.
Terdapat tiga macam bentuk hubungan antar variabel, yaitu hubungan simetris, hubungan
sebab akibat (kausal) dan hubungan interaktif (saling mempengaruhi). Untuk mencari hubungan
antara dua variabel atau lebih dilakukan dengan menghitung korelasi antar variabel yang akan
dicari hubungannya. Korelasi merupakan angka yang menunjukkan arah dan kuatnya hubungan
antar dua variabel atau lebih. Arah dinyatakan dalam bentuk hubungan positif atau negatif,
sedangkan kuatnya hubungan dinyatakan dalam koefisien korelasi.
Hubungan dua variabel atau lebih dinyatakan positif, bila nilai suatu variabel ditingkatkan,
maka akan meningkatkan variabel yang lain, dan sebaliknya bila satu variabel diturunkan maka
akan menurunkan variabel yang lain. Hubungan dua variabel atau lebih dinyatakan negatif, bila
nilai satu variabel dinaikkan maka akan menurunkan nilai variabel yang lain, dan juga sebaliknya
bila nilai satu variabel diturunkan, maka akan menaikkan nilai variabel yang lain
Gambar Korelasi Positif Gambar Korelasi Negatif
12
12
10
10
8 8
6 6
4 4
2 2
0
0
2 4 6 8 2 4 6 8
Kuatnya hubungan antar variabel dinyatakan dalam koefisien korelasi. Koefisien korelasi
positif sebesar =1 dan koefisien korelasi negatif terbesar adalah -1, sedangkan yang terkecil
adalah 0. Bila hubungan antara dua variabel atau lebih itu mempunyai koefisien korelasi = 1 atau
-1, maka hubungan tersebut sempurna. Dalam arti kejadian-kejadian pada variabel yang satu akan
dapat dijelaskan atau diprediksikan oleh variabel yang lain tanpa terjadi kesalahan (error).
Semakin kecil koefisien korelasi, maka akan semakin besar error untuk membuat prediksi.
Besarnya koefisien korelasi dapat diketahui berdasarkan penyebaran titik-titik pertemuan
antara dua variabel misalnya X dan Y. Bila titik-titik itu terdapat dalam satu garis, maka
koefisien korelasinya = 1 atau -1. Bila titik-titik itu membentuk lingkaran, maka koefisien
58
MODUL STATISTIKA I
korelasinya = 0. Hubungan X dan Y untuk berbagai koefisien bila digambarkan dalam diagram
pencar (scatterplot) dapat dilihat pada gambar di bawah ini.
Variabel Variabel
Y Y
Variabel X
Variabel X
Gambar r = 1
Variabel
Variabel X
59
MODUL STATISTIKA I
xy
rxy i 1
n n
x2 y2
i 1 i 1
60
MODUL STATISTIKA I
10 10
xi
70
y i
20
x 7
i 1
y i 1
2
10 10 10 10
10
xy 10
rxy i 1
0,9129
10 10
20 x6
x y
i 1
2
i 1
2
Jadi ada korelasi positif sebesar 0,9129 antara pendapatan dan pengeluaran tiap bulan. Hal ini
berarti semakin besar pendapatan, maka akan semakin besar pula pengeluaran. Apakah koefisien
korelasi hasil perhitungan tersebut signifikan (dapat digeneralisasikan) atau tidak, maka perlu
dibandingkan dengan r tabel, dengan taraf kesalahan tertentu. Tahap-tahap pengujiannya adalah
sebagai berikut:
I. H0 : ρ = 0
H1 : ρ ≠ 0
II. α = 5% maka untuk N = 10 nilai rtabel = 0,632
III. Daerah penolakan H0 adalah jika rhitung > rtabel
IV. Statistik uji : rhitung = 0,9129
V. Keputusan : Tolak H0 karena rhitung > rtabel atau 0,9129 > 0,632
VI. Kesimpulan : Ada hubungan positif dan signifikan antara pendapatan dan pengeluaran
sebesar 0,9129.
Pengujian signifikansi koefisien korelasi, selain dapat menggunakan tabel, juga dapat
dihitung dengan uji t.
r n2
t
1 r2
Tahapan pengujian dengan uji t untuk contoh tersebut adalah sebagai berikut:
I. H0 : ρ = 0
H1 : ρ ≠ 0
II. α = 5% maka t ; df = n – 2 = t0,025 ; df = 10-2 = t0,025 ; df = 8 =2,306
2
III. Daerah penolakan H0 adalah jika thitung > 2,306 atau thitung < -2,306
r n2 0,9129 8 2
IV. Statistik uji : t = 6,33
1 r 2
1 0,9129 2
V. Keputusan : Tolak H0 karena thitung > 2,306 atau 6,33 > 2,306
VI. Kesimpulan : Hal ini berarti terdapat hubungan yang positif dan signifikan antara
pendapatan dan pengeluaran sebesar 0,9129.
Untuk dapat memberikan penafsiran terhadap koefisien korelasi yang ditemukan
tersebut besar atau kecil, maka dapat berpedoman pada ketentuan yang tertera pada tabel
berikut ini:
Interval koefisien Tingkat hubungan
61
MODUL STATISTIKA I
Dalam analisis korelasi terdapat suatu angka yang disebut dengan koefisien
determinasi, yang besarnya adalah kuadrat dari koefisien korelasi (r 2). Koefisien ini disebut
koefisien penentu, karena varian yang terjadi pada variabel dependen dapat dijelaskan melalui
varian yang terjadi pada variabel independen. Untuk contoh di atas ditemukan r = 0,9129.
Koefisien determinasinya adalah r2 = 0,91292 = 0,83. Hal ini berarti varian yang terjadi pada
variabel pengeluaran 83% dapat dijelaskan melalui varian yang terjadi pada variabel pendapatan,
atau pengeluaran 83% ditentukan oleh besarnya pendapatan, dan 17% oleh faktor lain misalnya
terjadi musibah, sehingga pengeluaran tersebut tidak dapat diduga.
7.2 Korelasi Ganda
Korelasi Ganda (Multiple Correlation) merupakan angka yang menunjukkan arah dan
kuatnya hubungan antara dua variabel secara bersama-sama atau lebih dengan variabel yang lain.
Pemahaman tentang korelasi ganda dapat dilihat melalui gambar berikut ini. Simbol korelasi
ganda adalah R.
r1
X1
R Y
X2
r2
Gambar 1
r5 R
r3
X2 Y
r4
r6
X3
r2
Gambar 2
62
MODUL STATISTIKA I
variabel Y
ryx1 = Korelasi Product Moment antara X1 dengan Y
Jadi untuk dapat menghitung korelasi ganda, maka harus dihitung terlebih dahulu korelasi
sederhananya dulu melalui korelasi Product Momen dan Pearson.
Contoh:
Misalnya dari suatu penelitian yang berjudul ”Kepemimpinan dan Tata Ruang Kantor dalam
Kaitannya dengan Kepuasan Kerja Pegawai di Lembaga A”. Berdasarkan data yang terkumpul
untuk setiap variabel dan setelah dihitung korelasi sederhananya ditemukan sebagai berikut:
1. Korelasi antara Kepemimpinan dengan Kepuasan Kerja Pegawai (r1) = 0,45
2. Korelasi antara Tata Ruang Kantor dengan Kepuasan Kerja Pegawai (r 2)= 0,48
3. Korelasi antara Kepemimpinan dengan Tata Ruang Kantor (r 3) = 0,22
Jawab: r1 = 0,45
X1
Dimana: X1 = Kepemimpinan
r3 = 0,22 R = 0,5959 Y X2 = Tata Ruang
Kantor X2
Y = Kepuasan
r2 = 0,48
Kerja Pegawai
Korelasi ganda antara Kepemimpinan dan Tata Ruang Kantor secara bersama-sama dengan
Kepuasan Kerja Pegawai dapat dihitung sebagai berikut:
R2 k
F
1 R 2 n k 1
Dimana : R = Koefisien Korelasi Ganda n = jumlah anggota sampel
k = jumlah variabel independen
Berdasarkan angka yang telah ditemukan, dan bila n = 30, maka harga Fh dapat dihitung
dengan rumus:
0,5959 2 2
F
1 0,5959 2 30 2 1
= 7,43
Harga tersebut selanjutnya dibandingkan dengan harga Ftabel dengan derajat kebebasan
pembilang = k dan derajat kebebasan penyebut = (n-k-1). Jadi dkpembilang = 2 dan dkpenyebut = 10-2-
1 = 7. Dengan taraf kesalahan 5%, harga Ftabel ditemukan sebesar = 4,74. Ternyata harga Fhitung
lebih besar dari Ftabel (7,43 > 4,74). Karena Fhitung lebih besar dari Ftabel maka H0 ditolak dan H1
diterima. Jadi koefisien korelasi ganda yang ditemukan adalah signifikan (dapat diberlakukan
untuk populasi dimana sampel diambil).
rp n 3
t
1 rp2
64
MODUL STATISTIKA I
2. Korelasi antara nilai kuliah dengan waktu belajar = 0,1 ( ryx2 = 0,1)
Jika waktu belajar dibuat sama/dikendalikan, berapa korelasi antara IQ dengan nilai kuliah?
Jawab:
III. Daerah penolakan H0 adalah jika thitung > 2,064 atau thitung < -2,064
IV. Statistik uji:
rp n 3 0,68 25 3
t = 4,35
1 rp2 1 0,68 2
V. Keputusan: Tolak H0 karena thitung > 2,064 atau 4,35 > 2,064
VI. Kesimpulan: Ada korelasi antara IQ dengan nilai kuliah bila waktu belajar dibuat sama (r p
≠ 0). Dengan demikian koefisien korelasi yang ditemukan tersebut adalah signifikan yaitu
dapat digeneralisasikan ke seluruh populasi dimana sampel diambil.
2
C
N 2
Dimana: C = Koefisien Kontingensi
χ2 = Chi Kuadrat
N = Jumlah data
Harga Chi Kuadrat dicari dengan rumus:
65
MODUL STATISTIKA I
r k O Eij
2
2 ij
i 1 j 1 Eij
Dimana: O = Observasi k = jumlah kategori variabel A
E = Ekspektasi / Harapan r = jumlah kategori variabel B
Untuk memudahkan perhitungan, maka data-data hasil penelitian perlu disusun ke dalam
tabel yang modelnya ditunjukkan pada tabel di bawah ini:
Variabel A
Variabel B Jumlah
A1 A2 ... Ak
B1 A1B1 A2B1 ... AkB1
B2 A1B2 A2B2 ... AkB2
... ... ... ... ...
Br A1Br A2Br ... AkBr
Jumlah
Contoh:
Dilakukan penelitian untuk mengetahui adalah hubungan antara profesi pekerjaan dengan jenis
olahraga yang sering dilakukan. Profesi dikelompokkan : Dokter, Pengacara, Dosen, Bisnis (Dr,
P, Do, Bi). Jenis olahraga dikelompokkan menjadi Golf, Tenis, Bulutangkis dan Sepak Bola (Go,
Te, Bt, Sb). Jumlah Dokter yang digunakan sebagai sampel = 58 orang, pengacara = 75 orang,
Dosen = 68 orang, Bisnis = 81. Jumlah seluruhnya 282 orang.
Jawab:
H0 : Tidak ada hubungan yang signifikan antara Jenis Profesi dengan Jenis Olahraga yang
disenangi.
H1 : Ada hubungan yang signifikan antara Jenis Profesi dengan Jenis Olahraga yang
disenangi.
Berdasarkan sampel 4 kelompok profesi yang dipilih secara random, diperoleh data
seperti ditunjukkan pada tabel di bawah ini.
Jenis Profesi
Olahraga Jumlah
Dr P Do Bi
Go 17 23 10 30 80
Te 23 14 17 26 80
Bt 12 26 18 14 70
Sb 6 12 23 11 52
Jumlah 58 75 68 81 282
66
MODUL STATISTIKA I
Untuk mengetahui f yang diharapkan (fh) pertama-tama dihitung berapa persen dari masing-
masing sampel yang menyenangi olahraga Golf, Tenis, Bulutangkis dan Sepak Bola.
Dari sini dapat dihitung prosentase:
1. ke empat sampel yang menyenangi olahraga Golf, adalah:
17 23 10 31 80
0,284
282 282
2. ke empat sampel yang menyenangi olahraga Tenis, adalah:
23 14 17 26 80
0,284
282 282
3. ke empat sampel yang menyenangi olahraga Bulutangkis, adalah:
12 26 18 14 70
0,248
282 282
4. ke empat sampel yang menyenangi olahraga Sepak Bola, adalah:
6 12 23 11 52
0,184
282 282
Selanjutnya masing-masing fh (frekuensi yang diharapkan) kelompok yang menyenangi
setiap jenis olahraga dapat dihitung:
a. Yang menyenangi Golf: b. Yang menyenangi Tenis:
1) fh Dokter = 0,284 x 58 = 16,472 1) fh Dokter = 0,284 x 58 =
16,472
2) fh Pengacara= 0,284 x 75 = 21,300 2) fh Pengacara= 0,284 x 75 =
21,300
3) fh Dosen = 0,284 x 68 = 19,312 3) fh Dosen = 0,284 x 68 =
19,312
4) fh Bisnis = 0,284 x 81 = 23,004 4) fh Bisnis = 0,284 x 81 =
23,004
Jumlah 80 Jumlah 80
c. Yang menyenangi Bulutangkis: d. Yang menyenagi Sepak Bola:
1) fh Dokter = 0,248 x 58 = 14,384 1) fh Dokter = 0,184 x 58 =0,672
2) fh Pengacara= 0,248 x 75 = 18,600 2) fh Pengacara= 0,184 x 75 =
13,800
3) fh Dosen = 0,248 x 68 = 16,864 3) fh Dosen = 0,184 x 68 =
12,512
4) fh Bisnis = 0,248 x 81 = 20,088 4) fh Bisnis = 0,184 x 81 =
14,904
Jumlah 70 Jumlah 52
67
MODUL STATISTIKA I
fo fh fo fh fo fh fo fh
Go 17 16,472 23 21,300 10 19,312 30 23,004 80
Te 23 16,472 14 21,300 17 19,312 26 23,004 80
Bt 12 14,384 26 18,600 18 16,864 14 20,088 70
Sb 6 10,672 12 13,800 23 12,512 11 14,904 52
Jumlah 58 75 68 81 282
Selanjutnya harga Chi Kuadrat dapat dihitung dengan rumus:
r k O Eij
2
2 ij
i 1 j 1 Eij
Dalam hal ini O (observasi) = fo dan E (Ekspektasi) = fh.
2
17 16,472
2
23 21,3
2
11 14,904
2
29,881
16,472 21,3 14,904
2 29,881
Jadi = 29,881 maka C
2
2 = 0,31
N 282 29,881
Jadi besarnya koefisien kontingensi antara jenis profesi dengan kesenangan olahraga sebesar 0,31.
Untuk menguji signifikansi koefisien kontingensi (C) dapat dilakukan dengan uji Chi Kuadrat.
Langkah – langkah pengujiannya adalah sebagai berikut:
I H0 : Tidak ada hubungan yang signifikan antara jenis Profesi dengan jenis Olahraga
yang disenangi.
H1 : Ada hubungan yang signifikan antara jenis Profesi dengan jenis Olahraga yang
disenangi.
II α = 5% 2 ; df = (k-1)(r-1) = 02, 05 ; df = (4-1)(4-1) = 02, 05 ; df = 9 = 15,51
IV Statistik uji:
r k O Eij
2
2 ij
= 29,881
i 1 j 1 Eij
V Keputusan : Tolak H0 karena hitung
2
> 15,51 atau 29,881 > 15,51
VI Kesimpulan : Jenis Profesi mempunyai hubungan yang signifikan dengan jenis olahraga
yang disenangi.
BAB VIII
68
MODUL STATISTIKA I
REGRESI LINEAR
Analisis regresi adalah analisis statistika yang bertujuan untuk memodelkan hubungan
antara variable independen dengan variable dependen. Analisis regresi digunakan bila kita ingin
mengetahui bagaimana variable dependen dapat diprediksi melalui variable independen. Dampak
dari penggunaan analisis regresi dapat digunakan untuk memutuskan apakah naik dan
menurunnya variable dependen dapat dilakukan melalui menaikkan dan menurunkan keadaan
variable independen.
8.1 Regresi Linear Sederhana
Regresi linear sederhana adalah analisis statistika yang bertujuan untuk memodelkan
hubungan antara satu variabel independent dengan satu variabel dependen. Persamaan umum
regresi linear sederhana adalah:
Yˆ = a + bX
Dimana: Y = variabel dependen a = konstanta (harga Y jika X = 0)
X = variabel independen b = koefisien regresi
Harga a dan b ini bisa dicari dengan rumus berikut:
Y X X X Y
2
a
i i i i i
n X X 2 2
i i
n X Y X Y
b
i i i i
n X X 2 2
i i
thitung =
dimana:
69
MODUL STATISTIKA I
b : koefisien regresi
sb : kesalahan standard koefisien regresi yang dapat ditentukan dengan rumus:
∑ ̂
√
√∑ ∑
Jawab a:
Berikut ini adalah tabel penolong untuk menghitung persamaan regresi sederhana dan korelasi:
No X Y XY X2 Y2
1 54 167 9018 2916 27889
2 50 155 7750 2500 24025
70
MODUL STATISTIKA I
a
1618 27615 52384975 = 91,24
1027615 523
2
Dari nilai koefisien korelasi tersebut dapat disimpulkan bahwa terdapat hubungan yang
positif sebesar 0,66 antara nilai kualitas layanan dan rata-rata penjualan barang tiap bulan.
Koefisien determinasinya r2 = 0,662 = 0,4356. hal ini berarti nilai rata-rata penjualan barang tiap
bulan 43,56% ditentukan oleh nilai kualitas layanan yang diberikan, sisanya 56,44% ditentukan
oleh faktor lain.
Jawab b:
No Yˆ Y Yˆ
2
1 164.14 8.1796
2 158.74 13.9876
3 162.79 218.7441
4 151.99 35.8801
5 156.04 194.8816
6 176.29 10.8241
7 153.34 18.8356
8 166.84 0.7056
71
MODUL STATISTIKA I
9 161.44 73.2736
10 166.84 51.2656
jumlah 626.5775
Berikut ini adalah tahapan pengujian koefisien regresi linear sederhana:
1. H0 : β = 0 , kualitas layanan (X) tidak berpengaruh terhadap penjualan barang (Y)
H1 : β ≠ 0 , kualitas layanan (X) berpengaruh terhadap penjualan barang (Y)
2. α = 5% maka ttabel = t0,025 ; 10 – 1 – 1 = t0,025 ; 8 = 2,306
3. Daerah kritis :
H0 diterima apabila – 2,306 ≤ thitung ≤ 2,306
H0 ditolak apabila thitung < - 2,306 atau thitung > 2,306
Daerah Penerimaan H0
-2,306 0 2,306
4. Statistik uji:
∑ ̂
√ =√ =√ = 8,85
= = = 0,547
√∑ ∑ √ √
thitung = = = 2,468
5. Keputusan: tolak H0 karena thitung > t0,025 ; 8 atau 2,468 > 2,306
6. Kesimpulan: Kualitas Layanan (X) berpengaruh terhadap Penjualan Barang (Y)
8.2 Regresi Linear Berganda
Analisis regresi berganda digunakan untuk memodelkan hubungan antara variabel
dependen (respon) dengan dua atau lebih variabel independent (prediktor). Jadi analisis regresi
ganda akan dilakukan bila jumlah variabel independennya minimal 2.
Persamaan regresi berganda untuk dua prediktor adalah
Yˆ = a + b1X1 + b2X2
Persamaan regresi berganda untuk n prediktor adalah
Yˆ = a + b1X1 + b2X2 +. . . + bnXn
a Y b1 X 1 b2 X 2
72
MODUL STATISTIKA I
b1
x x y x x x y
2
2 1 1 2 2
x x x x
2
1
2
2 1 2
2
x x y x x x y
2
1 2 1 2 1
x x x x
b2 2 2 2
2 1 1 2
Dimana:
Y
Y X1
X 1
X2
X 2
n n n
y Y nY
2 2 2
x X nX
2
1 1
2
1
2
x X nX
2
2
2
2
2
2 x y X Y nX Y
1 1 1
x y X Y nX Y
2 2 2 x x X X nX
1 2 1 2 1 X2
73
MODUL STATISTIKA I
Residual n-p-1
(Y Yˆ ) (Y Yˆ )
2 2
/ (n-p-1)
(Y Y )
Total n-1 2
5. Keputusan
Memutuskan apakah menerima atau menolak H0 dengan membandingkan nilai Fhitung
dengan Ftabel.
6. Kesimpulan
thitung =
dimana:
b : koefisien regresi
sb : kesalahan standard koefisien regresi
Untuk koefisien regresi b1 dan b2, kesalahan standardnya dirumuskan sebagai berikut:
√ ∑ ̅
√ ∑ ̅
X : variabel independen
74
MODUL STATISTIKA I
Y : variabel dependen
̂ : variabel Y hasil taksiran regresi
n : jumlah data
p : jumlah variabel X
5. Membuat keputusan
Dilakukan dengan membandingkan nilai thitung dengan ttabel
6. Membuat kesimpulan
Contoh 2:
Sebuah penelitian untuk mengetahui pengaruh kemampuan kerja pegawai (X 1) dan
kepemimpinan direktif (X2) terhadap produktivitas kerja pegawai (Y). Berdasarkan 10 responden
yang digunakan sebagai sumber data penelitian, hasilnya sebagai berikut:
No.
X1 X2 Y
responden
1 10 7 23
2 2 3 7
3 4 2 15
4 6 4 17
5 8 6 23
6 7 5 22
7 4 3 10
8 6 3 14
9 7 4 20
10 6 3 19
Y = 17 X1 = 6 X2 = 4
75
MODUL STATISTIKA I
x = 406 – 10(6)2 = 46
2
1 x = 182 – 10(4)2 = 22
2
2
x x = 267 – 10 (6)(4) = 27
1 2 y = 3162 – 10 (17)2 = 272
2
b1
22 102 27 57 = 2,491
46 22 27 2
b2
46 57 27 102 = -0,466
22 46 27 2
a = 17 – (2,491)(6)- (-0,466)(4) = 3,918
Jadi persamaan regresi linear berganda untuk dua predictor (kemampuan kerja pegawai dan
kepemimpinan direktif) adalah:
Yˆ = 3,918 + 2,491 X1 – 0,466 X2
Dari persamaan tersebut berarti produktivitas kerja pegawai akan naik bila kemampuan
pegawai ditingkatkan, dan akan turun jika kepemimpinan direktif (otoritas) ditingkatkan.
Jawab b:
No Yˆ Yˆ Y
2
Y Yˆ 2
Y Y 2
Kurva Distribusi F
Daerah penolakan H0
Daerah penerimaan H0
4,47
76
MODUL STATISTIKA I
Tabel ANOVA
Sumber db Jumlah Kuadrat F
Variasi Kuadrat Tengah
(KT)
Regresi 2 227,53 227,53 113,77
113,77 17,89
2 6,36
Total 9 272
V. Keputusan: Tolak H0 karena F hitung > 4,74 atau 17,89 > 4,74
VI. Kesimpulan: X1 (kemampuan kerja pegawai) dan X2 (kepemimpinan derektif)
mempengaruhi Y (produktivitas pegawai).
= = = 0,849
√{ }{ } √
Uji koefisien β1
I. H0 : β1 = 0 (X1 tidak mempengaruhi Y)
H1 : β1 ≠ 0 (X1 mempengaruhi Y)
II. α = 5% maka t0,025 ; 7 = 2,365
III. H0 ditolak jika t hitung > 2,365 atau t hitung < - 2,365
V. Keputusan: Tolak Ho karena t hitung > 2,365 atau 3,54 > 2,365
VI. Kesimpulan: X1 (kemampuan kerja pegawai) mempengaruhi Y
Uji koefisien β2
I. H0 : β2 = 0 (X2 tidak mempengaruhi Y)
H1 : β2 ≠ 0 (X2 mempengaruhi Y)
II. α = 5% maka t0,025 ; 7 = 2,365
77
MODUL STATISTIKA I
III. H0 ditolak jika t hitung > 2,365 atau t hitung < - 2,365
IV. Statistik uji:
ˆ2 0,466
t = 0,459
SEˆ 1,016
2
V. Keputusan: Terima Ho karena t hitung > - 2,365 atau -0,459 > -2,365
VI. Kesimpulan: X2 (kepemimpinan derektif) tidak mempengaruhi Y
Latihan:
1. Di bawah ini adalah hasil pengamatan mahasiswa terhadap hasil penjualan produk susu, yang
dipengaruhi oleh biaya promosi. Dan hasil pengamatan tersebut dalam bentuk jutaan rupiah,
yaitu dikemukakan per bulan selama tahun 2009 dan datanya adalah sebagai berikut:
No Bulan Promosi Penjualan No Bulan Promosi Penjualan
1. Januari 38,2 1.910,4 7. Juli 64,3 2.794,1
2. Februari 40,8 2.061,3 8. Agustus 72,5 3.021,3
3. Maret 43,3 2.176,0 9. September 76,8 3.343,0
4. April 46,9 2.345,0 10. Oktober 78,0 3.395,0
5. Mei 52,1 2.460,0 11. Nopember 79,9 3.477,7
6. Juni 53,2 2.637,1 12. Desember 80,8 3.648,0
Jika tingkat keyakinan terhadap data tersebut adalah 90%, maka yang menjadi pertanyaan
adalah:
a. Apakah ada pengaruh promosi terhadap penjualan?
b. Ujilah koefisien regresinya!
78