1. Dari populasi mahasiswa baru, secara acak kita ambil 100 mahasiswa dan didapatkan rata-rata IQ
mereka = 103,8. Pilih pernyataan yang sesuai dengan kondisi … Rata-rata IQ untuk populasi
mahasiswa baru = 103,8
2. Suatu universitas mempunyal populasi 1000 mahasiswa. Pada suatu aptitude test nilal ragam skor
test = 80, yang diperoleh dari sampel test sebanyak 100 mahasiswa. Apabila sampel dilakukan "tanpa
pengemballan", berapakah ragam populasi? ... (1000-100) / 1000-1
3. Kombinasi antara analisis regresi dan analisis varians disebut dengan ... anacova
4. Seorang peneliti ingin melihat besarnya kontribusi faktor komunikasi dalam keluarga, kohesivitas,
dan self concept secara bersama-sama terhadap motivasi menggunakan obat terlarang dari para
mahasiswa. Pengujian hipotesis dalam penelitian tersebut menggunakan teknik statistik ... Analisis
korelasi dengan 3 prediktor
5. Berikut ini tugas-tugas pokok analisis regresi, kecuali ... Mencari besar perbedaan antara
kelompok-kelompok sample
6. Manakah pernyataan yang salah mengenai analisis regresi ... Makin besar harga jumlah kuadrat
residu, makin kecil harga f regresi
7. Pendataan yang melibatkan sebagian anggota populasi disebut ... sampling
8. Samepel random atau Contoh acak adalah jika dan hanya jika setiap anggota populasi memiliki ...
peluang yg sama terpilih sbg anggota sampel
9. Pengacakan sampel dapat dilakukan dengan ... undian
10. Seorang hakim menghadapi terdakwa di pengadilan, hipotesis awal atau hipotesis nol adalah ...
Terdakwa bersalah
11. Pernyataan yang tepat mengenai tingkat kepercayaan 99% adalah ... Peluang data populasi berdiri
di luar tingkat kepercayaan = 1%
12. Pernyataan atau dugaan mengenai satu atau beberapa polusi disebut ... Hipotesa statistik
13. Suatu hipotesis ditolak karena ... Bukti dari sampel tidak mendukung penerimaan hipotesis
14. Kesalahan karena menerima hipotesis nol (H0) yang salah disebut ... Kesalahan jenis 2
Selama beberapa tahun terakhir ini, rata – rata test aptitude di suatu di suatu institusi pada skor 225. Test
mutakhir dilakukan dengan peserta 100 orang dan dari peserta – peserta itu rata – rata skor 235,simpangan
baku 28. Apakah benar tejadi kenaikan skor test ? (Taraf uji 0,05)
15. Hipotesis nol pada maslah itu ... skor test yang mutakhir lebih rendah dibandingkan dengan
skor test terdahulu
16. Berapakah nilai statistik hitung pada masalah itu ... 3,57
17. Kesimpulan yang mungkin dikemukakan ... skor test saat ini (yg mutakhir) meningkat
dibandingkan terdahulu
Suatu test diadakan untuk menilai apakah ada hubungan / keterkaitan antar faktor sex (jenis kelamin )
dengan perilaku “mudah menolong”. Data teroleh sebagai berikt :
x 1 2 3 4 5
P(X = k
z)
Nilai k
adalah
Jawaban
3. Berikut ini besaran data kelompok yang digunakan sebagai dasar perhitungan dalam
menentukan nilai modus data kelompok adalah
Jawaban
Tepi batas kelas
5. Ukuran statistik yang merupakan ukuran pusat data semu dan tidak dipengaruhi
angka ekstrim adalah
Jawaban
Modus
6. Aktivitas Berikut merupakan aktivitas dalam sastika deskriptif yang bersifat memberi
gambaran, kecuali
Jawaban
Meramalkan dan Menduga Data.
7. Suatu program diet diperkenalkan oleh sebuah lembaga periklanan bahwa program
tersebut dapat menurunkan berat badan dalam waktu 1 minggu tanpa menimbulkan
efek samping. Terhadap peserta program diet yang dipilih secara acak dan berat
badannya ditimbang sebelum dan sesudahnya. Hasilnya sebagai berikut
Berat (Kg)
Sebelum 80 65 76 87 98 86 73 80
Sesudah 78 66 74 82 90 80 72 76
Bila diasumsikan berat badan menyebar normal, dengan selang kepercayaan 95%
beda rata-rata berat badan sebelum dan sesudah adalah
Jawaban
0.9296 < < 5.8204
9. Sebuah perusahaan membutuhkan karyawan baru melalui tes seleksi karyawan. Dari
seluruh peserta tes, hanya 40% yang lolos. Dari para peserta tes tersebut diambil
sampel secara acak sebanyak 20 orang. Peluang sampel terdiri dari peserta lolos
sebanyak 5 orang adalah
Jawaban
0.0746
10. Seorang kepala daerah ingin menduga proporsi penduduk daerahnya yang menjadi
pegawai negeri. Dari 700 penduduk yang menjadi responden, ternyata ada 96 orang
yang menjadi pegawai negeri. Dengan selang kepercayaan 80% kepala daerah
tersebut mengestimasikan bahwa proporsi penduduk yang menjadi pegawai negeri di
daerahnya adalah
Jawaban
0.114 < 0.146
12. Berikut ini merupakan tabel analisa Skewness dan Kurtosis data pasien pengunjung
sebuah Puskesmas yang disajikan dalam distribusi kelompok berdasarkan usia
13. Berdasarkan pengamatan terhadap 150 orang laki-laki yang berumur 40 - 60 tahun
diperoleh ratarata kadar kolesterol mereka 215 mg% dan simpangan baku 45 mg%.
Peluang seseorang mempunyai kadar kolesterol > 250 mg% adalah
Jawaban
0.2177
14. Ukuran proporsi keragaman total nilai peubah Y yang dapat dijelaskan oleh nilai
peubah acak Y disebut
Jawaban
Koefisien Determinan
15. Hasil pemeriksaan terhadap 10 orang yang akan melakukan donor darah, 3 diantaranya
bergolongan darah O, 4 orang bergolongan darah A, dan 3 orang bergolongan darah
B. Jika secara acak dipanggil 5 orang pendonor untuk secara bersamaan dilakukan
pengambilan darah. Peluang terpanggilnya 1 orang bergolongan darah O, 2 orang
bergolongan darah A, dan 2 orang bergolongan darah B adalah Jawaban
17. Suatu program diet diperkenalkan oleh sebuah lembaga periklanan bahwa program
tersebut dapat menurunkan berat badan dalam waktu 1 minggu tanpa menimbulkan
efek samping. Terhadap peserta program diet yang dipilih secara acak dan berat
badannya ditimbang sebelum dan sesudahnya. Hasilnya sebagai berikut
Berat (Kg)
Sebelum 80 65 76 87 98 86 73 80
Sesudah 78 66 74 82 90 80 72 76
Bila diasumsikan berat badan menyebar normal, dengan selang kepercayaan 95%
beda rata-rata berat badan sebelum dan sesudah adalah
Jawaban
0.9296 < < 5.8204
18. Rata-rata berat bayi baru lahir di sebuah rumah sakit adalah 3750 dengan simpangan
baku 325 gram. Jika dalam sebulan ada 500 bayi lahir dan berat badan lahir bayi
terdistribusi normal, maka jumlah bayi lahir dengan berat antara 4000 gram dan 4250
gram adalah
Jawaban
79 orang
19. Seorang pegawai asuransi jiwa menawarkan rata-rata kebijakan asuransi setiap
minggunya. Peluang kejadian pegawai itu menawarkan sedangkan satu kebijakan
asuransi dalam rentang waktu seminggu (jika diketahui e = 2,71828)
Jawaban
0.9502
20. Besar responden yang diperlukan untuk menduga rata-rata pendapatan suatu
masyarakat sehingga hasil juga hanya dapat dipercaya 90% menyimpang dari yang
sebenarnya tidak lebih dari Rp. 2 ribu, bila simpangan bakunya Rp. 20 ribu
Jawaban
270 responden
21. Jika X adalah nilai ujian statistika hasil rekap nilai etika di sebuah perguruan tinggi
diperoleh
Maka standar deviasi untuk nilai ujian statistika di perguruan tinggi tersebut
adalah
Jawaban
11.6486
22. Berikut merupakan dalil yang berlaku dalam penjumlahan,
kecuali
Jawaban
23. 4 kantong sedang diambil secara acak dari suatu penyalur beras, di mana masing-
masing beratnya 5,4 ; 5,3 ; 4,7 ; 4,6 kg. Jika kantong-kantong beras tersebut
merupakan sebaran normal dengan selang kepercayaan 90% estimasi rata-rata berat
kantong beras pada penyalur tersebut adalah
Jawaban
4.5176 < 𝝁 < 5.4824
24. 4 kantong sedang diambil secara acak dari suatu penyalur beras, di mana masing-
masing beratnya 5,4 ; 5,3 ; 4,7 ; 4,6 kg. Jika kantong-kantong beras tersebut
merupakan sebaran normal dengan selang kepercayaan 90% estimasi rata-rata berat
kantong beras pada penyalur tersebut adalah
Jawaban
4.5176 < 𝝁 < 5.4824
25. Seorang pedagang buah di Tangerang, setiap hari berbelanja 300 kg buah di Pasar
induk Kramat jati, Jakarta Timur. Probabilitas buah tersebut busuk dan tidak laku
sebesar 20%. Jika suatu saat pedagang tersebut mampu menjual dagangannya sebesar
250 kg buah, maka probabilitas tersebut terjual 250 kg buah tersebut adalah
Jawaban
0.9147
QUIS
4. Diketahui mesin pencetak IC perlu diperbaiki jika dari 1000 unit IC yang
dicetak terdapat 20 unit IC yang rusak. Seorang karyawan pengawasan mutu
mengobservasi sampel acak yang terdiri dari 250 unit IC, kemudian ia mencatat jumlah
ICyang rusak.Jika jumlah IC yang rusak sebagai variabel acak X, maka X tersebut akan
memiliki distribusi probabilitas: Poisson
7. Data berikut merupakan data kualitatif, kecuali: Masa pakai komponen mesin
10. Dalam tabel distribusi frekuensi, interval kelas menunjukkan: Perbedaan batas
kelas bawah dari dua kelas yang berdekatan
2. Diketahui mesin pencetak IC perlu diperbaiki jika dari 1000 unit IC yang
dicetak terdapat 20 unit IC yang rusak. Seorang karyawan pengawasan mutu
mengobservasi sampel acak yang terdiri dari 250 unit IC, kemudian ia mencatat jumlah
IC yang rusak. Probabilitas karyawan tersebut akan menemukan paling sedikit 2 unit
IC yang rusak adalah:
Select one:
a. 0.9596
b. 0.4225
c. 0.0842
d. 0.7566
3. Seorang dosen memberikan kuis yang terdiri dari 25 soal dengan jawaban Benar
(B) dan Salah (S). Susunan jawaban kuis tersebut yang mungkin terjadi akan berjumlah:
Select one:
a. 25P2
b. 25C2
c. 2 pangkat 25
d. 25 pangkat 2
13. Tersedia 6 flashdisk 16GB dan 4 flashdisk 32GB yang berbeda merknya, jika
akan dipilih 3 flashdisk 16GB dan 2 flashdisk 32GB, maka jumlah pilihan yang dapat
dibuat adalah:
Select one:
a. 100
b. 140
c. 80
d. 120
18. Jika frekuensi dalam tabel distribusi frekuensi dinyatakan dalam persen, maka
penyajian data secara grafis sebaiknya menggunakan:
Select one:
a. Ogive
b. Poligon
c. Histogram
d. Pie diagram (diagram lingkaran)
20. Data yang diperoleh hasil observasi selama periode tertentu, merupakan:
Select one:
a. Data primer
b. Data aktual
c. Data time-series
d. Data sekunder
24. Jumlah cara agar 5 kelereng dengan warna yang berbeda dapat disusun sebaris
adalah:
Select one:
a. 120 cara
b. 625 cara
c. 125 cara
d. 25 cara
26. Bentuk dan ketinggian kurva distribusi peluang normal ditentukan oleh
besarnya ...
Select one:
a. Variabel
b. Peluang
c. Percobaan
d. Standard deviasi
28. Diketahui mesin pencetak IC perlu diperbaiki jika dari 1000 unit IC yang
dicetak terdapat 20 unit IC yang rusak. Seorang karyawan pengawasan mutu
mengobservasi sampel acak yang terdiri dari 250 unit IC, kemudian ia mencatat jumlah
IC yang rusak. Probabilitas karyawan tersebut tidak menemukan IC yang rusak adalah:
Select one:
a. 0.0404
b. 0.0067
c. 0.1512
d. 0.1128
32. Di Lab Psikologi Dasar tersedia 15 meja praktikum yang dapat digunakan
mahasiswa, suatu saat hadir 20 orang mahasiswa yang akan berpraktikum. Jumlah
susunan penempatan praktikum mahasiswa tersebut adalah:
Select one:
a. 20P15
b. 35C20
c. 20C15
d. 35P20
33. Hipotesis yang didukung atau ingin diterima oleh peneliti adalah:
Select one:
a. Pendugaan hipotesis
b. Hipotesis nol
c. Hipotesis populasi
d. Hipotesis alternatif
35. Tersedia 6 flashdisk 16GB dan 4 flashdisk 32GB yang berbeda merknya,
probabilitas akan terpilih 3 flashdisk 16GB dan 2 flashdisk 32GB adalah:
Select one:
a. 0.48
b. 0.41
c. 0.56
d. 0.32
36. Diketahui nilai ujian Statistik I seluruh mahasiswa Universitas Gunadarma
berdistribusi normal dengan rata-rata 60 dan standar deviasi 12. Seluruh peserta ujian
Statistik I tercatat 10 ribu mahasiswa, sebanyak 20 persennya adalah mahasiswa
Akuntansi. Jika ditetapkan nilai minimal untuk lulus ujian Statistik I adalah 57, maka
persentase jumlah mahasiswa UG yang lulus Statistik I akan ada sebanyak:
Select one:
a. 49.5%
b. 69.9%
c. 20%
d. 59.9%
37. Diketahui nilai ujian Statistik I seluruh mahasiswa Universitas Gunadarma
berdistribusi normal dengan rata-rata 60 dan standar deviasi 12. Seluruh peserta ujian
Statistik I tercatat 10 ribu mahasiswa, sebanyak 20 persennya adalah mahasiswa
Akuntansi. Probabilitas seorang mahasiswa Akuntansi mendapat nilai paling tinggi 45
adalah:
Select one:
a. 0.2939
b. 0.8944
c. 0.1056
d. 0.3944
38. Seorang pegawai pengawasan mutu mengobservasi sebagian produk yang
dipilih dengan cara tertentu dari keseluruhan produk yang dihasilkan. Teknik
pengumpulan data yang digunakan pegawai tersebut adalah:
Select one:
a. Pengamatan langsung
b. Sampling
c. Sensus
d. Proporsional
39. Distribusi Poisson memiliki beberapa karakteristik, kecuali :
Select one:
a. Parameter penentu hanya satu
b. Terdiri dari n ulangan
c. Parameter penentu ada banyak
d. Setiap ulangan harus bebas satu sama lain
40. Kesalahan akibat menerima Ha, padahal sesungguhnya Ho yang benar disebut:
Select one:
a. Keputusan statistik
b. Uji hipotesis
c. Salah jenis 1
d. Salah jenis 2
Bagian Pertama
Pilihlah satu jawaban yang paling benar!
3. Cabang Statistika yang mempelajari tentang peringkasan data yang diperoleh dari suatu
kelompok objek dinamakan:
A. Statistika matematik C. Statistika deskriptif
B. Statistika terapan D. Statistika inferensi
5. Peranan metodologi statistika dalam penerapan metode ilmiah ialah pada tahap:
A. Penentuan tujuan C. Analisis data
B. Pengumpulan informasi D. Semuanya benar
10. Data yang diperoleh langsung dari subjek yang ingin diketahui karakteristiknya dinamakan:
A. Data diskret C. Data primer
B. Data rasio D. Data sekunder
11. Data yang diperoleh dari pihak ketiga, yang biasanya telah dikumpulkan sebelumnya untuk
keperluan lain dari subjek yang hendak dipelajari dinamakan:
A. Data diskret C. Data primer
B. Data rasio D. Data sekunder
12. Luas lantai berbagai tipe rumah disebuah real estate merupakan contoh data:
A. Nominal C. Interval
B. Ordinal D. Rasio
15. Nilai IPK mahasiswa semester akhir Gunadarma merupakan contoh data:
A. Ordinal dan diskret C. Rasio dan diskret
B. Ordinal dan kontinu D. Rasio dan kontinu
Bagian Pertama
Pilihlah satu jawaban yang paling benar!
1. Jarak antara kelas yang satu dengan kelas lainnya secara berurutan pada tabel distribusi
frekuensi dinamakan:
A. Rentang
B. Interval kelas
C. Limit kelas (class limit)
D. Batas kelas (class boundary)
2. Array adalah:
A. Kumpulan data yang sudah di urutkan dari yang terkecil ke yang terbesar
B. Kumpulan data yang telah disusun dalam bentuk distribusi frekuensi
C. Kumpulan data yang memiliki lebih daripada satu modus
D. Semuanya salah
3. Misalkan dari suatu survei diperoleh data sebanyak 200 item. Apabila akan dibuat distribusi
frekuensinya, jumlah kelas menurut aturan Sturges adalah:
A. 5
B. 7
C. 9
D. 12
4. Jika untuk soal No. 3 di atas diketahui pula nilai minimum Xmin = 35 dan nilai
maksimum max X =164, maka interval kelas adalah:
A. 14
B. 15
C. 18
D. 19
7. Data yang tersusun dalam bentuk distribusi frekuensi dapat disajikan dalam bentuk grafik
berikut, kecuali:
A. Histogram
B. Diagram tebar
C. Diagram batang
D. Diagram lingkar
8. Ogive adalah:
A. Poligon frekuensi untuk frekuensi kumulatif
B. Histogram untuk distribusi frekuensi relatif
C. Diagram batang untuk distribusi frekuensi mutlak
D. Semuanya salah
11. Dari grafik di bawah ini dapat disimpulkan bahwa: Diagram. Jumlah penjualan komputer
di Toko A, B, dan C Agustus 2000
A. Jumlah penjualan di Toko B kurang lebih dua kali penjualan di Toko A.
B. Jumlah penjualan di Toko A kurang lebih sepertiga penjualan di Toko C.
C. A) dan B) benar.
D. A) dan B) salah.
Bagian Pertama
Pilihlah satu jawaban yang paling benar!
1. Ukuran-ukuran berikut merupakan ukuran pusat sekaligus ukuran
lokasi, kecuali:
A. Rerata (mean) C. Variansi
B. Median D. Modus
3. Jika deviasi suatu nilai terhadap tiap observasi lainnya dijumlahkan, dan hasil
penjumlahannya sama dengan nol, maka nilai tersebut adalah nilai:
A. Rerata C. Modus
B. Median D. Semuanya salah
4. Jika setengah di antara seluruh observasi nilai-nilainya lebih kecil daripada suatu nilai
tertentu, dan setengah observasi lainnya nilainilainya lebih besar daripada nilai tertentu
tersebut, nilai tertentu itu adalah nilai:
A. Rerata C. Modus
B. Median D. Rerata harmonik.
Bagian Kedua
Pilihlah satu jawaban yang paling benar!
Untuk soal nomor 1 s.d. 6:
Diketahui data hasil ujian Ilmu Alamiah Dasar sekelompok
mahasiswa sebagai berikut:
72, 86, 63, 59, 74, 67, 74, 77, 63, 74, 82, 67
2. Mediannya adalah:
A. 71.50 C. 74.00
B. 73.00 D. 78.00
3. Modusnya yaitu:
A. 71.50
B. 73.00
C. 74.00
D. 78.00
n
11. 2
i1
A. 330 C. 63 800
B. 22 342 D. 108 900
n
2
12. ∑ xi =
i1
A. 330 C. 63 800
B. 22 342 D. 108 900
Bagian Pertama
Pilihlah satu jawaban yang paling benar!
8. Pernyataan berikut yang tidak benar mengenai konsep kuantil(fraktil):
A. Kuartil II = median C. Desil 3 = kuartil I
B. Persentil 75 = kuartil III D. Desil 1 = persentil 10
12. Ukuran variansi yang terbaik untuk membandingkan variasi berat badan dan variasi
tinggi badan adalah:
A. Rentang C. Standar deviasi
B. Rentang inter-kuartil D. Koefisien variasi
13.
A. Selalu lebih besar daripada nol
B. Selalu sama dengan nol
C. Dapat lebih kecil daripada nol
D. Semuanya salah
14.
A. 0 C.
B. D. Semuanya salah
18. Peringkasan data secara grafikal yang menampilkan nilai-nilai kuartil I, median, dan
kuartil III didapatkan pada:
A. Diagram batang-daun-daun C. Diagram titik
B. Diagram kotak D. Semuanya benar
2. Jika diketahui di antara 2,056 kelahiran hidup tercatat adanya 1,056 bayi lakilaki, maka
probabilitas untuk mendapatkan bayi perempuan adalah:
A. 0.486 C. 0.947
B. 0.514 D. Tak dapat dihitung
6. Jika P (A) = 0.2 dan P (B) = 0.5, maka hukum penjumlahan menyatakan:
A. P (A B) = 0.10 C. P (A B) = 0.7
B. P (A B) = 0.10 D. P (A B) = 0.7
8. Jika P (A) = 0.3 dan P (B) = 0.4, maka hukum perkalian menyatakan:
A. P (A B) = 0.12. C. P (A B) = 0.7
B. P (A B) = 0.12 D. P (A B) = 0.7
9. Jika peristiwa A dapat terjadi dengan 6 cara dan peristiwa B dengan 2 cara,
maka aturan banyaknya cara menyatakan peristiwa A dan B dapat terjadi
dalam:
A. 3 cara C. 12 cara
B. 8 cara D. Semuanya salah
10. Area berwarna gelap pada diagram Venn di bawah ini menyatakan:
A. A
B
C C
C
C
C. B C A
CC
B. C A B D. B C B C A
11. Kelompok seni drama Gunadarma yang beranggotakan 12 orang akan memilih tiga orang
anggotanya untuk tampil dalam pentas, masingmasing untuk berperan sebagai dokter, perawat,
dan bidan. Banyaknya kelompok tiga orang anggota yang mungkin dipilih adalah:
A. 15 C. 220
B. 36 D. 1,320
12. Rumah Sakit Sukasehat membutuhkan lima orang perawat baru. Jika
ada sepuluh perawat yang melamar, maka banyak susunan lima
perawat yang mungkin diterima adalah:
A. 15 C. 252
B. 50 D. 30,240
13. Sebuah dadu dan sebuah mata uang, keduanya setimbang, dilemparkan
bersama-sama. Probabilitas untuk mendapatkan angka genap pada dadu
dan sisi muka mata uang bersama-sama adalah:
A. 1
6
B. 1
4
C. 5
6
D. 1
10.
A. 330 C. 63 800
B. 22 342 D. 108 900
11.
A. 330 C. 63 800
B. 22 342 D. 108 900
12.
A. 330 C. 63 800
B. 22 342 D. 108 900
13.
A. 330 C. 63 800
B. 22 342 D. 108 900
14. s =
A. 10.6 C. 112.4
B. 11.9 D. 140.5
Dengan TK_PEND (tingkat pendidikan) sebagai faktor dan JAM_BELAJAR sebagai variabel
dependen, diperoleh hasil analisis variansi 1-arah SPSS sebagai berikut:
ANOVA
JAM_BELAJAR
Sum of Squares df Mean Square F Sig.
Between Groups 64586.167 2 32293.083 2.683 .122
Within Groups 108335.500 9 12037.278
Total 172921.667 11
8. Dengan tingkat signifikansi = 0.05, daerah kritis pada uji khi kuadrat untuk data di atas
ialah:
A.2 > 5.99 C.2 > 12.59
B.2 > 7.38 D.2 > 14.45
9. Statistik penguji pada uji khi-kuadrat untuk data di atas besarnya
adalah:
A. 0.68 C. 6.76
B. 4.43 D. 13.56
10. Pada tingkat signifikansi = 0.05, kesimpulan yang diperoleh pada uji khi-kuadrat
terhadap data di atas ialah:
A. Ditemukan asosiasi yang bermakna secara statistik antara kadar kolesterol serum dengan
kejadian PJK.
B. Tidak ditemukan asosiasi yang bermakna secara statistik antara kadar kolesterol serum
dengan kejadian PJK.
C. Kadar kolesterol serum di atas 260 mg/100 ml merupakan faktor risiko yang bermakna
secara statistik bagi kejadian PJK
D. Semuanya salah.
11. Uji statistik yang relevan bagi data di atas untuk mengkaji hubungan antara macam nutrisi
bayi dengan status gigi geligi adalah:
A. Uji t C. Uji eksak Fisher
B. Uji khi-kuadrat D. Semuanya salah.
12. Nilai rasio odds untuk data pada tabel di atas adalah:
A. OR = 0.20 C. OR = 3.20
B. OR = 0.31 D. OR = 5.00
Bagian Pertama
Pilihlah satu jawaban yang paling benar!
1. Misalkan dimiliki garis regresi Yˆ b b X , dan r menyatakan I 0 1 I koefisien korelasi
X dengan Y:
A. Jika r = 0, maka b 0
B. Jika r = −1, maka b = −1
C. Jika r 1 , maka b 1
D. Yang benar lebih daripada satu.
2.
Kedua gambar di atas menunjukkan diagram tebar dan garis regresi 2
sampel data bivariat, masing-masing dengan estimasi garis regresi
Yˆ a b X dan koefisien korelasi r serta garis regresi Yˆ a bX
11122
dan koefisien korelasi r . Jika kedua diagram dibuat dengan skala
pengukuran yang sama, maka:
A. b b dan r r C. b b dan r r
1212 1212
B. b b dan r r D. b b dan r r
1212 1212
4. Dimiliki data bivariat dengan variabel independen X dan variable dependen Y serta estimasi
garis regresi Yˆ b b X. Jika padadiagram tebar X ;Y seluruh titik-titik Xi ;Yi 0
1 terletak pada garis regresi Yˆ b b X , maka: 0 1
A. JKR = 0 C. JKR = JKG
B. JKR =1 D. JKR = JKT
Bagian Kedua
Pilihlah satu jawaban yang paling benar!
Lihat kembali data tinggi dan berat badan mahasiswa Univesitas Gunadarma pada tabel 1
Materi Korelasi sesi 9 yang lalu. Dengan menggunakan data 12 mahasiswa pertama, Tinggi
Badan sebagai variable independen dan Berat Badan sebagai variabel dependen, maka
Sxx = ∑ 𝑋𝑖2 –(∑𝑋𝑖)2/𝑛 = 309.624 –(1.926)2/12 = 309.624 – 309.123 = 501
Syy = ∑ 𝑌𝑖2 –(∑ 𝑌𝑖)2/𝑛 = 43.517 –(711)2/12 = 43.517 – 42.126,75 = 1.390,25 (JKT)
Sxy = ∑ 𝑋𝑖𝑌𝑖 –(∑ 𝑋𝑖)(∑ 𝑌𝑖)/𝑛 = 114.406 – (1.926)(711)/12 = 114.406 – 114.115,5 = 290,5
6. Jumlah kuadrat galat adalah: JKG = JKT – JKR = 1.390,25 - 168,49 = 1.221,76
7. Untuk subjek berusia 50 tahun, taksiran berat badannya (dalam kg) berdasarkan garis regresi
adalah: (salah soal)
𝑌̂ = 𝛽0 + 𝛽1𝑋𝑖 = -33,84 + 0,58𝑋𝑖 = -33,84 + (0,58)(50) = -33,84 + 29 = -4,84
3. ∑( Xi − i
A. 8
B. 27
7. Jika r menyatakan koefisien Pearson antara variabel X dan Y dan diketahui r < 0, maka:
A. Untuk nilai X yang besar, nilai Y juga cenderung besar.
B. Untuk nilai X yang besar, nilai Y cenderung kecil.
C. Untuk nilai X yang kecil, nilai Y cenderung besar
D. B) dan C) benar.
8. Misalkan dimiliki himpunan data bivariat ( X 2 − Y2 ) , . . . , ( X 8 − Y8 ) dan r menyatakan
koefisien korelasi X dengan Y. Jika gambaran titik-titik data tersebut pada diagram
tebar (scatter diagram) membentuk titik-titik sudut segi delapan beraturan, maka:
A. r > 0 C. r < 0
B. r = 0 D. Semuanya salah.
9. Dimiliki data usia (dalam tahun) dan tekanan darah sistolik (dalam mm Hg) kelompok subjek
yang terdiri dari enam orang dewasa sebagai berikut:
Subjek (i) 1 2 3 4 5 6
Usia ( Xi ) 47 52 37 53 65 59
Tekanan darah (Yi ) 135 110 140 120 150 180
Koefisien korelasi antara usia dengan tekanan darah sistolik subjek adalah:
A. 0.122 C. 0.910
B. 0.349 D. 0.954
10. Data berikut menyatakan nilai tes keterampilan (X) dan produktivitas kerja per
minggu (Y) 8 orang karyawan.
Siswa (i) 1 2 3 4 5 6 7 8
Tes keterampilan ( Xi ) 6 9 3 8 7 5 8 10
Produktivitas kerja (Yi ) 30 49 18 42 39 25 41 52
Koefisien korelasi antara nilai tes masuk dengan nilai ujian akhir siswa adalah:
A. 0.982 C. 1.028
B. 0.991 D. 5.13
1. Ada beberapa persyaratan atau asumsi dasar yang harus terpenuhi ketika hendak
memakai analisis korelasi bivariate Pearson untuk menguji hipotesis penelitian:
2. Cara yang dapat digunakan sebagai pedoman atau dasar pengambilan keputusan
dalam analisis korelasi bivariate Pearson yaitu :
A. melihat nilai signifikansi Sig. (2-tailed).
B. membandingkan nilai r hitung (Pearson Correlations) dengan nilai r tabel
product moment.
C. melihat tanda bintang (*) yang terdapat pada output program SPSS.
D. Semua jawaban benar
3. Koefisien korelasi atau Pearson Correlations memiliki nilai paling kecil -1 dan
paling besar adalah 1. Pernyataan yang benar adalah :
A. Semakin nilai pearson correlations mendekati 1 atau -1 maka hubungan antara
dua variabel adalah semakin kuat.
B. Jika nilai r atau pearson correlations mendekati 0 berarti hubungan dua
variabel menjadi semakin lemah.
C. jika angka korelasi di atas 0,5 maka menunjukkan korelasi yang cukup kuat
sedangkan jika di bawah 0,5 maka menunjukkan korelasi yang lemah.
D. Semua jawaban benar
4. Cara yang dapat digunakan sebagai pedoman atau dasar pengambilan keputusan
dalam analisis korelasi bivariate Pearson antara lain menggunakan Nilai
Signifikansi Sig. (2-tailed):
A. Jika nilai Sig. (2-tailed) < 0,05 maka terdapat korelasi antar variabel yang
dihubungkan.
B. Jika nilai Sig. (2-tailed) > 0,05 maka tidak terdapat korelasi.
C. Jawaban A dan B benar
D. Jawaban A dan B salah
5. Cara yang dapat digunakan sebagai pedoman atau dasar pengambilan keputusan
dalam analisis korelasi bivariate Pearson antara lain menggunakan Nilai r hitung
(Pearson Correlations):
A. Jika nilai r hitung > r tabel maka tidak ada korelasi antar variabel.
B. Jika nilai r hitung < r tabel maka artinya ada korelasi antar variabel.
C. Jawaban A dan B benar
D. Jawaban A dan B salah
11. Ukuran kekuatan (atau keeratan) dan arah hubungan linier peubah X dan Y
dinyatakan oleh :
A. Koefisien Korelasi Linier (R)
B. Koefisien Korelasi non linier
C. Koefisien Determinasi (Rsquare)
D. Gradien atau Kemiringan Garis
12. Ukuran proporsi keragaman total nilai variabel tak bebas Y yang dapat dijelaskan
oleh nilai variabel bebas X melalui hubungan liniernya :
A. Koefisien Determinasi (Rsquare)
B. Koefisien yang menunjukkan besarnya pengaruh variabel X terhadap variabel
Y
C. Jawaban A dan B salah
D. Jawaban A dan B benar
13. Koefisien korelasi linier dari persamaan regresi linier sederhana bernilai 0.90, hal
ini menggambarkan hubungan kedua variabel (yaitu X dan Y) yang :
A. Positif (searah) dan tinggi (kuat)
B. Positif (searah) dan rendah (lemah)
C. Negatif (tidak searah) dan tinggi (kuat)
D. Negatif (tidak searah) dan rendah (lemah)
14. Koefisien korelasi linier dari persamaan regresi linier sederhana bernilai 0.90.
maka koefisien determinasinya bernilai :
A. 0,81 atau 81% hal ini menggambarkan bahwa pengaruh variabel X terhadap
Y adalah besar
B. 0,18 atau 18% hal ini menggambarkan bahwa pengaruh variabel X terhadap
Y adalah sangat kecil
C. 90 % hal ini menggambarkan bahwa pengaruh variabel X terhadap Y adalah
D. Tidak dapat disimpulkan
A. Untuk variabel bebas yang memiliki 2 kategori, maka uji statistik yang cocok
digunakan adalah uji beda t-test.
B. Merupakan analisis yang digunakan untuk menguji dua rata-rata dari dua
sampel yang saling independen atau tidak berkaitan.
C. Uji dua sampel untuk mengetahui apakah ada perbedaan rata-rata (mean)
antara dua populasi, dengan melihat rata-rata dua sampelnya.
D. Semua jawaban benar
16. Diketahui rata-rata jam kerja karyawan laki-laki 3,25 jam sedangkan rata-rata jam
kerja karyawan perempuan 4,10 jam.
Untuk melihat apakah terdapat perbedaan kedua rata rata tersebut memang nyata
(signifikan) secara statistik maka perlu dilihat analisis output dari Independent
sample t-test, yaitu :
A. Menguji dahulu asumsi apakah variance populasi kedua sampel tersebut (laki-
laki dan perempuan) adalah sama (equal variance assumed) ataukah berbeda
(equal variances not assumed)
B. Melihat nilai t-test untuk menentukan apakah terdapat perbedaan nilai rata-rata
secara nyata (signifikan) atau tidak
C. Jawaban A dan B SALAH
D. Jawaban A dan B BENAR
17. Diketahui :
H0: Varians populasi jam kerja antara karyawan laki-laki dengan karyawan
perempuan adalah sama
H1: Varians populasi jam kerja antara karyawan laki-laki dengan karyawan
perempuan adalah berbeda
Hasil analisis uji beda (t-test) harus menggunakan asumsi equal variance
assumed. Nilai t pada equal variance assumed sebesar 0,597 dengan
probabilitas signifikansi 0,555 (0,555>0,05) (two tail). Keputusan yang benar
adalah:
A. Tolak H0
B. Terima H1
C. Terima H0
D. Tidak dapat diputuskan
18. Diketahui :
H0: Varians populasi jam kerja antara karyawan laki-laki dengan karyawan
perempuan adalah sama
H1: Varians populasi jam kerja antara karyawan laki-laki dengan karyawan
perempuan adalah berbeda
Hasil analisis uji beda (t-test) harus menggunakan asumsi equal variance
assumed. Nilai t pada equal variance assumed sebesar 0,597 dengan
probabilitas signifikansi 0,555 (0,555>0,05) (two tail). Jadi dapat disimpulkan
bahwa rata-rata masa kerja karyawan laki-laki dengan karyawan perempuan
adalah :
A. sama (berbeda secara signifikan)
B. tidak sama (berbeda secara signifikan)
C. tidak sama (tidak berbeda secara signifikan)
D. sama (tidak berbeda secara signifikan)
19. Terdapat 10 bola terdiri dari 4 bola merah dan 6 bola hitam. Pengambilan sebuah
bola dilakukan dengan pemulihan.
Peluang Bola pertama berwarna Merah= P(MERAH) = 4/10
Peluang Bola kedua berwarna Hitam= P(HITAM) = 6/10
P(HITAM MERAH) = Peluang Bola pertama Merah dan Bola kedua Hitam adalah
A. 4/10 x 6/10 = 24/100 = .6/25
B. 4/10 x 6/9 = 24/90 = 8/30
C. 4/10 + 6/9 = 10/19
D. 4/10 + 6/10 = 10/10 = 1
20. Diketahui : P(A) = 0.4, P(B) = 0.35 dan P(A dan B) = 0.5. Tentukan P(A
atau B), dimana kejadian A dan B tidak saling bebas :
A. 0.65
B. 0.6
C. 0.25
D. 0.5
21. Salah satu indikator electronic word of mouth (e-WoM) adalah aktivitas seseorang
menulis dan membaca komentar mengenai website yang dikunjunginya
Peluang seorang pengunjung menulis komentar mengenai website yang
dikunjunginya = P(Tulis) = 0.30
Peluang seorang pengunjung membaca komentar orang lain mengenai website
yang dikunjunginya = P(Baca) = 0.45
Peluang seorang pengunjung menulis DAN membaca komentar orang lain
mengenai website yang dikunjunginya = 0.18
Dari keterangan di atas, pernyataan yang BENAR adalah :
A. Kejadian Tulis dan kejadian Baca adalah kejadian-kejadian bebas
B. Kejadian Tulis dan kejadian Baca adalah kejadian-kejadian saling
berkomplemen
C. Kejadian Tulis dan kejadian Baca adalah kejadian-kejadian tidak bebas
D. Kejadian Tulis dan kejadian Baca adalah kejadian-kejadian saling terpisah
22. Salah satu indikator electronic word of mouth (e-WoM) adalah aktivitas seseorang
menulis dan membaca komentar mengenai website yang dikunjunginya
Peluang seorang pengunjung menulis komentar mengenai website yang
dikunjunginya = P(Tulis) = 0.30
Peluang seorang pengunjung membaca komentar orang lain mengenai website
yang dikunjunginya = P(Baca) = 0.45
Peluang seorang pengunjung menulis DAN membaca komentar orang lain
mengenai website yang dikunjunginya = 0.18
Peluang seorang pengunjung menulis komentar SETELAH terlebih dahulu ia
membaca komentar orang lain mengenai website yang dikunjunginya =
P(Tulis|Baca) = …
A. 0.18/0.45 = 0.4
B. 0.18/0.30 = 0.6
C. 0.30 x 0.45 = 0.135
D. 0.14
35. Peluang suatu software dapat menjadi host bagi suatu virus = 1/1000 =0,001. Jika
terdapat 5000 software, peluang terdapat lebih dari 4 software yang menjadi host
suatu virus adalah :
A. Tidak dapat dikerjakan dengan binomial karena n sangat besar dan P sangat
kecil
B. Bisa dikerjakan dengan poisson, dengan menggunakan µ = n . p
C. Jawaban A dan B benar
D. Jawaban A dan B salah
36. Peluang suatu software dapat menjadi host bagi suatu virus = 1/1000 =0,001. Jika
terdapat 5000 software, peluang terdapat lebih dari 4 software yang menjadi host
suatu virus adalah :
A. Tidak dapat diketahui
B. Seragam(x =5000 ; 1/5000)
C. Poisson (x > 4; µ = 5)
D. Binomial (x>4; n = 5000, p = 1/5000)
37. Penghitungan peluang kejadian dalam sampel yang diambil tanpa pemulihan
(pengembalian) dan dengan memperhatikan banyak anggota sukses dan gagal
dapat dilakukan dengan Distribusi Peluang ...
A. Poisson
B. Hipergeometrik
C. Binomial
D. Seragam
39. Suatu tim programmer rata-rata (µ) menyelesaikan sistem pencatatan transaksi
terintegrasi perbankan dalam waktu 8.9 hari dengan simpangan baku 0.75 (σ)
hari. Dalam proyek serupa yang akan dilakukan bulan depan, klien menyanggupi
akan memberi bonus jika sistem selesai dalam waktu lebih dari 9.8 hari. Peluang
tim programmer tersebut mendapat bonus dari klien karena dapat menyelesaikan
tugas tersebut lebih dari 9.8 hari (x) adalah :
Catatan:
x−
dimana z =
P(X > 9) diduga dengan P(Z > …) . Nilai z adalah sebesar :
A. 1.2
B. – 1.2
C. 0.9
D. Tidak dapat dihitung
40. Suatu tim programmer rata-rata (µ) menyelesaikan sistem pencatatan transaksi
terintegrasi perbankan dalam waktu 8.9 hari dengan simpangan baku 0.75 (σ)
hari. Dalam proyek serupa yang akan dilakukan bulan depan, klien menyanggupi
akan memberi bonus jika sistem selesai dalam waktu lebih dari 9.8 hari. Peluang
tim programmer tersebut mendapat bonus dari klien karena dapat menyelesaikan
tugas tersebut lebih dari 9.8 hari (x) adalah :
x−
dimana z =
Diketahui Luas daerah di bawah kurva Normal dari sumbu z = 0 ke z = 1.2 adalah
0.3849 atau P(0<Z<1.2) = 0.3849. Tentukan P(X > 9.8) :
A. 0.3849
B. 0.8849
C. 0.6151
D. 0.1151
41. Rata-rata waktu pemindaian suhu badan seorang penumpang kereta api listrik
(KRL) = 2.84 detik dengan simpangan baku = 0.13 detik. Peluang pemindaian
suhu badan seorang penumpang KRL selesai dalam lebih dari 3 detik dapat dicari
dengan cara :
Catatan :
A. P(X > 3) didekati dengan P(Z < 1.23)
B. P(X > 3) didekati dengan P(Z > 1.23)
C. P(X < 3) didekati dengan P(Z < 1.23)
D. P(X < 3) didekati dengan P(Z > 1.23)
43. Seorang mahasiswa akan membuat aplikasi berbasis web mengenai pendaftaran
pembuatan e-KTP di Kelurahan Sukmajaya Depok. Untuk keperluan tersebut
mahasiswa membutuhkan data mengenai prosedur pembuatan e-KTP yang
berjalan di kelurahan tersebut.
Sumber data yang dibutuhkan mahasiswa merupakan :
A. Data primer
B. Data sekunder
C. Data kategorik
D. Data numerik
44. Aplikasi berbasis web untuk pendaftaran e-KTP sudah dibuat oleh seorang
mahasiswa. Mahasiswa tersebut ingin mengetahui tanggapan atau penerimaan
user terhadap aplikasi tersebut. Tanggapan user diberikan untuk menilai user
interface, konten dan manfaat dari aplikasi yang sudah dibuat. Daftar pernyataan
dibuat dengan 3 pilihan tanggapan (kurang baik , cukup baik dan baik)
Sumber data dan jenis data yang digunakan mahasiswa tersebut berturut-turut
adalah :
A. Sekunder dan Numerik
B. Primer dan Kategorik
C. Primer dan Numerik
D. Sekunder dan kategorik
45. Contoh berikut ini termasuk dalam statistika deskriptif, kecuali :
A. Tabel yang berisi data npm, nama dan IPK mahasiswa
B. Hasil pengujian hipotesis statistik pada suatu penelitian
C. Histogram yang menunjukkan nilai hasil ujian akhir mata kuliah Statistika dari
50 mahasiswa
D. Diagram kue (diagram pie) yang menunjukkan presentase jenis kelamin
responden
47. Diketahui suatu tabel distribusi frekuensi memiliki 6 kelas. Batas bawah kelas
pertama adalah 80 dan batas atas kelas pertama adalah 119. Batas bawah kelas
keenam adalah 300 dan batas atas kelas keenam adalah 339. Frekuensi kelas
pertama adalah 10. Jumlah data atau frekuensi total adalah 80.
Interval kelas nya adalah :
A. 39
B. 40
C. 41
D. Tidak diketahui
48. Diketahui suatu tabel distribusi frekuensi memiliki 6 kelas. Batas bawah kelas
pertama adalah 80 dan batas atas kelas pertama adalah 119. Batas bawah kelas
keenam adalah 300 dan batas atas kelas keenam adalah 339. Frekuensi kelas
pertama adalah 10. Jumlah data atau frekuensi total adalah 80.
Batas bawah dan batas atas kelas pada kelas kedua adalah :
A. 120 dan 158
B. 119 dan 159
C. 119 dan 158
D. 120 dan 159
49. Diketahui sekelompok data hasil UTS Statistika dari beberapa mahasiswa:
40 40 50 50 60 60 60 70 80 90
Mean, Median dan Modus dari kelompok data tersebut adalah:
A. Semua sama yaitu 60
B. 60, 50 dan 60
C. 60, 40, dan 60
D. Tidak dapat ditentukan
50. Diketahui sekelompok data hasil UTS Statistika dari beberapa mahasiswa:
40 40 50 50 60 60 60 70 80 90
Kuartil kedua, Desil kelima dan Persentil ke limapuluh dari kelompok data tersebut
adalah:
A. 40, 50, 60
B. 70, 80, 90
C. 40, 60, 80
D. Semua sama yaitu 60
KUNCI JAWABAN
01 s/d 10 : DDDCD CBBAA
11 s/d 20 : ADAAD DCDAC
21 s/d 30 : CABAB DCBCB
31 s/d 40 : BDADC CBBAD
41 s/d 50 : BABBB CBDAD
CONTOH UAS STATISTIKA 1 2019 SWWR
A. 1 C. 0,0907
B. 0.2117 D. 0,9093
x−
z= adalah : (50 – 40)/ √32 = 1.77
A. 1,25 C. -1,77
B. 1,77 D. 0,33
23. Nilai P (x < 50) dapat dihitung dengan :
A. P (z < 1.77)
B. P (z > 1.77)
C. P (0 < z < 1.77)
D. P (Z = 0)
25. Jika dari seperangkat kartu bridge diambil 7 kartu secara acak
TANPA pemulihan, berapa peluang diperoleh 5 kartu MERAH?
Kasus ini dapat diselesaikan dengan :
A. Distribusi peluang hipergeometrik
B. Distribusi peluang normal
C. Distribusi peluang poisson
D. Distribusi peluang binomial
26.Dari soal no. 25, dapat dihitung nilai N dan k, yaitu masing
masing : merah berarti kartu hati dan diamond total 26 (k)
A. k = 52, N = 13 C. N = 52, k = 13
B. k = 13, N = 26 D. N = 52, k = 26
27. Dalam suatu kotak terdapat 7 apel yang terdiri dari 2 apel
Merah, 4 apel hijau dan 1 apel Fuji. Berapa peluang terambil 3
apel hijau, dari 5 kali pengambilan yang dilakukan secara acak
DENGAN pemulihan? Kasus ini dapat diselesaikan dengan
A. Distribusi peluang Normal
B. Distribusi peluang Poisson
C. Distribusi peluang Hipergeometrik
D. Distribusi peluang Binomial
Kasus untuk soal no. 28 sd 30 gunakan soal berikut ini
Diketahui sekelompok hasil UTS Statistika dari beberapa mahasiswa
UG:
60 75 70 60 80 75 80 75 85 90
n=5
X 0.05 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 0.95
0 .774 .590 .328 .168 .078 .031 .010 .002 .000 .000 .000
1 .204 .328 .410 .360 .259 .156 .077 .028 .006 .000 .000
2 .021 .073 .205 .309 .346 .312 .230 .132 .051 .008 .001
3 .001 .008 .051 .132 .230 .312 .346 .309 .205 .073 .021
4 .000 .000 .006 .028 .077 .156 .259 .360 .410 .328 .204
5 .000 .000 .000 .002 .010 .031 .078 .168 .328 .590 .774
TABEL POISSON ( p(x;μ)
µ
TABEL LUAS DIBAWAH KURVA NORMAL
(Setengah Kurva)
Koordinator : SRI WULAN WINDU RATIH
1. Menurut data dari BPS diketahui hasil survey di kota A pada tahun 2008
menunjukkan bahwa 2 dari 3 wanita menikah pada usia 30 tahun an. Diperkirakan
pada tahun 2018 semakin banyak wanita di kota A yang menikah di atas usia 30
tahun an.
Metode statistika, sumber data dan tipe (jenis) data pada kasus di atas berturut-
turut adalah :
A. Deskriptif, Sekunder dan Numerik
B. Inferensia, Primer dan Kategorik
C. Inferensia, Sekunder dan Numerik
D. Deskriptif, Primer dan Kategorik
Berikut ini adalah tabel 80 nasabah yang mengambil kredit multiguna Bank Syariah.
Diketahui dari sekumpulan data hasil UTS Statistika Deskriftif nilai median,mean (rata-
rata) dan modus masing-masing adalah adalah 70.
10. Diantara tiga ukuran pemusatan berikut yaitu mean (rata-rata), median dan
modus, yang paling populer (banyak dipakai) dan dianggap paling “baik” untuk
dijadikan ukuran, adalah :
A. Modus C. Mean
B. Median D. tidak ada jawaban yang benar
12. Berdasarkan tabel di atas, maka mahasiswa yang kemampuannya (nilainya) sama
dengan standar minimal untuk diterima sebagai asisten adalah :
A. Harith B. Gloria C. Jaya D. Icha
14. Sebuah koin setimbang dilempar 2 kali. Berapakah peluang kejadian minimal satu
sisi gambar muncul ?
A. 1/2 B. ¾ C. 4/8 D. 1/4
15. Jika terdapat 10 mahasiswa akan dibagi kedalam 3 kelas yang berbeda, masing-
masing masuk ke kelas 2PA01 sebanyak 5 orang, 2PA02 sebanyak 3 orang dan
dan 2PA03 sebanyak 2 orang. Banyaknya cara penyusunan memasukkan
mahasiswa ke ketiga kelas yang berbeda dapat dilakukan dengan :
A. permutasi sebagian
B. permutasi keliling
C. kombinasi
D. permutasi kelompok
16. Sebuah kartu diambil dari setumpuk kartu bridge. Berapakah peluang terambilnya
sebuah kartu Queen merah ?
A. 1/26 B. 1/52 C. 1 D. 1/13
17. Peluang seorang mahasiswa lulus matakuliah Statistika adalah 4/9. Peluang ia
lulus matakuliah Struktur Data adalah 2/3. Bila peluang lulus salah satu mata
kuliah tersebut di atas adalah 4/5, berapakah peluang ia lulus kedua mata kuliah
tersebut ?
A. 4/5 B. 14/45 C.30/27 D. 10/9
18. Pada acara pelantikan anggota karate suatu universitas, sebanyak 50 calon
pemegang ban hitam duduk mengitari api unggun di lokasi pelantikan. Dalam
berapa carakah ke-50 peserta pelantikan duduk mengitari api unggun ?
A. 50! B. 51 ! C. 48! D. 49!
20. Berdasarkan soal no. 1 di atas, berapakah peluang tidak ada satupun mahasiswa
yang tidak lulus sidang PI ? n=20, x = 0 p =0,2
A. 0.2054 C. 0,4114
B. 0.0115 D. 0,0000
21. Peluang seorang mahasiswa yang dapat membuat Website berhasil diterima
bekerja sebagai Website Designer adalah 0,35. Jika terdapat 20 mahasiswa yang
dapat mendisain Website, berapakah peluang minimal 2 orang mahasiswa
diterima bekerja sebagai Website Designer ? Binomial n = 20, 2 sd 20 p=0.35
A.0.0002 B. 0.0100
B. 0,9978 D. 0,0120
x = 0 →0.0002 x = 1 → 0.0020 → 1 – (0.0022) = 0.9978
22. Jika diketahui nilai peluang sangat kecil sedangkan jumlah ulangan (n sampel)
sangat besar, maka distribusi peluang teoritis yang harus dipakai adalah :
B(x ; n, p) → P(x; µ)
A. binomial C. Poisson
B. seragam D. normal
23. Dari 1000 mahasiswa, 2 orang mengaku selalu tidur jika mengikuti kuliah di
ruang kelas. Jika pada suatu hari terdapat 2000 mahasiswa, berapakah peluang
bahwa ada 2 orang mahasiswa yang tidur dikelas saat mengikuti kuliah?
A. 0.0183 C. 0,2381
B. 0.7619 D. 0,1465
26. Jika diketahui suatu persamaan garis (persamaan regresi linier) Y = 2 + 0,4 X
Maka yang dimaksud dengan nilai “ 2” pada persamaan tersebut adalah :
A. Nilai X pada saat Y = 0
B. Nilai Y pada saat X = 0
C. Nilai b
D. Kemiringan garis
27. Jika diketahui suatu persamaan garis (persamaan regresi linier) Y = 2 + 0,4 X
Maka yang dimaksud dengan “0,4” pada persamaan tersebut adalah :
A. Jika X naik sebesar satu unit maka nilai Y naik sebesar 0,4 unit
B. Jika X turun sebesar satu unit maka nilai Y turun sebesar 0,4 unit
C. Jawaban A dan B benar
D. Jawaban A dan B salah
28. Diketahui suatu persamaan garis (persamaan regresi linier) Y = 2,530 + 1,053 X
Dimana X = biaya promosi minyak goreng “Sainah” (dalam juta rupiah)
dan Y = volume penjualan minyak goreng “Sainah” dalam ratusan juta liter)
Jika dikeluarkan biaya promosi sebesar 10 juta rupiah, maka diperkirakan volume
penjualan nya sebesar :
A. 3,583 (ratusan juta liter)
B. 13,06 (ratusan juta rupiah)
C. 13,06 (ratusan juta liter)
D. 3,583 (ratusan juta rupiah)
29. Besarnya volume penjualan minyak goreng “Sainah” tersebut di atas adalah :
A. Volume penjualan yang pasti terjadi
B. Volume penjualan yang bersifat perkiraan (peramalan)
C. Volume penjualan saat ini
D. Jawaban A, B dan C semua salah.
30. Pernyataan mengenai koefisien korelasi linier berikut ini yang salah adalah :
A. Nilai R = 0 menunjukkan bahwa antara variabel tak bebas (Y) dengan
variabel bebas (X) tidak memiliki relasi linier.
B. Nilai R yang mendekati -1 menunjukkan bahwa antara variabel tak bebas
(Y) dengan variabel bebas (X) memiliki korelasi linier yang rendah
C. Nilai R yang mendekati +1 menunjukkan bahwa antara variabel tak bebas
(Y) dengan variabel bebas (X) memiliki korelasi linier yang tinggi
D. Nilai R = -1 menunjukkan bahwa antara variabel tak bebas (Y) dengan
variabel bebas (X) memiliki korelasi sempurna
31. Ukuran proporsi keragaman total nilai variabel tak bebas Y yang dapat dijelaskan
oleh nilai variabel bebas X melalui hubungan linier :
A. Koefisien korelasi linier
B. Koefisien korelasi non linier
C. Koefisien determinasi (R 2)
D. Koefisien panas
32. Jika diketahui nilai koefisien korelasi linier R = 0,90, maka nilai koefisien
determinasi adalah :
A. 0,81
B. 0.30
C. 0,45
D. 0,18
33. Perhatikan nilai-nilai dan rumus menentukan persamaan regresi linier berikut ini :
∑Xi = 26 ∑Yi = 40 ∑Xi Yi = 232 ∑Xi 2= 158 ∑Yi 2= 248
(∑Xi )2= 676 (∑Yi )2= 1600 dan n = 5
n n n
n xi yi − ( xi )( yi )
i =1 i =1 i =1
R=
n n n n
[ n xi 2 − ( xi ) 2 ] [ n y i 2 − ( y i ) 2 ]
i =1 i =1 i =1 i
35. Untuk menentukan persamaan regresi linier berganda, dengan 2 variabel bebas
diperlukan perhitungan yang bertahap, yaitu :
A. Menentukan empat buah persamaan normal, Eliminasi dan Substitusi.
B. Menentukan tiga buah persamaan normal, Eliminasi dan Substitusi.
C. Menentukan dua buah persamaan normal, Eliminasi dan Substitusi.
D. Menentukan satu buah persamaan normal, Eliminasi dan Substitusi.
36. Pernyataan yang benar mengenai kemiringan (gradient atau slope) suatu
persamaan regresi linier dengan koefisien korelasi linier :
A. Jika kemiringan (gradient atau slope) positif maka koefisien korelasi
linier nya akan negatif
B. Jika kemiringan (gradient atau slope) negatif, maka koefisien korelasi
linier nya akan positif
C. Jika kemiringan (gradient atau slope) negatif maka koefisien korelasi
linier nya akan negative
D. Jawaban A, B dan C semua benar.
37. Untuk mengetahui hubungan antara Nilai IQ dengan Nilai Ujian. Keduanya berupa
data angka ( numerik) maka jenis uji korelasi yang tepat adalah
a. Somers’s D
b. Rank Spearman
c. Pearson
d. Kendall Tau B
38. Untuk mengetahui hubungan Tingkat Gizi (Baik, Cukup, Kurang) dengan Tingkat
Kesehatan (Baik, Cukup, Kurang), sebaiknya digunakan uji korelasi
a. Kendall Tau B
b. Rank Spearman
c. Pearson
d. Somer’s D
39. Pernyataan yang salah terkait Jenis Uji Korelasi Pearson Product Moment
a. Untuk skala data interval dan rasio (numerik)
b. Jumlah data banyak (lebih dari 30)
c. Data harus memenuhi kaidah normalitas (terdistribusi normal) dan
beberapa asumsi lainnya
d. untuk skala data ordinal
40. Untuk mengetahui hubungan yang terkait Kesesuaian Nilai Ujian mahasiswa kelas
2PA05 oleh Dosen I dan Dosen II paling tepat digunakan uji korelasi :
45. Nilai yang menjadi batas daerah penerimaan dan penolakan hipotesis.
A. Wilayah kritis
B. Titik kritis → nilai tabel ( misal t tabel atau Ztabel)
C. Nilai nol
D. Nilai α
46. Statistik Hitung
x − 0 22 − 20 2
A. t = = = = 2.5
s / n 4 / 25 0.8
x − 0 22 − 20 2
B. Z= = = = 2.5
s / n 4 / 25 0.8
x − 0 20 − 22 − 2
C. t= = = = - 2.5
s / n 4 / 25 0.8
x − 0 20 − 22 − 2
D. Z= = = = - 2.5
s / n 4 / 25 0.8
48. Teknik statistika untuk mengetahui parameter dalam populasi (rata-rata , standar
deviasi , proporsi π, koefisien korelasi , dsb) dengan menggunakan statistik
dalam sampel acak yang sesuai (rata-rata x , standar deviasi s, proporsi p̂ ,
koefisien korelasi r, dsb):
A. Statistical Parameter Estimation (Pendugaan Parameter) *
B. Pengujian Hipotesis
C. Distribusi Sampling
D. Uji Chi Kuadrat
51. Hal yang benar terkait interval estimation berikut ini adalah :
A. Mengestimasi suatu parameter berdasarkan banyak nilai dalam suatu
interval tertentu, hasil estimasi interval AKAN memberikan tingkat
keyakinan tertentu. *
B. Mengestimasi suatu parameter berdasarkan satu nilai saja. Misalnya
mengestimasi dengan x → = x , tentu saja hasil estimasi ini TIDAK
memberikan tingkat keyakinan tertentu.
C. Mengestimasi suatu parameter berdasarkan banyak nilai dalam suatu
interval tertentu, Hasil estimasi interval TIDAK akan memberikan tingkat
keyakinan tertentu.
D. Mengestimasi suatu parameter berdasarkan satu nilai saja. Misalnya
mengestimasi dengan x → = x , tentu saja hasil estimasi ini AKAN
memberikan tingkat keyakinan tertentu.
56. Seorang petani apel ingin mengetahui rata-rata berat buah apel hasil kebunnya.
Untuk itu, diambil sampel secara acak 10 buah apel dengan berat masing-masing
(gram) : 142, 157, 138, 175, 152, 149, 148, 200, 182, dan 164. Jika petani tersebut
merasa yakin 95% bahwa rata-rata berat buah apel akan tercakup dalam interval
estimasi, maka tentukanlah interval estimasinya tersebut.
Diketahui : n = 10 X = i → X =
x 1607
= 160.7
n 10
n x i2 − ( x i ) 10(261.711) − (1607)2
2
s= → s= = 19.62453113
n(n − 1) 10(9)
Ditanyakan : P( . . . . . . ) = 0.95
Rumus : PX − t0.5;df s X + t0.5;df s = 1−
n n
E = 2,262 (19,624 / √10) = 14,034
160.7 – 14,034 < µ < 160,7 – 14,034
146,666 < µ < 174,734
A. Petani tersebut merasa yakin sebesar 5% bahwa rata-rata berat buah apel
hasil kebunnya ada antara 146.66 gram dan 174.74 gram.
B. Petani tersebut merasa yakin sebesar 95% bahwa rata-rata berat buah apel
hasil kebunnya ada antara 146.66 gram dan 174.74 gram.
C. Petani tersebut merasa yakin sebesar 5% bahwa rata-rata berat buah apel
hasil kebunnya ada antara 138 gram dan 200 gram.
D. Petani tersebut merasa yakin sebesar 95% bahwa rata-rata berat buah apel
hasil kebunnya ada antara 138 gram dan 200 gram.
57. Dari hasil survey yang dilakukan suatu research agency mengenai kebiasaan ibu
rumah tangga menyaksikan tayangan iklan di TV Swasta. Ternyata diperoleh hasil
bahwa 76 orang dari 180 orang ibu rumah tangga yang dipilih secara acak, biasa
menyaksikan tayangan iklan paling sedikit 2 jam per minggu. Jika peneliti
tersebut menggunakan taraf konfidens sebesar 90%, maka tentukan interval
estimasi seluruh ibu rumah tangga yang biasa menyaksikan tayangan iklan paling
sedikit 2 jam per minggu.
Ditanyakan : P( . . . p . . . ) = 0.90
A. Kita merasa yakin sebesar 10% bahwa proporsi ibu-ibu yang biasa
menyaksikan tayangan iklan paling sedikit 2 jam per hari antara 35.9%
dan 48.1%
B. Kita merasa yakin sebesar 90% bahwa proporsi ibu-ibu yang biasa
menyaksikan tayangan iklan paling sedikit 2 jam per hari antara 42% dan
58%
C. Kita merasa yakin sebesar 90% bahwa proporsi ibu-ibu yang biasa
menyaksikan tayangan iklan paling sedikit 2 jam per hari antara 35.9%
dan 48.1%
D. Kita merasa yakin sebesar 10% bahwa proporsi ibu-ibu yang biasa
menyaksikan tayangan iklan paling sedikit 2 jam per hari antara 42% dan
58%
58. Dalam pendugaan parameter, ciri dari penduga yang baik adalah :
a. mempunyai tingkat kepercayaan yang tinggi
b. mempunyai selang antara nilai minimum dan maksimum yang pendek
c. keduanya salah
d. keduanya benar
CATATAN :
Tabel yang dipakai :
1.Tabel binomial dgn n=20
2. Tabel Poisson dengan nilai µ = 4
3. Tabel luas dibawah kurva normal
Semoga bermanfaat…..
ABJAD YUNANI
Johan Harlan
Metode Statistika 1
Penulis : Johan Harlan
ISBN 979-1223-01-7
Johan Harlan
Juni 2004
v
DAFTAR ISI
Kata Pengantar v
vii
Latihan 3 69
Bab 4 Probabilitas 75
4.1 Konsep Dasar Probabilitas 75
4.2 Probabilitas Peristiwa 80
4.3 Pencacahan Ruang Sampel 83
Lampiran 4A Saling Asing dan Independen 88
Lampiran 4B Teorema Bayes 90
Latihan 4 93
viii
Bab 6 Sampling 152
6.1 Distribusi Sampling 152
6.2 Metode Sampling 157
Kepustakaan 189
Addenda 191
Addendum A Program Komputer Statistik 191
Addendum B1 Distribusi Probabilitas Binomial 193
Addendum B2 Probabilitas Binomial Kumulatif 200
Addendum C1 Distribusi Probabilitas Poisson 205
Addendum C2 Probabilitas Poisson Kumulatif 211
Addendum D Distribusi Normal Standar 213
Addendum E Nilai Kritis Distribusi t 215
Addendum F Bilangan Acak 216
ix
BAB 1
PENDAHULUAN
Metode Statistika
adalah teknik tentang pengumpulan data, penyajian data, analisis data,
dan pengambilan kesimpulan dari data yang berhasil dihimpun tersebut.
1
Parameter dan Statistik
Parameter (parameter populasi) adalah ukuran-ukuran tertentu yang
digunakan untuk menggambarkan suatu populasi. Statistik (statistik sampel)
adalah ukuran-ukuran tertentu yang digunakan untuk menggambarkan suatu
sampel.
Data
Data merupakan kumpulan fakta atau angka atau segala sesuatu yang
dapat dipercaya kebenarannya, sehingga dapat digunakan sebagai dasar
menarik suatu kesimpulan.
Variabel
Variabel adalah karakteristik unsur yang menjadi perhatian dan
memiliki nilai-nilai yang berbeda-beda.
2
Data kuantitatif dibedakan menjadi data diskret dan data kontinu:
- Data diskret adalah karakteristik suatu variabel yang berasal dari
proses pencacahan (counting) dan berupa bilangan bulat.
Contoh: jumlah anak responden ibu rumah tangga, jumlah sesi
perkuliahan Statistika yang diikuti oleh responden mahasiswa, dan
sebagainya.
- Data kontinu adalah karakteristik suatu variabel yang berasal dari
proses pengukuran (measurement) dan nilai-nilainya berada dalam
suatu interval atau rentang tertentu. Nilai-nilai data kontinu dapat
berupa bilangan pecahan yang tak terhingga banyaknya.
Contoh: tinggi badan responden, berat badan responden, dan
sebagainya.
Skala pengukuran
- Skala nominal: data yang dihimpun dapat dibedakan menjadi beberapa
kategori tanpa memperhatikan urutan tertentu.
Contoh: suku bangsa, agama, dan sebagainya.
- Skala ordinal: data yang dihimpun dapat dibedakan menjadi beberapa
kategori yang berbeda dengan memperhatikan urutan.
Contoh: status sosial ekonomi (tinggi-menengah-rendah), kepangkatan
dalam militer (perwira-bintara-tamtama), dan sebagainya.
- Skala interval: data yang dihimpun dapat diletakkan dalam skala
dengan jarak (interval) antara dua titik skala diketahui dan skala
tersebut tidak memiliki titik nol mutlak (titik pusat).
Contoh: tanggal lahir, suhu tubuh dalam skala Celcius, dan sebagainya.
- Skala rasio: data yang dihimpun dapat diletakkan dalam skala dengan
jarak antara dua titik skala diketahui dan skala tersebut memiliki titik
nol mutlak.
Contoh: usia, suhu ruang dalam skala Kelvin, dan sebagainya.
3
binomial antara lain jenis kelamin (pria-wanita), hasil ujian (lulus-gagal), dan
sebagainya.
4
1.2 NOTASI SIGMA
Aturan sumasi
Aturan 1
Jika xi = k, suatu nilai konstan (yaitu nilai yang tidak berubah dengan
i), maka:
n n
∑ xi =
i =1
∑
i =1
k = k + k + . . . + k = nk
n
∑
i =1
xi = nk (1.1)
Aturan 2
Jika k suatu konstante, maka:
n
∑
i =1
kxi = k x1 + k x2 + . . . + k xn
n
= k ( x1 + x2 + . . . + xn ) = k ∑ xi
i =1
n n
∑
i =1
kxi = k ∑ xi
i =1
(1.2)
Aturan 3
n
∑
i =1
( xi + yi ) = ( x1 + y1 ) + ( x2 + y2 ) + . . . + ( xn + yn )
= ( x1 + x2 + . . . + xn ) + ( y1 + y2 + . . . + yn )
n n
= ∑
i =1
xi + ∑
i =1
yi
n n n
∑ ( xi + yi )
i =1
= ∑ xi +
i =1
∑
i =1
yi (1.3)
5
Contoh 1.1
n n
∑ ( xi + k ) ∑
2
1.
i =1
=
i =1
( xi2 + 2kxi + k 2 )
n n n
= ∑ xi2 +
i =1
∑ ( 2kxi )
i =1
+ ∑
i =1
k2 , aturan 3
n n
= ∑ xi2 + 2k ∑ xi + n k 2 ,
i =1 i =1
aturan 2 dan 1
n 2 n
∑( ) ∑ ( xi + 2 xi y i + y i )
2 2
2. xi + y i =
i =1 i =1
n n n
= ∑
i =1
xi2 + 2 ∑ xi yi +
i =1
∑
i =1
yi2 , aturan 3 dan 2
n n n
3. ∑ ( axi + byi ) = ∑ axi + ∑ byi , aturan 3
i =1 i =1 i =1
n n
= a ∑ xi + b ∑ y i , aturan 2
i =1 i =1
n n
∑ xi ( xi −1) = ∑ ( xi − xi )
2
4.
i =1 i =1
n n
= ∑ xi2 −
i =1
∑ xi , aturan 3
i =1
n n
∑ ( xi −1)( xi +1) = ∑ ( xi −1)
2
5.
i =1 i =1
n n
= ∑ xi2 −
i =1
∑1 , aturan 3
i =1
6
n
= ∑
i =1
xi2 − n, aturan 1
Sumasi Ganda
m n n m
maka: ∑∑ aij xi y j =
i =1 j =1
∑∑
j =1 i =1
a xyij i j
7
n
Misalkan Aij = aij x j dan ∑
i =1
Aij = bi , i = 1, 2, . . . , m dan j = 1, 2, . . .
, n,
a11 x1 + a12 x2 + ... + a1n xn = b1
a21 x1 a22 x2 a2 n xn = b2
. . . .
. . . .
. . . .
am1 x1 + am 2 x2 + ... + amn xn = bm
n
maka: ∑
i =1
aij x j = bi
m n m
dan: ∑∑
i =1 j =1
aij x j = ∑ bi
i =1
8
LAMPIRAN 1A: PERAN STATISTIKA DALAM
ILMU PENGETAHUAN
10
LAMPIRAN 1C: CONTOH-CONTOH
PENGGUNAAN NOTASI SIGMA
Contoh 1:
5
∑
i =1
xi = x1 + x2 + x3 + x4 + x5
4
∑
j =2
yj = y2 + y3 + y4
3
∑ zk
k =0
= z0 + z1 + z2 + z3
3
∑
i =1
( a + bxi ) = ( a + bx1 ) + ( a + bx2 ) + ( a + bx3 )
5
∑
i =3
( axi + byi ) = ( ax3 + by3 ) + ( ax4 + by4 ) + ( ax5 + by5 )
2
∑
i =1
( axi + b )( cxi + d ) = ( ax1 + b )( cx1 + d ) + ( ax2 + b )( cx2 + d )
3
∑
i =1
( axi yi ) = ax1 y1 + ax2 y2 + ax3 y3
2
∑
i =1
( axi2 + bxi + c ) = ( ax12 + bx1 + c ) + ( ax22 + bx2 + c )
3
∑
i =1
( axi + b )( cxi + d ) = ( ax1 + b )( cx1 + d ) + ( ax2 + b )( cx2 + d ) +
( ax3 + b )( cx3 + d )
11
Contoh 2:
i 1 2 3 4 5
Xi 80 65 70 60 65
5
• ∑
i =1
xi = 80 + 65 + 70 + 60 + 65 = 340
5
• ∑
i =1
xi2 = 802 + 652 + 702 + 602 + 652 = 23,350
5
5
5
• ∑
i =1
( 3xi + 7 ) + 3∑ xi
i =1
+ ∑ 7 = (3)(340) + (5)(7) = 1,055 =
i =1
5 5
5 2 5 5
∑ ( 2 xi + 3) ∑ 4∑ xi + 12∑ xi + ∑ 9
2
• = 4 xi(
2
+ 12 xi + 9 = )
i =1 i =1 i =1 i =1 i =1
= (4)(23,350) + (12)(340) + (5)(9) = 97,525
5 5
5
5
• ∑
i =1
( xi + 4 )( xi − 4 ) = ∑ ( xi2 − 16 ) = ∑ xi2
i =1 i =1
‒ ∑16
i =1
= 23,350 ‒ (5)(16) = 23,270
Catatan:
n
∑
i =1
xi = ∑i xi
m n
∑∑
i =1 j =1
xij = x11 + x12 + . . . + x1n + x21 + x22 + . . . + x2 n +
xm1 + xm 2 + . . . + xmn
m n
∑∑
i =1 j =1
xij = ∑∑
i j
xij
12
LATIHAN 1
Bagian Pertama
Pilihlah satu jawaban yang paling benar !
13
6. Yang tergolong dalam data kualitatif ialah:
A. Data nominal dan ordinal
B. Data interval dan rasio
C. Data diskret dan kontinu
D. Data kategorik dan numerik
10. Data yang diperoleh langsung dari subjek yang ingin diketahui
karakteristiknya dinamakan:
A. Data diskret C. Data primer
B. Data rasio D. Data sekunder
14
11. Data yang diperoleh dari pihak ketiga, yang biasanya telah
dikumpulkan sebelumnya untuk keperluan lain dari subjek yang hendak
dipelajari dinamakan:
A. Data diskret C. Data primer
B. Data rasio D. Data sekunder
12. Luas lantai berbagai tipe rumah disebuah real estate merupakan
contoh data:
A. Nominal C. Interval
B. Ordinal D. Rasio
15
17. Contoh berikut adalah data berskala interval, kecuali:
A. Tanggal ulang tahun siswa kelas 3 SMU Bintang Kejora
B. Rata-rata suhu luar-rumah harian di Jakarta yang dinyatakan
dalam skala Celcius.
C. Usia penduduk Desa Tamansari pada HUT terakhirnya
D. Semua merupakan contoh data berskala interval
18. Contoh data berskala rasio di antara pilihan di bawah ini adalah:
A. Suhu dalam skala Celcius C. Suhu dalam skala Kelvin
B. Suhu dalam skala Fahrenheit D. Semuanya benar
16
Bagian Kedua
A. 21 C. 23
B. 22 D. 24
5
2. ∑ ( 3x + 5) =
i =1
i
A. 64 C. 84
B. 74 D. 94
5
3. ∑ ( x − 2 )( 2 x + 3) =
i =1
i i
A. 196 C. 217
B. 203 D. 241
Bagian Ketiga
Selesaikanlah soal-soal berikut:
Anak 1 2 3 4 5 6 7 8
17
Hitunglah:
5 8
∑ ( xi 2 − xi − 1) ∑ ( x − 8)
2
A. E. i
i =1 i =1
8
1 8
B. x = ∑ xi
8 i =1
F. ∑ ( x − 10 )
i =1
i
5 8
C. ∑ ( xi − 8)
i =1
G. ∑ x − 10
i =1
i
8 5
1 1
D. ∑ x −8 i H. ∑ x −
8
i =1 i =1 i
Pasangan (i) 1 2 3 4 5 6 7 8
Umur pria ( xi ) 23 32 25 26 42 29 19 24
Umur wanita ( yi ) 19 38 21 26 35 32 17 20
Hitunglah:
8 8 8
A. ∑
i =1
xi , ∑ yi , dan ∑ xi yi
i =1 i =1
2 2
2 8 8 8
8 8 8
B. ∑ xi2 ,
i =1
∑
i =1
yi , ∑ i , ∑ yi , ∑ xi ∑ yi
x
i =1 i =1 i =1 i =1
8
C. ∑
i =1
( xi + yi )
8
∑
2
D. ( xi + yi )
i =1
8
E. ∑
i =1
( 2 xi + 5 yi )
18
BAB 2
PERINGKASAN DATA
Peringkasan data dapat dilakukan secara tabular (penyajian tabel),
secara grafikal (penyajian grafik), dan secara numerik (penyajian angka).
Dalam bagian ini akan dibahas mengenai peringkasan data secara tabular dan
grafikal.
2.1. TABEL
Distribusi Frekuensi
Tabel 2.1 Rincian nilai skala Depresi MMPI-2 50 mahasiswa
Psikologi Gunadarma 2003
21 25 24 23 24 21 19 25 23 27
17 32 26 32 28 29 21 21 25 23
35 37 19 26 24 27 16 23 24 25
25 18 31 23 17 26 29 21 16 23
23 30 29 18 28 22 19 24 29 21
Data yang disajikan diatas dikatakan sebagai data mentah (raw data).
Seyogyanya data tersebut disusun dari angka terkecil hingga angka terbesar:
19
Tabel 2.3. Distribusi frekuensi berat badan 64 mahasiswa
Psikologi Gunadarma 2003
Berat badan (kg) Frekuensi
36-44 20
45-53 19
54-62 17
63-71 5
72-80 1
81-89 1
90-98 1
Jumlah 64
Beberapa istilah:
a. Kelas / kelompok data
Jumlah kelas: biasanya 5 s.d. 15
Aturan Sturges (dibaca: ster’-jes):
Jumlah kelas = 1 + 3.322 log n (2.1)
Rentang adalah beda antara nilai data terbesar dengan nilai data terkecil.
c. Batas kelas dan tepi batas kelas
Batas-batas kelas (class limits) adalah dua angka yang dijadikan sebagai
pembatas kelas, terdiri atas batas kelas atas dan batas kelas bawah.
Kelas IV Kelas V
-----------o------------------------------------------------o---------------
20
tepi batas
Kelas IV kelas Kelas V
------------o--------------------------o-----------------------o-----------
71 71.5 72
Batas kelas atas Batas kelas bawah
kelas keempat kelas kelima
Diagram 2.2. Tepi batas kelas (class boundaries ) dengan garis bilangan
untuk data pada tabel 2.3
Contoh distribusi frekuensi dengan tepi batas kelas sebagai batas kelas:
Tabel 2.4. Distribusi berat badan 64 mahasiswa Psikologi Gunadarma
3003 − tepi batas kelas sebagai batas kelas
d. Titik tengah
Titik tengah setiap kelas dijadikan penaksir data asli yang sudah hilang
sebagai akibat proses pengelompokan. Contoh distribusi frekuensi
dengan titik tengah:
Tabel 2.5. Distribusi berat badan 64 mahasiswa Psikologi Gunadarma
2003 − dengan titik tengah
21
Langkah-langkah penyusunan distribusi frekuensi:
a. Menentukan jumlah kelas:
Untuk contoh tabel 2.2 → n = 50
Dengan aturan Sturges:
Jumlah kelas = 1 + 3.322 log 50
= 6.64 ≈ 7 kelas
b. Menentukan interval kelas
Rentang angka data terbesar dengan angka terkecil adalah:
37 – 16 = 21
Interval kelas = [Rentang kelas + 1] : jumlah kelas
= 22 : 7 = 3.14 ≈ 4 (dibulatkan ke atas)
c. Menyusun kelas-kelas data
Tabel 2.6. Batas kelas bawah dan batas kelas atas
Batas kelas bawah Batas kelas atas
13 16
17 20
21 24
25 28
29 32
33 36
37 40
d. Memasukkan data
Semua angka data harus dapat dimasukkan tanpa mengalami keragu-
raguan. Pemasukan data dipermudah dengan membuat tally (melidi)
terlebih dahulu.
22
Hasil penyusunan distribusi frekuensi:
Batas atas dapat juga dinyatakan dengan simbol ‘lebih kecil daripada’
(<):
23
Tabel 2.10. Distribusi frekuensi nilai skala Depresi MMPI-2 50
mahasiswa Psikologi Gunadarma 2003
13-16 2 < 17 2
17-20 7 < 21 20 + 7 = 9
21-24 19 < 25 9 + 19 = 28
25-28 12 < 29 28 + 12 = 40
29-32 8 < 33 40 + 8 = 48
33-36 1 < 37 48 + 1 = 49
37-40 1 < 41 49 + 1 = 50
24
Distribusi frekuensi kumulatifnya adalah:
25
2.2. GRAFIK
Histogram Frekuensi:
Histogram merupakan penyajian secara grafikal data yang ada pada
tabel distribusi frekuensi. Histogram umumnya digunakan untuk data
kuantitatif (numerik) yang dikategorisasikan.
Poligon Frekuensi
Sama seperti histogram, hanya pada poligon frekuensinya dilukiskan
dalam bentuk garis yang menghubungkan tiap titik tengah puncak masing-
masing kelas. Poligon frekuensi untuk data pada tabel 2.8 adalah:
26
Diagram 2.4. Poligon frekuensi nilai skala Depresi MMPI-2 50
mahasiswa Psikologi Gunadarma 2003
Ogive
Distribusi frekuensi kumulatif dapat disajikan dalam bentuk diagram
yang dinamakan ogive. Ogive untuk tabel 2.12 adalah:
27
Diagram Batang (bar chart)
Biasanya digunakan untuk data kategorik ordinal. Berbeda dengan
histogram, pada diagram batang antara batang yang satu dengan yang
berikutnya didapatkan celah (gap).
28
Diagram 2.7. Asal fakultas 218 mahasiswa
Studi Nyeri Kepala Gunadarma, 2003
Diagram Batang-dan-Daun:
Diagram batang-dan–daun (stem-and-leaf) merupakan kombinasi
antara histogram dengan penyajian data individual secara numerik. Untuk
angka dua digit, puluhan dijadikan ‘batang’ dan satuan dijadikan ‘daun’.
Dari contoh data pada tabel 2.15 di bawah dihasilkan diagram batang-
dan-daun seperti terlihat pada diagram 2.8.
41 45 49 51 52 53 55 56 56 57
57 58 59 59 60 61 61 62 63 63
65 65 65 67 67 67 67 69 69 69
69 70 71 71 71 73 73 73 73 73
75 75 77 77 77 79 79 81 81 81
83 83 87 89 89 92 92 93 94 96
29
4* | 159
5* | 12356677899
6* | 01123355577779999
7* | 0111333335577799
8* | 11133799
9* | 22346
30
LAMPIRAN 2A BAGIAN-BAGIAN TABEL
1. Judul (title).
- ditempatkan di atas tabel
- memberikan deskripsi yang singkat dan eksplisit mengenai isi tabel
- terdiri atas:
a. nomor tabel (table number) jika ada lebih daripada satu tabel
b. cakupan dan jangkauan informasi
c. periode sehubungan dengan isi tabel
d. cara pengumpulan informasi
e. unit pengukuran apabila tak disebutkan di bagian lain tabel
f. jika judul terlalu panjang, sebagian di antaranya ditulis di bawah
judul utama(sebagai headnote)
31
Contoh tabel dan bagian-bagiannya
32
LATIHAN 2
Bagian Pertama
Pilihlah satu jawaban yang paling benar !
1. Jarak antara kelas yang satu dengan kelas lainnya secara berurutan pada
tabel distribusi frekuensi dinamakan:
A. Rentang
B. Interval kelas
C. Limit kelas (class limit)
D. Batas kelas (class boundary)
2. Array adalah:
A. Kumpulan data yang sudah di urutkan dari yang terkecil ke yang
terbesar
B. Kumpulan data yang telah disusun dalam bentuk distribusi
frekuensi
C. Kumpulan data yang memiliki lebih daripada satu modus
D. Semuanya salah
3. Misalkan dari suatu survei diperoleh data sebanyak 200 item. jika akan
dibuat distribusi frekuensinya, jumlah kelas menurut aturan Sturges
adalah:
A. 5 C. 9
B. 7 D. 12
4. Jika untuk soal No. 3 di atas diketahui pula nilai minimum X min = 35
dan nilai maksimum X max = 164, maka interval kelas adalah:
A. 14 C. 18
B. 15 D. 19
33
6. Tabel yang baik ialah tabel yang:
A. bersifat self − explanatory.
B. sederhana
C. bersifat self − explanatory dan sederhana.
D. bersifat self − explanatory dan kompleks.
8. Ogive adalah:
A. Poligon frekuensi untuk frekuensi kumulatif
B. Histogram untuk distribusi frekuensi relatif
C. Diagram batang untuk distribusi frekuensi mutlak
D. Semuanya salah
34
11. Dari grafik di bawah ini dapat disimpulkan bahwa:
35
Bagian Kedua
Selesaikan soal berikut:
67 52 72 42 21 55 47 66 54 37 37 34
59 51 44 56 48 44 69 56 27 34 47 59
20 51 42 78 35 61 44 51 52 77 82 57
63 73 49 67 33 78 48 47 41 62 72 85
25 72 54 52 108 28 93 37 22 37 66 49
69 42 54 59 58 75 61 66 99 97 51 61
26 73 33 71 64 57 55 56 47 87 68 97
36
BAB 3
UKURAN STATISTIK
3.1 UKURAN PUSAT (NILAI TENGAH)
Rerata; Rerata Hitung (Mean; Arithmetic Mean) untuk
Data Tak-berkelompok (Ungroup Data)
Rerata hitung adalah jumlah seluruh angka data dibagi dengan
banyaknya (jumlah) data.
x + x + . . . + xn
x = 1 2
n
n
∑
i
=1
xi
atau x= (3.1)
n
x : rerata sampel
xi : data ke-i variabel acak X; i = 1, 2, . . . , n
n : ukuran sampel (banyaknya anggota sampel)
Untuk populasi:
N
∑
i
Xi
=1
µ = (3.2)
N
Contoh 3.1:
Misalkan dimiliki data tinggi badan 10 orang mahasiswa (dalam cm):
162, 161, 157, 154. 164, 170, 162, 165, 162, 161.
n
n = 10 dan ∑
i
=1
xi = 162 + 161 + . . . + 161 = 1618
37
n
∑
i
=1
xi
1618
sehingga: x= = = 161.8
n 10
k
∑
j
f jxj
=1
atau: x= (3.3)
n
x : rerata sampel
xj : titik tengah kelas ke-j; j = 1, 2, . . . , k
fj : frekuensi (banyak anggota) kelas ke-j
n : ukuran sampel (jumlah frekuensi data sampel)
Rerata populasi:
K
∑
j
fjX j
=1
µ = K
∑
j
fj
=1
K
∑
j
fjX j
=1
atau: µ = (3.4)
N
µ : rerata populasi
Xj : titik tengah kelas ke-j; j = 1, 2, . . . , K
fj : frekuensi (jumlah anggota) kelas ke-j
N : ukuran populasi (jumlah frekuensi data populasi)
38
Contoh 3.2:
Lihat kembali data berat badan 64 mahasiswa Psikologi Gunadarma
pada tabel 2.3.
3, 307
x = = 51.67
64
Keunggulan rerata:
1. Lebih dikenal, sehingga penggunaannya pun lebih mudah .
2. Setiap dapat digunakan data kuantitatif memiliki dan hanya memiliki
satu rerata.
3. Karena kumpulan data hanya memilki satu rerata, maka ukuran pusat
data ini dapat digunakan dengan baik dalam prosedur statistika, seperti
perbandingan dua atau lebih kumpulan data.
Kelemahan rerata:
1. Sangat peka terhadap data ekstrim.
2. Tidak dapat digunakan untuk menentukan ukuran pusat data kualitatif.
3. Untuk data berkelompok, hasil perhitungan tidak mencerminkan rerata
sesungguhnya.
4. Untuk data berkelompok dengan kelas terbuka, rerata-nya tidak dapat
dihitung.
39
Rerata Geomerik (Geometric Mean)
Misalkan G menyatakan rerata geometrik untuk data x1 , x2 , . . . , xn ,
maka:
n
G n = x1 . x2 . . . xn = xi (3.5.a)
i =1
Contoh 3.3:
Misalkan jumlah kasus DBD (Demam Berdarah Dengue) di kota B
pada tahun 2000, 2001, 2002, dan 2003 masing-masing adalah 124, 130,
143, dan 158. Rerata geometriknya adalah:
G= n x1 x2 . . . xn
40
Contoh 3.4:
Misalkan kelajuan sebuah mobil adalah 60 km/jam selama
menempuh kilometer pertama, 80 km/jam pada kilometer kedua, dan 65
km/jam pada kilometer ketiga. Rerata kelajuan mobil tersebut (dihitung
sebagai rerata harmonik) dalam km/jam adalah:
n
H= n
1
∑
i =1 xi
3 3
= = = 67.34
1 1 1 1 1 1
+ + + +
x1 x2 x3 60 80 65
Contoh 3.5:
Misalkan mahasiswa Y mendapatkan nilai 90 untuk tugas harian mata
kuliah Statistika, 80 untuk Ujian Tengah Semester, dan 60 untuk Ujian Akhir
Semester. Jika bobot tugas harian, UTS, dan UAS masing-masing adalah
10%, 60%, dan 30%, maka nilai akhirnya (dihitung sebagai rerata
tertimbang) adalah:
n
W= ∑
i
wi xi
=1
= (0.10)(90) + (0.60)(80) + (0.30)(60) = 75
41
Rerata Terpangkas (Trimmed mean)
Rerata terpangkas digunakan untuk menghindari pengaruh nilai-nilai
ekstrim terhadap rerata. Untuk menghitungnya, mula-mula data
‘dipangkas’, yaitu dengan membuang sejumlah nilai terendah dan nilai-nilai
tertinggi, misalnya 5% nilai terendah dan 5% nilai tertinggi (atau 10% nilai
terendah dan 10% nilai tertinggi), lalu terhadap sisa data dilakukan
perhitungan rerata hitung seperti biasa.
Med = X , n ganjil )
n+1
2
X +X
n n
2 +1
2
Med = , n genap ) (3.8.a)
2
Contoh 3.6:
Lihat kembali data tinggi badan 10 orang mahasiswa pada contoh 3.1:
162, 161, 157, 154, 164, 170, 162, 165, 162, 161. Data diurutkan dalam
bentuk array (dibaca: er-rei) sebagai berikut:
42
X = 154 X = 162
(1) ( 6)
X = 157 X = 162
( 2) (7)
X = 161 X = 164
( 3) (8)
X = 161 X = 165
( 4) (9)
X = 162 X = 170
( 5) (10 )
( n 2 ) − fkmed
Med = Bmed + i (3.9)
f med
Med : median
Bmed : tepi batas kelas bawah pada kelas median (lower class boundary)
i : interval kelas
n : ukuran sampel
fkmed : frekuensi kumulatif sebelum kelas median
f med : frekuensi pada kelas median
Contoh 3.7:
Lihat kembali data berat badan 64 mahasiswa Psikologi Gunadarma
pada tabel 2.3.
43
Tabel 3.2. Distribusi frekuensi berat badan 64 mahasiswa
Psikologi Gunadarma 2003
Titik posisi median = 32. Kelas posisi median yaitu kelas ke-2.
Bmed = 44.5
i =9
fkmed = 20
f med = 19
( n 2 ) − fkmed
Med = Bmed + i
f med
32 − 20
= 44.5 + 9 = 50.18
19
Keunggulan median:
1. Tidak dipengaruhi oleh data ekstrim
2. Mudah dimengerti dan mudah dihitung, baik dari data tak-berkelompok
maupun data berkelompok. Juga dapat dihitung untuk data
berkelompok dengan kelas terbuka.
3. Dapat digunakan untuk data kuantitatif maupun data kualitatif.
Kelemahan median:
1. Hanya dapat ditentukan dari data yang telah diurutkan sehingga
membutuhkan waktu yang tidak sedikit.
2. Dihitung bukan berdasarkan nilai data, tetapi berdasarkan jumlah data,
sehingga sulit dijadikan sebagai ukuran pusat data untuk
menggambarkan kumpulan datanya.
44
Modus untuk Data Tak-berkelompok
Modus adalah nilai yang memiliki frekuensi tertinggi.
Contoh 3.8:
Lihat kembali data tinggi badan 10 orang mahasiswa pada contoh 3.1:
162, 161, 157, 154, 164, 170, 162, 165, 170, 161. Modus akan lebih mudah
ditentukan jika data tersusun dalam distribusi frekuensi seperti di bawah ini.
di
Mo = Bmo + i (3.10)
d1 + d 2
Mo : modus
Bmo : tepi batas kelas bawah pada kelas modus
i : interval kelas
d1 : frekuensi kelas modus dikurangi frekuensi kelas sebelum kelas
modus
d2 : frekuensi kelas modus dikurangi frekuensi kelas sesudah kelas
modus
45
Contoh 3.9:
Lihat kembali data berat badan 64 mahasiswa Psikologi Gunadarma
pada tabel 2.3 dan distribusi frekuensi beserta frekuensi kumulatifnya pada
tabel 3.2.
Kelas posisi modus yaitu kelas pertama.
Bmo = 35.5
i=9
d1 = 20 ‒ 0 = 20
d 2 = 20 ‒ 19 = 1
di
Mo = Bmo + i
d1 + d 2
20
= 35.5 + 9 = 44.07
20 + 1
Keunggulan modus:
1. Dapat digunakan untuk data kualitatif maupun kuantitatif.
2. Tidak dipengaruhi oleh data ekstrim.
3. Dapat dihitung untuk data berkelompok dengan kelas terbuka.
Kelemahan modus:
1. Dalam kasus-kasus tertentu, kumpulan data tidak memiliki modus.
2. Jika modus justru lebih daripada satu, tidak dapat digunakan sebagai
ukuran pusat data.
Contoh 3.10:
Hitung rerata, median, dan modus distribusi frekuensi berikut:
Tabel 3.4. Distribusi frekuensi IPK 32 orang mahasiswa
IPK Frekuensi
X < 1.5 1
1.5 < X < 2.0 4
2.0 < X < 2.5 5
2.5 < X < 3.0 7
3.0 < X < 3.5 11
X > 3.5 4
Jumlah 32
46
Tabel 3.5. Perhitungan rerata, median, dan modus IPK
32 orang mahasiswa
Xj fj Xj fj Frekuensi kumulatif
1.52 1 1.25 1
1.75 4 7.00 5
2.25 5 11.25 10
2.75 7 19.25 17
3.25 11 35.75 28
3.75 4 15.00 32
Jumlah 32 89.50
a. Rerata:
n
∑
i
Xi
=1 89.50
X= = = 2.80
n 32
b. Median:
Kelas posisi median adalah kelas keempat.
( n 2 ) − fkmed
Med = Bmed + i
f med
16 − 10
= 2.50 + 0.5 = 2.93
7
c. Modus:
Kelas posisi modus adalah kelas kelima.
di
Mo = Bmo + i
d1 + d 2
4
= 3.00 + 0.5 = 3.18
4 + 7
47
Posisi kuartil (n < 30):
n+2
Posisi Q1 = )
4
2n + 2 n +1
Posisi Q2 = = ) (3.11)
4 2
= Posisi median
3n + 2
Posisi Q3 = )
4
( n 4 ) − fkq
Q1 = Bq + i (3.12.a)
fq
( 3n 4 ) − fkq
Q3 = Bq + i (3.12.b)
fq
Q1 : kuartil pertama
Q3 : kuartil ketiga
Bq : tepi batas kelas bawah pada kelas kuartil
i : interval kelas
n : ukuran sampel
fkq : frekuensi kumulatif sebelum kelas kuartil
fq : frekuensi pada kelas kuartil
Contoh 3.11:
Lihat tabel 3.5. Tentukan kuartil pertama dan kuartil ketiga!
32
Posisi kuartil pertama: =8
4
Bq = 2.00
i = 0.5
48
fkq = 5
fq = 5
( n 4 ) − fkq
Q1 = Bq + i
fq
8 − 5
= 2.00 + (0.5) = 2.25
5
49
Contoh 3.12:
Lihat tabel 3.6. Tentukan desil ke-7!
120 × 7
Posisi desil ke-7: = 84
10
Bd (tepi batas bawah kelas desil) : 63.5
i (interval kelas) : 4
fkd (frekuensi kumulatif sebelum kelas desil) : 75
f d (frekuensi pada kelas desil) : 18
50
Posisi beberapa titik persentil:
Contoh 3.13:
Lihat tabel 3.6. Tentukan persentil ke-67!
120 × 67
Posisi titik persentil ke-67: = 80.4
100
B p (tepi batas bawah kelas persentil) : 63.5
i (interval kelas) : 4
fk p (frekuensi kumulatif sebelum kelas persentil) : 75
f d (frekuensi pada kelas persentil) : 18
51
3.2 UKURAN PENYEBARAN
Rentang (Range)
Rentang adalah selisih antara data terbesar dan data terkecil.
R = X max ‒ X min (3.13)
Contoh 3.14:
Lihat kembali data tertinggi badan 10 mahasiswa pada contoh 3.1.
Data terkecil adalah X min = 154 dan data terbesar adalah X max = 170,
sehingga rentang adalah:
R = X max ‒ X min
= 170 ‒ 154 = 16
Rentang Inter-kuartil
Rentang inter-kuartil (inter-quartile range) adalah selisih antara
kuartil ketiga dan kuartil pertama.
IQR = Q3 ‒ Q1 (3.14)
Contoh 3.15:
Lihat data IPK 32 orang mahasiswa pada tabel 3.4. Pada contoh 3.11
telah dihitung kuartil pertama Q1 = 2.25 dan kuartil ketiga Q3 = 3.32,
sehingga rentang inter-kuartil adalah:
IQR = Q3 ‒ Q1
= 3.32 ‒ 2.25 = 1.07
52
dan deviasi mutlak rata-rata untuk sampel adalah:
n
∑
i
xi − x
=1
MAD = (3.15.a)
n
σ2 : variansi populasi
σ : standar deviasi populasi
Xi : data ke-i variabel random X; i i = 1, 2, . . . , N
µ : rerata populasi
N : ukuran populasi
53
n
∑
2
( xi − x )
i=1
s= (3.14.a)
n −1
s2 : variansi sampel
s : standar deviasi sampel
xi : data ke-i variabel random X; i = 1, 2, . . . , n
x : rerata sampel
n : ukuran sampel
∑ X i2 − ( ∑ X i ) N
2
2
σ = (3.18)
N
∑ X i2 − ( ∑ X i ) N
2
σ = (3.18.a)
N
σ2 : variansi populasi
σ : standar deviasi populasi
Xi : data ke-i variabel random X; i = 1, 2, . . . , N
N : ukuran populasi
∑ xi2 − ( ∑ xi ) n
2
2
s = (3.19)
n −1
∑ xi2 − ( ∑ xi ) n
2
s= (3.19.a)
n −1
s2 : variansi sampel
s : standar deviasi sampel
xi : data ke-i variabel random X; i = 1, 2, . . . , n
n : ukuran sampel
54
Contoh 3.16:
Lihat kembali data tinggi badan 10 mahasiswa pada contoh 3.1.
n
∑
2
( Xi − X )
i
s2 = =1
n −1
167.60
= = 18.62
10 − 1
s = 18.62 = 4.32
2
s =
n −1
261,960 − (1, 618 ) 10
2
= = 18.62
10 − 1
55
Variansi dan Standar Deviasi Data Berkelompok
Rumus definisi variansi SD untuk populasi:
K 2 K 2
∑ (
fj X j −µ ) ∑ (
fj X j −µ )
σ2 = j =1
K
= j =1
(3.20)
N
∑ fj
j =1
K 2
∑ f j (X j − µ)
j =1
σ = (3.20.a)
N
σ2 : variansi populasi
σ : standar deviasi populasi
Xj : titik tengah kelas ke-j; j = 1, 2, . . . , K
µ : rerata populasi
fj : frekuensi kelas ke-j
K
N : ukuran populasi (= ∑ f j )
j =1
s2 : variansi populasi
s : standar deviasi populasi
xj : titik tengah kelas ke-j; j = 1, 2, . . . , k
x : rerata sampel
fj : frekuensi kelas ke-j
k
N : ukuran sampel (= ∑ f j )
j =1
56
Dalam praktik, yang digunakan umumnya adalah rumus operasional.
f j X 2j − N
2
∑
(∑ f j X j )
σ2 = (3.22)
N
∑ f j X 2j − ( ∑ f j X j ) N
2
σ = (3.22.a)
N
σ2 : variansi populasi
σ : standar deviasi populasi
Xj : titik tengah kelas ke-j: j = 1, 2, . . . , K
fj : frekuensi kelas ke-j
N : ukuran populasi
∑ f j x 2j − ( ∑ f j x j ) n
2
s2 = (3.23)
n −1
f j x 2j − ∑ f j x j n
2
∑ (
)
s= (3.23.a)
n −1
s2 : variansi sampel
s : standar deviasi sampel
xj : titik tengah kelas ke-j; j = 1, 2, . . . , k
fj : frekuensi kelas ke-j
n : ukuran sampel
Contoh 3.17:
Lihat kembali data berat badan 64 mahasiswa Psikologi Gunadarma
pada tabel 2.3. Pada contoh 3.2 telah dihitung nilai reratanya X = 51.67.
57
Tabel 3.8. Perhitungan variansi dan standar deviasi berat badan 64
mahasiswa Psikologi Gunadarma dengan rumus definisi
2
Titik tengah: X j Deviasi: ( X i − X ) Frekuensi: f j f j ( Xi − X )
40 −11.67 20 2,724.65
49 −2.67 17 135.64
58 6.33 17 680.77
67 15.33 5 1,174.76
76 24.33 1 591.86
85 33.33 1 1,791.67
94 42.33 1 1,791.67
Jumlah 0 64 8,210.11
Variansi-nya adalah:
k 2
∑ (
fj X j − X )
s2 = j =1
n −1
k
∑ 8, 210.11
j =1
` = = 130.32
64 − 1
Dengan rumus operasional, terlebih dahulu harus dihitung f j X j dan
f j X 2j .
58
Variansi-nya adalah:
2
n
∑ f j j ∑ j j
x 2
−(
f x )
s2 =
n −1
179, 089 − ( 3,307 ) 64
2
= = 130.32
64 − 1
Koefisien Variansi
Koefisien variasi (coefficient of variation; CV) adalah nilai standar
deviasi dibagi dengan rerata. Koefisien merupakan ukuran penyebaran data
yang tak memiliki satuan, karena itu dapat digunakan untuk membandingkan
penyebaran data 2 variabel yang memiliki satuan berbeda, misalnya tinggi
dan berat badan.
Koefisien variansi untuk populasi adalah:
σ
CV = (3.24)
µ
dan koefisien variansi untuk sampel adalah:
s
CV = (3.24.a)
x
Koefisien variansi juga dapat dinyatakan dalam persentase, yaitu CV
= ( σ / µ ) 100% untuk populasi dan CV = (s/ x ) 100% untuk sampel.
Contoh 3.18:
Lihat kembali data tinggi badan 10 mahasiswa pada contoh 3.1. Pada
contoh 3.1. telah dihitung rerata-nya xa = 161.8 cm dan pada contoh 3.16
telah dihitung standar deviasi-nya sa = 4.32 cm, sehingga koefisien variansi-
nya adalah:
s
CVa = a (100%)
xa
59
4.32
= (100%) = 2.67%
161.8
Misalkan untuk kelompok mahasiswa yang sama diketahui pula data
berat badannya dengan rerata xb = 54.4 kg dan standar deviasi sb = 6.75 kg,
sehingga koefisien variasi-nya adalah:
s
CVb = b (100%)
xb
6.75
= (100%) = 12.41%
54.4
Tampak bahwa ukuran berat badan mahasiswa jauh lebih menyebar
dibandingkan ukuran tinggi badan pada kelompok mahasiswa yang sama.
60
LAMPIRAN 3A: UKURAN PUSAT PADA
DISTRIBUSI SIMETRIS DAN ASIMETRIS
Pada diagram 2.3 dapat dilihat gambaran distribusi frekuensi sampel
yang berasal dari populasi kontinu, namun telah dikategorisasikan. Jika
sampel yang berasal dari distribusi kontinu diperbesar ukurannya sampai
menjadi tak berhingga dan diperbanyak jumlah kelasnya sampai menjadi tak
berhingga banyaknya (atau tidak dilakukan kategorisasi lagi), akan diperoleh
beberapa gambaran seperti terlihat pada diagram III.1 di bawah ini.
61
Jika nilai-nilai besar lebih banyak daripada nilai-nilai kecil, akan
didapatkan gambaran distribusi asimetris dengan ekor yang lebih panjang di
sisi kanan, seperti pada diagram III.3. Distribusi seperti ini disebut juga
“menceng ke kanan” (skewed to the right). Distribusi ini dapat dianggap
berasal dari distribusi simetris dengan penambahan sejumlah nilai-nilai
ekstrim yang besar. Penambahan nilai-nilai ekstrim yang besar terutama akan
mempengaruhi nilai rerata, sehingga posisi rerata seolah-olah ‘tertarik’ ke
kanan, sedangkan posisi median hanya ‘tertarik’ sedikit (nilai median sedikit
terpengaruh), sedangkan posisi modus tidak berubah.
62
LAMPIRAN 3B: FRAKTIL
Matriks III.1. Macam-macam fraktil (kuantil)
Macam Data dibagi menjadi Fraktil
Median 2 bagian Med
Kuartil 4 bagian Q1 , Q2 , Q3 , ( Q4 )
Desil 10 bagian D1 , D2 , D3 , . . . , D9 , ( D10 )
Persentil 100 bagian P1 , P2 , P3 , . . . , P99 , ( P100 )
Matriks III.2. Kesamaan beberapa fraktil
Med
Q1 Q2 Q3
D1 D2 D3 D4 D5 D6 D7 D8 D9
P10 P20 P25 P30 P40 P50 P60 P70 P75 P80 P90
63
Contoh:
n× j
Posisi D j :
10
60 ×1
Posisi D1 : =6
10
60 × 3
Posisi D3 : = 18
10
60 × 7
Posisi D7 : = 42
10
64
2
LAMPIRAN 3C: NOTASI ∑ ( xi - x ) DAN ∑ ( xi - x )
A. ∑ ( xi − x ) = ∑ xi ‒ ∑ x
Karena x = ∑ i , sehingga ∑ x
x
i = n x ; dan pada pengambilan satu
n
sampel, x merupakan konstante, sehingga ∑ x = n x , maka:
∑ ( xi − x ) = ∑ xi ‒ ∑ x
=nx ‒nx =0
∑ ( xi − x ) ∑ ( xi2 − 2 xxi + x 2 )
2
B. =
= ∑ xi2 ‒ 2 x ∑ xi + ∑ x 2 [ x dan x 2 konstante]
= ∑ xi2 ‒ ( 2 x ) ( nx ) + n x 2
= ∑ xi2 ‒ 2n x 2 + n x 2
= ∑ xi2 ‒ n x 2
2
∑ xi
= ∑ x ‒ n
2
i n
2
( ∑ xi )
= ∑ xi
2
‒
n
65
LAMPIRAN 3D: DIAGRAM KOTAK
Diagram kotak (diagram kotak-dan-titik; box−plot;
box−and−whisker plot) adalah bentuk grafik yang menyajikan peringkasan
data dalam bentuk kuartil pertama, median, dan kuartil ketiga. Secara kasar
dapat dilihat apakah sebaran data simetris atau tidak, selain itu disajikan pula
‘nilai perbatasan bawah’ (lower adjacent value) dan ‘nilai perbatasan atas’
(upper adjacent value) yang antara lain berguna untuk menyimpulkan ada
tidaknya ‘data pencilan’ (outlier).
x 13 x 14 x 15 x 16 x 17 x 18 x 19 x 20 x 21 x 22 x 23
( ) ( ) ( ) ( ) ( ) ( ) ( ) ( ) ( ) ( ) ( )
22 23 23 23 23 23 23 23 24 24 24
x 24 x 25 x 26 x 27 x 28 x 29 x 30 x 31 x 32 x 33 x 34
( ) ( ) ( ) ( ) ( ) ( ) ( ) ( ) ( ) ( ) ( )
24 25 25 25 25 25 26 26 26 27 27
x 35 x 36 x 37 x 38 x 39 x 40 x 41 x 42 x 43 x 44 x 45
( ) ( ) ( ) ( ) ( ) ( ) ( ) ( ) ( ) ( ) ( )
28 28 29 29 29 30 31 31 32 32 37
n 45 1
Posisi Q1 = = = 11 ≈ 11
4 4 4
Q1 = x 11 = 21
( )
Posisi Q2 = Med =
2n
=
( 2 )( 45) = 22 1
4 4 2
x 22 + x 23
( ) ( )
Q2 = Med = = 24
2
66
Posisi Q3 =
3n
=
( 3)( 45 ) = 33 3 ≈ 34
4 4 4
Q3 = x 34 = 27
( )
IQR (rentang inter-kuartil) = Q3 – Q1 = 27 – 21 = 6
1.5 IQR = (1.5)(6) = 9
67
Diagram III.5. Diagram kotak skala Depresi MMPI-2 45
mahasiswa wanita Psikologi Gunadarma 2003
68
LATIHAN 3
Bagian Pertama
69
6. Keunggulan median antara lain yaitu:
A. Tidak dipengaruhi oleh data ektrim
B. Dapat digunakan untuk menentukan ukuran pusat data kategorik
C. A) dan B) benar
D. A) dan B) salah
70
n
13. ∑
i =1
( xi − x )
A. Selalu lebih besar daripada nol
B. Selalu sama dengan nol
C. Dapat lebih kecil daripada nol
D. Semuanya salah
n
∑
2
14. ( xi − x ) =
i =1
2
n
n ∑ xi
A. 0 C. ∑ xi ‒ i =1
2
i =1 n
n
B. ∑
i =1
xi2 + nx 2 D. Semuanya salah
71
19. Diagram kotak antara lain berguna untuk:
A. Menilai simetris atau tidaknya sebaran data
B. Menilai ada tidaknya data pencilan
C. Keduanya benar
D. Keduanya salah
Bagian Kedua
2. Mediannya adalah:
A. 71.50 C. 74.00
B. 73.00 D. 78.00
3. Modusnya yaitu:
A. 71.50 C. 74.00
B. 73.00 D. 78.00
72
5. Rentang-nya (rentang) adalah:
A. 22.5 C. 25
B. 24 D. 27
n
6. Jika diketahui ∑
i =1
xi2 = 62.058, dengan menggunakan pembagi (n – 1)
i xi xi2
1 ... 2500
2 75 ...
3 64 ...
4 ... ...
5 ... 6400
∑ xi = . . . ∑ xi2 = . . .
2
( ∑ xi ) =...
73
n
10. ∑
i =1
xi =
A. 330 C. 63 800
B. 22 342 D. 108 900
n
11. ∑
i =1
xi2 =
A. 330 C. 63 800
B. 22 342 D. 108 900
2
n
12. ∑ xi =
i =1
A. 330 C. 63 800
B. 22 342 D. 108 900
4
∑
2
13. ( 2 xi + 12 ) =
i =2
A. 330 C. 63 800
B. 22 342 D. 108 900
14. s=
A. 10.6 C. 112.4
B. 11.9 D. 140.5
Bagian Ketiga
Selesaikanlah soal-soal berikut:
Lihat kembali soal Latihan 2 Bagian Kedua. Hitunglah rerata,
variansi, dan standar deviasi penghasilan bulanan 84 keluarga di desa B:
A. Sebagai data tak berkelompok
B. Sebagai data berkelompok.
Petunjuk:
- Untuk soal A, gunakan rumus operasional. ∑ xi dan ∑ xi2 dihitung
dengan menggunakan program komputer Excel.
- Untuk soal B, gunakan tabel distribusi frekuensi yang telah disusun pada
soal Latihan 2 Bagian Kedua.
74
BAB 4
PROBABILITAS
4.1 KONSEP DASAR PROBABILITAS
Himpunan (set)
a. Himpunan berhingga. Contoh:
− A adalah himpunan mahasiswa kelompok I mata kuliah Statistika
kelas 2PA01, maka:
A = {Agustin, Anita, Endang, . . . , Yenny}
− B adalah himpunan buah yang dijual di sebuah supermarket,
maka:
B = {jeruk, pepaya, melon, . . .}
− C adalah angka-angka yang tampak di permukaan sebuah dadu,
maka:
C = {1, 2, 3, 4, 5, 6}
b. Himpunan tak berhingga:
− D adalah himpunan nilai-nilai IP semester yang mungkin
diperoleh mahasiswa Gunadarma, maka:
D = {x | 0 < x < 4}
(dibaca: x adalah sedemikian hingga x lebih besar atau sama
dengan nol dan x lebih kecil atau sama dengan empat)
75
Ruang sampel ditulis dengan lambang ‘S’ ( = semesta), peristiwa
dengan huruf besar A, B, C, . . . . Jika suatu percobaan menghasilkan n
kemungkinan peristiwa, ruang sampelnya disajikan sebagai:
S = { a1 , a2 , . . . , an } (4.1)
dengan a1 , a2 , . . . , an menyatakan semua hasil yang mungkin terjadi pada
percobaan itu. A = { a2 , a4 } menunjukkan peristiwa yang hanya terdiri dari
hasil a2 dan a4
Contoh 4.1:
1) Percobaan : Pelontaran sebuah dadu
Hasil : Mata dadu yang tampak di atas.
Ruang sampel S = {1, 2, 3, 4, 5, 6}
Salah satu peristiwa : A = titik ganjil tampak
= {1, 3, 5}
2) Percobaan : Pelontaran sebuah mata uang logam dua kali.
Salah satu hasil : MB (hasil pelontaran pertama adalah muka,
dan hasil pelontaran kedua adalah belakang.
Ruang sampel : S = {MM, MB, BM, BB}
Contoh peristiwa : A = paling sedikit satu muka
= {MM, MB, BM}
B = kedua hasil sama
= {MM, BB}
76
dadu merah, j menyatakan titik yang tampak
di atas pada dadu putih.
Ruang sampel : S = 6 × 6 pasangan berurut (i, j) dengan i = 1,
2, 3, 4, 5, 6 dan j = 1, 2, 3, 4, 5, 6.
Contoh peristiwa:
a) A = jumlah titik yang tampak sama dengan 7
= {(1, 6), (2, 5), (3, 4), (4, 3), (5, 2), (6, 1)}
b) B = kedua hasil sama
= {(1, 1), (2, 2), (3, 3), (4, 4), (5, 5), (6, 6)}
77
Diagram 4.1. Diagram Venn: union, interseksi, komplemen
Contoh 4.2:
1) Sebuah kartu diambil secara acak dari satu dek kartu bridge.
Didefinisikan peristiwa-peristiwa berikut:
A = kartu yang terambil adalah Ace.
B = kartu yang terambil adalah ♥
C = kartu yang terambil adalah .
D = kartu yang terambil adalah Merah
E = kartu yang terambil adalah Hitam
Maka:
B ∪C = kartu yang terambil adalah ♥ atau
B ∩C = karena satu kartu tidak dapat berupa ♥ dan
sekaligus.
B ∪C ∪ E = S = D ∪ E
A∩C = kartu yang terambil adalah Ace
C
D = kartu yang terambil bukan Merah = E
78
C
(B ∪C) = DC = E
∅ adalah himpunan kosong yang tak mempunyai anggota, = {}.
2) Jika sebuah dadu dilemparkan, dan A = {1, 3, 5}; B = {1}; dan C = {2,
4, 6}, maka:
A ∪ C = {1, 2, 3, 4, 5, 6} = S
AC = {2, 4, 6} = C
A ∪ B = {1, 3, 5} = A
B ∪ C = {1, 2, 4, 6}
A∩C = ∅
A ∩ B = {1} = B
BC = {2, 3, 4, 5, 6}
C
B ∩ A = {3, 5}
Hukum De Morgan:
C
a) ( A ∪ B) = AC ∩ BC (4.2.a)
C
b) ( A ∩ B) = AC ∪ BC (4.2.b)
Hukum distributif:
a) A ∩ ( B ∪ C ) = ( A ∩ B) ∪ ( A ∩ C ) (4.3.a)
b) A ∪ ( B ∩ C ) = ( A ∪ B) ∩ ( A ∪ C ) (4.3.b)
Partisi:
Misalkan dimiliki himpunan A dengan sejumlah himpunan bagian-
nya A1 , A 2 , . . . , An ..
79
a) Himpunan-himpunan bagian A1 , A 2 , . . . , An dikatakan ‘saling
asing’ (mutually exclusive) jika Ai ∩ Aj = ∅ untuk setiap pasangan
nilai (i, j); i = 1, 2, . . . , n; j = 1, 2, . . . , n; i ≠ j.
b) Himpunan-himpunan bagian A1 , A 2 , . . . , An dikatakan ‘terbagi
habis’ (mutually exclusive) jika A1 ∪ A 2 ∪ . . . ∪ An = A.
Contoh 4.3:
1) Jika A adalah peristiwa ‘banyaknya titik ganjil’ pada satu kali
pelontaran sebuah dadu, maka N(A) = 3 dan N(S) = 6, sehingga P(A) =
3/6 = 1/2. Demikian juga P(1) = 1/6 dan P(genap) = 3/6 = 1/2.
2) Dalam pelontaran dua buah dadu, peristiwa ‘berpasangan’ [{1, 1}, {2,
2}, . . . , {6, 6}] terdiri atas 6 unsur. Karena seluruhnya ada 36 unsur
dalam ruang sampelnya (= 62), maka P (berpasangan) = 6/36 = 1/6.
Juga P (jumlah genap) = 18/36 = 1/2.
Untuk setiap peristiwa A, berlaku:
0 < P (A) < 1 (4.5)
80
Selanjutnya:
N (∅ ) 0
P (∅) = = =0 (4.5.a)
N (S ) N (S )
dan:
N (S )
P (S) = =1 (4.5.b)
N (S )
N ( A ∪ B) N ( A) N ( B) ( A ∩ B)
= + –
N (S ) N (S ) N (S ) N (S )
atau: (
P (B) = P ( B ∩ A) + P B ∩ AC ) (4.9.b)
81
Definisi Probabilitas
Misalkan ruang sampel S suatu percobaan terdiri atas N unsur [ a1 , a2 ,
. . . , a N ] dan misalkan pula p1 , p2 , . . . , pN adalah bilangan-bilangan non-
negatif yang jumlahnya sama dengan 1. Untuk suatu peristiwa A (himpunan
bagian S), probabilitasnya didefinisikan sebagai:
P (A) = ∑ pi (4.10)
dengan pi menyatakan proporsi tiap hasil ai ; ai adalah unsur yang
termasuk dalam A.
Contoh 4.4:
1) Sebuah dadu dibuat sedemikian hingga dalam jangka panjang sisi dadu
akan tampak di atas dalam proporsi (frekuensi relatif) sebagai berikut:
S = {1, 2, 3, 4, 5, 6}
A = titik genap = {2, 4, 6}
P(A) = p2 + p4 + p6
= 0.18 + 0.16 + 0.20 = 0.54
C
A = titik ganjil = {1, 3, 5}
P(AC) = p1 + p3 + p5
= 0.13 + 0.18 + 0.15 = 0.46 = 1 – P(A)
2) Sebuah bola diambil secara acak dari sebuah kotak berisi 34% bola
merah, 27% bola putih, 20% bola biru, dan 19% bola hitam. Jika a1
menyatakan peristiwa yang terambil bola merah, a2 putih, a3 biru, dan
a4 hitam, maka ruang sampelnya adalah S = { a1 , a2 , a3 , a4 } dengan
p1 = 0.34, p2 = 0.27, p3 = 0.20, dan p4 = 0.19; ∑ pi = 1.
Misalkan A = bola yang terpilih tidak hitam, maka:
P(A) = p1 + p2 + p3
= 0.34 + 0.27 + 0.20 = 0.81 = 1 − p4
3) Pada pelontaran sepasang dadu, misalkan yang diperhatikan adalah
jumlah titik keduanya. Ruang sampel yang terjadi yaitu S yang
82
memiliki 11 unsur: S = { a2 , a3 , . . . , a12 }. Diperoleh distribusi nilai
probabilitas sebagai berikut:
Hasil a2 a3 a4 a5 a6
Prob. 1/36 2/36 3/36 4/36 5/36
Contoh 4.5:
a) Sebuah dadu dilontarkan dua kali berturut-turut. Lontaran pertama
dapat memberikan 6 hasil yang mungkin. Untuk tiap hasil ini, pada
lontaran kedua dapat terjadi 6 hasil yang mungkin.
b) Seorang pria mempunyai 5 kemeja, 3 celana, dan 2 pasang sepatu.
Maka banyak cara ia dapat berpakaian secara berbeda adalah 5 × 3
× 2 = 30.
2) Banyak susunan atau urutan berbeda yang dapat dibentuk oleh k objek
yang diambil dari sekumpulan n objek yang berbeda dinamakan banyak
permutasi k objek dari n objek (dengan memperdulikan urutannya;
dinyatakan dengan lambang Pnk , dihitung dengan rumus:
83
n!
Pkn = (4.11)
( n − k )!
= [(n – k) + 1] . [(n – k) + 2] . [(n – k) + 3] . . . (n – 2) .
(n – 1) . n
Contoh 4.6:
Banyak bilangan tiga digit yang dapat dibentuk dengan
menggunakan angka-angka 1, 2, 3, 4, 5 adalah:
‒ Tanpa pengulangan:
P35 = 3 . 4 . 5 = 60
‒ Dengan pengulangan:
5 . 5 . 5 = 125
3) Banyak kombinasi k objek yang diambil dari n objek yang berbeda
(tanpa memperdulikan urutannya; dinyatakan dengan lambang Ckn )
adalah:
n!
Ckn = (4.13)
k !( n − k ) !
Contoh 4.7:
Misalkan dimiliki lima bola dengan warna berbeda-beda. Jika
diambil tiga bola dari kumpulan lima bola itu, banyak kombinasi yang
mungkin adalah:
5!
C35 = = 10
3!2!
84
Perhatikan:
Aturan permutasi digunakan jika peristiwa yang disebutkan memiliki
urutan tertentu pada hasil percobaan. Jika urutan itu tidak penting, digunakan
aturan kombinasi.
Probabilitas Bersyarat
Misalkan A dan B dua peristiwa dengan P(B) > 0, maka probabilitas
bersyarat (conditional probability) peristiwa A dengan syarat (jika diketahui)
B terjadi adalah:
P ( A ∩ B)
P ( A B) = (4.14)
P (B)
Contoh 4.8:
1) Misalkan dalam sebuah populasi yang terdiri dari 1000 orang memiliki
data berikut:
Buta warna Normal Jumlah
680
P (A ) = = 0.68
1000
135
P (B ) = = 0.135
1000
Probabilitas yang dipilih buta warna, jika diketahui ia seorang pria,
adalah:
60 3
P ( B A) = =
680 34
Tampak bahwa:
N ( A ∩ B) N ( A ∩ B) N (S )
P ( B A) = =
N ( A) N ( A) N ( S )
85
P ( A ∩ B)
P ( B A) = (4.14.a)
P ( A)
2) Sebuah kartu dipilih secara acak dari satu dek kartu bridge, dan
ternyata diperoleh kartu Merah.
a) Probabilitas kartu itu Ace adalah:
P ( Ace | Merah )
P (Ace|Merah) =
P ( Merah )
2 52 1
= = = P(Ace)
26 52 13
b) Probabilitas kartu itu ♥ (Hati) adalah:
P ( Hati ∩ Merah ) 13 52 1
P(Hati|Merah) = = =
P ( Merah ) 26 52 2
13 1
≠ P(Hati) = =
52 4
P ( B | A) = P ( B ) (4.15.b)
Contoh 4.9:
1) Sebuah kartu diambil secara acak dari satu dek kartu bridge, lalu
dikembalikan, kartu dikocok kembali, lalu diambil kartu kedua secara
acak (sampling dengan pengembalian).
Misalkan A1 adalah peristiwa ‘diperoleh Ace pada pengambilan
pertama’, dan A2 adalah peristiwa ‘diperoleh Ace pada pengambilan
kedua’, maka:
86
4
P(A1) = P(A2) =
52
4 4
P ( A1 ∩ A2 ) = = P(A1) . P(A2)
52 52
Jadi A1, A2 independen.
2) Dua kartu diambil secara acak dari satu dek kartu bridge, kartu pertama
tidak dikembalikan terlebih dahulu pada pengambilan kartu kedua
(sampling tanpa pengembalian), maka probabilitas kedua kartu adalah
Ace:
P ( A1 ∩ A2 ) = P(A1) . P(A2|A1)
4 3 1 1 1
= = =
52 51 13 17 221
3) Sebuah kotak berisi 100 bola, di antaranya hitam dan 40 sisanya putih.
Di antara 100 bola ini, 70 bernomor 0 dan 30 sisanya bernomor 1.
Diketahui pula 42 bola berwarna hitam dan bernomor 0.
Misalkan sebuah bola diambil secara acak, probabilitas bola itu
bernomor 0 (peristiwa A) dan berwarna hitam (peristiwa B) adalah:
42
P ( A ∩ B) = = 0.42
100
70
P(A) = = 0.7
100
60
P(B) = = 0.6
100
P ( A ∩ B ) = P(A) . P(B), sehingga peristiwa A, B independen.
Seandainya ada 48 bola yang berwarna hitam dan bernomor 0, maka:
48
P ( A ∩ B) = = 0.48
100
≠ P(A) . P(B) = (0.7)(0.6) = 0.42
87
LAMPIRAN 4A: SALING ASING DAN INDEPENDEN
A. Saling asing
Dua peristiwa A dan B dikatakan saling asing jika:
- Keduanya memuat unsur (unsur-unsur) yang seluruhnya berasal dari
satu semesta, dengan kata lain memuat unsur-unsur yang berasal dari
satu ruang sampel.
- Kedua peristiwa tidak memiliki unsur persekutuan.
Contoh:
Pada satu kali pelontaran dadu, semestanya adalah {1, 2, 3, 4, 5, 6}
- Misalkan A = {1, 3, 5} dan B = {2, 4, 6}, maka A dan B saling asing.
- Misalkan pula C = {3, 4, 6}, maka A dan C tidak saling asing.
B. Saling independen
Dua peristiwa A dan B dikatakan saling independen jika:
‾ Unsur-unsur peristiwa berasal dari semesta yang berbeda, dengan kata
lain unsur-unsur pada kedua peristiwa merupakan hasil yang mungkin
pada dua percobaan yang berbeda.
‾ Ruang sampel keduanya dapat digabungkan menjadi satu ruang sampel
‘bersama’.
Contoh:
- Misalkan menyatakan hasil yang diperoleh pada pelontaran sebuah
dadu, A = {1, 2, 3, 4, 5, 6}; B menyatakan hasil pelontaran sebuah mata
uang, B = {Muka, Belakang}, maka A dan B saling independen. Kedua
ruang sampel dapat digabungkan menjadi {(1, Muka), (1, Belakang),
(2, Muka), . . . , (6, Belakang)}.
- Sebuah kotak berisi 6 bola merah dan 4 bola hitam. Dua buah bola
diambil berturut-turut tanpa pengembalian. Misalkan A menyatakan
hasil pada pengambilan bola pertama, A = {Merah, Hitam}, dan B hasil
pada pengambilan bola kedua, tidak saling independen, karena
probabilitas hasil-hasil B tergantung pada hasil peristiwa A. Kedua
88
ruang sampel dapat digabungkan menjadi {(Merah, Merah), (Merah,
Hitam), (Hitam, Merah), (Hitam, Hitam)}.
89
LAMPIRAN 4B: TEOREMA BAYES
Misalkan B merupakan dua peristiwa yang tidak independen dalam
ruang sampel S maka:
P ( A ∩ B)
P(A|B) =
P (B)
P ( A ∩ B)
Dari: P(B|A) =
P ( A)
diperoleh: P ( A ∩ B ) = P(A) . P(B|A)
P ( A) P ( B | A)
sehingga: P(A|B) =
P ( B)
Selain itu denominator (penyebut) P ( B ) dapat dijabarkan menjadi:
(
P(B) = P ( B ∩ A ) + P B ∩ AC )
(hukum probabilitas total)
= P(A) . P(B|A) + P(A ) . P(B|AC)
C
Contoh:
Pada berbagai uji diagnostik di bidang kesehatan umumnya dimiliki
dua parameter, yaitu sensitivitas dan spesifisitas. Sensitivitas adalah
probabilitas bahwa seseorang menunjukkan hasil uji positif dengan syarat ia
sakit (menderita penyakit yang diperiksa dengan uji diagnostik tersebut):
Sn = P ( pos | sakit )
sedangkan spesifisitas adalah probabilitas seseorang menunjukkan hasil uji
negatif dengan syarat ia tidak sakit:
Sp = P ( neg | tidak sakit )
90
Dalam praktik, dengan memperoleh hasil uji positif atau negatif, yang
ingin diketahui ialah probabilitas seseorang menderita penyakit dengan
syarat hasil ujinya positif, yaitu P ( sakit | pos ) ataupun probabilitas
seseorang tidak menderita penyakit dengan syarat hasil ujinya negatif, yaitu
P ( tidak sakit | neg ) . Probabilitas ini dapat dihitung jika diketahui proporsi
penderita penyakit tersebut dalam populasi, yaitu probabilitas tidak bersyarat
untuk menderita penyakit tersebut.
Misalkan suatu uji diagnostik untuk penyakit DM (Diabetes Melitus)
diketahui memiliki sensitivitas sebesar 90% dan spesifisitas 70%, dan
diketahui pula proporsi penderita DM dalam populasi adalah 8%, maka:
Didefinisikan:
A : peristiwa subjek menderita DM
AC : peristiwa subjek sehat (tidak menderita DM)
B : peristiwa subjek menunjukkan hasil uji positif
BC : peristiwa subjek menunjukkan hasil uji negatif dan diketahui
bahwa:
P(B|A) = P ( pos | DM ) = Sn = 0.90
( )
P BC | AC = P ( neg | sehat ) = Sp = 0.70
P ( A) = P ( DM ) = 0.08
Selanjutnya:
( )
P BC | A = P ( neg | DM ) = 1 ‒ Sn = 1 ‒ 0.90 = 0.10
dan: P ( B ) = P ( A ) P ( B A) + P ( A ) P ( B | A )
C C
Sehingga:
P ( A) P ( B A)
P(A|B) =
P ( B)
91
P ( DM ) P ( pos DM )
atau: P ( DM pos ) =
P ( Pos )
=
( 0.08 )( 0.90 ) = 0.2069 = 20.69%
0.348
Kemudian:
P B C = P ( A ) P B C A + P AC P B C AC
( ) ( )
P ( neg ) = P ( DM ) P ( neg DM ) + P ( sehat ) P ( neg sehat )
= (0.08)(0.10) + (0.92)(0.70) = 0.652
Sehingga:
P AC P BC AC
( )
P AC BC
P BC ( )
P ( sehat ) P ( neg sehat )
atau: P ( sehat neg ) =
P ( neg )
=
( 0.92 )( 0.70 ) = 0.9877 = 98.77%
0.652
Maka disimpulkan bahwa seseorang yang hasil ujinya positif hanya
memiliki probabilitas sebesar 20.69% untuk menderita DM, sebaliknya
seseorang yang hasil ujinya negatif memiliki probabilitas sebesar 98.77%
untuk tidak menderita DM.
92
LATIHAN 4
Bagian Pertama
Pilihlah satu jawaban yang paling benar!
A. A ∩ (B ∪ C)
B. AC ∩ (B ∪ C)
C. (A ∩ B) ∪ C
D. (A ∩ B) ∪ (B ∩ C) ∪ (A ∩ C)
93
6. Pada pelontaran sebuah dadu, A menyatakan yang tampak di atas
adalah angka ganjil, B menyatakan yang tampak di atas adalah angka
genap, C menyatakan angka yang tampak di atas lebih besar daripada
5, dan S menyatakan semesta (universe), maka:
A. A ∪ B = S C. B ∪ C = C
B. A ∩ C = S D. B ∩ C = C
1 1 = 1 1 1 = 7
B. 4
3 4 3 D. 7
6 6
36
94
10. Sebuah dadu dan sebuah koin, keduanya setimbang, dilontarkan
bersama-sama. Probabilitas untuk mendapatkan angka lebih besar
daripada 4 pada dadu dan sisi belakang koin bersama-sama adalah:
1 1 4 2 1 5
A. + = C. + =
6 2 6 6 2 6
1 1 1 2 1 1
B. . = D. . =
6 2 12 6 2 6
Bagian Kedua
Pilihlah satu jawaban yang paling benar!
1. Banyaknya bilangan bulat antara 100−1000 dengan tidak ada digit yang
sama adalah:
A. 648 C. 9(P10)
B. 900 D. 10( P 29 )
2
2. Dua belas pertanyaan dalam ujian harus dijawab dengan B (benar) atau
S (salah). Seorang mahasiswa mencoba menjawab secara acak dengan
6 jawaban B dan 6 jawaban S. Ada berapa cara seperti ini?
A. 900 C. 924
B. 920 D. 1000
95
3. Grup A, B, dan C berturut-turut mempunyai 57, 49, dan 43 orang
anggota. A dan B mempunyai 13 anggota bersama; A dan C mempunyai
7 anggota bersama; B dan C 4 anggota bersama; 1 orang anggota dari
ketiga grup. Probabilitas mendapatkan 1 orang anggota ketiga grup
adalah:
1 1
A. C.
126 151
1 1
B. D.
148 160
B.
( 48)(5) D.
C5
48
52
C5 52
96
6. Satu tahun dianggap terdiri atas 365 hari. Probabilitas paling sedikit 2
orang di antara 5 orang mempunyai tanggal lahir yang sama adalah:
1
A.
5
365
1
B. 1−
5
365
C.
( 365)(364)(363)(362)( 361)
5
365
D. 1−
( 365)(364)(363)(362)( 361)
5
365
7.
Tiga kotak; I, II, dan III masing-masing berisi sejumlah bola putih (p)
dan merah (m). Dari kotak I diambil 1 bola, dimasukkan dalam kotak
II. Kemudian dari kotak II diambil 1 bola, dimasukkan ke dalam kotak
III. Selanjutnya 1 bola diambil dari kotak III. Probabilitas untuk
mendapatkan bola merah pada pengambilan ketiga adalah:
416 418
A. C.
630 630
417 419
B. D.
630 630
97
8. Dari 52 kartu bridge diambil setiap kali 1 kartu berturut-turut tanpa
pengembalian. Berapa probabilitas kartu wajik (diamond) tampak
ketiga kalinya pada pengambilan ke-6?
13
C2 C3
39 13
C 2 C3 11
39
A.
C5
52
C.
C5 47
52
13
C 2 C3
39
13 C 2 C3 10
13 39
B.
52 D.
C5 39
52 52
C5
Bagian Ketiga
Selesaikanlah soal-soal berikut!
1. Jika sebuah dadu dilontarkan, dan A = {1, 3}, B = {2, 5, 6}, dan C = {4,
5}, maka:
A. A ∪ B = E. CC =
B. A ∩ B = F. (A ∩ B)C =
C. A ∪ C = G. (B ∪ C)C =
D. A ∩ C = H. (A ∩ C)C =
3. Di antara 600 orang laki-laki dewasa di desa ‘X’, terdapat 6 orang tuna
aksara, sedangkan di antara perempuan dewasanya didapatkan 8 orang
tuna aksara. Jumlah penduduk dewasa di desa ‘X’ adalah 1000 orang.
Jika seorang penduduk dewasa dipilih secara acak dari desa ‘X’,
hitunglah probabilitas bahwa ia laki-laki dengan syarat ia buta huruf.
98
4. Diketahui 3 peristiwa A, B, dan C. A dan B saling independen, B dan C
saling asing. P (A), P (B), dan P (C) masing-masing adalah 0.5, 0.3,
dan 0.1. Nyatakan peristiwa berikut dalam notasi probabilitas dan
hitunglah probabilitasnya:
A. B dan C keduanya terjadi.
B. Paling sedikit salah satu dari A dan B terjadi
C. B tidak terjadi
D. Ketiga peristiwa terjadi
99
BAB 5
DISTRIBUSI TEORETIS
Contoh 5.1:
Percobaan melontarkan mata uang logam tiga kali menghasilkan ruang
sampel berikut:
MMM MMB MBB BBB
S= MBM BMB
BMM BBM
Jika mata uang logam seimbang, delapan unsur ruang sampel memiliki
probabilitas sama besar, masing-masing dengan probabilitas 1/8.
Misalkan variabel random X adalah ‘banyak M dalam tiap unsur’,
maka:
X (MMM) = 3
X (MMB) = X (MBM) = X (BMM) = 2
X (MBB) = X (BMB) = X (BBM) = 1
X (BBB) = 0
Contoh 5.2:
Seorang mahasiswa dipilih secara acak dari kelas yang beranggotakan
30 mahasiswa. Ruang sampelnya terdiri atas 30 mahasiswa, dinyatakan
sebagai S = { a1 , a2 , . . . , a30 }.
Misalkan variabel random Y (a) menyatakan indeks prestasi mahasiswa
a, dan IP mahasiswa a1 = 3.16, IP mahasiswa a2 = 2.43, dan seterusnya,
maka:
100
Y ( a1 ) = 3.16 ; Y ( a2 ) = 2.43 ; dan seterusnya
Suatu variabel random yang hanya dapat menjalani nilai-nilai berbeda
yang banyaknya berhingga (data diskret) disebut variabel random diskret.
Suatu variabel random yang dapat menjalani setiap nilai (tak berhingga
banyaknya) dalam suatu interval (data kontinu) disebut variabel random
kontinu.
Pada contoh 5.1 di atas, X hanya dapat menjalani nilai-nilai dalam
himpunan terhingga {0, 1, 2, 3}. Jadi X adalah variabel random diskret.
Pada contoh 5.2 di atas, Y(a) dapat menjalani setiap nilai yang tak
berhingga banyaknya, antara 0 dan 4, termasuk. Jadi Y (a) adalah variabel
random kontinu.
Distribusi Probabilitas
Lihat kembali hasil tiga kali pelontaran mata uang di atas. Ruang
sampelnya adalah:
MMM MMB MBB BBB
S= MBM BMB
BMM BBM
Dengan asumsi mata uang seimbang, sehingga tiap unsur memiliki
probabilitas sebesar 1/8 untuk terjadi, maka diperoleh distribusi
probabilitas diskret berikut:
101
Nilai Harapan dan Variansi
Rerata suatu variabel random X atau distribusi probabilitasnya,
dinamakan juga nilai harapan X dan dituliskan E [X].
Jika X dapat menjalani nilai-nilai yang mungkin X1 , X 2 , . . . ,
dengan probabilitas masing-masing f ( X i ) = P [X = X i ], maka nilai harapan
X adalah:
n
E [X] = rerata X = µ = ∑
i =1
Xi f ( Xi ) (5.1)
Contoh 5.3:
Misalkan variabel random X menyatakan jumlah anak dalam tiap
keluarga di negara Rusia, dan distribusi probabilitasnya diketahui,
perhitungan nilai harapan X = rerata X dapat dilakukan seperti terlihat pada
tabel 5.2 berikut:
Contoh 5.4:
Dalam suatu permainan dadu yang dinyatakan ‘seimbang’, untuk
bermain satu lemparan, pemain harus membayar C ribu rupiah dan akan
menerima uang (dalam ribuan rupiah) sebanyak titik yang tampak di atas
pada hasil pelemparan dadu tersebut. Misalkan variabel random X
menyatakan jumlah uang (dalam ribuan rupiah) yang diterima pemain,
distribusi probabilitasnya adalah:
102
Tabel 5.3. Distribusi probabilitas jumlah uang yang diterima pemain
pada permainan dadu seimbang
Nilai X 1 2 3 4 5 6
Prob X 1/6 1/6 1/6 1/6 1/6 1/6
E [X] = 1/6 (1 + 2 + 3 + 4 + 5 + 6)
= 3.5 = Rp. 3,500
Maka permainan dapat dinyatakan ‘adil’ jika C = Rp. 3,500, sehingga
banyak uang yang diterima pemain dalam jangka panjang akan sama dengan
banyak uang uang yang dibayar untuk bermain.
Var ( X ) = E [ X − µ ]2 = E X 2 ‒ µ 2 (5.5)
Var ( X ) = E X 2 ‒ ( E [ X ])
2
atau: (5.5.a)
Standar deviasi variabel random X atau distribusi probabilitasnya,
dituliskan SD (X) atau σ , adalah akar variansi variabel random X atau
distribusi probabilitasnya.
Contoh 5.5:
Misalkan variabel random X menyatakan jumlah penjualan HP merek
N per hari. Distribusi probabilitasnya dan perhitungan variansinya
diperlihatkan pada tabel 5.4 berikut:
103
Tabel 5.4. Distribusi probabilitas jumlah penjualan HP merek N
dan perhitungan variansinya
Xi f ( Xi ) Xi f ( Xi ) X i2 f ( X i )
0 0.1 0.0 0.0
1 0.1 0.1 0.1
2 0.2 0.4 0.8
3 0.3 0.9 2.7
4 0.2 0.8 3.2
5 0.1 0.5 2.5
Var ( X ) = E X 2 ‒ ( E [ X ])
2
= 9.3 – (2.7)2 = 2.01
SD (X) = 2.01 = 1.42
Dengan transformasi:
X − µx
Z= (5.10)
σx
maka variabel random X dengan rerata µ x dan standar deviasi σ x menjadi
variabel random Z yang mempunyai rerata 0 dan standar deviasi 1. Variabel
random Z ini dinamakan variabel random standar.
E (Z) = 0 (5.10.a)
Var (Z) = 1 (5.10.b)
104
Contoh 5.6:
Misalkan variabel random X menyatakan banyak penjualan HP merek
N per hari dan variabel random Y menyatakan keuntungan bersihnya sebagai
fungsi X:
Y = 5,000 X – 2,000
Maka: E [Y] = E [5,000 X – 2,000]
= 5,000 E [X] – 2,000
= (5,000)(2.7) – 2,000 = 11,500
Var (Y) = Var [5,000 X – 2,000]
= 5,0002 Var (X)
= (5,0002)(2.01) = 50,250,000
SD (Y) = 50, 250, 000 = 7,088.72
105
Diagram 5.1. Contoh grafik distribusi uniform
Distribusi Binomial
Distribusi binomial dapat dianggap sebagai hasil percobaan yang
diulang-ulang, yang memenuhi syarat sebagai ‘Bernoulli trials’.
Contoh 5.7:
Misalkan dilakukan Bernoulli trials sebanyak n kali, dengan
probabilitas sukses p pada tiap percobaan. Variabel random X menyatakan
banyak sukses dalam n kali percobaan tersebut, maka distribusi probabilitas
X dikatakan berdistribusi binomial dengan n kali percobaan dan probabilitas
sukses p.
Misalkan dilakukan n = 4 kali percobaan, maka semua hasil yang
mungkin adalah sebagai berikut:
106
TTTT TTTS SSTT SSST SSSS
TTST STST SSTS
TSTT STTS STSS
STTT TSST TSSS
TSTS
TTSS
Distribusi probabilitasnya diperlihatkan pada tabel 5.5 berikut:
0 C04 = 1 p0 q4 = q4
1 C14 = 4 p1 q 3 = p q 3
2 C24 = 6 p 2 q2
3 C34 = 4 p 3 q1 = p 3 q
4 C44 = 1 p4 q0 = p4
P (X = x) = Cxn p x q n − x ; x = 0, 1, . . . , n (5.13)
107
Contoh 5.8:
Sepasang suami isteri yang baru menikah merencanakan untuk
memperoleh empat orang anak. Jika rencananya mungkin terlaksana dan
diketahui probabilitas untuk memperoleh anak laki-laki dalam tiap kelahiran
adalah 0.51, maka:
a. Probabilitas untuk memperoleh empat orang anak laki-laki:
P (X = 4) = C44 p 4
= (1)(0.514) = 0.0677
b. Probabilitas untuk memperoleh tiga orang anak laki-laki:
P (X = 3) = C34 p 3 q
= (4)(0.513)(0.49) = 0.2600
c. Probabilitas untuk memperoleh dua orang anak laki-laki:
P (X = 2) = C24 p 2 q 2
= (6)(0.512)(0.492) = 0.3747
d. Probabilitas untuk memperoleh paling sedikit dua orang anak laki-laki:
P (X > 2) = P (X = 2) + P (X = 3) + P (X = 4)
= 0.3747 + 0.2600 + 0.0677 = 0.7024
Nilai-nilai probabilitas distribusi binomial dapat dilihat tabel
probabilitas binomial (Addendum B1). Untuk menjelaskan
penggunaannya, diperlihatkan cuplikan tabel binomial pada tabel 5.6 berikut.
Misalnya:
• Untuk n = 2 dan p = 0.01 : P (X = 1) = 0.0198
• Untuk n = 3 dan p = 0.40 : P (X = 2) = 0.2880
• Untuk n = 25 dan p = 0.99 P (X = 25) = 0.778
Kebanyakan tabel binomial tidak menyajikan nilai-nilai probabilitas
untuk p > 0.50.
Perhatikan bahwa:
P (X = x | p) = P (X’ = n – x | p’ = 1 – p);
yaitu probabilitas untuk mendapatkan x kali sukses P (X = x) adalah sama
dengan probabilitas untuk mendapatkan (n – x) kali sukses P (X’ = n – x) dari
percobaan dengan n yang sama dan probabilitas sukses baru p’ = 1 – p.
108
Tabel 5.6. Cuplikan tabel distribusi binomial [P (X = x)]
p
n X
01 0.05 ... 0.40 ... 0.95 .99
2 0 .9801 ... .3600 ... .0001
1 .0198 ... .4800 ... .0198
2 .0001 ... .1600 ... .9801
Misalnya:
• Jika n = 2, P (X = 0) = 0.0001 untuk p = 0.99, bernilai sama dengan:
P (X = 2) = 0.0001 untuk p = 0.01
• Jika n = 2, P (X = 2) = 0.9801 untuk p = 0.9, bernilai sama dengan:
P (X = 0) = 0.9801 untuk p = 0.01
• Jika n = 3, P (X = 2) = 0.0294 untuk p = 0.99, bernilai sama dengan:
P (X = 1) = 0.0294 untuk p = 0.01
Nilai-nilai probabilitas distribusi binomial dapat pula disajikan secara
kumulatif, yaitu P (X < x) dalam bentuk tabel binomial kumulatif
(Addendum B2).
109
Tabel 5.7. Cuplikan tabel distribusi binomial kumulatif P (X < x):
p
n X
.01 .05 ... .40 ... .95 .99
2 0 .9801 ... .3600 ... .0001
1 .9999 ... .8400 ... .0199
2 .1000 ... .1000 ... .1000
. .
. .
. .
Misalnya:
• Untuk n = 2 dan p =0.01 :
P (X = 1) = P (X < 1) – P (X = 0)
= 0.0000 – 0.9801 = 0.0198
• Untuk n = 3 dan p = 0.40 :
P (X = 2) = P (X < 2) – P (X < 1)
= 0.9360 – 0.6480 = 0.2880
• Untuk n = 25 dan p = 0.99 :
P (X = 25) = P (X < 25) – P (X < 24)
= 1.00 – 0.222 = 0.778
110
Distribusi Hipergeometrik
Sampel dengan dan tanpa pengembalian:
Pengembalian sampel dapat dilakukan dengan atau tanpa
pengembalian. Pada sampling (pengambilan sampel) dengan pengembalian
(with replacement), tiap anggota sampel yang terpilih dikembalikan ke dalam
‘himpunan calon anggota sampel’ untuk pemilihan anggota sampel
berikutnya, sehingga tiap anggota populasi dapat terpilih lebih daripada satu
kali (ataupun tidak terpilih) untuk menjadi anggota sampel.
Pada sampling tanpa pengembalian (without replacement), tiap
anggota sampel yang terpilih dikeluarkan dari ‘himpunan calon anggota
sampel’ untuk pemilihan anggota sampel berikutnya, sehingga tiap anggota
populasi hanya mungkin terpilih satu kali (ataupun tidak terpilih) untuk
menjadi anggota sampel.
Pengambilan sampel dengan pengembalian dari populasi yang
memiliki karakteristik yang bersifat biner (dikotomi) akan menghasilkan
distribusi binomial, sedangkan pengambilan sampel tanpa pengembalian
dari populasi yang memiliki karakteristik biner menghasilkan distribusi
hipergeometrik.
Contoh 5.9:
Sebuah berisi 6 bola merah (M) dan bola hitam (H). Dari kotak
tersebut, dikeluarkan sebuah bola secara acak tiga kali berturut-turut.
Probabilitas untuk mendapatkan bola merah atau hitam pada tiap kali
pengambilan, baik pada sampling dengan ataupun tanpa pengembalian
diperlihatkan pada diagram 5.3.
Pada sampling dengan pengembalian, komposisi isi kotak selalu tetap
6 bola merah dan 4 bola hitam, probabilitas untuk mendapatkan bola merah
selalu tetap berupa P (M) = 6/10 dan probabilitas untuk mendapatkan bola
hitam selalu tetap berupa P (H) = 4/10. Probabilitas untuk mendapatkan x
bola merah (atau n – x bola hitam) pada n kali pengambilan sampel dengan
pengembalian dapat dihitung dengan menggunakan distribusi binomial.
Pada sampling tanpa pengembalian, probabilitas untuk mendapatkan
bola merah (atau bola hitam) pada tiap kali pengambilan akan selalu
berubah, karena komposisi isi kotak akan selalu berubah, sesuai dengan hasil
yang diperoleh pada pengambilan sebelumnya. Probabilitas untuk
mendapatkan x bola merah (atau n – x bola hitam) pada n kali pengambilan
sampel tanpa pengembalian dapat dihitung dengan menggunakan distribusi
hipergeometrik.
111
Diagram 5.3. Skema probabilitas hasil tiap percobaan pada sampling dengan dan tanpa pengembalian
112
Contoh 5.10:
Misalkan dalam sebuah populasi yang beranggotakan N = 1000
terdapat 300 orang perokok (= R) dan 700 orang bukan perokok (= R ).
Apabila dipilih 2 orang secara acak di antara anggota populasi, maka
probabilitas untuk mendapatkan perokok pada kedua kali memilih
anggotanya secara acak tersebut adalah:
a. Sampling dengan pengambilan:
- Memilih anggota pertama: terdapat 300 orang perokok di antara 1000
anggota populasi. Probabilitas untuk memperoleh perokok adalah
P ( R ) P (R) = 300/1000 = 0.30
- Memilih anggota kedua: Tak tergantung hasil pemilihan pertama,
karena selalu akan dikembalikan kedalam populasi, pada pemilihan
kedua terdapat 300 orang perokok di antara 1000 anggota populasi.
Probabilitas untuk memperoleh adalah P (R) = 300/1000 = 0.30
113
R R N
300 700 1000
n = 2:
Dengan pengembalian Tanpa pengembalian
300 300
1) P (R) = = 0.3000 1) P (R) = = 0.3000
1000 1000
Contoh 5.11:
a N–a N
10 40 50
114
Untuk soal a. :
C010C340 C110C240
P (X = 0) = P (X = 1) =
C350 C350
C210C140 C310C040
P (X = 2) = P (X = 3) =
C350 C350
Untuk soal b. :
C010C1540
C110C1440
P (X = 0) = 50 P (X = 1) = 50
C15 C15
C210C1340
C310C1240
P (X = 2) = 50 P (X = 3) = 50
C15 C15
dan seterusnya.
C xa CnN−−xa
P (X = x) = (5.14)
CnN
x = 0, 1, . . . , n jika n < a
= 0, 1, . . . , a jika n > a
115
Dalam praktik, pengambilan sampel tanpa pengembalian dapat
diasumsikan berdistribusi binomial jika N besar dan N >> n.
Nilai-nilai probabilitas hipergeometrik juga dapat dilihat pada tabel
probabilitas hipergeometrik, walaupun tidak semua buku-buku Statistika
melampirkannya. Cuplikan tabel tersebut dapat dilihat pada tabel 5.8 berikut.
116
Diagram 5.5. Grafik distribusi hipergeometrik (a = 20, N = 1000, n =
100) dan distribusi binomial (p = 0.02, n = 100)
Distribusi Poisson
Variabel random binomial X diasumsikan berdistribusi Poisson
(dibaca: pwa-song’) jika n sangat besar dan p sangat kecil (mendekati 0),
sehingga hasil perkalian n dan p bersifat konstan dan nilainya tidak terlalu
besar.
n p = λ (konstan)
Distribusi probabilitas distribusi Poisson adalah:
e −λ λ x
P (X = x) = (5.15)
x!
e = 2.71828 (bilangan pokok log naturalis)
Rerata X = Var (X) = λ (5.15.a)
Contoh 5.12:
Suatu proses produksi memiliki probabilitas 2% untuk menghasilkan
produk cacat. Jika yang diperiksa adalah 100 produk, maka:
p = 0.02 n = 100
117
λ = np = (100)(0.02) = 2
e −λ λ x
P (X = x) =
x!
e−2λ 0
P (X = 0) = = 0.135
0!
e−2λ1
P (X = 1) = = 0.271
1!
e−2λ 2
P (X = 2) = = 0.271
2!
Nilai-nilai probabilitas Poisson juga dapat diperoleh dari tabel
probabilitas Poisson, yang cuplikannya diperlihatkan pada tabel 5.9.
λ
X
.01 .02 ... 2 ... 19 20
0 .9048 .8187 ... .1353 ... .0000 .0000
1 .9005 .1637 ... .2707 ... .0000 .0000
2 .0045 .0164 ... .2707 ... .0000 .0000
. . . . . .
. . . . . .
. . . . . .
38 .0000 .0000 ... .0000 ... .0000 .0001
39 .0000 .0000 ... .0000 ... .0000 .0001
118
Diagram 5.6. Contoh beberapa grafik distribusi Poisson dengan
berbagai nilai rerata (= λ)
119
Diagram 5.7. Grafik fungsi probabilitas distribusi homogen
Distribusi Normal
Variabel random kontinu X dikatakan berdistribusi normal (distribusi
Gauss) dengan rerata µ dan variansi σ 2 , jika variabel itu mempunyai fungsi
probabilitas yang berbentuk:
1
( x − µ )2
1 2
f (x) = e 2σ ; −∞ < x < ∞ (5.17)
2
2πσ
120
2
Diagram 5.8. Kurva normal X dengan rerata µ dan variansi σ
121
Diagram 5.9. Luas area kurva normal antara x = a dan x = b
122
Diagram 5.11.a. Kurva normal dengan variansi yang sama, namun
rerata berbeda: µ1 < µ2 < µ3
1 2
1 z
f (z) = e2 ; −∞< x < ∞ (5.20)
2π
123
Diagram 5.12. Transformasi variabel random normal X dengan µ = 50
dan σ2 menjadi variabel random normal standar Z
Beberapa luas area pada kurve normal standar Z (lihat diagram 5.13):
P [–1 < Z < +1] ≈ 68% )
P [–2 < Z < +2] ≈ 95% ) (5.21)
P [–3 < Z < +3] ≈ 99% )
124
Tabel 5.10. Cuplikan salah satu bentuk tabel Z [P (0 < Z < z)]
125
• P [|Z| < 3.00] = (2)(0.4987) = 0.9974
• P [0.00 < Z < 1.96] = 0.4750
• P [|Z| < 1.96] = (2)(0.4750) = 0.9500
Dapat dibalik: Jika A = 95%, maka |Z| < 1.96 (dengan syarat A simetris
terhadap sumbu vertikal)
• P [|Z| < 1.64] = (2)(0.4495) = 0.8990 ≈ 0.9000
Dapat dibalik: Jika A = 99%, maka |Z| < 1.64 (dengan syarat A simetris
terhadap sumbu vertikal)
• P [1.00 < Z < 2.00] = P [0.00 < Z < 2.00] – P [0.00 < Z < 1.00]
= 0.4772 – 0.3413 = 0.1359
• P [−1.00 < Z < 2.00] = P [−1.00 < Z < 0.00] + P [0.00 < Z < 2.00]
= P [0.00 < Z < 1.00] + P [0.00 < Z < 2.00]
= 0.3413 + 0.4772 = 0.8185
Untuk aplikasi tabel Z pada perhitungan bagi variabel random X yang
berdistribusi normal, transformasikan terlebih dahulu nilai-nilai X menjadi
nilai Z:
X −µ
Z=
σ
sebaliknya pada akhir perhitungan, nilai-nilai Z dapat ditransformasikan
kembali ke nilai X:
X=µ+Zσ
Contoh 5.13:
Nilai-nilai ujian seleksi penerimaan mahasiswa baru secara nasional
dianggap berdistribusi normal dengan rerata 45 dan standar deviasi 13. Jika
hanya 32.5% calon mahasiswa yang akan diterima, berapakah nilai terendah
calon mahasiswa yang diterima?
Misalkan variabel random normal X menyatakan nilai-nilai ujian
seleksi penerimaan mahasiswa baru, maka X ~ N (45 ; 13). Jika x
menyatakan nilai terendah calon mahasiswa yang diterima, maka:
P [X > x] = 0.325
Dengan menggunakan tabel Z serta interpolasi linear (lihat Lampiran
5D dan 5E), diperoleh bahwa untuk luas area sebesar 0.325 pada sisi kanan
distribusi Z, nilai z-nya adalah 0.4538, sehingga:
P [Z > 0.4538] = 0.325
126
Dari transformasi standar Z = ( X − µ ) σ diperoleh:
x=µ+zσ
dan: x = 45 + (0.4538)(13) = 50.90
Contoh 5.14:
Usia hidup rata-rata elemen kering merek PQR adalah 300 jam
dengan standar deviasi 35 jam. Dengan asumsi bahwa distribusi usia hidup
elemen kering itu mendekati distribusi normal, hitunglah:
a. Berapa persen elemen kering merek PQR yang usia hidupnya kurang
daripada 225 jam?
b. Berapa persen elemen kering merek PQR yang usia hidupnya
kurangnya daripada 350 jam?
Misalkan variabel random normal X menyatakan usia hidup rata-rata
elemen kering merek PQR, maka X ~ N (300 ; 35), maka proporsi elemen
kering merek PQR yang usia hidupnya kurang daripada 225 jam dapat
dinyatakan sebagai:
P (X < 225)
yang dengan transformasi standar dapat diubah menjadi:
225 − 300
PZ < = P (Z < −2.14)
35
yang bernilai sama dengan:
P (Z > 2.14) = 0.5000 – P (0 < Z < 2.14)
= 0.5000 – 0.4838 = 0.0162 ≈ 1.62%
Proporsi elemen kering merek PQR yang usia hidupnya kurang
daripada 350 jam dapat dinyatakan sebagai:
P (X < 350)
yang dengan transformasi standar dapat diubah menjadi:
350 − 300
PZ < = P (Z < 1.43)
35
= 0.5000 + P (0 < Z < 1.43)
= 0.5000 + 0.4236 = 0.9236 = 92.36%
Distribusi t
Distribusi t (Student’s t) digunakan untuk sampel berukuran kecil (n
< 30). Gambaran kurvanya menyerupai distribusi Z, namun memiliki ekor
127
yang lebih tebal (sebaran nilai yang lebih besar) daripada distribusi Z (lihat
diagram 5.14).
Kurvanya / variansinya dapat berubah-ubah sesuai nilai ‘derajat
bebas’-nya (db; df; degree of freedom), yaitu db = n – 1. Pada db > 30,
distribusi t dapat dianggap sama dengan distribusi Z.
Nilai-nilai untuk distribusi t dapat dilihat pada tabel (lihat contoh
cuplikan pada tabel 5.11).
128
Tabel 5.11. Cuplikan salah satu bentuk tabel t [α = P (t > tα)]:
Perhatikan:
o Secara matematik, distribusi t baru akan sama dengan distribusi Z pada n
= ∞ , namun secara praktis keduanya sudah dapat dianggap sama pada n
= 30 (n = 50).
o Pada tabel t, badan tabel memuat nilai t dan luas area tercantum pada sisi
atas tabel (pada tabel Z, badan tabel memuat luas area, nilai Z diperoleh
dari sisi kiri dan atas tabel).
o Sesuai kebutuhan, tabel t hanya memuat nilai-nilai t untuk luas area kecil
(10% atau kurang).
Contoh 5.15:
Lihat tabel t satu sisi (satu ekor, one-tail). Tampak bahwa untuk db
11 dan luas area 0.05, nilai t adalah 1.796 atau:
t(11;0.05) = 1.796
129
yang dalam konteks probabilitas berarti bahwa:
P [ t(11) > 1.796] = 0.05
Jika digunakan tabel t dua sisi (dua ekor, two-tails), nilai t sebesar
1.796 dengan db 11 akan diperoleh untuk luas area 0.10, atau:
t(11;0.10) = 1.796
karena yang dimaksud dengan luas area pada tabel t dua sisi adalah:
P [| t(11) | > 1.796] = 0.10
130
Diagram 5.15. Pendekatan normal untuk distribusi binomial dengan p =
0.5. Atas: n = 6; tengah: n = 10; bawah: n = 14
131
Pada pendekatan normal untuk binomial ini biasa digunakan ‘koreksi
kontinuitas’ (karena nilai-nilai diskret pada distribusi binomial), yaitu:
o P (X = c) ≈ P (c – 0.5 < X < c + 0.5) )
o P (X < c) ≈ P (X < c + 0.5) ) (5.23)
o P (X > c) ≈ P (X > c − 0.5) )
Contoh 5.16:
Delapan puluh persen mahasiswa Psikologi Gunadarma adalah
wanita. Jika 50 orang mahasiswa Psikologi Gunadarma dipilih secara acak,
maka probabilitas bahwa sekurang-kurangnya 35 orang di antaranya adalah
wanita dapat dihitung dengan pendekatan normal untuk binomial (tanpa
korelasi kontinuitas).
n = 50 p = 0.80 q = 1 – p = 0.20
x − np
P (X > x) = P Z ≥
npq
35 − ( 50 )( 0.80 )
P (X > x) = P Z ≥
( 50 )( 0.80 )( 0.20 )
= P (Z > −1.7778)
= P (−1.7778 < Z < 0) + P (Z > 0)
= 0.4614 + 0.5000 = 0.9614
Contoh 5.17:
Misalkan untuk data pada contoh 5.16 di atas hendak dihitung P (X =
35):
• Dengan ‘koreksi kontinuitas’ pada pendekatan normal:
P (X = c) ≈ P (c – 0.5 < X < c + 0.5)
P (X = 35) ≈ P (34.5 < X < 35.5)
34.5 − 40 35.5 − 40
=P <Z<
8 8
= P (−1.9445 < Z < −1.5910)
= P (1.5910 < Z < 1.9445)
= 0.4741 – 0.4442 = 0.0299
132
• Dengan ‘cara eksak’ (menggunakan distribusi binomial):
P (X = x) = C xn p x q n − x
50
P (X = 35) = C35 ( ) ( 0.2 )
0.835 15
= 0.0299
133
LAMPIRAN 5A: RANGKUMAN PARAMETER DISTRIBUSI PROBABILITAS
A. DISTRIBUSI PROBABILITAS DISKRET
134
B. DISTRIBUSI PROBABILITAS KONTINU
135
LAMPIRAN 5B: BEBERAPA CONTOH PENGGUNAAN
DISTRIBUSI PROBABILITAS DISKRET
P [X = x] = C xn p x q n − x
n
P [X > x] = ∑
i= x
Cxn p x q n − x
= P [X = 6] + P [X = 7] + P [X = 8] + P [X = 9] + P [X = 10]
= 0.1115 + 0.0425 + 0.0106 + 0.0016 + 0.0001 = 0.1663
Probabilitas bahwa kurang daripada separuhnya membayar iuran
adalah:
4
P [X < 4] = ∑
i =0
Ci10 0.4i 0.610 − i
= P [X = 0] + P [X = 1] + P [X = 2] + P [X = 3] + P [X = 4]
= 0.0060 + 0.0403 + 0.1209 + 0.2150 + + 0.2508 = 0.6330
3. Sebuah kapal penangkap ikan rata-rata mendapat tiga ekor ikan dalam
lima hari.
Beberapa probabilitas penangkapan:
a. Dua ekor ikan dalam tiga hari.
b. Sekurang-kurangnya tiga ekor ikan dalam dua hari.
Jumlah ikan yang ditangkap berdistribusi Poisson dengan rerata λ = 3
untuk periode 5 hari.
a. Untuk periode 3 hari, nilai rerata berubah menjadi:
3
λ’ = λ
5
= (0.6)(3) = 1.8
137
e−1.8 1.82
P [X = 2] = = 0.2678
2!
b. Untuk periode 2 hari, nilai rerata berubah menjadi:
2
λ” = λ
5
= (0.4)(3) = 1.2
P [X > 3] = 1 − P [X < 2]
= 1 – [P (X = 0) + P (X = 1) + P (X = 2)]
= 1 – [0.3012 + 0.3614 + 0.2169]
= 0.1205
138
LAMPIRAN 5C: NILAI STANDAR (NILAI BAKU,
VARIABEL STANDAR Z)
Variabel standar Z
adalah variabel dengan nilai mean nol ( µ z = 0) dan standar deviasi
satu ( σ z = 1). Setiap variabel X dapat ditransformasikan menjadi variabel
standar Z dengan menggunakan rumus:
X − µx
Z=
σx
Jika nilai µ x dan σ x tidak diketahui, digunakan nilai penaksirnya
X −x
(estimatornya), yaitu x dan s x , sehingga Z = .
sx
Contoh:
Lihat data BB lima orang mahasiswa pertama kelas 2PA01 TA
3003/2004 (dalam kg): 50, 56, 47, 45, 54.
2
n=5 ∑ xi = 252 ∑ xi = 12,786
∑ xi
x =
n
252
= = 50.4
5
2 ( ∑ xi )2
∑ xi −
sx = n
n −1
2522
12, 786 −
= 5 = 4.62
5 −1
50 − 50.4
x1 = 50 ⇒ z1 = = −0.09
4.62
56 − 50.4
x2 = 56 ⇒ z2 = = 1.21
4.62
139
47 − 50.4
x3 = 47 ⇒ z3 = = −0.74
4.62
47 − 50.4
x4 = 45 ⇒ z4 = = −1.17
4.62
54 − 50.4
x5 = 54 ⇒ z5 = = 0.78
4.62
140
LAMPIRAN 5D: BEBERAPA CONTOH
PENGGUNAAN DISTRIBUSI NORMAL
Luas area antara X1 = 58 dan X 2 = 86.3 adalah sama dengan luas area
antara Z1 = 0.53 dan Z 2 = 2.42, atau:
P (58 < X < 86.3) = P (0.53 < Z < 2.42)
= P (0 < Z < 2.42) − P (0 < Z < 0.53)
= 0.4922 – 0.2019 = 0.2903
Luas area di sisi kanan X1 = 72 adalah sama dengan luas area di sisi
kanan Z1 = 1.09 atau:
P (X > 72) = P (Z > 1.09)
= P (0 < Z < ∞ ) – P (0 < Z < 1.09)
= 0.5000 – 0.3621 = 0.1379
141
3. X berdistribusi normal dengan rerata µ = 75 dan standar deviasi σ = 14.
Hitunglah luas area kurve normal di sisi kanan X1 = 70.
70 − 75
Z1 = = −0.36
14
Luas area di sisi kanan adalah sama dengan luas area di sisi kanan
Z1 = −0.36, atau:
P (X > 70) = P (Z > −0.36)
= P (−0.36 < Z < 0) + P (0 < Z < ∞)
= 0.1406 + 0.5000 = 0.6406
142
LAMPIRAN 5E: INTERPOLASI LINEAR
Interpolasi linear digunakan untuk pembacaan tabel probabilitas
kontinu X secara lebih akurat jika dimiliki nilai x yang terletak di antara dua
nilai berurutan x1 dan x2 yang ada pada tabel (yang masing-masing
bersesuaian dengan luas area A1 dan A 2 ) dan akan ditentukan luas areanya
A yang nilainya berada di antara luas area A1 dan A 2 .
Salah satu dalil planimetri (ilmu ukur bidang) menyatakan: Jika pada
segitiga sebarang ABC, DE sejajar dengan alas BC, maka AD : AB = AE :
AC (lihat diagram V.1).
143
Jika yang diketahui adalah A dan yang dicari adalah nilai x, maka:
A − A1
x = x1 + ( x2 − x 1 )
A 2 − A1
Yang dimaksud dengan tabel probabilitas X di sini dapat berupa tabel
Z, tabel t, ataupun tabel probabilitas kontinu lainnya.
Contoh:
1. Misalkan hendak dicari nilai z untuk luas area A = P (0 < Z < z) =
0.4000. Dari tabel Z yang bersesuaian diperoleh:
z A
1.28 0.3997
1.29 0.4015
Maka nilai z yang bersesuaian untuk A = 0.4000 adalah:
A − A1
z = z1 + ( z2 − z1 )
A 2 − A1
0.4000 − 0.3997
= 1.28 + (1.29 – 1.28) = 1.2817
0.4015 − 0.3997
144
LATIHAN 5
Bagian Pertama
Pilihlah satu jawaban yang paling benar !
145
6. Jika diasumsikan bahwa probabilitas untuk memperoleh anak laki-laki
pada tiap kelahiran adalah 0.50, maka probabilitas untuk memperoleh
paling sedikit 2 orang anak perempuan pada pasangan suami isteri baru
yang merencanakan untuk memperoleh 4 orang anak adalah:
A. 0.0625 C. 0.3125
B. 0.25 D. 0.6875
A. p = 0.25 ; n = 3 C. p = 0.75 ; n = 3
B. p = 0.5 ; n = 3 D. p = 0.5 ; n = 2
10. Pada pengambilan sampel tanpa pengembalian yang ditarik dari suatu
populasi berhingga, perhitungan probabilitasnya secara eksak
didasarkan atas asumsi distribusi:
A. Binomial C. Poisson
B. Hipergeometrik D. Normal
146
11. Dalam sebuah kotak terdapat 12 bola, 5 putih, 4 merah, dan sisanya
kuning. Tiga buah bola diambil secara acak tanpa pengembalian.
Probabilitas bahwa ketiga bola yang terambil semuanya tidak merah
adalah:
A. C812 C711 C610 C. A) dan B) benar
C38 C04
B. D. A) dan B) salah
C312
16. Jumlah rata-rata panggilan telepon yang masuk ke sebuah kantor tiap
menit pada jam kerja adalah 2.5. Probabilitas bahwa akan didapatkan
tiga panggilan pada suatu menit tertentu dalam jam kerja adalah:
A. 0.142 C. 0.544
B. 0.214 D. 0.758
147
17. Jumlah rata-rata konsultasi yang diterima oleh guru BP di SMU
‘Santai’ adalah tiga kasus per minggu. Probabilitas bahwa pada minggu
depan hanya akan didapatkan dua kasus konsultasi adalah:
A. 0.149 C. 0.224
B. 0.199 D. 0.423
19. Jika pada suatu distribusi diketahui bahwa rerata, median, dan
modusnya berimpit, maka distribusi tersebut:
A. Belum tentu berdistribusi normal
B. Pasti berdistribusi normal
C. Menceng ke kiri.
D. Menceng ke kanan.
22. Jika X berdistibusi normal dengan mean 30 dan variansi 25, maka
probabilitas bahwa 25 < X < 37.5 adalah (menggunakan tabel):
A. 0.0919 C. 0.4332
B. 0.3413 D. 0.7745
148
Untuk soal No. 23 dan 24:
Misalkan nilai-nilai ujian akhir semester mahasiswa Gunadarma
dapat dianggap berdistribusi normal dengan mean 65 dan variansi 100.
23. Jika ambang nilai batang lulus ditetapkan sebesar 55, maka persentase
mahasiswa yang tidak lulus adalah:
A. 4.0 % C. 34.1 %
B. 15.9 % D. 46.0 %
24. Jika diputuskan bahwa 10% mahasiswa terbaik nilai ujian akhir
semesternya akan diberikan beasiswa pada semester berikutnya, maka
nilai terendah yang mendapatkan beasiswa adalah:
A. 67.5 C. 81.4
B. 77.8 D. 85.0
149
Bagian Kedua
Pilihlah satu jawaban yang paling benar!
Nilai X 0 1 2 3
Probabilitas X 0.2 0.4 0.3 0.1
3. Jika keuntungan bersih untuk tiap penjualan mobil rata-rata sebesar Rp.
5,000,000, nilai harapan keuntungan bersih show-room Kartika per
minggu adalah:
A. Rp. 4,050,000 C. Rp. 6,500,000
B. Rp. 4,500,000 D. Rp. 12,500,000
Banyak 1 2 3 4 5 6
titik
X −3 −2 −1 1 2 3
P (X) 1/6 1/6 1/6 1/6 1/6 1/6
150
4. Nilai harapan X adalah:
2
A. E (X) = µ = 0 C. E (X) = µ = 4
3
B. E (X) = µ = 3.5 D. Semuanya salah
6. Variansi X adalah:
A. Var (X) = E ( X 2 ) − µ 2 = 0
B. Var (X) = E ( X 2 ) − µ 2 = 3.5
2
C. Var (X) = E ( X 2 ) − µ 2 = 4
3
D. Semuanya salah
Bagian Ketiga
Selesaikanlah soal berikut:
151
BAB 6
SAMPLING
6.1 DISTRIBUSI SAMPLING
Distribusi Sampling Nilai Rerata
Misalkan dimiliki populasi dengan N = 3;
X1 = 3 X2 = 6 X3 = 8
µ x = µ = 5.67 σ x2 = σ 2 = 4.22
Misalkan pula dilakukan pengambilan sampel secara acak dengan n =
2. Kemungkinan sampel yang diperoleh adalah:
• Sampling dengan pengembalian (jumlah kemungkinan sampel = N n =
32 = 9):
( x1; x1 ) ( x1; x2 ) ( x1; x3 )
( x2 ; x1 ) ( x2 ; x2 ) ( x2 ; x3 )
( x3 ; x1 ) ( x3 ; x2 ) ( x3 ; x3 )
Rerata-nya masing-masing adalah:
x(1a ) = 3 x( 2 a ) = 4.5 x( 3a ) = 5.5
x( 4 a ) = 4.5 x( 5 a ) = 6 x( 6 a ) = 7
x( 7 a ) = 5.5 x( 8 a ) = 7 x( 9 a ) = 8
152
Kumpulan rerata semua kemungkinan sampel demikian pada
sampling dengan pengembalian:
{x( 1a )
, x( 2 a ) , x( 3 a ) , x( 4 a ) , x( 5 a ) , x( 6 a ) , x( 7 a ) , x(8 a ) , x( 9 a ) }
ataupun apada sampling tanpa pengembalian:
{x( 1b )
, x 2 b , x 3b
( ) ( ) }
dinamakan distribusi sampling nilai rerata dengan rerata:
µx atau E(X )
dan variansi:
σ x2 atau Var ( X )
Standar deviasinya σ x atau SD (X) dinamakan juga standard error (x) =
SE ( X ) .
153
Sifat ini hanya berlaku pada sampling dengan pengembalian. Jika
dilakukan sampling tanpa pengembalian, maka rerata-nya adalah:
µx = E ( X ) = µ (6.5)
variansi-nya:
σ 2 ( N − n)
σ x2 = Var ( X ) = (6.6)
n ( N − 1)
dan standar deviasi-nya:
σ x = SE ( X ) =
σ ( N − n) (6.7)
n ( N − 1)
Tetapi jika N relatif jauh lebih besar daripada n, maka pada sampling
tanpa pengembalian dapat dianggap berlaku rerata:
µx = E ( X ) = µ
dan variansi:
σ2
σ x2 = Var ( X ) ≈
n
Perhatikan:
1. Distribusi sampel, jika n cukup besar dan pengembalian sampel
dilakukan secara acak, umumnya akan mendekati distribusi populasinya.
2. Jika ukuran sampel n cukup besar (n > 30), distribusi sampling nilai
rerata dapat dianggap berdistribusi normal (apa pun bentuk distribusi
x −µ
populasinya; lihat diagram 6.1), transformasi bakunya maupun
σ n
x −µ
transformasi (jika σ tak diketahui) selalu berdistribusi normal
s n
standar.
3. Jika ukuran sampel n lebih kecil daripada 30 dan populasinya
berdistribusi normal, distribusi sampling nilai rerata selalu berdistribusi
normal (tak tergantung besar nilai n ; sedangkan transformasi baku
x −µ x −µ
berdistribusi normal standar dan transformasi (jika σ tak
σ n s n
diketahui) berdistribusi t dengan derajat bebas (n – 1).
154
Diagram 6.1. Teorema limit pusat: distribusi x untuk berbagai
populasi dan ukuran sampel
Rangkuman hubungan antara distribusi parental (distribusi populasi) X,
distribusi sampling X , dan distribusi transformasi X diperlihatkan pada
matriks 1 Lampiran 6A.
Contoh 6.1:
Nilai ujian nasional lulusan SMU di Yogyakarta untuk mata pelajaran
matematika mempunyai rerata 41.4 dan variansi 84.64. Apabila dipilih 40
orang lulusan SMU tersebut secara acak, hitung probabilitas bahwa rerata
sampelnya terletak:
a. Antara 40 dan 45
b. Lebih besar daripada 45.
µ = 41.4 σ 2 = 84.64 n = 40
µ x = µ = 41.4
σ2 84.64
σ x2 = = = 2.116
n 40
σx = 2.116 = 1.45
( 40 − 41.5) ( 45 − 41.5)
a. P [40 < X < 45] = P <Z<
1.45 1.45
= P [‒1.30 < Z < 2.41]
= 0.3485 + 0.4920 = 0.8405
b. P [ X > 45] = P [Z > 2.41]
= 0.5 – 0.4920 = 0.0080
155
Distribusi Sampling Nilai Proporsi
Distribusi sampling proporsi sampel p adalah distribusi binomial
dengan parameter n dan P, n adalah ukuran sampel dan P proporsi populasi.
Variabel random X menyatakan banyaknya sukses dalam n percobaan.
Karena p = X n dan n merupakan konstante, X berdistribusi sama seperti p.
Jika ukuran sampel n membesar, teorema limit pusat juga berlaku di
sini, dan distribusi sampling p dapat dianggap berdistribusi normal dengan
rerata:
E (p) = P (6.8)
dan variansi:
P (1 − P ) PQ
Var (p) = = (6.9)
n n
sehingga:
p−P
Z= (6.10)
PQ n
berdistribusi normal standar.
Contoh 6.2:
Misalkan diketahui bahwa 70% calon pembeli mobil di Indonesia
terutama berminat untuk membeli kendaraan minibus. Apabila diambil
sampel 100 orang calon pembeli mobil secara acak, berapakah bahwa
sekurang-kurangnya 60 orang di antaranya memilih untuk membeli minibus?
P = 0.70 Q = 1 ‒ P = 0.30 n = 100
0.60 − 0.70
P (p > 0.60) = P Z ≥
( 0.70 )( 0.30 ) 100
= P (Z > ‒2.1822)
= 0.4854 + 0.5000 = 0.9854 = 98.54%
156
6.2 METODE SAMPLING
Penarikan Sampel
Tujuan
Mengumpulkan data yang valid (sahih) dan reliable (terpercaya)
untuk melakukan inferensi / generalisasi mengenai karakteristik populasi.
Manfaat
Penggunaan proses sampling memungkinkan dilakukannya inferensi /
generalisasi:
dengan jumlah data yang relatif sedikit
dalam jangka waktu yang relatif singkat, dan
dengan jumlah menggunakan biaya / sumber daya yang terbatas.
157
Diagram 6.2 Validitas dan reliabilitas data sampel: (a) Tidak valid dan
tidak reliabel; (b) Valid, tidak reliabel; (c) Reliabel, tidak valid; dan (d)
Valid dan reliabel
Beberapa istilah:
- Elemen (unsur) populasi: unit (satuan) yang dicari informasinya;
merupakan unit elementernya yang membentuk populasi yang diteliti.
Elemen populasi adalah unit analisis.
- Unit sampling: terdiri atas satu / lebih elemen, digunakan untuk
memilih elemen untuk anggota sampel.
- Populasi target (sasaran): Populasi yang di-‘target’-kan untuk diteliti
dan diestimasi nilai parameternya.
- Populasi aktual: kumpulan elemen yang ‘eligibel’ (memenuhi syarat)
untuk menjadi anggota sampel.
- Kerangka sampel: kumpulan elemen yang ‘terdaftar’ sebagai calon
anggota sampel.
Macam sampel
Berdasarkan objektif-tidak-nya beserta acak-tidak-nya cara
pengambilan, dikenal berbagai macam sampel yang secara skematis
diperlihatkan pada matriks 6.1.
158
Matriks 6.1. Teknik penarikan sampel
Probabilitas Non-probabilitas
Sampel
- ‘purposive’
Objektif Sampel random
- ‘quota’
- ‘haphazard’
Subjektif Sampel kuasi-random Sampel ‘judgment’
159
- Sampling acak sederhana ( simple random sampling)
- Sampling acak stratifikasi (stratified random sampling).
- Sampling acak klaster ( cluster random sampling)
- Sampling acak sistematik (systematic random sampling).
s2 N − n
ˆ (x ) =
Var (6.12)
n N
• Pelaksanaan.
Dapat digunakan antara lain:
160
(1) metode ‘penarikan undian’,
(2) bilangan acak yang dihasilkan oleh komputer / kalkulator
saintifik; atau
(3) tabel bilangan acak.
161
• Estimasi rerata dan variansi distribusi sampling nilai rerata.
L
xstr = ∑ N h xh n (6.13)
h =1
dengan:
L
xh = ∑ xh nh (6.14)
i =1 i
1 L N h − nh sh2
ˆ ( xstr ) =
Var ∑ 2
Ni
Nh nh
(6.15)
N2 h=1
• Pelaksanaan.
Populasi dibagi menjadi beberapa strata, yang masing-masing relatif
homogen. Lakukan sampling acak sederhana pada tiap stratum.
N : populasi
clust : pengelompokan (clustering)
162
Ni : kluster ke-i, i = 1, 2, . . . , M
srs : sampling acak sederhana (simple random sampling)
N i = ni : klaster terpilih menjadi sampel ; i = 1, 2, . . . , m
()
n : sampel
• Data sampel.
Klaster 1 : x11 , x12 , . . . , x1N 1
()
.
.
Kluster m : xm1 , xm 2 , . . . , xmN m
( )
dengan:
ni
xi = ∑ xij ni (6.17)
j =1
M −m 1 m
∑
2
ˆ ( xcl ) =
Var ni2 ( xi − xcl ) (6.18)
M m n2 m − 1 i =1
• Pelaksanaan.
Populasi dibagi menjadi sejumlah klaster, yang masing-masing relatif
heterogen. Lakukan sampling acak sederhana dengan klaster sebagai unit
sampling. Untuk tiap klaster yang terpilih, seluruh elemen anggotanya
dijadikan anggota sampel.
• Skema penyampelan:
163
Diagram 6.6. Sampling acak klaster dua-tahap
N : populasi
clust : pengelompokan (clustering)
Ni : kluster ke- i; i = 1, 2, . . . , M
srs : sampling acak sederhana
Ni : klaster terpilih menjadi sampel ; i = 1, 2, . . . , m
()
ni : sampel pada klaster ke-i; i = 1, 2, . . . , m
n : sampel
• Data sampel.
Klaster 1: x11 , x12 , . . . , x1n
()
1
.
.
Kluster m: xm1 , xm 2 , . . . , xmn( m )
• Pelaksanaan.
Populasi dibagi menjadi sejumlah klaster, yang masing-masing relatif
heterogen. Lakukan sampling acak sederhana dengan klaster sebagai unit
sampling. Pada tiap klaster terpilih, dilakukan sampling acak sederhana
164
(sampling tahap kedua) dengan elemen anggotanya sebagai unit untuk
memilih anggota sampel final.
165
B. N tidak merupakan kelipatan bulat k (N ≠ nk)
• Pelaksanaan.
(1) Bagi N anggota populasi menjadi n grup (group), dengan tiap
group memiliki k = N n elemen. Pilih secara acak satu di antara k
elemen anggota grup pertama untuk dijadikan anggota sampel.
Anggota selanjutnya ditentukan secara sistematik, yaitu tiap
anggota ke-k berikutnya dalam daftar; atau:
(2) Pilih secara acak di antara N anggota populasi untuk dijadikan
anggota sampel. Anggota selanjutnya ditentukan secara sistematik,
yaitu tiap anggota ke-k berikutnya dalam daftar; setelah mencapai
akhir daftar dilanjutkan mulai dari awal sampai kembali ke
anggota sampel pertama.
166
LAMPIRAN 6A: DISTRIBUSI X, DISTRIBUSI X ,
DAN DISTRIBUSI TRANSFORMASI X
X dalam teori sampling merupakan variabel random, karena
diperoleh dari sampel berulang dan memiliki nilai yang berubah-ubah pada
tiap penarikan sampel.
n X + X2 + . . . + Xn
X = ∑ Xi n = 1
i =1 n
X1 , X 2 , . . . , X n masing-masing mempunyai rerata µ dan variansi
σ 2 , sehingga:
X + X2 + . . . + Xn
E(X ) = E 1
n
1
= E X + X 2 + . . . + X n
n 1
1
= E ( X 1 ) + E ( X 2 ) + . . . + E ( X n )
n
1
= [ nµ ] = µ
n
X + X2 + . . . + Xn
dan: Var ( X ) = Var 1
n
1
= 2 Var X1 + X 2 + . . . + X n
n
1
= 2 Var ( X 1 ) + Var ( X 2 ) + . . . + Var ( X n )
n
1 σ2
= nσ 2
=
n2 n
167
Matriks 1. Distribusi tranformasi X untuk distribusi parental X normal dan sebarang serta
ukuran sampel besar dan kecil
Distribusi sampling σ2 σ2 σ2 σ2
X ~ N µ, X ~ N µ, X ~ N µ, X ~ ? µ,
rerata (distribusi X ) n n n n
σ x −µ x −µ x −µ
~ Z (0 ; 1) ~ Z (0 ; 1) ~ Z (0 ; 1)
Distribusi diketahui σ n σ n σ n
transformasi X ?
σ tak x −µ x −µ x −µ
~ Z (0 ; 1) ~ t( n−1) ~ Z (0 ; 1)
diketahui σ n σ n σ n
168
LAMPIRAN 6B: POPULASI , GALAT ACAK, DAN
GALAT SISTEMATIK
Hirarki populasi
Istilah ‘populasi’ dalam metodologi penelitian memiliki pengertian
lebih luas yang dapat dibedakan atas (lihat diagram 1):
1. Populasi studi (sampel): kumpulan subjek / objek yang sebenarnya
menghasilkan data untuk penelitian. Nilai statistik yang diperoleh dari
studi (sampel) sebagai estimator bagi parameter sesungguhnya
dinyatakan dengan lambang θˆ .
2. Populasi aktual: kumpulan subjek / objek yang ‘eligibel’ (memenuhi
syarat) untuk diikutsertakan dalam penelitian dan proses sampling.
Parameter yang ada pada populasi aktual dinyatakan dengan lambang
θo.
3. Populasi target: kumpulan subjek / objek yang menjadi target
penelitian sebenarnya (yang sebenarnya hendak diteliti). Parameter
yang ada pada populasi target dinyatakan dengan lambang θ
4. Populasi eksternal: kumpulan subjek / objek yang lebih luas daripada
populasi target, memiliki karakteristik yang tidak terlalu berbeda
dengan populasi target, dan dianggap masih ‘layak’ untuk ‘menerima’
generalisasi hasil penelitian.
170
LAMPIRAN 6C: STRATA DAN KLASTER
Stratum adalah pengelompokan yang relatif homogen, sedangkan
klaster merupakan pengelompokan yang bersifat heterogen (lihat diagram 1).
Sampling acak stratifikasi digunakan jika karakteristik yang menjadi dasar
stratifikasi, misalnya jenis kelamin, tingkat sosial ekonomi, suku bangsa, dan
sebagainya dianggap terkait dengan variabel yang hendak diteliti, untuk
menjamin agar anggota populasi dengan setiap taraf karakteristik tersebut
terwakili secara memadai dalam sampel akhir yang dikumpulkan.
Klaster adalah pengelompokan yang biasanya didasarkan atas tempat
(ruang) atau waktu, misalnya desa, kecamatan, kartu registrasi calon
mahasiswa yang terkumpul per hari, dan sebagainya. Klaster bersifat
heterogen, misalnya dalam satu klaster didapatkan subjek dari berbagai
tingkat sosial ekonomi, pria dan wanita, serta berbagai suku bangsa.
Sampling acak klaster digunakan jika ukuran populasi sangat besar sehingga
tidak mungkin ataupun tidak praktis untuk memperoleh atau menyusun
kerangka sampel secara lengkap.
Contoh:
1. Akan diteliti pengeluaran rata-rata mahasiswa per bulan di universitas
WWW. Jika variabel ini diasumsikan terkait erat dengan jenis kelamin
171
mahasiswa, maka dapat digunakan sampling acak stratifikasi dengan
jenis kelamin sebagai dasar stratifikasi.
2. Akan diteliti proporsi keluarga yang paling sedikit salah satu
anggotanya mendengarkan secara teratur siaran stasiun radio A di
kecamatan TS. Karena kerangka sampel bagi terlalu besar untuk
pelaksanaan sampling acak sederhana, dilakukan sampling acak klaster
dua-tahap dengan menggunakan desa sebagai unit klaster.
172
LAMPIRAN 6D: CONTOH PENGGUNAAN
KEEMPAT METODE SAMPLING
Data:
Basis data (dataset) mahasiswa kelas 2PA01 TA 2002/2003 dengan
nomor anggota kelas / populasi (nomor pada basis data), data jenis kelamin,
berat badan, dan IP semester I.
173
Soal:
1. Dengan menggunakan sampling acak sederhana (simple random
sampling), ambillah sampel yang terdiri atas 10 orang mahasiswa. Buat
daftar anggota sampel yang terpilih (No anggota kelas dan BB). Hitung
nilai rerata BB sampel sebagai estimator bagi nilai rerata populasi (data
kelas).
2. Bagi anggota kelas atas 2 strata, pria dan wanita. Dengan jenis kelamin
sebagai dasar stratifikasi, gunakan metode sampling acak stratifikasi
(stratified random sampling) untuk mendapatkan sampel berukuran 10
yang terdiri atas 2 pria dan 8 wanita. Buat daftar anggota sampel yang
terpilih (No anggota kelas dan BB). Hitung nilai rerata BB sampel.
3. Anggota kelas diklasifikasikan dalam 5 kelompok (klaster) berdasarkan
nilai IP-nya, yaitu klaster 1 (IP < 3.00), klaster 2 (IP 3.00-3.24), klaster
3 (IP 3.25-3.49), klaster 4 (IP 3.50-3.74), dan klaster 5 (IP 3.75-4.00).
Dengan metode sampling acak klaster (cluster random sampling) 2-
tahap, mula-mula dipilih 2 di antara 5 klaster secara acak, lalu dari
kedua klaster tersebut masing-masing diambil 5 orang anggota sampel
secara acak, sehingga seluruhnya didapatkan 10 orang anggota sampel.
Buat daftar anggota sampel yang terpilih [No anggota kelas, No
anggota klaster (nomor pada klaster masing-masing), dan BB). Hitung
nilai rerata BB sampel.
4. Dengan menggunakan metode sampling acak sistematik (systematic
random sampling) terhadap data nomor anggota kelas pada basis data
tersebut, tarik sampel berukuran 10. Buat daftar anggota sampel yang
terpilih (No anggota kelas dan BB). Hitung nilai rerata BB sampel.
5. Hitung nilai rerata BB kelas / populasi sebenarnya (70 mahasiswa kelas
2PA01 TA 2003/2004). Bandingkan hasilnya dengan nilai estimasi
yang diperoleh dengan keempat metode sampling.
Jawaban:
1. Sampling Acak Sederhana
Dengan tabel bilangan acak (tabel E) halaman 1, mulai dari baris
12, kolom ke-10 ke kanan, dan seterusnya.
Dengan ukuran populasi N = 70 dan ukuran sampel n = 10,
dilakukan pembacaan nomor-nomor dua digit: 54, 30, 98, dan
seterusnya. Pembacaan yang telah mencapai ujung kanan baris
diteruskan ke ujung kiri baris di bawahnya.
174
Nomor terpilih (digarisbawahi di bawah ini) adalah nomor yang
lebih kecil daripada (atau sama dengan) 70. Nomor-nomor yang
sama hanya dapat dipilih satu kali.
Pembacaan dihentikan setelah diperoleh 10 nomor berbeda yang
lebih kecil daripada (atau sama dengan) 70.
Tabel 1. Hasil pembacaan tabel bilangan acak
54 / 30 / 9 8 / 74 / 56 78 / 96 / 7 7 / 96 / 38
68 / 86 / 9 4 / 90 / 62 02 / 19 / 6 5 / 51 / 09
27 04 5 6 26 26 dst.
175
Wanita:
No str No kls No str No kls No str No kls No str No kls
1 2 17 18 33 36 49 53
2 3 18 21 34 37 50 54
3 4 19 22 35 38 51 55
4 5 20 23 36 39 52 56
5 6 21 24 37 40 53 60
6 7 22 25 38 41 54 61
7 8 23 26 39 42 55 62
8 9 24 27 40 43 56 63
9 10 25 28 41 44 57 64
10 11 26 29 42 45 58 65
11 12 27 30 43 46 59 66
12 13 28 31 44 47 60 67
13 14 29 32 45 49 61 68
14 15 30 33 46 50 62 69
15 16 31 34 47 51 63 70
16 17 32 35 48 52
176
Tabel 4. Hasil sampling acak sederhana pada stratum pria
No No str BB Rerata BB
(No kelas)
2
∑
j =1
x1 j
1 4 (48) 60 x1 =
2
135
2 1 (1) 75 = = 67.2
2
177
o Estimasi nilai rerata BB dengan sampel acak stratifikasi yang
diperoleh:
2 N x + N 2 x2
xst = ∑ N h xh N = 1 1
h =1 N1 + N 2
=
( 7 )( 67.5 ) + ( 63)( 49.875 ) = 51.64
7 + 63
178
Klaster 2 (IP 3.00-3.24):
No klast No kls No klast No kls No klast No kls No klast No kls
1 5 6 18 11 42 16 58
2 8 7 23 12 44 17 65
3 11 8 26 13 47 18 66
4 12 9 27 14 51 19 69
5 17 10 41 15 57
2 5 (19) 49 ∑
j =1
x1 j
3 7 (38) 42 x1 =
5
4 6 (37) 50
232
5 8 (40) 46 = = 46.4
5
179
o Pembacaan tabel bilangan acak yang terhenti pada titik akhir
untuk sampling acak sederhana pada klaster 4 dilanjutkan dengan
pembacaan untuk klaster 2.
o Dengan ukuran populasi klaster N 2 = 19, ukuran sampel klaster 2
n2 = 5, dilakukan pembacaan nomor-nomor dua digit: 96, 46, 62,
dan seterusnya. Pembacaan yang telah mencapai ujung kanan
baris diteruskan ke ujung kiri baris di bawahnya.
o Nomor terpilih (digarisbawahi di bawah ini) adalah nomor yang
lebih kecil daripada (atau sama dengan) 19. Nomor-nomor yang
sama hanya dapat dipilih satu kali.
o Pembacaan dihentikan setelah diperoleh 5 nomor berbeda yang
lebih kecil daripada (atau sama dengan) 19.
2 11 (42) 59 ∑
j =1
x2 j
3 8 (26) 50 x2 =
5
4 13 (47) 42 269
5 14 (51) 70 = = 53.8
5
1 5 12 19
= ( 232 ) + ( 269 ) = 56.39
70 2 5 5
180
4. Sampling Acak Sistematik
o Ukuran populasi N = 70, ukuran sampel n = 10, maka nilai k
adalah N/n = 70/10 = 7, sehingga N merupakan kelipatan bulat k.
o Mula-mula dilakukan sampling acak sederhana, yaitu memilih
menjadi angka 1 di antara 7 (nilai) untuk menentukan nomor
pertama yang terpilih menjadi anggota sampel.
o Digunakan tabel bilangan acak (tabel E) halaman 4, baris ke-80,
kolom ke-55 (hanya dibutuhkan 1 angka).
o Nomor terpilih (digarisbawahi di bawah ini) adalah nomor yang
lebih kecil daripada (atau sama dengan) 7, yaitu nomor 1,
sehingga yang terpilih untuk menjadi anggota sampel sistematik
adalah anggota populasi dengan nomor baris data 1, 8, 18, . . . ,
64 (10 orang).
No No kelas BB Rerata BB
1 1 75
2 8 49
3 15 45 10
4 22 57 ∑
i =1
xi
5 29 55
xsy =
10
6 36 53 542
7 43 45 = = 54.2
10
8 50 46
9 57 65
10 64 52
181
berdasarkan keempat metode sampling beserta nilai rerata populasi
sesungguhnya.
Tabel 14. Estimasi nilai rerata berat badan mahasiswa kelas 2PA01 TA
2002/2003, Depok dengan keempat metode sampling serta nilai rerata
populasi sesungguhnya
No Metode sampling Rerata BB (kg)
1 Sampling acak sederhana 50.7
2 Sampling acak stratifikasi 51.64
3 Sampling acak klaster 56.39
4 Sampling acak sistematik 54.2
Populasi kelas 49.87
182
LATIHAN 6
Bagian Pertama
Pilihlah satu jawaban yang paling benar !
183
5. Dibandingkan dengan nilai Var ( X ) pada sampling dengan
pengembalian, nilai Var ( X ) pada sampling tanpa pengembalian:
A. Selalu lebih besar.
B. Dapat lebih besar.
C. Tidak lebih besar.
D. Mungkin lebih besar, sama besar, ataupun lebih kecil.
x −µ
8. Pernyataan yang tidak benar mengenai transformasi ialah:
σ n
A. Hanya berdistribusi Z jika distribusi populasi normal dan n > 30
B. Hanya berdistribusi Z jika distribusi populasi normal
C. Hanya berdistribusi Z jika n > 30
D. Seluruhnya pernyataan di atas tidak benar
184
9. Pilihlah pernyataan yang salah:
A. Jika n besar dan populasi berdistribusi normal, distribusi
x −µ
sampling juga berdistribusi normal.
s n
B. Jika n besar dan populasi berdistribusi menceng ke kanan,
x −µ
distribusi sampling tetap berdistribusi normal.
s n
x −µ
C. Jika n besar dan distribusi sampling berdistribusi normal,
s n
distribusi populasinya pasti normal.
x −µ
D. Jika n besar dan distribusi sampling berdistribusi normal,
s n
distribusi populasinya mungkin menceng ke kiri.
11. Validitas data antara lain ditentukan oleh faktor berikut, kecuali:
A. Subjek / objek yang diukur
B. Instrumen pengukuran
C. Subjek pelaku pengukuran
D. Semua faktor di atas ikut menentukan validitas data
185
14. Populasi target adalah:
A. Kumpulan subjek / objek yang mengkontribusikan data bagi
penelitian.
B. Kumpulan subjek / objek yang eligibel untuk mengikuti proses
sampling.
C. Kumpulan subjek / objek yang sebenarnya hendak diestimasi
parameternya.
D. Semuanya salah.
15. Tiap elemen anggota populasi dimiliki probabilitas yang pasti sama
untuk terpilih menjadi anggota sampel pada:
A. Sampling acak sederhana. C. Sampling acak klaster.
B. Sampling acak stratifikasi. D. Semuanya benar.
20. Metode sampling yang hanya memerlukan penentuan secara acak bagi
anggota pertamanya didapatkan pada:
A. Sampling acak sederhana C. Samplingg acak kelompok
B. Sampling acak stratifikasi D. Sampling acak sistematik.
186
Bagian Kedua
Selesaikan soal-soal berikut:
1. Dimiliki populasi:
i 1 2 3 4 5 6 7 8 9 10
Xi 72 68 74 68 90 87 68 71 69 88
Hitunglah:
A. Rerata dan variansi populasi X
B. Rarata dan variansi distribusi sampling X jika dilakukan
sampling dengan pengembalian, n = 3.
C. Rerata dan variansi distribusi sampling X pada sampling tanpa
pengembalian dengan n = 3.
187
KEPUSTAKAAN
189
Kustituanto B, R Badrudin. Statistika I (Deskriptif). Jakarta: Penerbit
Gunadarma, 1994.
Maki DP, M Thompson. Finite Mathematics, Third Edition. New York:
McGraw-Hill, Inc, 1989.
Sanders DH. Statistics: A First Course, Fifth Edition. New York: McGraw-
Hill, Inc, 1995.
Scheaffer RL, W Mendelhall, L Ott. Elementary Survey Sampling, Third
Edition. Boston: Duxbury Press, 1986.
Snedecor GW, WG Cochran. Statistical Methods, Seventh Edition. Ames,
Iowa: The Iowa State University Press, 1982.
Soejoeti Z. Metode Statistik I. Jakarta: Universitas Terbuka Depdikbud,
1984.
Steel RGD, JH Torrie. Principles and Procedures of Statistics: A Biometrical
Approach, Second Edition. Auckland: McGraw-Hill International Book
Company, 1981.
Thompson SK. Sampling. New York: John Wiley & Sons, 1992.
190
review
STATISTIKA I
1
PENGERTIAN
• AWAL : segala sesuatu yang berhubungan
dengan informasi numerikal
• KINI : ilmu, seni, teknik tentang pengumpulan
data, penyajian data, analisis data, dan
pengambilan kesimpulan berdasarkan data
yang berhasil dikumpulkan
• metode yang berhubungan dengan penyajian
dan penafsiran kejadian yang bersifat peluang
dalam suatu penyelidikan terencana atau
penelitian ilmiah
2
DATA
Data :
➢ keterangan mengenai sesuatu
➢Jika diolah akan menghasilkan informasi
Jenis data
• Berdasarkan bentuknya
-Kuantitatif : berbentuk angka/ bilangan
-Kualitatif : tidak berbentuk angka/bilangan
3
DATA (lanjutan)
• Berdasarkan sumbernya
- Data intern : dikumpulkan dan digunakan
sendiri
- Data ekstern : dikumpulkan dan digunakan
oleh pihak lain
- Data primer : diumumkan sendiri oleh
pengumpulnya
- Data sekunder : diumumkan oleh pihak lain
(bukan pengumpulnya)
4
METODE STATISTIKA
➔prosedur-prosedur atau cara-cara penyajian dan
penafsiran data
• Penyajian data meliputi :
pengumpulan, pengorganisasian, peringkasan dan
penyajian data
(data collection, organization, summarization,
presentation)
• Penafsiran data meliputi :
analisis data, pendugaan, pengujian dugaan dan
penarikan kesimpulan (generalisasi). 5
METODE STATISTIKA (lanjutan)
• Statistika deskriptif :
– Serangakaian teknik : pengumpulan, penyajian,
dan peringkasan data
– Bersifat memberikan gambaran
• Statistika inferensia :
– Serangkaian teknik untuk mengkaji, menaksir, dan
mengambil kesimpulan
– Bersifat melakukan generalisasi (menarik
kesimpulan)
6
POPULASI & SAMPEL
• Populasi :
– Seluruh obyek yang ingin diketahui besaran
karakteristiknya
• Sampel :
– Sebagian obyek populasi (memiliki karakteristik sama
dengan populasinya) yang ingin diketahui besaran
karakteristiknya
7
POPULASI & SAMPEL (lanjutan)
• Bias : perbedaan ciri sampel dengan ciri
populasi tempat sampel diambil.
• Sampel yang baik adalah sampel dengan bias
minimal.
• Cara mendapatkan sampel dengan bias
minimal adalah dengan mengambil
sampel/Contoh acak.
•
8
Notasi penjumlahan
9
TABEL DISTRIBUSI FREKUENSI
Prinsip pembentukan Tabel Distribusi Frekuensi
1. Tentukan banyaknya kelas
→Jangan terlalu banyak/sedikit
2. Tentukan interval/selang kelas
→Semua data harus bisa dimasukkan dalam kelas TDF
→1 data hanya dapat dimasukkan ke dalam 1 kelas
3. Sorting data (ascending atau descending)
→Agar range data diketahui dan mempermudah
penghitungan frekuensi tiap kelas
10
Penentuan banyak kelas
→Sebenarnya tidak ada cara khusus menentukan banyaknya kelas.
• Cara Praktis
Banyak kelas : 5 – 15 dan untuk interval/selang kelas dipilih
bilangan-bilangan yang mudah misal kelipatan 5 atau 10
• Aturan STURGES
k = 1 + 3.322 log n
k = banyak kelas
n = banyak pengamatan/data
11
Interval kelas
r
i = ---
k
i = interval kelas
k = banyak Kelas
r = range data
Interval kelas
= Beda Batas Bawah Kelas ke-i dengan Batas Bawah kelas ke-i + 1
= Beda Batas Atas Kelas ke-i dengan Batas Atas kelas ke-i + 1
12
DISTRIBUSI FREKUENSI
• Distribusi frekuensi relatif
14
15
UKURAN STATISTIKA
Ukuran Pemusatan
→Bagaimana, di mana data berpusat?
• Rata-Rata Hitung
• Median
• Modus
• Kuartil, Desil, Persentil
Ukuran Penyebaran
→Bagaimana penyebaran data?
• Ragam, Varians
• Simpangan Baku
• Modus
• Median
17
Ukuran Penyebaran
18
Ukuran Penyebaran (lanjutan)
19
Ukuran Penyebaran (lanjutan)
20
Ukuran Penyebaran (lanjutan)
21
PROBABILITAS
* Ruang Contoh (S) : himpunan yang memuat semua
kemungkinan hasil percobaan
Misal : a.ruang contoh percobaan pelemparan
sebuah mata uang ?
S : {head, tail} atau { gambar, angka}
b.Ruang contoh pelemparan dadu
S : {1, 2, 3, 4, 5, 6 }
25
26
Hijau : BENAR Merah : SALAH
Penyelesaian
2. Bila nilai ujian statistika mempunyai mean 74 dan deviasi standar 7.9, hitunglah
◦ Nilai lulus terendah, bila mahasiswa dengan nilai 10% terendah mendapat E.
◦ Nilai B tertinggi, bila probabilitas mahasiswa dengan nilai 5% tertinggi men-dapat A .
Penyelesaian
3. Sebuah pengiriman 7 set televisi berisi 2 set cacat. Sebuah hotel melakukan pembelian secara
acak 3 set dari semua set televisi yang ada. Bila x adalah jumlah set televisi yang cacat yang
dibeli oleh hotel tersebut,
◦ Carilah distribusi probabilitas X
◦ Carilah distribusi kumulatif F(x)
◦ Dengan menggunakan F(x), hitunglah P(X = 1) dan P(0 < x 2)
◦ Hitung nilai E(X)
Penyelesaian
4. Jumlah jam total, yang diukur dalam satuan 100 jam, bahwa suatu fungsi keluarga
menggunakan pengisap debu pada periode satu tahun merupakan suatu variabel random
kontinu X yang mempunyai fungsi probabilitas : f(x) = x , untuk 0 < x < 1, f(x) = 2 – x , untuk 1
x < 2, dan f(x) = 0, untuk x lainnya
◦ Tunjukkan bahwa P(0 < x < 2) = 1
◦ Carilah probabilitas bahwa pada periode satu tahun, sebuah keluarga menggunakan pengisap
debu mereka kurang dari 120 jam
◦ Carilah probabilitas bahwa pada periode satu tahun, sebuah keluarga menggunakan pengisap
debu mereka antara 50 sampai 100 jam.
◦ Carilah probabilitas bahwa pada periode satu tahun, sebuah keluarga menggunakan pengisap
debu mereka lebih dari 150 jam.
◦ Hitung nilai harapan X.
Penyeklesaian
5. Sebuah industri yang menghasilkan sabun mandi telah mengambil sampel 3 buah sabun mandi
dengan aroma melati dan 7 aroma mawar. Semua sabun mempunyai bentuk dan ukuran sama.
Semua sampel dimasukkan dalam kotak dan kemudian diambil 4 sabun. Didefinisikan variabel
random X adalah banyaknya sabun mandi beraroma melati yang terambil, tentukan:
• Nilai dari variabel random X
• Distribusi probabilitas variabel random X
• Distribusi kumulatif F(x) kemudian hitung P(X=2)
• Hitung rata-rata dan variansinya
Penyelesaian
6. • Proporsi orang yang menjawab suatu tawaran lewat pos berbetuk varaibel random kontinu X
yang mempunyai fungsi padat probabilitas untuk 0 < x < 1 dan f(x) = 0 untuk nilai x lainnya.
• Buktikan bahwa f(X) merupakan fungsi padat probabilitas.
• Hitung P( ½ < x < ¼)
• Tentukan distribusi kumulatif F(x) kemudian hitung P( ½ < x < ¼)
2(𝑥+2)
𝑓 (𝑥 ) =
5
Penyelesaian
7. Probabilitas menghasilkan produk cacat dari PT Idaman, sebuah perusahaan yang
menghasilkan lemari es, adalah 0,2. Dalam rangka untuk mengendalikan kualitas lemari es,
maka bagian pengendali kualitas bermaksud melakukan penelitian tentang probilitas
kerusakan lemari es. Sebagai langkah awal diambillah sampel sebanyak 8 lemari es. Dari 8
lemari es tersebut berapakah probabilitas diperoleh :
◦ Dua lemari es rusak
◦ Tiga lemari es baik
◦ Paling banyak 7 lemari es baik
◦ Antara 3 sampai 5 lemari es rusak
◦ Paling sedikit 2 lemari es baik
◦ Paling banyak 2 lemari es rusak
Penyelesaian
8. Disket yang diproduksi oleh PT Akbar ternyata sangat berkualitas. Hal ini terbukti dari 100
buah disket ternyata hanya ada 2 disket yang tidak berfungsi. Apabila diambil 150 buah disket,
maka probabilitas:
◦ Tiga diantaranya tidak berfungsi
◦ Maksimum 5 tidak berfungsi
◦ Antara 3 sampai 6 tidak berfungsi
◦ Minimum 145 berfungsi
Penyelesaian
9. Rata-rata banyaknya makanan kaleng yang ada di gudang telah kadaluarsa adalah 5. Diambil
sampel random sebanyak 10 buah makanan kaleng di gudang, hitung probabilitas:
◦ Lima diantaranya kadaluarsa
◦ Maksimum 4 telah kadaluarsa
◦ Antara 5 sampai 8 telah kadaluarsa
◦ Minimum 186 masih bisa dimakan
Penyelesaian
10. Tes IQ 600 calon mahasiswa mempunyai mean 115 dan deviasi standarnya 12. Mahasiswa
dikatakan lulus tes, bila mempunyai IQ paling rendah 95, berapakah mahasiswa yang
dinyatakan tidak lulus ?
Penyelesaian
11. Gaji pegawai suatu perusahaan rata-rata Rp.525,- per jam dengan deviasi standar Rp.60,-.
◦ Berapa persen karyawan yang bergaji Rp.575,- dan Rp.600,- per jam ?
◦ Di atas berapa rupiahkah 5% gaji per jam tertinggi ?
Penyelesaian
Penyelesaian
Peluang terambilnya 2 kartu face mengikuti aturan kombinasi yaitu pengelompokan unsur
tanpa memperhatikan urutan. Banyaknya kombinasi yang terjadi dapat dihitung dengan
urutan :
𝑛!
nCr =
{𝑟!(𝑛−𝑟)!}
dengan :
nCr = Banyaknya kombinasi r unsur dari n unsur yang tersedia
n = Banyak unsur yang tersedia
r = Banyak unsur yang diambil
Penyelesaian
Seperangkat kartu bridge terdiri dari 52 kartu, sehingga n(S) = 52
Banyaknya kartu Queen ada 4, sehingga peluang terambilnya sebuah kartu Queen :
𝑛(𝑄)
P (Q) =
𝑛(𝑆)
4
=
52
1
=
3
13. Dua puluh mahasiswa tingkat satu dibagi ke dalam 10 pasang, setiap pasangan kira-kira
mempunyai IQ yang sama. Salah seorang dari setiap pasangan diambil secara acak dan
diamsukkan ke dalam kelas yang hanya menggunakan bahan terprogramkan. Anggota
pasangan yang lain dimasukkan ke dalam kelas biasa. Pada akhir semester kedua grup itu
diberikan ujian yang sama dan hasilnya sbb:
Tentukan selang kepercayaan 98% bagi selisih sesungguhnya dalam kedua metode pengajaran
tersebut?
Penyelesaian
25. Apa perbedaan antara ukuran Statistik dari data tersebar dengan data kelompok ?
Ukuran penyebaran data digunakan sebagai ukuran yang menunjukkan seberapa jauh
data tersebar dari rata-rata. Ukuran penyebaran data ini terdiri dari :
Jangkauan adalah range yaitu selisih data antara nilai terbesar dan terkecil
dalam data kelompok simpangan rata-rata adalah untuk nilai yang di observasi
terhadap rata-rata
simpangan baku adalah nilai ukuran penyebaran data yang secara umum paling
banyak digunakan
kuartil adalah ukuran posisi yang membagi kelompok data menjadi 4 bagian
sama besar
desil adalah nilai batas atas sekumpulan data yang dibagi menjadi 10 bagian
sama besar
persentil adalah nilai batas yang membagi data menjadi 100 bagian yang sama
besar
Data kelompok adalah cara penyajian data yang menggunakan tabel distribusi frekuensi
di mana data tersebut dikelompokkan ke data interval tertentu
26. Apakah Persyaratan yang harus dipenuhi untuk menentukan ukuran statistik pada data
kelompok ?
Ada 3 ukuran pemusatan data yang sering digunakan yaitu :
rata-rata adalah nilai yang memiliki himpunan atau sekumpulan data (aset of data).
Rata-rata sangat baik digunakan apabila sebaran data merata atau nilai antara data
yang satu dengan data yang lain tidak berbeda jauh (homogen)
median adalah nilai yang terletak di bagian tengah dari suatu kumpulan data yang telah
diurutkan. Nilai median dipengaruhi oleh banyaknya pengamatan dan tidak tergantung
pada besarnya nilai pengamatan walaupun nilainya tersebut sangat ekstrem
modus adalah nilai yang paling sering muncul dari sekumpulan data
27. Untuk menentukan ukuran statistik data kelompok, data apa yang perlu disajikan pada
ditribusi frekuensi.
Data yang dapat disajikan bisa berupa nilai individual atau nilai data yang sudah
dikelompokkan ke dalam selang interval tertentu yang di sertakan dengan nilai frekuensi yang
sesuai
Bab I
Pendahuluan dan Notasi Sigma
1. Pengertian Statistika
2. Jenis-Jenis Data
3. Metode Statistika
3
Contoh Masalah Statistika Deskriptif :
1. Tabulasi Data
2. Diagram Balok
3. Diagram Kue Pie
4. Grafik perkembangan harga dari tahun ke tahun
Contoh 1
Seorang mahasiswi FE-UG, mengumpulkan data untuk
penulisan ilmiahnya dengan mewawancara 10 pedagang
asongan di depan kampus. Hasilnya diketahui bahwa
rata-rata pendapatan kotor mereka adalah Rp. 97,523.25.
Hasil wawancara tersebut dilaporkan dalam PI-nya.
(Deskriptif, Primer, Numerik)
Contoh 2
Berdasarkan tayangan TV langsung dari Bursa Efek, Drs.
Djoko (seorang pialang saham) memperkirakan bahwa
harga saham perusahaan-perusahaan “Blue-Chip” akan
terus turun sampai minggu ke tiga bulan September.
Perubahan akan bervariasi antara $ -2.35 sampai $ -5.60
per 100 lembar. (Inferensia, Sekunder, Numerik)
Contoh 3
Dalam rangka pengembangan produk, perusahaan
DONKING DONUT melakukan survei rasa kesukaan
(favorite favor) donatnya secara acak terhadap 1000
pelanggannya. Pelanggan terpilih diminta menetapkan
rangking terhadap 4 macam rasa donat yang baru
(MINT, PEACH, MOCCA, SUGAR-FREE). Hasil
4
survey disajikan dalam bentuk diagram pie. (Deskriptif,
Primer, Kategorik)
4. Populasi Vs Sampel
5
4.2. Parameter dan Statistik
Bedakan antara :
Statistik (tanpa akhiran “a”) = Statistic (without “s”)
dengan :
Statistika (dengan “a”) = Statistics (with “s”).
Bentuk Umum :
n
x i =1
i = x1 + x2 + x3 +... xn
i : indeks dari 1,2,3,..n:
xi : data/nilai/pengamatan ke-i
6
Dalil-1 :
Penjumlahan 2 atau lebih peubah (variabel) = jumlah
masing-masing penjumlahannya
n n n n
(x
i =1
i + yi + zi ) = xi + yi + zi
i =1 i =1 i =1
i : indeks, 1,2,3,...n
xi : nilai ke-i untuk variabel ke-1
yi : nilai ke-i untuk variabel ke-2
zi : nilai ke-i untuk variabel ke-3
Dalil-2
Jika c adalah konstanta maka :
n n
cxi = c xi
i =1 i =1
Dalil-3
Jika c adalah konstanta maka :
n
c
i =1
i = nc
7
Soal-soal
8
3. Definisikan suatu populasi bagi contoh-contoh berikut ini :
a. Penghuni 200 rumah di kota Depok dihubungi melalui
telepon dan ditanya apakah mereka merasa senang
dengan di bukanya ITC dan Town Square di jalan
Margonda.
b. Dua ratus pasang sepatu tennis jenis baru diuji,
ternyata rata-rata umur pakainya mencapai 4 bulan.
c. Dari lima kali pencatatan , untuk mencapai kantornya
di tengah kota, seseorang memerlukan waktu 21, 26,
24, 22, dan 21 menit.
x 13 24 35 46 49 47 86 43 45 76
y 21 17 65 72 53 78 90 56 87 43
z 24 21 69 76 57 82 85 32 65 43
8
b. (2xi 2-yi + 3)
i=3
5
c. (xi + 2) / xi
i=2
d. xi 2 yi
e. (2xi - yi + 3 zi )
9
Bab II
Menghimpun Data
1. Pengertian Data
Data → merupakan kumpulan fakta atau angka atau
segala sesuatu yang dapat dipercaya
kebenarannya sehingga dapat digunakan
sebagai dasar menarik suatu kesimpulan
4. Menyusun Kuesioner
Tahap terpenting dalam pengumpulan data
Kuesioner memuat berbagai pertanyaan, terdiri atas :
o Identifikasi data, memuat :
identitas responden,
waktu, wawancara
nama, dan kode pewawancara
o Permohonan kerjasama, memuat :
Instansi/lembaga yang melaksanakan wawancara
Maksud dan tujuan wawancara
o Petunjuk pengisian
o Inti kuesioner :
pertanyaan yang berkaitan dengan informasi/data yang
dibutuhkan
o Klasifikasi data :
menunjukkan karakteristik responden
Tahap-tahap dalam menyusun kuesioner :
a. Persiapan
b. Penetapan isi pertanyaan
pendekatan agar responden memiliki kesediaan untuk
memberikan tanggapan :
• Counterbiasing statement
• Indirect Statement
• Randomized response technique
c. Penetapan tipe pertanyaan
• Pertanyaan terbuka
• Pertanyaan tertutup
• Pertanyaan campuran
• Pertanyaan kotomi
d. Penyusunan kalimat
• Kalimat sederhana
• Kalimat harus jelas
• Hindari pertanyaan bersifat mengarahkan
• Hindari pertanyaan ganda dalam satu kalimat
e. Pengurutan pertanyaan
• Menggunakan pertanyaan pembuka yang
sederhana dan menarik
• Mendahulukan pertanyaan yang bersifat umum
• Letakkan pertanyaan yang sulit dan kurang me
narik pada urutan terakhir
• Susun kalimat dengan urutan logik
f. Penetapan karakteristik fisikal
g. Uji Pendahuluan dan perbaikan
5. Pemilihan Sampel
a. Unit Sampling
b. Kerangka Sampling
c. Populasi Kajian
d. Proses Sampling
Distribusi frekuensi :
Penyajian data dengan pengelompokan data berdasarkan ciri-
ciri penting sejumlah data, ke dalam beberapa kelas dan meng
hitung banyaknya pengamatan yang masuk ke dalam setiap
kelas.
Distribusi frekuensi :
• Distribusi frekuensi bilangan
o Data berupa angka
o Kelas menurut besar bilangan
• Distribusi frekuensi kategoris
o Data bukan angka
o Kelas berdasarkan sifat lain
Contoh
• Distribusi frekuensi bilangan • Distribusi frekuensi kategoris
Bobot koper (kg) Banyaknya Kategori Banyaknya
7–9 3 Anak-anak 30
10 – 12 7 Gadis 35
13 – 15 17 Bersuami 25
16 – 18 15 Janda 10
19 - 21 8
• Jumlah kelas
a. Tergantung keadaan dan banyaknya data
b. Biasanya antara 5 – 20 kelas
c. Dapat ditentukan dengan aturan Sturges :
Penyajian grafik
• Diagram Balok
Sumbu x : menggunakan selang kelas
Sumbu y : menggunakan frekuensi
• Histogram
Sumbu x : menggunakan tepi batas kelas
Sumbu y : menggunakan frekuensi
• Poligon
Sumbu x : menggunakan titik tengah
Sumbu y : menggunakan frekuensi
• Ogive/Poligon frekuensi kumulatif
Sumbu x : menggunakan tepi batas kelas
Sumbu y : menggunakan frekuensi kumulatif
Soal Latihan peerorangan :
(dikerjakan dalam selembar kertas, dikumpulkan per kelompok)
≥ 53 52,5 – 60,5 40
≥ 61 60,5 – 68,5 38
≥ 69 68,5 – 76,5 dst
dst
Bab IV
Ukuran Statistik
1. Pendahuluan
Ukuran Statistik (diskripsi data):
1. Ukuran Pemusatan
Bagaimana, di mana data berpusat?
Rata-Rata Hitung = Arithmetic Mean
Median
Modus
Kuartil, Desil, Persentil
2. Ukuran Penyebaran
Bagaimana penyebaran data?
Ragam, Varians
Simpangan Baku
2. Ukuran Pemusatan
xi
n
x i
= i =1
dan x = i =1
N n
Dimana :
: rata-rata hitung populasi x : rata-rata hitung sampel
N : ukuran Populasi n : ukuran Sampel
xi : data sampel /populasi ke i
• Metode Defisional
n
fx
n
i =1
i i
fx
i =1
i i
𝑥̅ = sehingga : 𝑥̅ =
n
𝑛
fi
i =1
Dimana :
𝑥̅ : rata-rata hitung sampel fi : frekuensi di kelas ke-i
n : ukuran Sampel xi : Titik Tengah Kelas ke-i
• Metode pendugaan
dengan suatu nilai dugaan (M)
fi di
x = M + i =1
n
Dimana :
di = x i – M
xi : Titik Tengah Kelas ke-i
M : dapat ditentukan sembarang !
Tidak ada cara khusus!
atau …..
M dapat ditentukan dengan :
Titik Tengah Kelas (xi) pada Kelas tepat di tengah TDF
• jika banyak kelas (k) ganjil
maka ambil (xi) pada kelas ke k + 1 (kelas yang di
2
tengah-tengah)
• jika banyak kelas (k) genap
k k
maka gunakan (xi) pada kelas ke dan kelas ke +1
2 2
selanjutnya kedua nilai (xi) tersebut dibagi dua
• Metode pengkodean
dengan menggunakan kode U
hanya bisa untuk interval kelas sama
n
U
i =1
i fi
𝑥̅ = 𝑥𝑎 + 𝑖
𝑛
[ ]
Dimana :
i : interval Ui : kode kelas ke – i
n : ukuran sample fi : frekuensi kelas ke i
xa : Titik Tengah Kelas dengan Ui = 0
i =1
(𝑥𝑖 − 𝑥̅ )= 0
i =1
(𝑥𝑖 − 𝑥̅ )2 = 𝑚𝑖𝑛𝑖𝑚𝑢𝑚
2.2 Modus
Nilai yang paling sering muncul
Nilai yang frekuensinya paling tinggi
d1
Modus = TBB Kelas Modus + i
d1 + d 2
di mana :
Kelas Modus : Kelas di mana Modus berada
Kelas dengan frekuensi tertinggi
TBB : Tepi Batas Bawah
d1 : Beda Frekuensi Kelas Modus dengan
Frekuensi Kelas sebelumnya
d2 : Beda Frekuensi Kelas Modus dengan
Frekuensi Kelas sesudahnya
I : interval kelas
Sifat-sifat :
• Tidak dipengaruhi angka ekstrim
• Dapat dihitung dari data kelompok
• Dapat dicari dari data kualitatif
• Merupakan ukuran pusat data semu
Contoh 1. :
a. Nilai rata-rata hitung dengan metode defisional
1679
x = = 33.58
50
b. Nilai rata-rata hitung dengan metode pengkodean
Kelas xi M di Frekuensi fi di
(fi)
16-23 19.5 39.5 -20 10 -200
24-31 27.5 39.5 -12 17 -204
32-39 35.5 39.5 - 4 7 -28
40-47 43.5 39.5 4 10 40
48-55 51.5 39.5 12 3 36
56-63 59.5 39.5 20 3 60
Jumlah () 0 50 -296
n
fd
i =1
i i
x= M+
n
− 295
= 39.5 + = 39.5 − 592
. = 3358
.
50
Contoh 2. :
Sumbangan PMI warga Depok
Rp. 7500 8000 9000 8000 3000 5000 8000
Contoh 3. :
1. Berat 5 orang bayi :
3.6 3.5 2.9 3.1 3.0
(Tidak Ada Modus)
2. Umur Mahasiswa :
19 18 19 18 23 21
19 21 18 20 22 17
Modus : 18 dan 19
Contoh 4. :
Kelas Modus = 24 - 31
TBB Kelas Modus = 23.5
i (interval) = 8
frek. kelas Modus = 17
frek. kelas sebelum kelas Modus = 10
frek. kelas sesudah kelas Modus = 7
d1 = 17 - 10 = 7
d2 = 17 - 7 = 10
7
Modus = 23.5 + 8
7 + 10
7
= 23.5 + 8
17
= 23.5 + 8 (0.41176...)
= 23.5 + 3.2941...
= 26.7941... 27
Median = TBB Kelas Median + i s
fM
atau
n
Letak Median = n: banyak data
2
dimana :
TBB : Tepi Batas Bawah
s : selisih antara Letak Median dengan
Frekuensi Kumulatif sebelum kelas Median
TBA : Tepi Batas Atas
s’ : selisih antara Frekuensi Kumulatif sampai
kelas Median dengan Letak Median
i : interval kelas
fM : Frekuensi kelas Median
B.2. Kuartil untuk Grouped Data
Kuartil ke-q =TBA Kelas Kuartil ke-q - i s'
fQ
dimana :
TBB : Tepi Batas Bawah
s : selisih antara Letak Kuartil ke-q dengan
Frekuensi Kumulatif sebelum kelas Kuartil
ke-q
TBA : Tepi Batas Atas
s’ : selisih antara Frekuensi Kumulatif
sampai kelas Kuartil ke-q dengan Letak
Kuartil ke-q
i : interval kelas
fQ : Frekuensi kelas Kuartil ke-q
atau
s'
Desil ke-d =TBA Kelas Desil ke-d - i
fD
dimana :
TBB : Tepi Batas Bawah
S : selisih antara Letak Desil ke-d dengan
Frekuensi Kumulatif sebelum kelas
Desil ke-d
TBA : Tepi Batas Atas
s’ : selisih antara Frekuensi Kumulatif
sampai kelas Desil ke-d dengan Letak
Desil ke-d
i : interval kelas
fD : Frekuensi kelas Desil ke-d
atau
s'
Persentil ke-p = TBA Kelas Persentil ke-p - i
fP
dimana :
TBB : Tepi Batas Bawah
s : selisih antara Letak Persentil ke-p dengan
Frekuensi Kumulatif sebelum kelas Persentil
ke-p
TBA : Tepi Batas Atas
s’ : selisih antara Frekuensi Kumulatif sampai
kelas Persentil ke-p dengan Letak Persentil ke-p
i : interval kelas
fP : Frekuensi kelas Persentil ke-p
Contoh 1 :
Tinggi Badan 5 mahasiswa:
Sorted :
1.60 1.73 1.75 1.78 1.78 meter
n=5
5+1 6
Letak Median = = =3
2 2
Median = Data ke-3 = 1.75
Contoh 2:
Tinggi 6 mahasiswa :
n= 6
6+1 7
Letak Median → = = 3.5
2 2
Median
= 1 (Data ke 3 + Data ke 4)
2
= 1 (1.75 + 1.78) = 1.765
2
= Data ke-3 + 0.5 (Data ke-4 – Data ke-3)
= 1.75 + 0.5 (1.78 – 1.75)
= 1.75 + (0.5 0.02)
= 1.75 + 0.015 = 1.765
Contoh 3:
Terdapat 253 data yang sudah tersortir ascending
Data ke-190 bernilai 175 ;Data ke-191 bernilai 180
Data ke-50 bernilai 45 ;Data ke-51 bernilai 48
Data ke-165 bernilai 100 ;Data ke-166 bernilai 102
Letak Kuartil ke-3 =
3( n + 1 ) 3( 253 + 1 ) 762
= = = 190.5
4 4 4
Nilai Kuartil ke-3
= Data ke 190 + 0.5 (Data ke-191 – Data ke-190)
= 175 + 0.5 (180 – 175) = 175 + (0.5 5)
= 175 + 2.5 = 177.5
n 50
Letak Median = = = 25 interval = i = 8
2 2
Median = Data ke-25 terletak di kelas 24-31
Kelas Median = 24 - 31
TBB Kelas Median = 23.5
TBA Kelas Median = 31.5
f M = 17
Frek. Kumulatif sebelum Kelas Median = 10
→ s = 25 - 10 = 15
Frek. Kumulatif sampai Kelas Median = 27
→ s’ = 27 - 25 = 2
Median = TBB Kelas Median + i s
fM
= 23.5 + 8 15
17
= 23.5 + 8 (0.8823...)
= 23.5 + 7.0588...
= 30.5588... 30.6
Median = TBA Kelas Median - i s'
fM
31.5 - 8
2
=
17
= 31.5 - 8 (0.1176...)
= 31.5 - 0.9411..= 30.5588... 30.6
= 39.5 + 8 35
.
10
= 39.5 + 8 (0.35)
= 39.5 + 2.8 = 42.3
Kuartil ke-3 = TBA Kelas Kuartil ke-3 - i s'
fQ
6.5
= 47.5 - 8
10
= 47.5 - 8 ( 0.65)
= 47.5 - 5.2 = 42.3
interval = i = 8
56n 56 50
Letak Persentil ke-56 = = = 28
100 100
Persentil ke-56 = Data ke-28 terletak di kelas 32 - 39
Kelas Persentil ke-56 = 32 - 39
TBB Kelas Persentil ke-56 = 31.5
TBA Kelas Persentil ke-56 = 39.5
f P56 = 7
Frek. Kumulatif sebelum Kelas Persentil ke-56 = 27
→ s = 28 - 27 = 1
Frek. Kumulatif sampai Kelas Persentil ke-56 = 34
→ s’ = 34 - 28 = 6
s
Persentil ke-56 = TBB Kelas Persentil ke-56 + i
fP
= 31.5 + 8 1
7
= 31.5 + 8 (0.142...)
= 31.5 + 1.142..
= 32.642...
s'
Persentil ke-56 = TBA Kelas Persentil ke-56 - i
fP
= 39.5 - 8 6
7
= 39.5 - 8 (0.857...)
= 39.5 - 6.857...
= 32.642...
Bx
i =1
i i
xB = n
B
i =1
i
Dimana
xB : rata-rata tertimbang xi : data ke-I
Bi : beban ke-I n: banyak data
atau
3. Ukuran Penyebaran
Meliputi :
• Jangkauan :
o Beda antara data terbesar dengan data terkecil
• Inter quartile :
o Beda antara Quartile ke3 dengan Quartile ke 1
• Deviasi kuartil :
o Rata-rata hitung inter kuartil
• Deviasi rata-rata :
o Rata-rata beda absolute antara data observasi
individu dengan pusat data (nilai rata-rata)
• Variasi :
o Variabilitas data yang merupakan rata-rata
selisih/beda kuadrat antara data observasi dengan
pusat data (nilai rata-rata)
• Simpangan baku
• Koefisien variasi
POPULASI :
N
xi −
Deviasi rata - rata = i =1
SAMPEL :
n
xi − x
Deviasi rata - rata = i =1
n
POPULASI :
k
f i xi −
Deviasi rata - rata = i =1
SAMPEL :
k
fi xi − x
Deviasi rata - rata = i =1
n
POPULASI :
N N
N xi 2 − ( xi ) 2
N
(x i − ) 2
2 = i =1 atau 2 = i =1 i =1
N2
dan = 2
SAMPEL :
n n n
(x i − x )2 n xi 2 − ( xi )2
i =1 i =1
s2 = i =1
atau s2 =
n −1 n( n − 1)
dan s= s2
Dimana :
x i : data ke-i
: rata-rata populasi x : rata-rata sampel
² : ragam populasi s² : ragam sampel
: simpangan baku populasi s : simpangan baku sampel
N : ukuran populasi n : ukuran sampel
POPULASI :
k
f i ( xi − ) 2
2
= i =1
dan = 2
SAMPEL :
k
f ( xi − x ) 2
s = s2
i
i =1
s2 = dan
n −1
Dimana :
x i : Titik Tengah Kelas ke-i f i : frekuensi kelas ke-i
k : banyak kelas
: rata-rata populasi x : rata-rata sampel
² : ragam populasi s² : ragam sampel
: simpangan baku populasi s : simpangan baku sampel
N : ukuran populasi n : ukuran sampel
3.5. Koefisien Ragam
Koefisien Ragam = Koefisien Varians
Semakin besar nilai Koefisien Ragam maka data semakin
bervariasi, keragaman data makin tinggi.
Untuk Populasi
→ Koefisien Ragam =
100%
Untuk Sampel
s
→ Koefisien Ragam = 100%
x
x−
z=
Dimana :
z : Angka baku x : nilai data
: rata-rata populasi : simpangan baku populasi
selesai
Penyajian Data dalam Distribusi Frekuensi (Group Data)
k
f x fid i f iU i
i . i
x M i 1
x Xa i 1
x i1
n n
n
b. Penentuan /Perhitungan Modus
kelas modus
2 24-31 23.5 31.5 27.5 17
𝒅𝟐 = 17 - 7
3 32-39 31.5 39.5 35.5 7
Xa
d1
Modus = TBB Kelas Modus + i
d1 d 2
7
Modus = 23.5 + 8
7 1 10
Modus = 23.5 + 8 (7 /17)
c. Penentuan /Perhitungan Median, Kuartil , Desil, Presentil
3 .5
Kuartil ke-q
39.5=+ 8 ` = ….
10
Untuk Desil dan Presentil sama , hanya edikit berbeda cara mencari letaknya ( lihat rumus)
d. Penentuan /Perhitungan Deviasi rata-rata , Varians dan standart deviasi
k
f i xi f i ( xi ) 2
Deviasi rata - rata i 1
2
i 1
σ = σ2
Bab IV
Ukuran Statistik
1. Pendahuluan
Ukuran Statistik (diskripsi data):
1. Ukuran Pemusatan
Bagaimana, di mana data berpusat?
Rata-Rata Hitung = Arithmetic Mean
Median
Modus
Kuartil, Desil, Persentil
2. Ukuran Penyebaran
Bagaimana penyebaran data?
Ragam, Varians
Simpangan Baku
2. Ukuran Pemusatan
xi
n
x i
i 1
dan x i 1
N n
Dimana :
: rata-rata hitung populasi x : rata-rata hitung sampel
N : ukuran Populasi n : ukuran Sampel
xi : data sampel /populasi ke i
Metode Defisional
n
fx
n
i 1
i i
fx
i 1
i i
𝑥̅ = sehingga : 𝑥̅ =
n
f
𝑛
i
i 1
Dimana :
𝑥̅ : rata-rata hitung sampel fi : frekuensi di kelas ke-i
n : ukuran Sampel xi : Titik Tengah Kelas ke-i
Metode pendugaan
dengan suatu nilai dugaan (M)
fi di
x M i 1
n
Dimana :
di = x i – M
xi : Titik Tengah Kelas ke-i
M : dapat ditentukan sembarang !
Tidak ada cara khusus!
atau …..
M dapat ditentukan dengan :
Titik Tengah Kelas (xi) pada Kelas tepat di tengah TDF
jika banyak kelas (k) ganjil
maka ambil (xi) pada kelas ke k 1 (kelas yang di
2
tengah-tengah)
jika banyak kelas (k) genap
k k
maka gunakan (xi) pada kelas ke dan kelas ke +1
2 2
selanjutnya kedua nilai (xi) tersebut dibagi dua
Metode pengkodean
dengan menggunakan kode U
hanya bisa untuk interval kelas sama
n
U
i 1
f
i i
𝑥̅ = 𝑥𝑎 + 𝑖
𝑛
[ ]
Dimana :
i : interval Ui : kode kelas ke – i
n : ukuran sample fi : frekuensi kelas ke i
xa : Titik Tengah Kelas dengan Ui = 0
i 1
(𝑥𝑖 − 𝑥̅ )= 0
i 1
(𝑥𝑖 − 𝑥̅ )2 = 𝑚𝑖𝑛𝑖𝑚𝑢𝑚
2.2 Modus
Nilai yang paling sering muncul
Nilai yang frekuensinya paling tinggi
d1
Modus = TBB Kelas Modus + i
d1 d 2
di mana :
Kelas Modus : Kelas di mana Modus berada
Kelas dengan frekuensi tertinggi
TBB : Tepi Batas Bawah
d1 : Beda Frekuensi Kelas Modus dengan
Frekuensi Kelas sebelumnya
d2 : Beda Frekuensi Kelas Modus dengan
Frekuensi Kelas sesudahnya
I : interval kelas
Sifat-sifat :
Tidak dipengaruhi angka ekstrim
Dapat dihitung dari data kelompok
Dapat dicari dari data kualitatif
Merupakan ukuran pusat data semu
Contoh 1. :
a. Nilai rata-rata hitung dengan metode defisional
1679
x = = 33.58
50
b. Nilai rata-rata hitung dengan metode pengkodean
Kelas xi M di Frekuensi fi di
(fi)
16-23 19.5 39.5 -20 10 -200
24-31 27.5 39.5 -12 17 -204
32-39 35.5 39.5 - 4 7 -28
40-47 43.5 39.5 4 10 40
48-55 51.5 39.5 12 3 36
56-63 59.5 39.5 20 3 60
Jumlah () 0 50 -296
n
fdi 1
i i
x M
n
295
= 39.5 39.5 5.92 3358
.
50
Contoh 2. :
Sumbangan PMI warga Depok
Rp. 7500 8000 9000 8000 3000 5000 8000
Contoh 3. :
1. Berat 5 orang bayi :
3.6 3.5 2.9 3.1 3.0
(Tidak Ada Modus)
2. Umur Mahasiswa :
19 18 19 18 23 21
19 21 18 20 22 17
Modus : 18 dan 19
Contoh 4. :
Kelas Modus = 24 - 31
TBB Kelas Modus = 23.5
i (interval) = 8
frek. kelas Modus = 17
frek. kelas sebelum kelas Modus = 10
frek. kelas sesudah kelas Modus = 7
d1 = 17 - 10 = 7
d2 = 17 - 7 = 10
7
Modus = 23.5 + 8
7 10
7
= 23.5 + 8
17
= 23.5 + 8 (0.41176...)
= 23.5 + 3.2941...
= 26.7941... 27
Median = TBB Kelas Median + i s
fM
atau
n
Letak Median = n: banyak data
2
dimana :
TBB : Tepi Batas Bawah
s : selisih antara Letak Median dengan
Frekuensi Kumulatif sebelum kelas Median
TBA : Tepi Batas Atas
s’ : selisih antara Frekuensi Kumulatif sampai
kelas Median dengan Letak Median
i : interval kelas
fM : Frekuensi kelas Median
B.2. Kuartil untuk Grouped Data
Kuartil ke-q =TBA Kelas Kuartil ke-q - i s'
fQ
dimana :
TBB : Tepi Batas Bawah
s : selisih antara Letak Kuartil ke-q dengan
Frekuensi Kumulatif sebelum kelas Kuartil
ke-q
TBA : Tepi Batas Atas
s’ : selisih antara Frekuensi Kumulatif
sampai kelas Kuartil ke-q dengan Letak
Kuartil ke-q
i : interval kelas
fQ : Frekuensi kelas Kuartil ke-q
atau
s'
Desil ke-d =TBA Kelas Desil ke-d - i
fD
dimana :
TBB : Tepi Batas Bawah
S : selisih antara Letak Desil ke-d dengan
Frekuensi Kumulatif sebelum kelas
Desil ke-d
TBA : Tepi Batas Atas
s’ : selisih antara Frekuensi Kumulatif
sampai kelas Desil ke-d dengan Letak
Desil ke-d
i : interval kelas
fD : Frekuensi kelas Desil ke-d
atau
s'
Persentil ke-p = TBA Kelas Persentil ke-p - i
fP
dimana :
TBB : Tepi Batas Bawah
s : selisih antara Letak Persentil ke-p dengan
Frekuensi Kumulatif sebelum kelas Persentil
ke-p
TBA : Tepi Batas Atas
s’ : selisih antara Frekuensi Kumulatif sampai
kelas Persentil ke-p dengan Letak Persentil ke-p
i : interval kelas
fP : Frekuensi kelas Persentil ke-p
Contoh 1 :
Tinggi Badan 5 mahasiswa:
Sorted :
1.60 1.73 1.75 1.78 1.78 meter
n=5
51 6
Letak Median = = =3
2 2
Median = Data ke-3 = 1.75
Contoh 2:
Tinggi 6 mahasiswa :
n= 6
61 7
Letak Median = = 3.5
2 2
Median
= 1 (Data ke 3 + Data ke 4)
2
= 1 (1.75 + 1.78) = 1.765
2
= Data ke-3 + 0.5 (Data ke-4 – Data ke-3)
= 1.75 + 0.5 (1.78 – 1.75)
= 1.75 + (0.5 0.02)
= 1.75 + 0.015 = 1.765
Contoh 3:
Terdapat 253 data yang sudah tersortir ascending
Data ke-190 bernilai 175 ;Data ke-191 bernilai 180
Data ke-50 bernilai 45 ;Data ke-51 bernilai 48
Data ke-165 bernilai 100 ;Data ke-166 bernilai 102
Letak Kuartil ke-3 =
3( n 1 ) 3( 253 1 ) 762
190 .5
4 4 4
Nilai Kuartil ke-3
= Data ke 190 + 0.5 (Data ke-191 – Data ke-190)
= 175 + 0.5 (180 – 175) = 175 + (0.5 5)
= 175 + 2.5 = 177.5
n 50
Letak Median = = = 25 interval = i = 8
2 2
Median = Data ke-25 terletak di kelas 24-31
Kelas Median = 24 - 31
TBB Kelas Median = 23.5
TBA Kelas Median = 31.5
f M = 17
Frek. Kumulatif sebelum Kelas Median = 10
s = 25 - 10 = 15
Frek. Kumulatif sampai Kelas Median = 27
s’ = 27 - 25 = 2
Median = TBB Kelas Median + i s
fM
= 23.5 + 8 15
17
= 23.5 + 8 (0.8823...)
= 23.5 + 7.0588...
= 30.5588... 30.6
Median = TBA Kelas Median - i s'
fM
31.5 - 8
2
=
17
= 31.5 - 8 (0.1176...)
= 31.5 - 0.9411..= 30.5588... 30.6
= 39.5 + 8 3.5
10
= 39.5 + 8 (0.35)
= 39.5 + 2.8 = 42.3
Kuartil ke-3 = TBA Kelas Kuartil ke-3 - i s'
fQ
6.5
= 47.5 - 8
10
= 47.5 - 8 ( 0.65)
= 47.5 - 5.2 = 42.3
interval = i = 8
56n 56 50
Letak Persentil ke-56 = = = 28
100 100
Persentil ke-56 = Data ke-28 terletak di kelas 32 - 39
Kelas Persentil ke-56 = 32 - 39
TBB Kelas Persentil ke-56 = 31.5
TBA Kelas Persentil ke-56 = 39.5
f P56 = 7
Frek. Kumulatif sebelum Kelas Persentil ke-56 = 27
s = 28 - 27 = 1
Frek. Kumulatif sampai Kelas Persentil ke-56 = 34
s’ = 34 - 28 = 6
s
Persentil ke-56 = TBB Kelas Persentil ke-56 + i
fP
= 31.5 + 8 1
7
= 31.5 + 8 (0.142...)
= 31.5 + 1.142..
= 32.642...
s'
Persentil ke-56 = TBA Kelas Persentil ke-56 - i
fP
= 39.5 - 8 6
7
= 39.5 - 8 (0.857...)
= 39.5 - 6.857...
= 32.642...
Bx
i 1
i i
xB n
B
i 1
i
Dimana
xB : rata-rata tertimbang xi : data ke-I
Bi : beban ke-I n: banyak data
3. Ukuran Penyebaran
Meliputi :
Jangkauan :
o Beda antara data terbesar dengan data terkecil
Inter quartile :
o Beda antara Quartile ke3 dengan Quartile ke 1
Deviasi kuartil :
o Rata-rata hitung inter kuartil
Deviasi rata-rata :
o Rata-rata beda absolute antara data observasi
individu dengan pusat data (nilai rata-rata)
Variasi :
o Variabilitas data yang merupakan rata-rata
selisih/beda kuadrat antara data observasi dengan
pusat data (nilai rata-rata)
Simpangan baku
Koefisien variasi
POPULASI :
N
xi
Deviasi rata - rata i 1
SAMPEL :
n
xi x
Deviasi rata - rata i 1
n
POPULASI :
k
fi xi
Deviasi rata - rata i 1
SAMPEL :
k
fi xi x
Deviasi rata - rata i 1
n
POPULASI :
N N
N xi 2 ( xi ) 2
N
(x i ) 2
2 i 1 atau 2 i 1 i 1
N2
dan 2
SAMPEL :
n n n
(x i x )2 n xi 2 ( xi )2
i 1 i 1
s2 i 1
atau s2
n 1 n( n 1)
dan s s2
Dimana :
x i : data ke-i
: rata-rata populasi x : rata-rata sampel
² : ragam populasi s² : ragam sampel
: simpangan baku populasi s : simpangan baku sampel
N : ukuran populasi n : ukuran sampel
POPULASI :
k
f i ( xi ) 2
2
i 1
dan 2
SAMPEL :
k
f ( xi x ) 2
s s2
i
i 1
s2 dan
n 1
Dimana :
x i : Titik Tengah Kelas ke-i f i : frekuensi kelas ke-i
k : banyak kelas
: rata-rata populasi x : rata-rata sampel
² : ragam populasi s² : ragam sampel
: simpangan baku populasi s : simpangan baku sampel
N : ukuran populasi n : ukuran sampel
3.5. Koefisien Ragam
Koefisien Ragam = Koefisien Varians
Semakin besar nilai Koefisien Ragam maka data semakin
bervariasi, keragaman data makin tinggi.
Untuk Populasi
Koefisien Ragam =
100%
Untuk Sampel
s
Koefisien Ragam = 100%
x
x
z
Dimana :
z : Angka baku x : nilai data
: rata-rata populasi : simpangan baku populasi
selesai
Skewness dan Kurtosis
Ukuran kemiringan kurva (Skewness) adalah derajat ( ukuran ) ketidak sime trisan
lengkungan halus (kurva) dari suatu distribusi data
Pada Kelompok A ,
data menyebar normal sehingga histogram yang terbentuk mengikuti kurva
normal dengan frekuensi mean = median = modus = 20
Pada Kelompok B
data simetris kanan dan kiri sehingga histogram yang terbentuk bersifat
simetris dengan frekuensi mean = median = modus = 20, memiliki 2 modus
Pada Kelompok C
data lebih menyebar ke data yang lebih kecil sehingga histogram yang
terbentuk panjang ke kanan dengan frekuensi mean (16,52) > median (15) >
modus (10)
Pada Kelompok D
data lebih menyebar ke data yang lebih besar sehingga histogram yang
terbentuk panjang ke kiri dengan frekuensi mean (23,48) < median (25) <
modus (30)
28 39 23 67 37 28 56 40 28 50
51 45 44 65 61 27 24 61 34 44
Penyelesaian :
Dari data tersebut diperoleh :
Mean = 𝑥̅ = 109.6
Median = Med = 108
Modus = Mod = 105
Standar deviasi = S = 9.26
• Ukuran Kemencengan Pearson adalah
K = 109.6 – 105 = 4.6
• Koefisien Kemencengan (CK) adalah
4.6
CK = = 0.5
9.26
Keterangan :
𝛼3 = koefisien kemencengen
M3 = momen ke 3 , mengukur kemencengan
s = simpangan baku
n = banyaknya data
xi = data ke i
𝑥̅ = rata-rata hitung /arithmetic atau mean
Data Kelompok
Keterangan
𝛼3 = koefisien kemencengen
M3 = momen ke 3 , mengukur kemencengan
s = simpangan baku
n = banyaknya data pengamatan
k = banyaknya kelas
fi = frekuensi kelas ke i
𝑥̅ = rata-rata hitung atau mean
Jika : 𝛼3 = 0, maka distribusi datanya simetris
𝛼3 < 0, maka distribusi datanya menceng ke kiri
𝛼3 > 0 , maka distribusi datanya menceng ke kanan
Data berkelompok
Keterangan
𝛼3 = koefisien kemencengen
M3 = momen ke 3 , mengukur kemencengan
s = simpangan baku
n = banyaknya data pengamatan
k = banyaknya kelas
c = besar interval kelas
fi = frekuensi kelas ke i
di = simpangan kelas ke I terhadap titik asal konsumsi
𝑥̅ = rata-rata hitung atau mean
Contoh (data tersebar/ungroup data) :
28 39 23 67 37 28 56 40 28 50
51 45 44 65 61 27 24 61 34 44
Jenis Kurtosis :
1. Leptokurtis,
merupakan distribusi yang memiliki puncak kurva tinggi
2. Mesokurtis,
merupakan distribusi yang puncak tidak tinggi dan tidak
mendatarmendatar, bila merupakan distribusi simetris dianggap sebagai
distribusi/kurva normal
3. Platikurtis ,
merupakan distribusi yang memiliki puncak kurva rendah
Keterangan :
𝛼4 = koefisien Keruncingan
M4 = momen ke 4 , mengukur keruncingan
s = simpangan baku
n = banyaknya data
xi = data ke i
𝑥̅ = rata-rata hitung /arithmetic atau mean
b. Data Kelompok (Group data)
Keterangan
𝛼4 = koefisien keeruncingan
M4 = momen ke 4 , mengukur keruncingan
s = simpangan baku
n = banyaknya data pengamatan
k = banyaknya kelas
fi = frekuensi kelas ke i
𝑥̅ = rata-rata hitung atau mean
Jika : 𝛼4 > 3, maka bentuk kurva leptokurtis (meruncing)
𝛼4 = 3, maka bentuk kurva mesokurtis (normal)
𝛼4 < 3 , maka bentuk kurva platikurtis (mendatar)
Contoh Menghitung Koefisien Keruncingan Kurva dengan Momen
Sehingga :
1. Pendahuluan
• Ruang Contoh (S) : himpunan yang memuat semua kemungkinan hasil percobaan
1
Kemunculan suatu kejadian meniadakan kemunculan kejadian yg
lain/tdk terjadi secara bersamaan.
e. Kejadian-kejadian Not Mutually Exclusive
Kemunculan suatu kejadian dpt terjadi secara bersamaan atau sendiri-
sendiri.
Kaidah Penggandaan:
Jika operasi ke-1 dapat dilakukan dalam n1 cara
operasi ke-2 dapat dilakukan dalam n2 cara
:
:
operasi ke-k dapat dilakukan dalam nk cara
Permutasi sejumlah obyek adalah penyusunan obyek tersebut dalam suatu urutan/posisi
tertentu.
Dalam permutasi urutan/posisi diperhatikan!!!
• Dalil-1 Permutasi:
Banyaknya Permutasi n benda yang berbeda adalah n!
• Dalil-2 Permutasi :
Banyaknya permutasi r benda dari n benda yang berbeda adalah :
n!
Pr =
n
(n − r )!
Perhatikan dalam contoh ini urutan/posisi obyek sangat diperhatikan!
2
• Dalil-3 Permutasi Melingkar:
Banyaknya permutasi n benda yang disusun dalam suatu lingkaran adalah : (n-1)!
Contoh :
Berapa permutasi dari kata STATISTIKA?
10!
S = 2; T = 3; A = 2; I = 2; K = 1 Permutasi = = 75600
2! 3! 2! 2!1!
2.3 Kombinasi
Kombinasi r obyek yang dipilih dari n obyek adalah susunan r obyek tanpa memperhatikan
urutan/posisi
• Dalil-1 Kombinasi : Kombinasi r dari n obyek adalah
n!
Crn =
r !(n − r )!
Contoh :
Manajer SDM mengajukan 10 calon manajer yang berkualifikasi sama, 5 calon berasal dari
Kantor Pusat, 3 calon dari Kantor cabang dan 2 dari Program Pelatihan manajer.
(a) Berapa cara Manajer SDM dapat memilih 6 manajer baru dengan ketentuan 3 berasal
dari Kantor Pusat. 2 dari Kantor Cabang dan 1 dari Program Pelatihan manajer?
Pemilihan 3 dari 5 calon dari Kantor Pusat = C = 5! = 10 5
3
3! 2!
Pemilihan 2 dari 3 calon dari Kantor Cabang = 3!
C23 = =3
2!1!
Pemilihan 1 dari 2 calon dari Program Pelatihan = 2!
C12 = =2
1!1!
n = Pemilihan Manajer = 10 3 2 = 60 cara
3
3. Pengolahan Peluang
n
P ( A) =
N
n : banyak titik contoh penyusun Kejadian A
N : banyak titik contoh dalam Ruang Contoh (S)
Peluang Bersyarat berlaku untuk penetapan peluang kejadian yang tidak bebas.
(= Kejadian-kejadian yang bergantung dengan kejadian )
Kejadian yang terjadi tanpa bergantung dengan kejadian lain disebut Kejadian Bebas.
4
Notasi Peluang Bersyarat :
𝑃(𝐵|𝐴)
Dibaca : "Peluang terjadinya B, bila A telah terjadi"
atau "Peluang B, jika peluang A diketahui"
5
(Peluang kejadian Bersama)
Bila dalam suatu percobaan kejadian A1, A2,..., Ak, maka :
Bila kejadian B1 , B2, B3, …, Bk merupakan sekatan dari ruang contoh R dengan
P(Bi) ≠ 0 untuk i = 1, 2, 3 …,k , maka untuk sembarang kejadian A yang
bersifat P(A) ≠ 0 adalah :
𝑃(𝐵𝑖 ) 𝑥 𝑃(𝐴|𝐵𝑖 )
𝑃(𝐵𝑖 |𝐴) =
∑𝑘𝑗=1 𝑃(𝐵𝑖 ) 𝑥 𝑃(𝐴|𝐵𝑖 )
Untuk I = 1, 2, 3, … ,k
6
Soal dan Pembahasan :
Contoh Soal 1.
Contoh Soal 2 :
Sebanyak 9 orang mahasiswa akan pergi mengadakan kegiatan pengabdian kepada masyarakat
dengan mengendarai mobil , tersedia 3 mobil dengan kapasitas tempat duduk masing-masing 3
orang, 2 orang dan 4 orang
Ada berapa kemungkinan susunan mereka dapat terangkut oleh ketiga mobil tersebut .
Contoh Soal 4.
Tim bola basket suatu universitas terdiri dari 9 orang , diantaranya ada yang bernama Johny dan
Arif. Ada berapa kombinasi pemain yang dapat diturunkan bila :
a. Setiap pemain mempunyai kemungkinan untuk terpilih
b. Johny terpilih sebagai pemain
c. Johny dan Arif terpilih untuk bermain
Contoh Soal 5 :
Sepuluh orang sedang antri periksa Kesehatan , terdiri atas 6 orang Laki-laki dan 4 orang
perempuan. Petugas memanggil satu persatu, untuk diperiksa oleh dokter berdasarkan nomer irut
antrian.
Berapa peluang bahwa :
a. Orang yang dipanggil pertama dan ke dua adalah Laki-laki
b. Orang yang dipanggil pertama Laki-laki dan ke dua adalah Perempuan
c. Orang yang dipanggil pertama dan ke dua adalah Laki-laki
Contoh Soal 6 :
Contoh Soal 7 :
Anggota MPR yang bersidang di Gedung DPR/MPR, disediakan akomodasi menginap di tiga
hotel yaitu Hotel Hilton, Hotel Mulia dan Hotl Sahid, dengan komposisi masing-masing 50 %,
20 % dan 30 %.
Untuk menuju tempat sidang dari hotel masing-masing, panitia menyediakan kendaraan untuk
antar jemput.
Karena tempat menginap tidak berada dalam komplek tempat bersidang, maka ada kemungkinan
bahwa mereka datang terlambat untuk brsidang, yaitu dari Hotel Hilton sebesar 0.1, dari Hotel
Mulia sebesar 0.15 dan dari Hotel Sahit 0,2.
Pada sidang pertama di pagi hari, maka hitunglah :
a. Peluang bahwa seorang pesertya didang datang terlambatadalah menginap di Hotel
Sahid.
b. Peluang seorang peserta sidang akan terlambat mengikuti sidang
Distribusi Peluang Teoritis
1. Pendahuluan
Distribusi teoritis meruipakan distribusi dengan frekwensi yang diturunkan secara matematis.
Sedang pada Distribusi frekwensi, frekwensi diperoleh dari hasil observasi/pengamatan
Ruang sampel dibedakan menjadi :
• Ruang sampel Diskrit
berisi sejumlah kemungkinan terhingga atau urutan tidak terbatas dengan unsur
sebanyak jumlah bilangan bulat,
• Ruang sampel kontinyu.
berisi sejumlah kemungkinan tak terhingga yang sama dengan jumlah titik-titik dalam
sebuah segmen garis,
Titik-titik contoh di dalam Ruang Sampel (S) dapat disajikan dalam bentuk numerik/bilangan.
Peubah Acak
PEUBAH ACAK = VARIABEL ACAK = RANDOM VARIABLE
(beberapa buku juga menyebutnya sebagai STOCHASTIC VARIABLE )
• Adalah Fungsi yang mendefinisikan titik-titik contoh dalam ruang contoh sehingga memiliki
nilai berupa bilangan nyata
Atau : merupakan suatu fungsi yang menghubungkan sebuah bilangan real dengan setiap
unsur dalam ruang sampel.
• Biasanya PEUBAH ACAK dinotasikan sebagai X (X kapital)
Nilai dalam X dinyatakan sebagai x (huruf kecil x).
Contoh 1 :
Pelemparan sekeping Mata Uang setimbang sebanyak 3 Kali
S : {GGG, GGA, GAG, AGG, GAA, AGA, AAG, AAA}
dimana G = GAMBAR dan A = ANGKA
X: setiap satu sisi GAMBAR bernilai satu (G = 1)
S : {GGG, GGA, GAG, AGG, GAA, AGA, AAG, AAA} Perhatikan bahwa X{0,1,2,3}
Nilai 𝑥1 = 0, 𝑥2 = 1 𝑥3 = 2, 𝑥4 = 3
3 2 2 2 1 1 1 0
1
• Kategori Peubah Acak
Peubah Acak dapat dikategorikan menjadi:
a. Peubah Acak Diskrit :
▪ nilainya berupa bilangan cacah, dapat dihitung dan terhingga.
▪ merupakan hasil penghitungan untuk hal-hal yang dapat dicacah
Misal : Banyaknya Produk yang rusak = 12 buah
Banyak pegawai yang di-PHK = 5 orang
2
2. Distribusi Peluang Diskrit
3
Definisi Distribusi Peluang Binomial
Contoh 3 :
Tentukan peluang mendapatkan "MATA 1" muncul 3 kali pada pelemparan 5 kali
sebuah dadu setimbang!
Kejadian sukses/berhasil = mendapat "MATA 1"
x=3
n = 5 → pelemparan diulang 5 kali
1 1 5
p= q = 1- =
6 6 6
b( 3;5, 16 ) = C35 ( 16 ) 3 ( 56 ) 2
5! 52
= = 10 0.003215...= 0.03215...
3! 2! 65
4
Cara membaca Tabel tersebut :
Misal :
n x p = 0.10 p = 0.15 p = 0.20 dst
5 0 0.5905 0.4437 0.3277
1 0.3280 0.3915 0.4096
2 0.0729 0.1382 0.2048
3 0.0081 0.0244 0.0512
4 0.0004 0.0020 0.0064
5 0.0000 0.0001 0.0003
Perhatikan :
Total setiap Kolom p = 1.0000 karena pembulatan, nilainya tidak persis = 1.0000
hanya mendekati 1.0000
x = 0 n = 5 p = 0.10 b(0; 5, 0.10) = 0.5905
x =1 n = 5 p = 0.10 b(1; 5, 0.10) = 0.3280
Jika 0 x 2, n = 5 dan p = 0.10 maka
b(x; n, p) = b(0; 5, 0.10)+ b(1; 5, 0.10)+b(2;5,0.10)
= 0.5905 + 0.3280 +0.0729
= 0.9914
Contoh 4
Suatu perusahaan “pengiriman paket ” terikat perjanjian bahwa keterlambatan paket akan
menyebabkan perusahaan harus membayar biaya kompensasi.
Jika Peluang setiap kiriman akan terlambat adalah 0.20 Bila terdapat 5 paket, hitunglah
probabilitas :
a. Tidak ada paket yang terlambat, sehingga perusahaan tidak membayar biaya kompensasi?
(x = 0)
b. Lebih dari 2 paket terlambat? (x 2)
c. Tidak Lebih dari 3 paket yang terlambat?(x 3)\
d. Ada 2 sampai 4 paket yang terlambat?(2 x 4)
e. Paling tidak ada 2 paket yang terlambat?(x 2)
Jawab
a. x = 0 → b(0; 5, 0.20) = 03277 (lihat di tabel atau dihitung dgn rumus)
5
b. x 2 → Lihat tabel dan lakukan penjumlahan sebagai berikut :
b(3; 5, 0.20) + b(4; 5, 0.20) + b(5; 5, 0.20) =
0.0512 + 0.0064 + 0.0003 = 0.0579
atau .....
→ 1 - b(x 2) = 1 - [b(0; 5, 0.20) + b(1; 5, 0.20) + b(2; 5, 0.20)
= 1 - [0.3277 + 0.4096 + 0.2048)
= 1 - 0.9421 = 0.0579
perhatikan hasil perhitungan sebelumnya,!!
c. x 3 → Lihat tabel dan lakukan penjumlahan
b(0; 5, 0.20) + b(1; 5, 0.20) + b(2; 5, 0.20) +b(3; 5, 0.20) =
0.3277 + 0.4096 + 0.2048 + 0.0512 = 0.9933
atau ....
→ 1 - b(x 3) = 1 - [ b(4; 5, 0.20) + b(5; 5, 0.20)]
= 1 - [0.0064 + 0.0003]
= 1 - 0.0067 = 0.9933
d. 2 x 4 → Lihat tabel dan lakukan penjumlahan sebagai berikut :
b( 2; 5, 0.20) + b(3; 5, 0.20) + b(4; 5, 0.20) =
0.2048 + 0.0512 +0,0064 = 0.2624
e. Kerjakan sendiri!!!
6
Contoh 5:
Untuk b(5; 5 0.20), di mana x = 5, n = 5 dan p = 0.20
sehingga q = 0.80 maka
= 5 0.20 = 1.00
Perhatikan rumus yang digunakan! Peluang suatu kejadian Poisson hitung dari rata-rata
populasi ()
7
Cara membaca dan menggunakan Tabel ini tidak jauh berbeda dengan Tabel Binomial
Misal:
x = 4.5 = 5.0
0 0.0111 0.0067
1 0.0500 0.0337
2 0.1125 0.0842
3 0.1687 0.1404
dst dst dst
15 0.0001 0.0002
poisson (2; 4.5) = 0.1125
poisson (x < 3; 4.5) = poisson (0;4.5) + poisson (1; 4.5) + poisson (2; 4.5)
= 0.0111 + 0.0500 + 0.1125 = 0.1736
poisson (x > 2;4.5) = poisson (3; 4.5) + poisson (4; 4.5) +...+ poisson (15;4.5)
atau = 1 – poisson (x 2)
= 1 - [poisson (0;4.5) + poisson (1; 4.5) + poisson (2; 4.5)]
= 1 - [0.0111 + 0.0500 + 0.1125 ]
= 1 - 0.1736
= 0.8264
Contoh 6 :
Rata-rata seorang sekretaris baru melakukan 5 kesalahan ketik per halaman. Berapa
peluang bahwa pada halaman berikut ia membuat:
a. tidak ada kesalahan?(x = 0)
b. tidak lebih dari 3 kesalahan?( x 3)
c. lebih dari 3 kesalahan?(x >3)
d. paling tidak ada 3 kesalahan (x 3)
Jawab:
Diketahui : = 5
a. x = 0 → dengan rumus? hitung poisson(0; 5)
atau → dengan Tabel Distribusi Poisson
di bawah x:0 dengan = 5.0 → (0; 5.0) = 0.0067
8
b. x 3 → dengan Tabel Distribusi Poisson hitung
poisson(0; 5.0) + poisson(1; 5.0) + poisson(2; 5.0) + poisson(3; 5.0)
= 0.0067 + 0.0337 + 0.0842 + 0.1404 = 0.2650
c. x 3 → poisson( x 3; 5.0)
= poisson(4; 5.0) + poisson(5; 5.0) + poisson (6; 5.0) + poisson(7; 5.0) + ... +
poisson(15; 5.0)
atau
poisson(x >3) = 1 – poisson (x3)
= 1- [poisson(0;5.0) + poisson(1;5.0) + poisson(2;5.0) + poisson(3; 5.0)]
= 1 - [0.0067 + 0.0337 + 0.0842 + 0.1404]
= 1 - 0.2650
= 0.7350
Pendekatan Poisson untuk Distribusi Binomial :
Distribusi Poisson merupakan suatu bentuk pembatasan distribusi Binomial pada saat n besar,
peluang keberhasilan p mendekati 0 , dan np bersifat konstan.
Sehingga :
Peluang Poisson digunakan untuk Pendekatan Peluang Binomial, dilakukan jika :
n besar (n > 20) dan p sangat kecil (p < 0.01) dengan menetapkan p maka nilai :
=nxp
Contoh 7
Dari 1 000 orang mahasiswa 2 orang mengaku selalu terlambat masuk kuliah setiap hari,
jika pada suatu hari terdapat 5 000 mahasiswa, berapa peluang ada lebih dari 3 orang yang
terlambat?
Kejadian Sukses : selalu terlambat masuk kuliah
2
p= = 0.002 n = 5 000 x>3
1000
jika diselesaikan dengan peluang Binomial :
→ b(x > 3; 5 000, 0.002) tidak ada di Tabel,
jika menggunakan rumus sangat tidak praktis.
9
Dimana p = 0.002 n = 5 000 x>3
= n p = 0.002 5 000 = 10
b. diselesaikan dengan peluang Poisson
poisson (x > 3; 10) = 1 - poisson (x 3)
= 1 - [poisson (0;10) + poisson(1; 10) + poisson(2;10) + poisson(3; 10)
= 1 - [0.0000 + 0.0005 + 0.0023 +0,0075 ]
= 1 - 0.0103 = 0.9972
untuk x = 0,1,2,3...,k
10
Contoh 8 :
Jika dari seperangkat kartu bridge diambil 5 kartu secara acak tanpa pemulihan,
berapa peluang diperoleh 3 kartu hati?
N = 52 n=5 k = 13 x=3
C313 C239
h( 3;52,5,13) = (selesaikan sendiri !)
C552
f ( x1 , x 2 ,..., x k ; a1 , a 2 ,..., a k , N , n) =
CnN
k k
dan perhatikan bahwa n = x
i =1
i
dan N = a i
i =1
Contoh 9 :
Dari 10 pengemudi motor, 3 orang mengemudikan motor merk "S", 4 orang
memggunakan motor merk "Y" dan sisanya mengemudikan motor merk "H". Jika
secara acak diambil 5 orang, berapa peluang 1 orang mengemudikan motor merk "S",
2 orang merk "Y" dan 2 orang merk "H"?
11
Jawab :
N = 10, n = 5
a1 = 3, a2 = 4, a3= 3
x1 = 1, x2 = 2, x3= 2
C13 C24 C23 3 6 3 54 3
f (1,2,2; 3,4,3, 10, 5) = 10 = = = = 0.2142...
C5 252 252 18
Contoh 10 :
Dalam suatu kotak terdapat 5 bola yang terdiri dari 2 bola Merah, 2 bola Biru dan
1 buah Putih. Berapa peluang
a. terambil 2 bola Merah, dari 4 kali pengambilan yang dilakukan secara acak
dengan pemulihan?
b. terambil 2 bola Merah, dari 4 kali pengambilan yang dilakukan secara acak
tanpa pemulihan?
12
3 Distribusi Peluang Kontinyu
Distribusi probabilitas kontinu yang terpenting adalah distribusi normal dan grafiknya disebut kurva
normal.
Sifat kurva normal
• Kurva mencapai maksimum pada x =µ
• Kurva setangkup terhadap garis tegak yang melalui x = µ
• Kurva mempunyai titik belok pada x =µ ± σ
• Sumbu x merupakan asimtot dari kurva normal
• Seluruh luas di bawah kurva, di atas sumbu x adalah 1
Sifat-sifat distribusi normal :
• Nilai Peluang peubah acak dalam Distribusi Peluang Normal dinyatakan dalam luas dari
di bawah kurva berbentuk genta\lonceng (bell shaped curve).
• Kurva maupun persamaan Normal melibatkan nilai x, dan .
• Keseluruhan kurva akan bernilai 1, ini mengambarkan sifat peluang yang tidak pernah
negatif dan maksimal bernilai satu
• Nilai rata-rata (mean) pada distribusi normal akan terletak ditengah-tengah dari kurve normal.
• Bentuknya simetris dengan nilai mean = median =modus
• Ujung masing-masing sisi kurve sejajar dgn sumbu horisontal dan tidak memotong sumbu
horisontal tsb.
• Sebagian besar data ada ditengah-tengah dan sebagian kecil ada pada masing-masing sisi/tepi.
68% data berada dalam jarak ± 1 standar deviasi
95% data berada dalam jarak ± 2 standar deviasi,
99% data berada dalam jarak ± 3 standar deviasi.
Perhatikan gambar di bawah ini:
Gambar1. Kurva Distribusi Normal
i x
13
Definisi Distribusi Peluang Normal
1 x − 2
1 − ( )
n(x; , ) = e 2
22
untuk nilai x : - < x < e = 2.71828..... = 3.14159...
: rata-rata populasi
: simpangan baku populasi
² : ragam populasi
0 z
3. Nilai z yang dimasukkan dalam tabel ini adalah luas dari sumbu 0 sampai
dengan nilai z
14
Cara membaca Tabel Nilai z
z .00 .01 .02 .03 .04 .05 .06 .07 .08 .09
0.0
0.1
0.2
::
1.0
1.1
1.2 0.3944
1.3
:
3.4
Nilai 0.3944 adalah untuk luas atau peluang 0 < z < 1.25 yang digambarkan sebagai
berikut
luas = 0.3944
0 1.25
Gambar 2. Peluang 0 < z < 1.25
Dari Gambar 2 dapat kita ketahui bahwa P(z >1.25 ) = 0.5 - 0.3944 = 0.1056
0 1.25
Gambar 3. Peluang (z>1.25)
15
P(z < 25) = 0.5 + 0.3944 = 0.8944
0 1.25
Gambar 4. Peluang (z <1.25)
Luas daerah untuk z negatif dicari dengan cara yang sama, perhatikan contoh berikut :
P(-1.25 < z <0) = 0.3944
-1.25 0
Gambar 5. Peluang (-1.25 < z < 0)
P(z >-1.25) = 0.5 + 0.3944 = 0.8944
-1.25 0
Gambar 6. Peluang (z>-1.25)
-1.25 0
Gambar 7. Peluang (z < -1.25)
16
Jika ingin dicari peluang diantara suatu nilai z→ 𝑧1 < z < 𝑧2 , perhatikan contoh berikut:
-1.25 0 1.25
Gambar 8. Peluang (-1.25<z<1.25)
-1.30 -1.25 0
Gambar 9. Peluang(-1.30<x<1.25)
0 1.25 1.35
Gambar 10. Peluang (1.25 < z < 1.35)
• Untuk memastikan pembacaan peluang normal, gambarkan daerah yang ditanyakan!
17
Contoh 11 :
Rata-rata upah seorang buruh = $ 8.00 perjam dengan simpangan baku = $ 0.60,
jika terdapat 1 000 orang buruh, hitunglah :
a. banyak buruh yang menerima upah/jam kurang dari $ 7.80
b. banyak buruh yang menerima upah/jam lebih dari $ 8.30
c. .banyak buruh yang menerima upah/jam antara $ 7.80 sampai 8.30
= 8.00 = 0.60
a. x < 7.80
x− 7.80 − 8.00
z= = = −0.33
0.60
P(x < 7.80) = P(z < -0.33) = 0.5 - 0.1293 = 0.3707 (Gambarkan!)
banyak buruh yang menerima upah/jam kurang dari $ 7.80
= 0.3707 x 1 000
= 370.7 = 371 orang
b. x > 8.30
x− 8.30 − 8.00
z= = = 0.50.
0.60
P(x > 8.30) = P(z > 0.50) = 0.5 - 0.1915 = 0.3085 (Gambarkan!)
18
• Pendekatan untuk peluang Binomial bila p bernilai sangat kecil dan n relatif besar
o JIKA rata-rata () 20 MAKA lakukan pendekatan dengan distribusi
POISSON dengan
=np
o JIKA rata-rata () > 20 MAKA lakukan pendekatan dengan distribusi
NORMAL dengan
=np
▪ 2 = n pq
= n pq
Contoh 12 :
Dari 200 soal pilihan berganda, yang jawabannya terdiri dari lima pilihan (a, b, c,d
dan e), berapa peluang anda akan menjawab BENAR lebih dari 50 soal?
n = 300 p = 1/5 = 0.20 q = 1 - 0.20 = 0.80
a. Kerjakan dengan POISSON
P(x >50, p = 0.20) = n p = 200 0.20 = 40
Poisson (x > 50; = 40 ), = 40 dalam TABEL POISSON menggunakan
RUMUS, terlalu rumit!
= n pq = 32
P(x > 50 , p = 0.20) → P (z > ?)
50 − 40 10
z= = = 17677
. 177
.
32 5.6568...
P (z > 1.77) = 0.5 - 0.4616 = 0.0384 = 3.84 %
selesai
19
PENARIKAN SAMPEL
METODE SAMPLING
Salah satu teknik untuk mendapatkan sampel acak adalah dengan memanfaatkan bilangan acak
(random numbers)
Klasifikasi berdasarkan :
1. Jumlah sampel yang diambil :
➢ Tunggal
➢ Ganda
➢ Multiple
2. Cara memakainya :
➢ Sampling Kebijaksanaan
➢ Sampling Random/Acak
JENIS POPULASI
➢ Populasi Terhingga (FINITE)
Jumlah populasi kecil dan terbatas
➢ Populasi Tak Terhingga (INFINITE)
Jumlah populasi besar, pengambilan sampel tidak menghabiskan unsur dalam
populasi tersebut.
Berdasarkan Ukurannya, maka sampel dibedakan menjadi :
1. Sampel Besar jika ukuran sampel (n) 30
2. Sampel Kecil jika ukuran sampel (n) < 30
DISTRIBUSI PENARIKAN SAMPEL
( DISTRIBUSI SAMPLING)
distribusi besaran-besaran statistik yang muncul dari sample.
• Jumlah Sampel Acak yang dapat ditarik dari suatu populasi adalah sangat banyak.
• Nilai setiap Statistik Sampel akan bervariasi/beragam antar sampel.
• Suatu statistik dapat dianggap sebagai peubah acak yang besarnya sangat tergantung
dari sampel yang kita ambil.
• Karena statistik sampel adalah peubah acak maka ia mempunyai distribusi yang kita
sebut sebagai :
Distribusi peluang statistik sampel = Distribusi Sampling = Distribusi Penarikan
Sampel
DALIL - 1
JIKA …….
Sampel: Populasi berukuran = N
berukuran = 𝑛 ≥ 30diambil DENGAN PEMULIHAN dari Terdistribusi NORMAL
rata-rata = 𝑥̅ Rata-rata = µ ; simpangan baku = σ
MAKA………
Distribusi Rata-rata akan mendekati distribusi Normal dengan :
x−
x = dan x = dan nilai z=
n n
DALIL - 2
JIKA …….
Sampel: Populasi berukuran = N
berukuran = n ≥ 30 diambil TANPA PEMULIHAN dari Terdistribusi NORMAL
rata-rata = 𝑥̅ Rata-rata= µ;simpangan baku= σ
MAKA……….
Distribusi Rata-rata akan mendekati distribusi Normal dengan :
𝑁−𝑛
x = dan x = √ dan nilai Z=
𝑥̅ −µ
𝑁−𝑛
n 𝑁−1 (𝜎⁄𝑛)√
𝑁−1
N −n
• disebut sebagai FAKTOR KOREKSI populasi terhingga.
N −1
• Faktor Koreksi (FK) akan menjadi penting jika sampel berukuran n diambil dari
populasi berukuran N yang terhingga/ terbatas besarnya
• Jika sampel berukuran n diambil dari populasi berukuran N yang sangat besar maka
N −n
FK akan mendekati 1 → 1 , hal ini mengantar kita pada dalil ke-3 yaitu :
N −1
➢ DALIL LIMIT PUSAT = DALIL BATAS TENGAH
( THE CENTRAL LIMIT THEOREM )
JIKA….
Sampel: Populasi berukuran = N yang BESAR
Berukuran = n diambil dari distribusi : SEMBARANG
rata-rata =𝑥̅ Rata-rata= µ; simpangan baku= σ
MAKA…….
Distribusi Rata-rata akan mendekati distribusi Normal dengan :
x−
x = dan x = dan nilai z=
n n
n
KURANG DARI 5 % ukuran populasi atau 5%
N
2. Distribusi Sampling Bagi Beda 2 Rata Rata
JIKA….
Dua (2) Sampel Dua (2) Populasi berukuran BESAR
berukuran n1 dan n2 diambil dari Rata-rata 1 dan 2
rata-rata = x1 dan x2 Ragam 12 dan 2 2
MAKA….
Distribusi Rata-rata akan mendekati distribusi Normal dengan :
12 2 2
x − x = 1 − 2 dan standard error = x − x = + dan
1 2 1 2
n1 n2
x1 − x2 − 1 − 2
z=
nilai z 12 2 2
+
n1 n2
MAKA….
Distribusi Rata-rata akan mendekati distribusi-t dengan :
s x−
x = dan x = dan nilai t=
n s n
Pada derajat bebas = n – 1 dan suatu nilai α
• Distribusi Sampling untuk sampel kecil didekati dengan distribusi t Student = distribusi
t (W.S. Gosset) dimana Distribusi-t pada prinsipnya adalah pendekatan distribusi sampel
kecil dengan distribusi normal.
Dua hal yang perlu diperhatikan dalam Tabel t adalah
a. Derajat bebas (db) = degree of freedom = v = n – 1 dimana n : ukuran sampel
b. Nilai
adalah luas daerah kurva di kanan nilai t atau luas daerah kurva di kiri nilai –t
Nilai → 0.1 (10%) ; 0.05 (5%) ; 0.025(2.5%) ; 0.01 (1%) ; 0.005(0.5%)
Nilai terbatas karena banyak kombinasi db yang harus disusun!
• Distribusi t akan di gunakan pula dalam PENGUJIAN HIPOTESIS
Penggunaan Distribusi T dalam pengujian
Nilai ditentukan terlebih dahulu
Lalu nilai t tabel ditentukan dengan menggunakan nilai dan db.
Nilai t tabel menjadi batas selang pengujian
Lakukan pembandingan nilai t tabel dengan nilai t hitung.
Nilai t hitung untuk kasus distribusi rata-rata sampel kecil didapat dengan
menggunakan DALIL 5
2.5% 95 % 2.5%
-2.306 2.306
Arti Gambar di atas :
nilai t sampel berukuran n = 9, berpeluang 95% jatuh dalam selang
-2.306 < t < 2.306.
Peluang t >2.306 = 2.5 % dan Peluang t < -2.306 = 2.5 %
Coba cari nilai t tabel untuk beberapa nilai db dan yang lain!
• Perbedaan Tabel z dan Tabel t
Tabel z → nilai z menentukan nilai
Tabel t → nilai dan db menentukan nilai t
• Dalam banyak kasus nilai simpangan baku populasi () tidak diketahui, karenanya
nilai diduga dari nilai simpangan baku sampel (s)
Distribusi penarikan Sampel besar untuk Nilai Tengah dan Proporsi dari :
1. Satu Populasi
Populasi terbatas / pengambilan Populasi tak terhingga /
sampel tanpa pemulihan / pengambilan sampel dengan
Parameter pengembalian : pengembalian / pemulihan
Nilai Nilai
Tengah Standar deviasi (x) Tengah Standar deviasi x
Nilai Tengah
x x =
𝜎 𝑁−𝑛 x = 𝜎
x = √ x =
√𝑛 𝑁−1 √𝑛
Proporsi p p = p 𝑝 .𝑞 𝑝 .𝑞
p =√ * f. koreksi p =√
𝑁 𝑁
q = ( 1 – p) q = ( 1 – p)
Catatan :
𝑁−𝑛
Factor koreksi √ digunakan jika :
𝑁−1
▪ Sampling dilakukan pada populasi terbatas.
▪ Sampel > 5 % dari populasi
2. Dua Populasi
Contoh Soal :
Sebaran Penarikan Contoh bagi Nilai tengah ( sebaran peluang suatu statistic) dari
Suatu populasi yang terdiri atas angka : 0 ; 1 ; 2 ; 3 diambil contoh sebesar 2 dengan
pemulihan
Jawab :
Nilai tengah Contoh Acak sebesar 2 dengan pemulihan tersebut :
I. Pendugaan Parameter
Tujuan pendugaan : mengetahui bagaimana data yang ada pada sampel bisa menggambarkan
keadaan populasi
Pendugaan / Estimator adalah kuantitas sample yang merupakan nilai sample untuk menduga
kuantitas populasi.
Nilai sample estimasi parameter
Statistical parameter angka hasil evaluasi penduga
Ciri-ciri penduga yang baik :
a. Tidak bias
Memiliki nilai harapan yang sama dengan parameter yang diestimasikan
μǑ = E(Ǒ) = Ө
b. Efisien
Penduga memiliki ragam / variasi terkecil
c. Konsisten
Penduga berkonsentrasi secara sempurna pada parameter jika besar sample bertambah
secara tak terhingga
P(Ө - Ǒ) = 0 bila n= ∞
Jenis estimasi :
Estimasi titik
• Adalah suatu nilai tunggal yang dihitung berdasarkan pengukuran sampel yang akan
dipakai untuk menduga nilai tunggal yang ada di tingkat populasi yang belum diketahui
• Hasil adalah suatu angka mutlak (angka pasti)
• Estimator yang digunakan
Mean atau rata-rata
Standar deviasiVariansi
Estimasi interval/Penduga selang
• suatu estimasi terhadap parameter populasi dengan memakai range (interval nilai)
• Hasil merupakan sekumpulan angka dan akan lebih objektif
• Menyatakan berapa besar tingkat kepercayaan bahwa interval yang terbentuk memang
mengandung nilai parameter yang diduga
• Peneliti bebas menentukan interval kepercayaan (90%, 95%, 99%)
o Semakin besar tingkat kepercayaan yang diberikan, semakin tinggi tingkat
kepercayaan bahwa parameter populasi yang diestimasi terletak dalam interval
yang terbentuk, namun penelitian menjadi semakin tidak teliti
o Ketelitian bisa dikaitkan dengan alpha (daerah penolakan)
Misal :
▪ apabila ditetapkan interval kepercayaan sebesar 95% maka alpha sebesar
5% (100%-95%)
Artinya bahwa diberikan toleransi untuk melakukan kesalahan sebanyak
5 kali dalam 100 kali percobaan
▪ Interval kepercayaan 90% (alpha 10%)
Artinya bahwa diberikan toleransi untuk melakukan kesalahan sebanyak
10 kali dari 100 kali percobaan
Maka interval kepercayaan 95% akan lebih teliti dibanding interval 90%
(alpha 0.10)
Penduga Selang
Bila Ǒ adalah penduga (titik) bagi parameter Ǒ1 maka Ǒ1 < Ө < Ǒ2 sehingga
P (Ǒ1 < Ө < Ǒ2) = 1 - adalah penduga interval bagi Ө , dimana 0< <1
1 - = interval kepercayaan
Ǒ1 Ө Ǒ2
Interval kepercayaan / interval convidensi :
Besarnya keyakinan untuk menerima kebenaran dari pendugaan dan mentolerir kesalahan
duga (error of estimate) sebesar
1 - = interval kepercayaan
𝜶⁄𝟐 𝜶⁄𝟐
batas keyakinan bawah batas keyakinan atas
Bentuk Umum Selang Kepercayaan
Batas Bawah < (Simbol) Parameter < Batas Atas
Pendugaan dapat dilakukan :
a. Searah mentolerir kesalahan duga sebesar
b. Dua arah mentolerir kesalahan duga sebesar tetapi dalam menentukan nilai
kritis digunakan 𝜶⁄𝟐
a. Pendugaan Satu Nilai tengah populasi (μ) dengan populasi tak terbatas
Kriteria
no Selang kepercayaan Nilai dugaan
populasi/sampel
1 • sample besar P (-𝑧𝜶⁄𝟐 < Z <𝑧𝜶⁄𝟐 ) = 1 - µ𝟏𝟐 = x ± 𝒁𝜶⁄𝟐 𝝈⁄√𝒏
(n ≥ 30)
• diketahui
2 • sample kecil Terdistribusi normal µ𝟏𝟐 = x ± 𝒕𝜶⁄𝟐,𝒗 𝒔⁄√𝒏
(n < 30) P (-𝑡𝜶⁄𝟐,𝒗 < Z < 𝑡𝜶⁄𝟐,𝒗 )
= 1-
𝒁𝜶⁄𝟐 𝛔 𝟐
n=
𝒆
• Populasi terhingga/terbatas
Untuk memenuhi keyakinan sebesar selang kepercayaan perlu factor koreksi untuk harga x
sebesar :
𝑁−𝑛
√
𝑁−1
Sehingga rumus besaran simpangan baku menjadi :
𝑁−𝑛 𝜎
𝜎𝑥 √ 𝑁−1 dimana : 𝜎𝑥 =
√𝑛
b. Pendugaan Beda dua Nilai tengah populasi (𝝁𝟏 -µ𝟐 )
v = 𝑛1 + 𝑛2 − 2
4 o data berpasangan P (-𝑡𝜶⁄𝟐,𝒗 < t < 𝑡𝜶⁄𝟐,𝒗 ) (𝝁𝟏 − 𝝁𝟐 )𝑨𝑩 = 𝑥𝐷 ± 𝑡𝜶⁄𝟐,𝒗 𝑠𝑑 ⁄√𝑛
= 1-
𝑛 ∑ 𝑑𝑖2 −(∑ 𝑑𝑖 )2
𝑠𝑑2 = 𝑛(𝑛−1)
𝑑𝑖 = 𝑥1𝑖 − 𝑥2𝑖
∑𝑑
𝑥𝐷 = 𝑛 𝑖
v = n– 1
Pendugaan Proporsi populasi ()
( p – μp)
z=
p
p = (p . q) / n
dimana : p = proporsi yang diharapkan
μp = proporsi populasi =
1-
/2 /2
- z /2 O z /2
sehingga :
1 = p - z/2 p
2 = p + z/2 p
Bila p = proporsi yang diharapkan
μp = proporsi populasi =
n = ukuran contoh acak
p = ragam populasi normal
Galat (e) dalam pendugaan proporsi tidak melebihi :
z/2 p
Selang kepercayaan bagi beda 2 proporsi (1 - 2) adalah P (-z/2< Z < z /2 ) = 1 -
1-
/2 /2
- z /2 O z /2
Selang kepercayaan (1 - ) 100 % bagi beda dua proporsi populasi (1 - 2)
Contoh soal 2.
Contoh soal 3 :
Contoh Soal 4 :
Contoh Soal 5 :
Regresi & Korelasi Linier Sederhana
1. Pendahuluan
Anda sudah dapat menentukan mana peubah takbebas dan peubah bebas?
Contoh 1:
1
Y : peubah takbebas a : konstanta
X1 : peubah bebas ke-1 b1 : kemiringan ke-1
X2 : peubah bebas ke-2 b2 : kemiringan ke-2
Xn : peubah bebas ke-n bn : kemiringan ke-n
• Metode Kuadrat terkecil (least square method): metode paling populer untuk menetapkan
persamaan regresi linier sederhana
b : positif → Y b : negatif → Y
Y = a + bX Y = a - bX
X X
n
n n
n xi yi − xi yi
i =1 i =1 i =1
b= 2
n
n
n x − xi
2
i =1 i =1
i
2
n n
y
i =1
i x
i =1
i
a = y − bx sehingga a= −b
n n
n : banyak pasangan data
yi : nilai peubah takbebas Y ke-i
xi : nilai peubah bebas X ke-i
Contoh 2 :
Berikut adalah data Biaya Promosi dan Volume Penjualan PT BIMOIL perusahaan Minyak
Goreng.
x y
Tahun Biaya Promosi Volume Penjualan x²
(Juta Rupiah) (Ratusan Juta Liter) xy
1992 2 5
1993 4 6
1994 5 8
1995 7 10
1996 8 11
x = y = xy = x² =
n=5
n
n n
n xi yi − xi yi
i =1 i =1 i =1 (5 232) − (26 40) 1160 − 1040 120
b= b= = = = 105263
. ... =
n
n
2
(5 158) − (262 ) 790 − 676 114
n xi2 − xi
i =1 i =1
1.053
n n
yi
i =1
x
i =1
i
a= −b
n n
40 26
a= − 105263
. ... = 8 − (105263
. ...5.2) = 8 − 5.4736... = 2.5263.... = 2.530
5 5
3
• Peramalan dengan Persamaan Regresi
Contoh 3 :
Diketahui hubungan Biaya Promosi (X dalam Juta Rupiah) dan Y (Volume penjualan dalam
Ratusan Juta liter) dapat dinyatakan dalam persamaan regresi linier berikut
Y = 2.530 + 1.053 X
4
• Penetapan & Interpretasi Koefisien Korelasi dan Koefisien Determinasi
n
n n
n xi yi − xi yi
i =1 i =1 i =1
r=
n n
2
n n
2
n xi − xi n yi − yi
2 2
i =1 i =1 i =1 i =1
R = r2
Contoh 4 :
Lihat Contoh 2, setelah mendapatkan persamaan Regresi Y = 2.530 + 1.053 X, hitung koef.
korelasi (r) dan koef determinasi (R).
n
n n
n xi yi − xi yi
i =1 i =1 i =1
r=
n n 2 n
2 2
2
n
n xi − xi n yi − yi
i =1 i =1 i =1 i =1
Nilai r = 0.9857 menunjukkan bahwa peubah X (biaya promosi) dan Y (volume penjualan)
berkorelasi linier yang positif dan tinggi
R = r 2 = 0.9857...2 = 0.97165....= 97 %
Nilai R = 97% menunjukkan bahwa 97% proporsi keragaman nilai peubah Y (volume penjualan)
dapat dijelaskan oleh nilai peubah X (biaya promosi) melalui hubungan linier.
5
Regresi dan Korelasi Berganda
Persamaan regresi :
Persamaan matematika untuk meramal kan nilai suatu peubah tak bebas dari nilai satu/lebih
peubah bebas
Y = a + bx
a = intersep
b = gradien/kemiringan
Σ y – b Σx
a =
n
Kurva regresi
kurva yang menghubungkan nilai tengah setiap sebaran
μY/x = α + β x
Korelasi :
Pengukuran hubungan antara peubah acak x dan y
Koefisien korelasi ( r ) :
[n∑x2-(∑x)2] [n∑y2-(∑y)2]
Jika x = X - X dan y = Y - Y
∑ 𝑥𝑦
Maka : r =
√∑ 𝑥 2 ∑ 𝑦 2
Merupakan peramalan nilai peubah acak tak bebas Y berdasarkan hasil pengukuran pada
beberapa peubah acak bebas (X1, X2, …, Xr.)
Persamaan :
Y|X1, X2, …, Xr = o + 1 x1 + 2 x2 + … + r xr
Persamaan regresi
Ŷ = bo + b1 x1 + b2 x2 + … + br xr
∑ yi = n bo + b1 ∑ x1i + b2 ∑ x2i
bo = y – b1 x1 – b2 x2
[n∑x2i2-(∑x2i) 2 ][n∑yi2-(∑yi)2]
[n∑x1i2-(∑x1i)2][n∑x2i2-(∑x2i)2]
Regresi Berganda & Korelasi
• Pembahasan akan meliputi regresi linier dengan 2 Variabel Bebas (X1 dan X2) dan 1 Variabel
Tak Bebas (Y).
• Bentuk Umum : Y = a + b1 X1 + b2 X2
Y : peubah takbebas a : konstanta
X1 : peubah bebas ke-1 b1 : kemiringan ke-1
X2 : peubah bebas ke-2 b2 : kemiringan ke-2
n n n
(i)
n a + b1 x1i + b 2 x2i = yi
i =1 i =1 i =1
n n n n
(ii)
a x1i + b1 x1i + b 2 x2i x1i = x1i yi
2
i =1 i =1 i =1 i =1
n n n n
(iii)
a x2i + b1 x2i x1i + b 2 x2i = x2i yi 2
i =1 i =1 i =1 i =1
1
Contoh 4:
Berikut adalah data Volume Penjualan (juta unit) Mobil dihubungkan dengan variabel biaya
promosi (X1 dalam juta rupiah/tahun) dan variabel biaya penambahan asesoris (X2 dalam
ratusan ribu rupiah/unit).
2 3 4 6 8 12 4 9 16
3 4 5 12 15 20 9 16 25
5 6 8 30 40 48 25 36 64
6 8 10 48 60 80 36 64 100
7 9 11 63 77 99 49 81 121
8 10 12 80 96 120 64 100 144
x 1 x 2
= y x x 1 2
x 1
y= x 2
y= x 1
2
= x 2
2
= y
2
=
=31 40 =50 =239 296 379 187 306 470
n=6
x = 31 1 x 2
= 40 y = 50
x x =239 1 2 x 1
y =296 x y = 379
2
x =187 x y = 470
2 2 2
1 2
=306
(i) 6a + 31 b1 + 40 b2 = 50
2
(ii) 31 a + 187 b1 + 239 b2 = 296
(iii) 40 a + 239 b1 + 306 b2 = 379
Lalu
360 b2 = 270
b2 = 0.75
Dapatkan Nilai (b1) dan nilai (a) dengan melakukan substitusi, sehingga:
Perhatikan b2 = 0.75
3
194 b1 + 236 (0.75) = 274
194 b1 + 177 = 274
194 b1 = 97
b1 = 0.50
(i) 6a + 31 b1 + 40 b2 = 50
6a + 31(0.50) + 40 (0.75) = 50
6a + 15.5 + 30 = 50
6a = 4.5
a = 0.75
• Koefisien Determinasi Sampel untuk Regresi Linier Berganda diberi notasi sebagai berikut
2
R y.12
• Sedangkan Koefisien Korelasi adalah akar positif Koefisien Determinasi atau
2
ry.12 = Ry.12
• Rumus
Ry2.12 = 1 − JKG
( n −1) s 2y
di mana
s = 2
n y − 2
( y ) 2
y
n(n − 1)
4
JKG = y 2 − a y − b1 x1 y − b2 x 2 y
Contoh 5:
x =187 x y = 470
2 2 2
1 2
=306
2
Maka tetapkan R y.12 dan jelaskan artinya nilai tersebut!
s y2 =
n y 2 − ( y ) 2
=
6(470) − (50) 2 2820 − 2500 320
= = = 10.667
n(n − 1) 6(6 − 5) 30 30
0.25 0.25
Ry2.12 = 1 − ( nJKG = 1− = 1−
−1) s 2 y 5 10.667 53.333
= 1 - 0.0046875
= 0.9953125
= 99.53%
2
Nilai R y.12 = 99.53% menunjukkan bahwa 99.53% proporsi keragaman nilai peubah Y (volume
penjualan) dapat dijelaskan oleh nilai peubah X (biaya promosi) dan X2 (biaya aksesoris) melalui
hubungan linier.
5
Selesai
6
Pengujian Parameter
2. Nilai kritik :
Nilai statistik sample yang dipakai sebagai dasar untuk menerima atau menolak
H0, merupakan pembatas wilayah kritik dengan wilayah penerimaan
wilayah penerimaan : wilayah penerimaan Hipotesis
wilayah kritik : wilayah penolakan Hipotesis
Ukuran wilayah kritik : ()
Taraf nyata untuk menentukan nilai batas keyakinan
3. Jenis pengujian:
o Pengujian searah
Pengujian alternative H1 lebih besar dari suatu nilai parameter atau H1 lebih
kecil dari suatu nilai parameter.
Taraf nyata nilai kritis =
1- = koefisien keyakinan
H1 = Ө > Ө0
Wilayah penerimaan
Ho 1- wil. Kritis
H1 = Ө < Өo
o Pengujian 2 arah
Taraf nyata nilai kritis : /2
H1 = ≠ 0
/2 /2
Wilayah penerimaan Ho
1. Ada pendapat bahwa rata-rata tingkat pengeluaran wisatawan asing selama mereka di Jakarta
adalah US$ 1.000. Intuk membuktikan pernyataan tersebut , dipilih 15 orang wisatawan asing
dan ternyata rata-rata pengeluarannya US$ 925 dengan simpangan baku US$ 85. Dengan
informasin ini apakah pernyataan tersebut dapat dipercaya ? Gunakan taraf uji 5 % dan
asumsikan pengeluaran wisatawan menyebar normal.
Diketahui : o = 1000 s = 85 x = 925 n = 15
= 0.05
Soal :Uji : Ho = = 1000
Jawab : Ho = = 1000
Ha = ≠1000
2. Suatu contoh acak berukuran n1 = 16 yang dipilih dari populasi normal dengan simpangan
baku 1 = 8 menghasilkan rata-rata contoh 75. Suatu contoh acak lain nya berukuran n2 = 9
yang yang dipilih dari populasi normal lain yang bebas dari populasi pertama dengan
simpangan baku 2 = 10 menghasilkan rata-rata contoh 70. Dengan taraf uji 5 % apakah dapat
dikatakan bahwa nilai tengah ke dua populasi tersebut berbeda ?
Diketahui : s1 = 8 x1 = 75 n = 16 σ1 ≠ σ2
s2 = 10 x2 = 70 n=9
= 0.05
Soal :Uji : Ha = 1 - 2 ≠ 0
Jawab : Ho = 1 - 2 = 0
Ha = 1 - 2 ≠ 0
Wilayah kritis t < - t 0.025, v t > t 0.025,v
t < …… t > ……
2 2
[ 𝑠1 ⁄𝑛1 +𝑠2 ⁄𝑛2 ] 2
V = (𝑠2 2 2 2
1 ⁄𝑛1 ) + (𝑠2 ⁄𝑛2 )
(𝑛1 −1) (𝑛2−1 )
(64/16 + 100/9)2
v=
((64/16)2/15) + ((100/9)2/8)
(x1 −𝑥2 ) − 𝜇0
Nilai Uji : t =
√(𝑠12 ⁄𝑛1 +𝑠22 ⁄𝑛1 )
t= (75-70) – 0
(64/16 +100/9)
t = ……… Keputusan t hitung ……. ± t 0.025
Kesimpulan : …………….
3. Dari dua contoh acak masing-masing berukuran n1 = 10 dan n2 = 14 dipilih dari dua populasi
normal yang bebas menghasilkan x1 = 54, s1 = 8 , x2 = 60 dan s2 = 7. Dengan taraf uji 5 %
apakah dapat dikatakan bahwa nilai tengah ke dua populasi tersebut berbeda ? Bila
diasumsikan kedua populasi terdistribusi normal dengan simpangan baku yang sama
Diketahui : s1 = 8 x1 = 54 n = 10 σ1 = σ2
s2 = 7 x2 = 60 n = 14
= 0.05
Soal : Uji : Ha = 1 - 2 ≠ 0
Jawab : Ho = 1 - 2 = 0
Ha = 1 - 2 ≠ 0
Wilayah kritis t < - t 0.025, (10+14-2) t > t 0.025,(10+14-2)
t < …… t > ……
(𝑛1 −1)𝑠12 + (𝑛2 −1)𝑠22
𝑠𝑝2 = 𝑛1 +𝑛2 − 2
Sp = Sp2 Sp = …….
(x1 −𝑥2 ) − 𝜇0
Nilai Uji : t =
𝑆𝑝 √(1⁄𝑛1 +1⁄𝑛2 )
t= (54-60) – 0
Sp(1/10 +1/14)
t = ……… Keputusan t hitung ……. ± t 0.025
Kesimpulan : …………….
4. Suatu program diet diperkenalkan oleh sebuah lembaga periklanan bahwa program tersebut
dapat menurunkan berat badan dalam waktu satu minggu tanpa menimbulkan efek samping.
Hasil test terhadap peserta program diet itu dipilih secara acak dan berat badannya ditimbang
sebelum dan sesudahnya. Hasilnya sebagai berikut :
Berat (kg)
Sebelum 85 65 76 87 98 86 73 80
Sesudah 78 66 74 82 90 80 72 76
Dengan taraf uji 5 % apakah dapat dikatakan program diet itu dapat menurunkan berat badan
lebih dari 10 kilogram, bila diasumsikan penurunan berat menyebar normal ?
( xD −µ0 )
t=
𝑆𝑑 ⁄√𝑛
Terpisah
(independent)
𝑑𝑖 = 𝑥1𝑖 − 𝑥2𝑖
dan
∑ 𝑑𝑖
t > 𝑡𝛼⁄2 ,𝑣 𝑥𝐷 =
𝑛
𝑣 = 𝑛− 1
Independent test
Digunakan untuk menguji signifikansi beda rata-rata dua kelompok
Pola uji t untuk data independen (independent sample test)
Kriteria populasi/sampel Ho Ha Nilai kritis Nilai Uji Statistik
Distribusi frekuensi :
Penyajian data dengan pengelompokan data berdasarkan ciri-
ciri penting sejumlah data, ke dalam beberapa kelas dan meng
hitung banyaknya pengamatan yang masuk ke dalam setiap
kelas.
Distribusi frekuensi :
• Distribusi frekuensi bilangan
o Data berupa angka
o Kelas menurut besar bilangan
• Distribusi frekuensi kategoris
o Data bukan angka
o Kelas berdasarkan sifat lain
Contoh
• Distribusi frekuensi bilangan • Distribusi frekuensi kategoris
Bobot koper (kg) Banyaknya Kategori Banyaknya
7–9 3 Anak-anak 30
10 – 12 7 Gadis 35
13 – 15 17 Bersuami 25
16 – 18 15 Janda 10
19 - 21 8
• Jumlah kelas
a. Tergantung keadaan dan banyaknya data
b. Biasanya antara 5 – 20 kelas
c. Dapat ditentukan dengan aturan Sturges :
Penyajian grafik
• Diagram Balok
Sumbu x : menggunakan selang kelas
Sumbu y : menggunakan frekuensi
• Histogram
Sumbu x : menggunakan tepi batas kelas
Sumbu y : menggunakan frekuensi
• Poligon
Sumbu x : menggunakan titik tengah
Sumbu y : menggunakan frekuensi
• Ogive/Poligon frekuensi kumulatif
Sumbu x : menggunakan tepi batas kelas
Sumbu y : menggunakan frekuensi kumulatif
Soal Latihan peerorangan :
(dikerjakan dalam selembar kertas, dikumpulkan per kelompok)
≥ 53 52,5 – 60,5 40
≥ 61 60,5 – 68,5 38
≥ 69 68,5 – 76,5 dst
dst
Distribusi Peluang Teoritis
1. Pendahuluan
Distribusi teoritis meruipakan distribusi dengan frekwensi yang diturunkan secara matematis.
Sedang pada Distribusi frekwensi, frekwensi diperoleh dari hasil observasi/pengamatan
Ruang sampel dibedakan menjadi :
• Ruang sampel Diskrit
berisi sejumlah kemungkinan terhingga atau urutan tidak terbatas dengan unsur
sebanyak jumlah bilangan bulat,
• Ruang sampel kontinyu.
berisi sejumlah kemungkinan tak terhingga yang sama dengan jumlah titik-titik dalam
sebuah segmen garis,
Titik-titik contoh di dalam Ruang Sampel (S) dapat disajikan dalam bentuk numerik/bilangan.
Peubah Acak
PEUBAH ACAK = VARIABEL ACAK = RANDOM VARIABLE
(beberapa buku juga menyebutnya sebagai STOCHASTIC VARIABLE )
• Adalah Fungsi yang mendefinisikan titik-titik contoh dalam ruang contoh sehingga memiliki
nilai berupa bilangan nyata
Atau : merupakan suatu fungsi yang menghubungkan sebuah bilangan real dengan setiap
unsur dalam ruang sampel.
• Biasanya PEUBAH ACAK dinotasikan sebagai X (X kapital)
Nilai dalam X dinyatakan sebagai x (huruf kecil x).
Contoh 1 :
Pelemparan sekeping Mata Uang setimbang sebanyak 3 Kali
S : {GGG, GGA, GAG, AGG, GAA, AGA, AAG, AAA}
dimana G = GAMBAR dan A = ANGKA
X: setiap satu sisi GAMBAR bernilai satu (G = 1)
S : {GGG, GGA, GAG, AGG, GAA, AGA, AAG, AAA} Perhatikan bahwa X{0,1,2,3}
Nilai 𝑥1 = 0, 𝑥2 = 1 𝑥3 = 2, 𝑥4 = 3
3 2 2 2 1 1 1 0
1
• Kategori Peubah Acak
Peubah Acak dapat dikategorikan menjadi:
a. Peubah Acak Diskrit :
▪ nilainya berupa bilangan cacah, dapat dihitung dan terhingga.
▪ merupakan hasil penghitungan untuk hal-hal yang dapat dicacah
Misal : Banyaknya Produk yang rusak = 12 buah
Banyak pegawai yang di-PHK = 5 orang
2
2. Distribusi Peluang Diskrit
3
Definisi Distribusi Peluang Binomial
Contoh 3 :
Tentukan peluang mendapatkan "MATA 1" muncul 3 kali pada pelemparan 5 kali
sebuah dadu setimbang!
Kejadian sukses/berhasil = mendapat "MATA 1"
x=3
n = 5 → pelemparan diulang 5 kali
1 1 5
p= q = 1- =
6 6 6
b( 3;5, 16 ) = C35 ( 16 ) 3 ( 56 ) 2
5! 52
= = 10 0.003215...= 0.03215...
3! 2! 65
4
Cara membaca Tabel tersebut :
Misal :
n x p = 0.10 p = 0.15 p = 0.20 dst
5 0 0.5905 0.4437 0.3277
1 0.3280 0.3915 0.4096
2 0.0729 0.1382 0.2048
3 0.0081 0.0244 0.0512
4 0.0004 0.0020 0.0064
5 0.0000 0.0001 0.0003
Perhatikan :
Total setiap Kolom p = 1.0000 karena pembulatan, nilainya tidak persis = 1.0000
hanya mendekati 1.0000
x = 0 n = 5 p = 0.10 b(0; 5, 0.10) = 0.5905
x =1 n = 5 p = 0.10 b(1; 5, 0.10) = 0.3280
Jika 0 x 2, n = 5 dan p = 0.10 maka
b(x; n, p) = b(0; 5, 0.10)+ b(1; 5, 0.10)+b(2;5,0.10)
= 0.5905 + 0.3280 +0.0729
= 0.9914
Contoh 4
Suatu perusahaan “pengiriman paket ” terikat perjanjian bahwa keterlambatan paket akan
menyebabkan perusahaan harus membayar biaya kompensasi.
Jika Peluang setiap kiriman akan terlambat adalah 0.20 Bila terdapat 5 paket, hitunglah
probabilitas :
a. Tidak ada paket yang terlambat, sehingga perusahaan tidak membayar biaya kompensasi?
(x = 0)
b. Lebih dari 2 paket terlambat? (x 2)
c. Tidak Lebih dari 3 paket yang terlambat?(x 3)\
d. Ada 2 sampai 4 paket yang terlambat?(2 x 4)
e. Paling tidak ada 2 paket yang terlambat?(x 2)
Jawab
a. x = 0 → b(0; 5, 0.20) = 03277 (lihat di tabel atau dihitung dgn rumus)
5
b. x 2 → Lihat tabel dan lakukan penjumlahan sebagai berikut :
b(3; 5, 0.20) + b(4; 5, 0.20) + b(5; 5, 0.20) =
0.0512 + 0.0064 + 0.0003 = 0.0579
atau .....
→ 1 - b(x 2) = 1 - [b(0; 5, 0.20) + b(1; 5, 0.20) + b(2; 5, 0.20)
= 1 - [0.3277 + 0.4096 + 0.2048)
= 1 - 0.9421 = 0.0579
perhatikan hasil perhitungan sebelumnya,!!
c. x 3 → Lihat tabel dan lakukan penjumlahan
b(0; 5, 0.20) + b(1; 5, 0.20) + b(2; 5, 0.20) +b(3; 5, 0.20) =
0.3277 + 0.4096 + 0.2048 + 0.0512 = 0.9933
atau ....
→ 1 - b(x 3) = 1 - [ b(4; 5, 0.20) + b(5; 5, 0.20)]
= 1 - [0.0064 + 0.0003]
= 1 - 0.0067 = 0.9933
d. 2 x 4 → Lihat tabel dan lakukan penjumlahan sebagai berikut :
b( 2; 5, 0.20) + b(3; 5, 0.20) + b(4; 5, 0.20) =
0.2048 + 0.0512 +0,0064 = 0.2624
e. Kerjakan sendiri!!!
6
Contoh 5:
Untuk b(5; 5 0.20), di mana x = 5, n = 5 dan p = 0.20
sehingga q = 0.80 maka
= 5 0.20 = 1.00
Perhatikan rumus yang digunakan! Peluang suatu kejadian Poisson hitung dari rata-rata
populasi ()
7
Cara membaca dan menggunakan Tabel ini tidak jauh berbeda dengan Tabel Binomial
Misal:
x = 4.5 = 5.0
0 0.0111 0.0067
1 0.0500 0.0337
2 0.1125 0.0842
3 0.1687 0.1404
dst dst dst
15 0.0001 0.0002
poisson (2; 4.5) = 0.1125
poisson (x < 3; 4.5) = poisson (0;4.5) + poisson (1; 4.5) + poisson (2; 4.5)
= 0.0111 + 0.0500 + 0.1125 = 0.1736
poisson (x > 2;4.5) = poisson (3; 4.5) + poisson (4; 4.5) +...+ poisson (15;4.5)
atau = 1 – poisson (x 2)
= 1 - [poisson (0;4.5) + poisson (1; 4.5) + poisson (2; 4.5)]
= 1 - [0.0111 + 0.0500 + 0.1125 ]
= 1 - 0.1736
= 0.8264
Contoh 6 :
Rata-rata seorang sekretaris baru melakukan 5 kesalahan ketik per halaman. Berapa
peluang bahwa pada halaman berikut ia membuat:
a. tidak ada kesalahan?(x = 0)
b. tidak lebih dari 3 kesalahan?( x 3)
c. lebih dari 3 kesalahan?(x >3)
d. paling tidak ada 3 kesalahan (x 3)
Jawab:
Diketahui : = 5
a. x = 0 → dengan rumus? hitung poisson(0; 5)
atau → dengan Tabel Distribusi Poisson
di bawah x:0 dengan = 5.0 → (0; 5.0) = 0.0067
8
b. x 3 → dengan Tabel Distribusi Poisson hitung
poisson(0; 5.0) + poisson(1; 5.0) + poisson(2; 5.0) + poisson(3; 5.0)
= 0.0067 + 0.0337 + 0.0842 + 0.1404 = 0.2650
c. x 3 → poisson( x 3; 5.0)
= poisson(4; 5.0) + poisson(5; 5.0) + poisson (6; 5.0) + poisson(7; 5.0) + ... +
poisson(15; 5.0)
atau
poisson(x >3) = 1 – poisson (x3)
= 1- [poisson(0;5.0) + poisson(1;5.0) + poisson(2;5.0) + poisson(3; 5.0)]
= 1 - [0.0067 + 0.0337 + 0.0842 + 0.1404]
= 1 - 0.2650
= 0.7350
Pendekatan Poisson untuk Distribusi Binomial :
Distribusi Poisson merupakan suatu bentuk pembatasan distribusi Binomial pada saat n besar,
peluang keberhasilan p mendekati 0 , dan np bersifat konstan.
Sehingga :
Peluang Poisson digunakan untuk Pendekatan Peluang Binomial, dilakukan jika :
n besar (n > 20) dan p sangat kecil (p < 0.01) dengan menetapkan p maka nilai :
=nxp
Contoh 7
Dari 1 000 orang mahasiswa 2 orang mengaku selalu terlambat masuk kuliah setiap hari,
jika pada suatu hari terdapat 5 000 mahasiswa, berapa peluang ada lebih dari 3 orang yang
terlambat?
Kejadian Sukses : selalu terlambat masuk kuliah
2
p= = 0.002 n = 5 000 x>3
1000
jika diselesaikan dengan peluang Binomial :
→ b(x > 3; 5 000, 0.002) tidak ada di Tabel,
jika menggunakan rumus sangat tidak praktis.
9
Dimana p = 0.002 n = 5 000 x>3
= n p = 0.002 5 000 = 10
b. diselesaikan dengan peluang Poisson
poisson (x > 3; 10) = 1 - poisson (x 3)
= 1 - [poisson (0;10) + poisson(1; 10) + poisson(2;10) + poisson(3; 10)
= 1 - [0.0000 + 0.0005 + 0.0023 +0,0075 ]
= 1 - 0.0103 = 0.9972
untuk x = 0,1,2,3...,k
10
Contoh 8 :
Jika dari seperangkat kartu bridge diambil 5 kartu secara acak tanpa pemulihan,
berapa peluang diperoleh 3 kartu hati?
N = 52 n=5 k = 13 x=3
C313 C239
h( 3;52,5,13) = (selesaikan sendiri !)
C552
f ( x1 , x 2 ,..., x k ; a1 , a 2 ,..., a k , N , n) =
CnN
k k
dan perhatikan bahwa n = x
i =1
i
dan N = a i
i =1
Contoh 9 :
Dari 10 pengemudi motor, 3 orang mengemudikan motor merk "S", 4 orang
memggunakan motor merk "Y" dan sisanya mengemudikan motor merk "H". Jika
secara acak diambil 5 orang, berapa peluang 1 orang mengemudikan motor merk "S",
2 orang merk "Y" dan 2 orang merk "H"?
11
Jawab :
N = 10, n = 5
a1 = 3, a2 = 4, a3= 3
x1 = 1, x2 = 2, x3= 2
C13 C24 C23 3 6 3 54 3
f (1,2,2; 3,4,3, 10, 5) = 10 = = = = 0.2142...
C5 252 252 18
Contoh 10 :
Dalam suatu kotak terdapat 5 bola yang terdiri dari 2 bola Merah, 2 bola Biru dan 1
buah Putih. Berapa peluang
a. terambil 2 bola Merah, dari 4 kali pengambilan yang dilakukan secara acak
dengan pemulihan?
b. terambil 2 bola Merah, dari 4 kali pengambilan yang dilakukan secara acak
tanpa pemulihan?
12
3 Distribusi Peluang Kontinyu
Distribusi probabilitas kontinu yang terpenting adalah distribusi normal dan grafiknya disebut kurva
normal.
Sifat kurva normal
• Kurva mencapai maksimum pada x =µ
• Kurva setangkup terhadap garis tegak yang melalui x = µ
• Kurva mempunyai titik belok pada x =µ ± σ
• Sumbu x merupakan asimtot dari kurva normal
• Seluruh luas di bawah kurva, di atas sumbu x adalah 1
Sifat-sifat distribusi normal :
• Nilai Peluang peubah acak dalam Distribusi Peluang Normal dinyatakan dalam luas
dari di bawah kurva berbentuk genta\lonceng (bell shaped curve).
• Kurva maupun persamaan Normal melibatkan nilai x, dan .
• Keseluruhan kurva akan bernilai 1, ini mengambarkan sifat peluang yang tidak pernah
negatif dan maksimal bernilai satu
• Nilai rata-rata (mean) pada distribusi normal akan terletak ditengah-tengah dari kurve normal.
• Bentuknya simetris dengan nilai mean = median =modus
• Ujung masing-masing sisi kurve sejajar dgn sumbu horisontal dan tidak memotong sumbu
horisontal tsb.
• Sebagian besar data ada ditengah-tengah dan sebagian kecil ada pada masing-masing sisi/tepi.
68% data berada dalam jarak ± 1 standar deviasi
95% data berada dalam jarak ± 2 standar deviasi,
99% data berada dalam jarak ± 3 standar deviasi.
Perhatikan gambar di bawah ini:
Gambar1. Kurva Distribusi Normal
𝑥̅ 𝑥𝑖
13
Definisi Distribusi Peluang Normal
1 x − 2
1 − ( )
n(x; , ) = e 2
22
untuk nilai x : - < x < e = 2.71828..... = 3.14159...
: rata-rata populasi
: simpangan baku populasi
² : ragam populasi
0 z
3. Nilai z yang dimasukkan dalam tabel ini adalah luas dari sumbu 0 sampai
dengan nilai z
14
Cara membaca Tabel Nilai z
z .00 .01 .02 .03 .04 .05 .06 .07 .08 .09
0.0
0.1
0.2
::
1.0
1.1
1.2 0.3944
1.3
:
3.4
Nilai 0.3944 adalah untuk luas atau peluang 0 < z < 1.25 yang digambarkan sebagai
berikut
luas = 0.3944
0 1.25
Gambar 2. Peluang 0 < z < 1.25
Dari Gambar 2 dapat kita ketahui bahwa P(z >1.25 ) = 0.5 - 0.3944 = 0.1056
0 1.25
Gambar 3. Peluang (z>1.25)
15
P(z < 1.25) = 0.5 + 0.3944 = 0.8944
0 1.25
Gambar 4. Peluang (z <1.25)
Luas daerah untuk z negatif dicari dengan cara yang sama, perhatikan contoh berikut :
P(-1.25 < z <0) = 0.3944
-1.25 0
Gambar 5. Peluang (-1.25 < z < 0)
P(z >-1.25) = 0.5 + 0.3944 = 0.8944
-1.25 0
Gambar 6. Peluang (z>-1.25)
-1.25 0
Gambar 7. Peluang (z < -1.25)
16
Jika ingin dicari peluang diantara suatu nilai z→ 𝑧1 < z < 𝑧2 , perhatikan contoh berikut:
-1.25 0 1.25
Gambar 8. Peluang (-1.25<z<1.25)
-1.30 -1.25 0
Gambar 9. Peluang(-1.30<x<1.25)
0 1.25 1.35
Gambar 10. Peluang (1.25 < z < 1.35)
• Untuk memastikan pembacaan peluang normal, gambarkan daerah yang ditanyakan!
17
Contoh 11 :
Rata-rata upah seorang buruh = $ 8.00 perjam dengan simpangan baku = $ 0.60,
jika terdapat 1 000 orang buruh, hitunglah :
a. banyak buruh yang menerima upah/jam kurang dari $ 7.80
b. banyak buruh yang menerima upah/jam lebih dari $ 8.30
c. .banyak buruh yang menerima upah/jam antara $ 7.80 sampai 8.30
= 8.00 = 0.60
a. x < 7.80
x− 7.80 − 8.00
z= = = −0.33
0.60
P(x < 7.80) = P(z < -0.33) = 0.5 - 0.1293 = 0.3707 (Gambarkan!)
banyak buruh yang menerima upah/jam kurang dari $ 7.80
= 0.3707 x 1 000
= 370.7 = 371 orang
b. x > 8.30
x− 8.30 − 8.00
z= = = 0.50.
0.60
P(x > 8.30) = P(z > 0.50) = 0.5 - 0.1915 = 0.3085 (Gambarkan!)
Banyak buruh yang menerima upah/jam lebih dari $ 8.30
= 0.3085 x 1 000
= 308.5 = 309 orang
c. 7.80 < x < 8.30
z1 = -0.33 z2 = 0.50
P(7.80 < x < 8.30) = P(-0.33 < z < 0.50) = 0.1915 + 0.1293 = 0.3208
(Gambarkan)
Banyak buruh yang menerima upah/jam dari $ 7.80 sampai $ 8.30
= 0.3208 x 1000 = 320.8 = 321 orang
18
• Pendekatan untuk peluang Binomial bila p bernilai sangat kecil dan n relatif besar
o JIKA rata-rata () 20 MAKA lakukan pendekatan dengan distribusi
POISSON dengan
=np
o JIKA rata-rata () > 20 MAKA lakukan pendekatan dengan distribusi
NORMAL dengan
=np
2 = n pq
= n pq
Contoh 12 :
Dari 200 soal pilihan berganda, yang jawabannya terdiri dari lima pilihan (a, b,
c,d
dan e), berapa peluang anda akan menjawab BENAR lebih dari 50 soal?
n = 300 p = 1/5 = 0.20 q = 1 - 0.20 = 0.80
a. Kerjakan dengan POISSON
P(x >50, p = 0.20) = n p = 200 0.20 = 40
Poisson (x > 50; = 40 ), = 40 dalam TABEL POISSON menggunakan
RUMUS, terlalu rumit!
= n pq = 32
P(x > 50 , p = 0.20) → P (z > ?)
50 − 40 10
z= = = 17677
. 177
.
32 5.6568...
P (z > 1.77) = 0.5 - 0.4616 = 0.0384 = 3.84 %
selesai
19
Bab II
Menghimpun Data
1. Pengertian Data
Data → merupakan kumpulan fakta atau angka atau
segala sesuatu yang dapat dipercaya
kebenarannya sehingga dapat digunakan
sebagai dasar menarik suatu kesimpulan
4. Menyusun Kuesioner
Tahap terpenting dalam pengumpulan data
Kuesioner memuat berbagai pertanyaan, terdiri atas :
o Identifikasi data, memuat :
identitas responden,
waktu, wawancara
nama, dan kode pewawancara
o Permohonan kerjasama, memuat :
Instansi/lembaga yang melaksanakan wawancara
Maksud dan tujuan wawancara
o Petunjuk pengisian
o Inti kuesioner :
pertanyaan yang berkaitan dengan informasi/data yang
dibutuhkan
o Klasifikasi data :
menunjukkan karakteristik responden
Tahap-tahap dalam menyusun kuesioner :
a. Persiapan
b. Penetapan isi pertanyaan
pendekatan agar responden memiliki kesediaan untuk
memberikan tanggapan :
• Counterbiasing statement
• Indirect Statement
• Randomized response technique
c. Penetapan tipe pertanyaan
• Pertanyaan terbuka
• Pertanyaan tertutup
• Pertanyaan campuran
• Pertanyaan kotomi
d. Penyusunan kalimat
• Kalimat sederhana
• Kalimat harus jelas
• Hindari pertanyaan bersifat mengarahkan
• Hindari pertanyaan ganda dalam satu kalimat
e. Pengurutan pertanyaan
• Menggunakan pertanyaan pembuka yang
sederhana dan menarik
• Mendahulukan pertanyaan yang bersifat umum
• Letakkan pertanyaan yang sulit dan kurang me
narik pada urutan terakhir
• Susun kalimat dengan urutan logik
f. Penetapan karakteristik fisikal
g. Uji Pendahuluan dan perbaikan
5. Pemilihan Sampel
a. Unit Sampling
b. Kerangka Sampling
c. Populasi Kajian
d. Proses Sampling
1. Pengertian Statistika
2. Jenis-Jenis Data
3. Metode Statistika
3
Contoh Masalah Statistika Deskriptif :
1. Tabulasi Data
2. Diagram Balok
3. Diagram Kue Pie
4. Grafik perkembangan harga dari tahun ke tahun
Contoh 1
Seorang mahasiswi FE-UG, mengumpulkan data untuk
penulisan ilmiahnya dengan mewawancara 10 pedagang
asongan di depan kampus. Hasilnya diketahui bahwa
rata-rata pendapatan kotor mereka adalah Rp. 97,523.25.
Hasil wawancara tersebut dilaporkan dalam PI-nya.
(Deskriptif, Primer, Numerik)
Contoh 2
Berdasarkan tayangan TV langsung dari Bursa Efek, Drs.
Djoko (seorang pialang saham) memperkirakan bahwa
harga saham perusahaan-perusahaan “Blue-Chip” akan
terus turun sampai minggu ke tiga bulan September.
Perubahan akan bervariasi antara $ -2.35 sampai $ -5.60
per 100 lembar. (Inferensia, Sekunder, Numerik)
Contoh 3
Dalam rangka pengembangan produk, perusahaan
DONKING DONUT melakukan survei rasa kesukaan
(favorite favor) donatnya secara acak terhadap 1000
pelanggannya. Pelanggan terpilih diminta menetapkan
rangking terhadap 4 macam rasa donat yang baru
(MINT, PEACH, MOCCA, SUGAR-FREE). Hasil
4
survey disajikan dalam bentuk diagram pie. (Deskriptif,
Primer, Kategorik)
4. Populasi Vs Sampel
5
4.2. Parameter dan Statistik
Bedakan antara :
Statistik (tanpa akhiran “a”) = Statistic (without “s”)
dengan :
Statistika (dengan “a”) = Statistics (with “s”).
Bentuk Umum :
n
x i =1
i = x1 + x2 + x3 +... xn
i : indeks dari 1,2,3,..n:
xi : data/nilai/pengamatan ke-i
6
Dalil-1 :
Penjumlahan 2 atau lebih peubah (variabel) = jumlah
masing-masing penjumlahannya
n n n n
(x
i =1
i + yi + zi ) = xi + yi + zi
i =1 i =1 i =1
i : indeks, 1,2,3,...n
xi : nilai ke-i untuk variabel ke-1
yi : nilai ke-i untuk variabel ke-2
zi : nilai ke-i untuk variabel ke-3
Dalil-2
Jika c adalah konstanta maka :
n n
cxi = c xi
i =1 i =1
Dalil-3
Jika c adalah konstanta maka :
n
c
i =1
i = nc
7
Soal-soal
8
3. Definisikan suatu populasi bagi contoh-contoh berikut ini :
a. Penghuni 200 rumah di kota Depok dihubungi melalui
telepon dan ditanya apakah mereka merasa senang
dengan di bukanya ITC dan Town Square di jalan
Margonda.
b. Dua ratus pasang sepatu tennis jenis baru diuji,
ternyata rata-rata umur pakainya mencapai 4 bulan.
c. Dari lima kali pencatatan , untuk mencapai kantornya
di tengah kota, seseorang memerlukan waktu 21, 26,
24, 22, dan 21 menit.
x 13 24 35 46 49 47 86 43 45 76
y 21 17 65 72 53 78 90 56 87 43
z 24 21 69 76 57 82 85 32 65 43
8
b. (2xi 2-yi + 3)
i=3
5
c. (xi + 2) / xi
i=2
d. xi 2 yi
e. (2xi - yi + 3 zi )
9
Probabilitas
1. Pendahuluan
• Ruang Contoh (S) : himpunan yang memuat semua kemungkinan hasil percobaan
1
Kemunculan suatu kejadian meniadakan kemunculan kejadian yg
lain/tdk terjadi secara bersamaan.
e. Kejadian-kejadian Not Mutually Exclusive
Kemunculan suatu kejadian dpt terjadi secara bersamaan atau sendiri-
sendiri.
Kaidah Penggandaan:
Jika operasi ke-1 dapat dilakukan dalam n1 cara
operasi ke-2 dapat dilakukan dalam n2 cara
:
:
operasi ke-k dapat dilakukan dalam nk cara
Permutasi sejumlah obyek adalah penyusunan obyek tersebut dalam suatu urutan/posisi
tertentu.
Dalam permutasi urutan/posisi diperhatikan!!!
• Dalil-1 Permutasi:
Banyaknya Permutasi n benda yang berbeda adalah n!
• Dalil-2 Permutasi :
Banyaknya permutasi r benda dari n benda yang berbeda adalah :
n!
Pr =
n
(n − r )!
Perhatikan dalam contoh ini urutan/posisi obyek sangat diperhatikan!
2
• Dalil-3 Permutasi Melingkar:
Banyaknya permutasi n benda yang disusun dalam suatu lingkaran adalah : (n-1)!
Contoh :
Berapa permutasi dari kata STATISTIKA?
10!
S = 2; T = 3; A = 2; I = 2; K = 1 Permutasi = = 75600
2! 3! 2! 2!1!
2.3 Kombinasi
Kombinasi r obyek yang dipilih dari n obyek adalah susunan r obyek tanpa memperhatikan
urutan/posisi
• Dalil-1 Kombinasi : Kombinasi r dari n obyek adalah
n!
Crn =
r !(n − r )!
Contoh :
Manajer SDM mengajukan 10 calon manajer yang berkualifikasi sama, 5 calon berasal dari
Kantor Pusat, 3 calon dari Kantor cabang dan 2 dari Program Pelatihan manajer.
(a) Berapa cara Manajer SDM dapat memilih 6 manajer baru dengan ketentuan 3 berasal
dari Kantor Pusat. 2 dari Kantor Cabang dan 1 dari Program Pelatihan manajer?
Pemilihan 3 dari 5 calon dari Kantor Pusat = C = 5! = 10 5
3
3! 2!
Pemilihan 2 dari 3 calon dari Kantor Cabang = 3!
C23 = =3
2!1!
Pemilihan 1 dari 2 calon dari Program Pelatihan = 2!
C12 = =2
1!1!
n = Pemilihan Manajer = 10 3 2 = 60 cara
3
3. Pengolahan Peluang
n
P ( A) =
N
n : banyak titik contoh penyusun Kejadian A
N : banyak titik contoh dalam Ruang Contoh (S)
Peluang Bersyarat berlaku untuk penetapan peluang kejadian yang tidak bebas.
(= Kejadian-kejadian yang bergantung dengan kejadian )
Kejadian yang terjadi tanpa bergantung dengan kejadian lain disebut Kejadian Bebas.
4
Notasi Peluang Bersyarat :
𝑃(𝐵|𝐴)
Dibaca : "Peluang terjadinya B, bila A telah terjadi"
atau "Peluang B, jika peluang A diketahui"
5
(Peluang kejadian Bersama)
Bila dalam suatu percobaan kejadian A1, A2,..., Ak, maka :
Bila kejadian B1 , B2, B3, …, Bk merupakan sekatan dari ruang contoh R dengan
P(Bi) ≠ 0 untuk i = 1, 2, 3 …,k , maka untuk sembarang kejadian A yang
bersifat P(A) ≠ 0 adalah :
𝑃(𝐵𝑖 ) 𝑥 𝑃(𝐴|𝐵𝑖 )
𝑃(𝐵𝑖 |𝐴) =
∑𝑘𝑗=1 𝑃(𝐵𝑖 ) 𝑥 𝑃(𝐴|𝐵𝑖 )
Untuk I = 1, 2, 3, … ,k
6
Bab IV
Ukuran Statistik
1. Pendahuluan
Ukuran Statistik (diskripsi data):
1. Ukuran Pemusatan
Bagaimana, di mana data berpusat?
Rata-Rata Hitung = Arithmetic Mean
Median
Modus
Kuartil, Desil, Persentil
2. Ukuran Penyebaran
Bagaimana penyebaran data?
Ragam, Varians
Simpangan Baku
2. Ukuran Pemusatan
xi
n
x i
i 1
dan x i 1
N n
Dimana :
: rata-rata hitung populasi x : rata-rata hitung sampel
N : ukuran Populasi n : ukuran Sampel
xi : data sampel /populasi ke i
Metode Defisional
n
fx
n
i 1
i i
fx
i 1
i i
𝑥̅ = sehingga : 𝑥̅ =
n
f
𝑛
i
i 1
Dimana :
𝑥̅ : rata-rata hitung sampel fi : frekuensi di kelas ke-i
n : ukuran Sampel xi : Titik Tengah Kelas ke-i
Metode pendugaan
dengan suatu nilai dugaan (M)
fi di
x M i 1
n
Dimana :
di = x i – M
xi : Titik Tengah Kelas ke-i
M : dapat ditentukan sembarang !
Tidak ada cara khusus!
atau …..
M dapat ditentukan dengan :
Titik Tengah Kelas (xi) pada Kelas tepat di tengah TDF
jika banyak kelas (k) ganjil
maka ambil (xi) pada kelas ke k 1 (kelas yang di
2
tengah-tengah)
jika banyak kelas (k) genap
k k
maka gunakan (xi) pada kelas ke dan kelas ke +1
2 2
selanjutnya kedua nilai (xi) tersebut dibagi dua
Metode pengkodean
dengan menggunakan kode U
hanya bisa untuk interval kelas sama
n
U
i 1
f
i i
𝑥̅ = 𝑥𝑎 + 𝑖
𝑛
[ ]
Dimana :
i : interval Ui : kode kelas ke – i
n : ukuran sample fi : frekuensi kelas ke i
xa : Titik Tengah Kelas dengan Ui = 0
i 1
(𝑥𝑖 − 𝑥̅ )= 0
i 1
(𝑥𝑖 − 𝑥̅ )2 = 𝑚𝑖𝑛𝑖𝑚𝑢𝑚
2.2 Modus
Nilai yang paling sering muncul
Nilai yang frekuensinya paling tinggi
d1
Modus = TBB Kelas Modus + i
d1 d 2
di mana :
Kelas Modus : Kelas di mana Modus berada
Kelas dengan frekuensi tertinggi
TBB : Tepi Batas Bawah
d1 : Beda Frekuensi Kelas Modus dengan
Frekuensi Kelas sebelumnya
d2 : Beda Frekuensi Kelas Modus dengan
Frekuensi Kelas sesudahnya
I : interval kelas
Sifat-sifat :
Tidak dipengaruhi angka ekstrim
Dapat dihitung dari data kelompok
Dapat dicari dari data kualitatif
Merupakan ukuran pusat data semu
Contoh 1. :
a. Nilai rata-rata hitung dengan metode defisional
1679
x = = 33.58
50
b. Nilai rata-rata hitung dengan metode pengkodean
Kelas xi M di Frekuensi fi di
(fi)
16-23 19.5 39.5 -20 10 -200
24-31 27.5 39.5 -12 17 -204
32-39 35.5 39.5 - 4 7 -28
40-47 43.5 39.5 4 10 40
48-55 51.5 39.5 12 3 36
56-63 59.5 39.5 20 3 60
Jumlah () 0 50 -296
n
fdi 1
i i
x M
n
295
= 39.5 39.5 5.92 3358
.
50
Contoh 2. :
Sumbangan PMI warga Depok
Rp. 7500 8000 9000 8000 3000 5000 8000
Contoh 3. :
1. Berat 5 orang bayi :
3.6 3.5 2.9 3.1 3.0
(Tidak Ada Modus)
2. Umur Mahasiswa :
19 18 19 18 23 21
19 21 18 20 22 17
Modus : 18 dan 19
Contoh 4. :
Kelas Modus = 24 - 31
TBB Kelas Modus = 23.5
i (interval) = 8
frek. kelas Modus = 17
frek. kelas sebelum kelas Modus = 10
frek. kelas sesudah kelas Modus = 7
d1 = 17 - 10 = 7
d2 = 17 - 7 = 10
7
Modus = 23.5 + 8
7 10
7
= 23.5 + 8
17
= 23.5 + 8 (0.41176...)
= 23.5 + 3.2941...
= 26.7941... 27
Median = TBB Kelas Median + i s
fM
atau
n
Letak Median = n: banyak data
2
dimana :
TBB : Tepi Batas Bawah
s : selisih antara Letak Median dengan
Frekuensi Kumulatif sebelum kelas Median
TBA : Tepi Batas Atas
s’ : selisih antara Frekuensi Kumulatif sampai
kelas Median dengan Letak Median
i : interval kelas
fM : Frekuensi kelas Median
B.2. Kuartil untuk Grouped Data
Kuartil ke-q =TBA Kelas Kuartil ke-q - i s'
fQ
dimana :
TBB : Tepi Batas Bawah
s : selisih antara Letak Kuartil ke-q dengan
Frekuensi Kumulatif sebelum kelas Kuartil
ke-q
TBA : Tepi Batas Atas
s’ : selisih antara Frekuensi Kumulatif
sampai kelas Kuartil ke-q dengan Letak
Kuartil ke-q
i : interval kelas
fQ : Frekuensi kelas Kuartil ke-q
atau
s'
Desil ke-d =TBA Kelas Desil ke-d - i
fD
dimana :
TBB : Tepi Batas Bawah
S : selisih antara Letak Desil ke-d dengan
Frekuensi Kumulatif sebelum kelas
Desil ke-d
TBA : Tepi Batas Atas
s’ : selisih antara Frekuensi Kumulatif
sampai kelas Desil ke-d dengan Letak
Desil ke-d
i : interval kelas
fD : Frekuensi kelas Desil ke-d
atau
s'
Persentil ke-p = TBA Kelas Persentil ke-p - i
fP
dimana :
TBB : Tepi Batas Bawah
s : selisih antara Letak Persentil ke-p dengan
Frekuensi Kumulatif sebelum kelas Persentil
ke-p
TBA : Tepi Batas Atas
s’ : selisih antara Frekuensi Kumulatif sampai
kelas Persentil ke-p dengan Letak Persentil ke-p
i : interval kelas
fP : Frekuensi kelas Persentil ke-p
Contoh 1 :
Tinggi Badan 5 mahasiswa:
Sorted :
1.60 1.73 1.75 1.78 1.78 meter
n=5
51 6
Letak Median = = =3
2 2
Median = Data ke-3 = 1.75
Contoh 2:
Tinggi 6 mahasiswa :
n= 6
61 7
Letak Median = = 3.5
2 2
Median
= 1 (Data ke 3 + Data ke 4)
2
= 1 (1.75 + 1.78) = 1.765
2
= Data ke-3 + 0.5 (Data ke-4 – Data ke-3)
= 1.75 + 0.5 (1.78 – 1.75)
= 1.75 + (0.5 0.02)
= 1.75 + 0.015 = 1.765
Contoh 3:
Terdapat 253 data yang sudah tersortir ascending
Data ke-190 bernilai 175 ;Data ke-191 bernilai 180
Data ke-50 bernilai 45 ;Data ke-51 bernilai 48
Data ke-165 bernilai 100 ;Data ke-166 bernilai 102
Letak Kuartil ke-3 =
3( n 1 ) 3( 253 1 ) 762
190 .5
4 4 4
Nilai Kuartil ke-3
= Data ke 190 + 0.5 (Data ke-191 – Data ke-190)
= 175 + 0.5 (180 – 175) = 175 + (0.5 5)
= 175 + 2.5 = 177.5
n 50
Letak Median = = = 25 interval = i = 8
2 2
Median = Data ke-25 terletak di kelas 24-31
Kelas Median = 24 - 31
TBB Kelas Median = 23.5
TBA Kelas Median = 31.5
f M = 17
Frek. Kumulatif sebelum Kelas Median = 10
s = 25 - 10 = 15
Frek. Kumulatif sampai Kelas Median = 27
s’ = 27 - 25 = 2
Median = TBB Kelas Median + i s
fM
= 23.5 + 8 15
17
= 23.5 + 8 (0.8823...)
= 23.5 + 7.0588...
= 30.5588... 30.6
Median = TBA Kelas Median - i s'
fM
31.5 - 8
2
=
17
= 31.5 - 8 (0.1176...)
= 31.5 - 0.9411..= 30.5588... 30.6
= 39.5 + 8 3.5
10
= 39.5 + 8 (0.35)
= 39.5 + 2.8 = 42.3
Kuartil ke-3 = TBA Kelas Kuartil ke-3 - i s'
fQ
6.5
= 47.5 - 8
10
= 47.5 - 8 ( 0.65)
= 47.5 - 5.2 = 42.3
interval = i = 8
56n 56 50
Letak Persentil ke-56 = = = 28
100 100
Persentil ke-56 = Data ke-28 terletak di kelas 32 - 39
Kelas Persentil ke-56 = 32 - 39
TBB Kelas Persentil ke-56 = 31.5
TBA Kelas Persentil ke-56 = 39.5
f P56 = 7
Frek. Kumulatif sebelum Kelas Persentil ke-56 = 27
s = 28 - 27 = 1
Frek. Kumulatif sampai Kelas Persentil ke-56 = 34
s’ = 34 - 28 = 6
s
Persentil ke-56 = TBB Kelas Persentil ke-56 + i
fP
= 31.5 + 8 1
7
= 31.5 + 8 (0.142...)
= 31.5 + 1.142..
= 32.642...
s'
Persentil ke-56 = TBA Kelas Persentil ke-56 - i
fP
= 39.5 - 8 6
7
= 39.5 - 8 (0.857...)
= 39.5 - 6.857...
= 32.642...
Bx
i 1
i i
xB n
B
i 1
i
Dimana
xB : rata-rata tertimbang xi : data ke-I
Bi : beban ke-I n: banyak data
3. Ukuran Penyebaran
Meliputi :
Jangkauan :
o Beda antara data terbesar dengan data terkecil
Inter quartile :
o Beda antara Quartile ke3 dengan Quartile ke 1
Deviasi kuartil :
o Rata-rata hitung inter kuartil
Deviasi rata-rata :
o Rata-rata beda absolute antara data observasi
individu dengan pusat data (nilai rata-rata)
Variasi :
o Variabilitas data yang merupakan rata-rata
selisih/beda kuadrat antara data observasi dengan
pusat data (nilai rata-rata)
Simpangan baku
Koefisien variasi
POPULASI :
N
xi
Deviasi rata - rata i 1
SAMPEL :
n
xi x
Deviasi rata - rata i 1
n
POPULASI :
k
fi xi
Deviasi rata - rata i 1
SAMPEL :
k
fi xi x
Deviasi rata - rata i 1
n
POPULASI :
N N
N xi 2 ( xi ) 2
N
(x i ) 2
2 i 1 atau 2 i 1 i 1
N2
dan 2
SAMPEL :
n n n
(x i x )2 n xi 2 ( xi )2
i 1 i 1
s2 i 1
atau s2
n 1 n( n 1)
dan s s2
Dimana :
x i : data ke-i
: rata-rata populasi x : rata-rata sampel
² : ragam populasi s² : ragam sampel
: simpangan baku populasi s : simpangan baku sampel
N : ukuran populasi n : ukuran sampel
POPULASI :
k
f i ( xi ) 2
2
i 1
dan 2
SAMPEL :
k
f ( xi x ) 2
s s2
i
i 1
s2 dan
n 1
Dimana :
x i : Titik Tengah Kelas ke-i f i : frekuensi kelas ke-i
k : banyak kelas
: rata-rata populasi x : rata-rata sampel
² : ragam populasi s² : ragam sampel
: simpangan baku populasi s : simpangan baku sampel
N : ukuran populasi n : ukuran sampel
3.5. Koefisien Ragam
Koefisien Ragam = Koefisien Varians
Semakin besar nilai Koefisien Ragam maka data semakin
bervariasi, keragaman data makin tinggi.
Untuk Populasi
Koefisien Ragam =
100%
Untuk Sampel
s
Koefisien Ragam = 100%
x
x
z
Dimana :
z : Angka baku x : nilai data
: rata-rata populasi : simpangan baku populasi
selesai
Inferensia Statistika
• Tehnik pengambilan keputusan tentang suatu parameter populasi
• Mencakup semua metode yang digunakan dalam penarikan kesimpulan atau generalisasi
mengenai suatu populasi
• Meliputi :
• Pendugaan Parameter
• Pengujian Hipotesis
• Perbedaan estimasi dan uji hipotesis :
Estimasi : pendugaan kenyataan yang ada di tingkat populasi berdasarkan sampel
Uji hipotesis : lebih ditujukan untuk membuat suatu pertimbangan tentang perbedaan antara
nilai statistik di sampel dengan nilai parameter populasi
I. Pendugaan Parameter
Tujuan pendugaan : mengetahui bagaimana data yang ada pada sampel bisa menggambarkan
keadaan populasi
Pendugaan / Estimator adalah kuantitas sample yang merupakan nilai sample untuk menduga
kuantitas populasi.
Nilai sample estimasi parameter
Statistical parameter angka hasil evaluasi penduga
Ciri-ciri penduga yang baik :
a. Tidak bias
Memiliki nilai harapan yang sama dengan parameter yang diestimasikan
μǑ = E(Ǒ) = Ө
b. Efisien
Penduga memiliki ragam / variasi terkecil
c. Konsisten
Penduga berkonsentrasi secara sempurna pada parameter jika besar sample bertambah
secara tak terhingga
P(Ө - Ǒ) = 0 bila n= ∞
Jenis estimasi :
Estimasi titik
• Adalah suatu nilai tunggal yang dihitung berdasarkan pengukuran sampel yang akan
dipakai untuk menduga nilai tunggal yang ada di tingkat populasi yang belum diketahui
• Hasil adalah suatu angka mutlak (angka pasti)
• Estimator yang digunakan
Mean atau rata-rata
Standar deviasiVariansi
Estimasi interval/Penduga selang
• suatu estimasi terhadap parameter populasi dengan memakai range (interval nilai)
• Hasil merupakan sekumpulan angka dan akan lebih objektif
• Menyatakan berapa besar tingkat kepercayaan bahwa interval yang terbentuk memang
mengandung nilai parameter yang diduga
• Peneliti bebas menentukan interval kepercayaan (90%, 95%, 99%)
o Semakin besar tingkat kepercayaan yang diberikan, semakin tinggi tingkat
kepercayaan bahwa parameter populasi yang diestimasi terletak dalam interval
yang terbentuk, namun penelitian menjadi semakin tidak teliti
o Ketelitian bisa dikaitkan dengan alpha (daerah penolakan)
Misal :
▪ apabila ditetapkan interval kepercayaan sebesar 95% maka alpha sebesar
5% (100%-95%)
Artinya bahwa diberikan toleransi untuk melakukan kesalahan sebanyak
5 kali dalam 100 kali percobaan
▪ Interval kepercayaan 90% (alpha 10%)
Artinya bahwa diberikan toleransi untuk melakukan kesalahan sebanyak
10 kali dari 100 kali percobaan
Maka interval kepercayaan 95% akan lebih teliti dibanding interval 90%
(alpha 0.10)
Penduga Selang
Bila Ǒ adalah penduga (titik) bagi parameter Ǒ1 maka Ǒ1 < Ө < Ǒ2 sehingga
P (Ǒ1 < Ө < Ǒ2) = 1 - adalah penduga interval bagi Ө , dimana 0< <1
1 - = interval kepercayaan
Ǒ1 Ө Ǒ2
Interval kepercayaan / interval convidensi :
Besarnya keyakinan untuk menerima kebenaran dari pendugaan dan mentolerir kesalahan
duga (error of estimate) sebesar
1 - = interval kepercayaan
𝜶⁄𝟐 𝜶⁄𝟐
batas keyakinan bawah batas keyakinan atas
Bentuk Umum Selang Kepercayaan
Batas Bawah < (Simbol) Parameter < Batas Atas
Pendugaan dapat dilakukan :
a. Searah mentolerir kesalahan duga sebesar
b. Dua arah mentolerir kesalahan duga sebesar tetapi dalam menentukan nilai
kritis digunakan 𝜶⁄𝟐
a. Pendugaan Satu Nilai tengah populasi (μ) dengan populasi tak terbatas
Kriteria
no Selang kepercayaan Nilai dugaan
populasi/sampel
1 • sample besar P (-𝑧𝜶⁄𝟐 < Z <𝑧𝜶⁄𝟐 ) = 1 - µ𝟏𝟐 = x ± 𝒁𝜶⁄𝟐 𝝈⁄√𝒏
(n ≥ 30)
• diketahui
2 • sample kecil Terdistribusi normal µ𝟏𝟐 = x ± 𝒕𝜶⁄𝟐,𝒗 𝒔⁄√𝒏
(n < 30) P (-𝑡𝜶⁄𝟐,𝒗 < Z < 𝑡𝜶⁄𝟐,𝒗 )
= 1-
𝒁𝜶⁄𝟐 𝛔 𝟐
n=
𝒆
• Populasi terhingga/terbatas
Untuk memenuhi keyakinan sebesar selang kepercayaan perlu factor koreksi untuk harga x
sebesar :
𝑁−𝑛
√
𝑁−1
Sehingga rumus besaran simpangan baku menjadi :
𝑁−𝑛 𝜎
𝜎𝑥 √ 𝑁−1 dimana : 𝜎𝑥 =
√𝑛
b. Pendugaan Beda dua Nilai tengah populasi (𝝁𝟏 -µ𝟐 )
v = 𝑛1 + 𝑛2 − 2
4 o data berpasangan P (-𝑡𝜶⁄𝟐,𝒗 < t < 𝑡𝜶⁄𝟐,𝒗 ) (𝝁𝟏 − 𝝁𝟐 )𝑨𝑩 = 𝑥𝐷 ± 𝑡𝜶⁄𝟐,𝒗 𝑠𝑑 ⁄√𝑛
= 1-
𝑛 ∑ 𝑑𝑖2 −(∑ 𝑑𝑖 )2
𝑠𝑑2 = 𝑛(𝑛−1)
𝑑𝑖 = 𝑥1𝑖 − 𝑥2𝑖
∑𝑑
𝑥𝐷 = 𝑛 𝑖
v = n– 1
Pengujian Parameter
2. Nilai kritik :
Nilai statistik sample yang dipakai sebagai dasar untuk menerima atau menolak
H0, merupakan pembatas wilayah kritik dengan wilayah penerimaan
wilayah penerimaan : wilayah penerimaan Hipotesis
wilayah kritik : wilayah penolakan Hipotesis
Ukuran wilayah kritik : ()
Taraf nyata untuk menentukan nilai batas keyakinan
3. Jenis pengujian:
o Pengujian searah
Pengujian alternative H1 lebih besar dari suatu nilai parameter atau H1 lebih
kecil dari suatu nilai parameter.
Taraf nyata nilai kritis =
1- = koefisien keyakinan
H1 = Ө > Ө0
Wilayah penerimaan
Ho 1- wil. Kritis
H1 = Ө < Өo
o Pengujian 2 arah
Taraf nyata nilai kritis : /2
H1 = ≠ 0
/2 /2
Wilayah penerimaan Ho
Persamaan regresi :
Persamaan matematika untuk meramal kan nilai suatu peubah tak bebas dari nilai satu/lebih
peubah bebas
Y = a + bx
a = intersep
b = gradien/kemiringan
Σ y – b Σx
a =
n
Kurva regresi
kurva yang menghubungkan nilai tengah setiap sebaran
μY/x = α + β x
Korelasi :
Pengukuran hubungan antara peubah acak x dan y
Koefisien korelasi ( r ) :
[n∑x2-(∑x)2] [n∑y2-(∑y)2]
Jika x = X - X dan y = Y - Y
∑ 𝑥𝑦
Maka : r =
√∑ 𝑥 2 ∑ 𝑦 2
Merupakan peramalan nilai peubah acak tak bebas Y berdasarkan hasil pengukuran pada
beberapa peubah acak bebas (X1, X2, …, Xr.)
Persamaan :
Y|X1, X2, …, Xr = o + 1 x1 + 2 x2 + … + r xr
Persamaan regresi
Ŷ = bo + b1 x1 + b2 x2 + … + br xr
∑ yi = n bo + b1 ∑ x1i + b2 ∑ x2i
bo = y – b1 x1 – b2 x2
[n∑x2i2-(∑x2i) 2 ][n∑yi2-(∑yi)2]
[n∑x1i2-(∑x1i)2][n∑x2i2-(∑x2i)2]
Uji t atau T test
Pengertian Uji tes
• dikembangkan oleh William Seely Gosset pada tahun 1915
• Disebut juga dengan Student t dan merupakan salah satu metode statistik yang digunakan
untuk menguji kebenaran atau kepalsuan hipotesis yang menyatakan bahwa diantara dua
buah mean sample yang diambil secara random dari populasi yang sama terdapat perbedaan
signifikan
• Student t test adalah uji komparatif untuk menilai perbedaan antara nilai tertentu dengan rata-
rata kelompok populasi. Student t test disebut juga dengan istilah one sample t test atau uji t
satu sampel oleh karena uji t di sini menggunakan satu sampel.
Terpisah
(independent)
𝑑𝑖 = 𝑥1𝑖 − 𝑥2𝑖
dan
∑ 𝑑𝑖
t > 𝑡𝛼⁄2 ,𝑣 𝑥𝐷 =
𝑛
𝑣 = 𝑛− 1
Independent test
Digunakan untuk menguji signifikansi beda rata-rata dua kelompok
Pola uji t untuk data independen (independent sample test)
Kriteria populasi/sampel Ho Ha Nilai kritis Nilai Uji Statistik
Ukuran kemiringan kurva (Skewness) adalah derajat ( ukuran ) ketidak sime trisan
lengkungan halus (kurva) dari suatu distribusi data
Pada Kelompok A ,
data menyebar normal sehingga histogram yang terbentuk mengikuti kurva
normal dengan frekuensi mean = median = modus = 20
Pada Kelompok B
data simetris kanan dan kiri sehingga histogram yang terbentuk bersifat
simetris dengan frekuensi mean = median = modus = 20, memiliki 2 modus
Pada Kelompok C
data lebih menyebar ke data yang lebih kecil sehingga histogram yang
terbentuk panjang ke kanan dengan frekuensi mean (16,52) > median (15) >
modus (10)
Pada Kelompok D
data lebih menyebar ke data yang lebih besar sehingga histogram yang
terbentuk panjang ke kiri dengan frekuensi mean (23,48) < median (25) <
modus (30)
28 39 23 67 37 28 56 40 28 50
51 45 44 65 61 27 24 61 34 44
Penyelesaian :
Dari data tersebut diperoleh :
Mean = 𝑥̅ = 109.6
Median = Med = 108
Modus = Mod = 105
Standar deviasi = S = 9.26
• Ukuran Kemencengan Pearson adalah
K = 109.6 – 105 = 4.6
• Koefisien Kemencengan (CK) adalah
4.6
CK = = 0.5
9.26
Keterangan :
𝛼3 = koefisien kemencengen
M3 = momen ke 3 , mengukur kemencengan
s = simpangan baku
n = banyaknya data
xi = data ke i
𝑥̅ = rata-rata hitung /arithmetic atau mean
Data Kelompok
Keterangan
𝛼3 = koefisien kemencengen
M3 = momen ke 3 , mengukur kemencengan
s = simpangan baku
n = banyaknya data pengamatan
k = banyaknya kelas
fi = frekuensi kelas ke i
𝑥̅ = rata-rata hitung atau mean
Jika : 𝛼3 = 0, maka distribusi datanya simetris
𝛼3 < 0, maka distribusi datanya menceng ke kiri
𝛼3 > 0 , maka distribusi datanya menceng ke kanan
Data berkelompok
Keterangan
𝛼3 = koefisien kemencengen
M3 = momen ke 3 , mengukur kemencengan
s = simpangan baku
n = banyaknya data pengamatan
k = banyaknya kelas
c = besar interval kelas
fi = frekuensi kelas ke i
di = simpangan kelas ke I terhadap titik asal konsumsi
𝑥̅ = rata-rata hitung atau mean
Contoh (data tersebar/ungroup data) :
28 39 23 67 37 28 56 40 28 50
51 45 44 65 61 27 24 61 34 44
Penyelesaian :
𝑥̅ = 109.6
3. Ukuran kemencengan Kurva menurut Bowley
K = (Q1 + Q3) – 2Q2
Keterangan :
K = ukuran kemencengan
Q1 = kuartil pertama
Q2 = kuartil ke dua
Q3 = kuartil ke tiga
𝐾
CK = 𝑄
3 −𝑄1
Keterangan :
CK = koefisien kemencengan
K = ukuran kemencengan
Q1 = kuartil pertama
Q2 = kuartil ke dua
Q3 = kuartil ke tiga
Contoh (data tersebar):
Berikut ini adalah waktu tunggu (dalam menit) 20 pelanggan di restoran
ABC saat malam Minggu untuk memperoleh meja
28 39 23 67 37 28 56 40 28 50
51 45 44 65 61 27 24 61 34 44
Ukuran dari data tersebut :
Q1 = 28 Q2 = 42 Q3 = 54,75
Ukuran kemencengan Bowley
K = (Q1 + Q3) – 2Q2
= (28 +54,75) – 2(42) = - 1,25
Koefisien kemencengan (CK)
𝐾 −1.25
CK = = = -0,046
𝑄3 −𝑄1 54,75 −28
Contoh (data kelompok):
Data tinggi badan karyawan suatu perusahaan .
Tentukan besarnya kemencengan kurva dari data berikut :
Kelas Frekuensi (𝑓𝑖 )
93 - 97 2
98 – 102 10
103 – 107 12
108 - 112 10
113 – 117 7
118 – 122 4
123 – 127 3
128 – 132 1
133 – 137 0
138 - 142 1
Ukuran dari data tersebut :
Q1 = 102.71 Q2 = 108 Q3 = 116
Ukuran kemencengan Bowley
K = (Q1 + Q3) – 2Q2
= (102.71 +116) – 2(108) = 2.71
Koefisien kemencengan (CK)
𝐾 2.71
CK = = = 0.204
𝑄3 −𝑄1 116 −102.71
Jenis Kurtosis :
1. Leptokurtis,
merupakan distribusi yang memiliki puncak kurva tinggi
2. Mesokurtis,
merupakan distribusi yang puncak tidak tinggi dan tidak
mendatarmendatar, bila merupakan distribusi simetris dianggap sebagai
distribusi/kurva normal
3. Platikurtis ,
merupakan distribusi yang memiliki puncak kurva rendah
Keterangan :
𝛼4 = koefisien Keruncingan
M4 = momen ke 4 , mengukur keruncingan
s = simpangan baku
n = banyaknya data
xi = data ke i
𝑥̅ = rata-rata hitung /arithmetic atau mean
b. Data Kelompok (Group data)
Rumus 1.
Keterangan
𝛼4 = koefisien keeruncingan
M4 = momen ke 4 , mengukur keruncingan
s = simpangan baku
n = banyaknya data pengamatan
k = banyaknya kelas
fi = frekuensi kelas ke i
𝑥̅ = rata-rata hitung atau mean
Jika : 𝛼4 > 3, maka bentuk kurva leptokurtis (meruncing)
𝛼4 = 3, maka bentuk kurva mesokurtis (normal)
𝛼4 < 3 , maka bentuk kurva platikurtis (mendatar)
Rumus 2.
Keterangan
𝛼4 = koefisien keruncingan
M4 = momen ke 4 , mengukur keruncingan
s = simpangan baku
n = banyaknya data pengamatan
k = banyaknya kelas
c = besar interval kelas
fi = frekuensi kelas ke i
di = simpangan kelas ke I terhadap titik asal konsumsi
𝑥̅ = rata-rata hitung atau mean
Sehingga :
·
I .
j,,.,__.. ,,_,,.•, :.
\I
I
CONTOH UAS STATISTIKA 1 2019 SWWR
A. 1 C. 0,0907
B. 0.2117 D. 0,9093
x−
z= adalah : (50 – 40)/ √32 = 1.77
A. 1,25 C. -1,77
B. 1,77 D. 0,33
23. Nilai P (x < 50) dapat dihitung dengan :
A. P (z < 1.77)
B. P (z > 1.77)
C. P (0 < z < 1.77)
D. P (Z = 0)
25. Jika dari seperangkat kartu bridge diambil 7 kartu secara acak
TANPA pemulihan, berapa peluang diperoleh 5 kartu MERAH?
Kasus ini dapat diselesaikan dengan :
A. Distribusi peluang hipergeometrik
B. Distribusi peluang normal
C. Distribusi peluang poisson
D. Distribusi peluang binomial
26.Dari soal no. 25, dapat dihitung nilai N dan k, yaitu masing
masing : merah berarti kartu hati dan diamond total 26 (k)
A. k = 52, N = 13 C. N = 52, k = 13
B. k = 13, N = 26 D. N = 52, k = 26
27. Dalam suatu kotak terdapat 7 apel yang terdiri dari 2 apel
Merah, 4 apel hijau dan 1 apel Fuji. Berapa peluang terambil 3
apel hijau, dari 5 kali pengambilan yang dilakukan secara acak
DENGAN pemulihan? Kasus ini dapat diselesaikan dengan
A. Distribusi peluang Normal
B. Distribusi peluang Poisson
C. Distribusi peluang Hipergeometrik
D. Distribusi peluang Binomial
Kasus untuk soal no. 28 sd 30 gunakan soal berikut ini
Diketahui sekelompok hasil UTS Statistika dari beberapa mahasiswa
UG:
60 75 70 60 80 75 80 75 85 90
n=5
X 0.05 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 0.95
0 .774 .590 .328 .168 .078 .031 .010 .002 .000 .000 .000
1 .204 .328 .410 .360 .259 .156 .077 .028 .006 .000 .000
2 .021 .073 .205 .309 .346 .312 .230 .132 .051 .008 .001
3 .001 .008 .051 .132 .230 .312 .346 .309 .205 .073 .021
4 .000 .000 .006 .028 .077 .156 .259 .360 .410 .328 .204
5 .000 .000 .000 .002 .010 .031 .078 .168 .328 .590 .774
TABEL POISSON ( p(x;μ)
µ
TABEL LUAS DIBAWAH KURVA NORMAL
(Setengah Kurva)
CONTOH UAS STATISTIKA 1 2019 SWWR
A. 1 C. 0,0907
B. 0.2117 D. 0,9093
x−
z= adalah : (50 – 40)/ √32 = 1.77
A. 1,25 C. -1,77
B. 1,77 D. 0,33
23. Nilai P (x < 50) dapat dihitung dengan :
A. P (z < 1.77)
B. P (z > 1.77)
C. P (0 < z < 1.77)
D. P (Z = 0)
25. Jika dari seperangkat kartu bridge diambil 7 kartu secara acak
TANPA pemulihan, berapa peluang diperoleh 5 kartu MERAH?
Kasus ini dapat diselesaikan dengan :
A. Distribusi peluang hipergeometrik
B. Distribusi peluang normal
C. Distribusi peluang poisson
D. Distribusi peluang binomial
26.Dari soal no. 25, dapat dihitung nilai N dan k, yaitu masing
masing : merah berarti kartu hati dan diamond total 26 (k)
A. k = 52, N = 13 C. N = 52, k = 13
B. k = 13, N = 26 D. N = 52, k = 26
27. Dalam suatu kotak terdapat 7 apel yang terdiri dari 2 apel
Merah, 4 apel hijau dan 1 apel Fuji. Berapa peluang terambil 3
apel hijau, dari 5 kali pengambilan yang dilakukan secara acak
DENGAN pemulihan? Kasus ini dapat diselesaikan dengan
A. Distribusi peluang Normal
B. Distribusi peluang Poisson
C. Distribusi peluang Hipergeometrik
D. Distribusi peluang Binomial
Kasus untuk soal no. 28 sd 30 gunakan soal berikut ini
Diketahui sekelompok hasil UTS Statistika dari beberapa mahasiswa
UG:
60 75 70 60 80 75 80 75 85 90
n=5
X 0.05 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 0.95
0 .774 .590 .328 .168 .078 .031 .010 .002 .000 .000 .000
1 .204 .328 .410 .360 .259 .156 .077 .028 .006 .000 .000
2 .021 .073 .205 .309 .346 .312 .230 .132 .051 .008 .001
3 .001 .008 .051 .132 .230 .312 .346 .309 .205 .073 .021
4 .000 .000 .006 .028 .077 .156 .259 .360 .410 .328 .204
5 .000 .000 .000 .002 .010 .031 .078 .168 .328 .590 .774
TABEL POISSON ( p(x;μ)
µ
TABEL LUAS DIBAWAH KURVA NORMAL
(Setengah Kurva)