Anda di halaman 1dari 146

Buku Ajar

St
Σ
istika
at
Supardi
Program Studi Pendidikan
Guru Sekolah Dasar
Universitas Muhammadiyah Palangkaraya
Pengantar

Segala puji bagi Allah, semoga shalawat dan salam selalu tercurah
kepada Nabi Muhammad shollallahu’alaihi wa sallam, kepada keluarga dan
kepada sahabat serta kepada pengikutnya yang lurus hingga hari kiamat.
Buku ajar mata kuliah Statistika ini merupakan kumpulan materi yang
penulis ajarkan selama bertahun-tahun di Fakultas Keguruan dan Ilmu
Pendidikan Universitas Muhammadiyah Palangkaraya.
Keberhasilan penyusunan buku ajar ini tidak terlepas dari bantuan
banyak pihak, khususnya rekan sejawat di Program Studi Agroteknologi. Pener-
bitan buku ajar ini juga tidak terlepas dari peran Universitas Muhammadiyah
Palangka Raya yang telah memberikan kesempatan berupa hibah bahan ajar.
Oleh karena itu, dalam kesempatan ini penulis mengucapkan terimakasih yang
sebesar-besarnya kepada semua pihak tersebut.
Semoga buku ajar ini diridhoi Allah subhanahu wa ta’ala dan dapat
memberikan sumbangan bagi pengajaran mata kuliah Statistika, sehingga men-
jadi amal jariyah bagi semua pihak yang telah turut serta dalam menyelesaikan
bahan ajar ini.

Palangkaraya, Juni 2020


Penulis,

Supardi

i
Daftar Isi

Prakata i

1 Populasi dan Sampel 1


1.1 Pengantar . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1
1.2 Pengumpulan data . . . . . . . . . . . . . . . . . . . . . . . . . 2
1.3 Sifat variabel dalam penelitian . . . . . . . . . . . . . . . . . . . 5

2 Penya jian Data 8


2.1 Distribusi Frekuensi . . . . . . . . . . . . . . . . . . . . . . . . . 8
2.2 Histogram . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 10
2.3 Diagram Batang dan Daun . . . . . . . . . . . . . . . . . . . . . 13

3 Ringkasan Data 15
3.1 Ukuran Kecenderungan Pusat . . . . . . . . . . . . . . . . . . . 15
3.2 Varian . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 20
3.3 Persentil . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 21
3.4 Box Plot . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 23
3.5 Teorema Chebyshev . . . . . . . . . . . . . . . . . . . . . . . . . 24

4 Peluang 26
4.1 Ruang Sampel . . . . . . . . . . . . . . . . . . . . . . . . . . . . 26
4.2 Peluang . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 30
4.3 Peluang Bersyarat . . . . . . . . . . . . . . . . . . . . . . . . . 34
4.4 Prinsip Dasar Perhitungan . . . . . . . . . . . . . . . . . . . . . 37
4.5 Permutasi . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 38

ii
4.6 Kombinasi . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 40

5 Variabel Random 42
5.1 Variabel Random Diskrit . . . . . . . . . . . . . . . . . . . . . . 42
5.2 Nilai Harapan Variabel Random Diskrit . . . . . . . . . . . . . 46
5.3 Variabel Random Kontinu . . . . . . . . . . . . . . . . . . . . . 48
5.4 Variabel Random Bersama . . . . . . . . . . . . . . . . . . . . . 49

6 Beberapa Distribusi Peluang 52


6.1 Distribusi binomial . . . . . . . . . . . . . . . . . . . . . . . . . 52
6.2 Distribusi Normal . . . . . . . . . . . . . . . . . . . . . . . . . . 53
6.3 Distribusi yang berhubungan dengan distribusi normal . . . . . 57
6.3.1 Distribusi Chi-Square . . . . . . . . . . . . . . . . . . . . 57
6.3.2 Distribusi t . . . . . . . . . . . . . . . . . . . . . . . . . 58
6.3.3 Distribusi F . . . . . . . . . . . . . . . . . . . . . . . . . 58

7 Teori Sampling 60

8 Estimasi 65
8.1 Interval kepercayaan untuk µ dengan σ diketahui . . . . . . . . 67
8.2 Interval kepercayaan untuk µ dengan σ tidak diketahui . . . . . 68
8.3 Interval kepercayaan untuk σ 2 . . . . . . . . . . . . . . . . . . . 69
8.4 Interval kepercayaan selisih dua mean . . . . . . . . . . . . . . . 71

9 Uji Hipotesis 74
9.1 Uji tentang mean populasi normal . . . . . . . . . . . . . . . . . 77
9.1.1 Uji hipotesis dengan σ 2 diketahui . . . . . . . . . . . . . 77
9.1.2 Uji hipotesis dengan σ 2 tidak diketahui . . . . . . . . . . 80
9.2 Uji kesamaan mean dua populasi . . . . . . . . . . . . . . . . . 82
9.2.1 Varian populasi diketahui . . . . . . . . . . . . . . . . . 82
9.2.2 Varian populasi tidak diketahui . . . . . . . . . . . . . . 83
9.2.3 Varian tidak diketahui dan tidak sama . . . . . . . . . . 86

3
9.3 Uji t berpasangan . . . . . . . . . . . . . . . . . . . . . . . . . . 86
9.4 Uji hipotesi tentang varian populasi normal . . . . . . . . . . . 88
9.5 Uji hipotesis kesamaan varian dua populasi normal . . . . . . . 89
9.6 Uji Goodness of Fit . . . . . . . . . . . . . . . . . . . . . . . . . 91
9.7 Uji Independen . . . . . . . . . . . . . . . . . . . . . . . . . . . 92

10 Regresi Linear Sederhana 96


10.1 Sifat estimator βˆ dan αˆ . . . . . . . . . . . . . . . . . . . . . . .
99
10.2 Inferensi tentang parameter β dan α . . . . . . . . . . . . . . . 100
10.3 Koefisien Determinasi . . . . . . . . . . . . . . . . . . . . . . . . 101
10.4 Korelasi . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 102

Daftar Pustaka 104

Lampiran Tabel 105

Glosarium 114

Indeks 116
Bab 1

Populasi dan Sampel

1.1 Pengantar
Pengambilan kesimpulan sehari-hari sering didasarkan pada informasi yang
tidak lengkap. Kesimpulan semacam ini tentu mengandung ketidakpastian. Di
dalam statistika, akan dipelajari bagaimana menggali informasi atau membuat
kesimpulan berdasarkan informasi yang tidak lengkap.

Definisi 1. Statistika merupakan studi tentang bagaimana mengumpulkan,


mengorganisasi, menganalisis dan menginterpretasikan data.

Dengan demikian persyaratan untuk dapat melakukan studi dengan statis-


tika adalah adanya data. Data diperoleh dengan melakukan observasi dari
karakter individu-indvidu yang menjadi perhatian.
Sering terjadi data yang diperlukan dalam studi statistik sudah tersedia,
misalnya data yang diterbitkan oleh Badan Pusat Statistik. Dapat pula ter-
jadi data yang diperlukan dalam studi belum tersedia. Dalam hal data belum
tersedia maka perlu diadakan dengan cara melakukan observasi atau eksperi-
men.

1
1.2 Pengumpulan data
Untuk memperoleh data, sering dilakukan pengurukuran terhadap objek yang
diteliti. Variabel adalah karakteristik yang diukur atau diobservasi dari su-
atu objek. Variabel yang dinyatakan dalam bentuk bilangan atau numerik
dinamakan variabel kuantitatif, sedangkan variabel yang dinyatakan
dalam kategori atau kelompok tertentu dinamakan variabel kualitatif.
Sebagai contoh, jika ingin diteliti prestasi belajar siswa suatu kelas, maka
variabelnya dapat berupa nilai hasil belajar. Penelitian tentang tingkat ke-
masaman air di Palangkaraya, variabelnya bisa berupa pH air. Suatu peneli-
tian yang bertujuan untuk mengetahui jenis warna yang disukai anak TK,
variabelnya dapat berupa warna.
Karena alasan tertentu, pengamatan tidak bisa dilakukan pada semua ob-
jek yang diteliti. Oleh karena itu biasanya hanya diambil bagian dari kumpu-
lan semua objek tersebut. Populasi adalah kumpulan semua individu (ob-
jek) yang menjadi perhatian studi. Bagian dari populasi dinamakan sampel.
Banyaknya anggota populasi dinamakan ukuran populasi, dan banyaknya
anggota sampel dinamakan ukuran sampel. Data yang diperoleh dari sam-
pel dinamakan data sampel.

Contoh 1. Suatu studi bertujuan untuk mengetahui berat badan rata-rata


mahasiswa UM Palangkaraya. Karena keterbatasan tenaga dan waktu, maka
diambil sampel 100 orang mahasiswa untuk timbang berat badannya. Dalam
studi ini, populasinya adalah seluruh mahasiswa UM Palangkaraya, sampel-
nya adalah ke 100 mahasiswa tersebut, dan variabelnya adalah berat badan
yang merupakan variabel kuantitatif. Jelas bahwa rata-rata berat badan yang
diukur dari 100 mahasiswa tidak menjamin akan mencerminkan rata-rata berat
badan seluruh mahasiswa UM Palangkaraya. Hal ini dikarenakan informasinya
tidak lengkap, yaitu hanya berdasarkan hasil pengamatan sampel berkuran 100
mahasiswa.
Dalam suatu studi umumnya digunakan dapat sampel. Banyak alasan
mengapa harus mengunakan data sampel, diantaranya (i) keterbatasan sum-
berdaya dan (ii) secara teknis tidak mungkin diamati seluruh anggota pop-
ulasi. Jika data sampel telah diperoleh, maka dari data ini dapat diperoleh
suatu kuantitas, misalnya dengan cara menghitung rata-ratanya. Statistik
adalah suatu nilai yang dihitung dari data sampel, sedangkan parameter
adalah suatu karateristik populasi.
Pada Contoh 1, parameternya adalah rata-rata berat badan seluruh ma-
hasiswa UM Palangkaraya, yang dalam hal ini nilainya tidak diketahui;
sedangkan statistiknya adalah rata-rata berat badan yang dihitung dari ke
100 ma- hasiswa tersebut.
Parameter umunya tidak diketahui nilainya. Oleh karena itu peneliti
harus cukup puas dengan nilai dugaan (prediksi) parameter. Statistik
digunakan untuk menduga (to estimasi) parameter. Suatu statistik dikatakan
representatif (mewakili) jika dapat menggambarkan keadaan parameter
dengan baik. Ada banyak kriteria mengenai statistik yang baik untuk suatu
parameter. Baik tidaknya suatu statistik sangat bergantung pada bagaimana
sampel tersebut diambil dari populasi. Suatu proses pengambilan sampel
dinamakan sampling. Ada beberapa cara pengambilan sampel, yaitu (1)
random sam- pling, (2) stratified sampling, (3) sistematik sampling dan (4)
cluster sampling.
Sampel random berukuran n dari suatu populasi adalah bagian
populasi yang diambil dengan cara sebagai berikut:

(1) setiap sampel berukuran n memiliki kesempatan yang sama untuk terpilih.

(2) setiap anggota populasi memiliki kesempatan yang sama untuk terpilih.

Suatu prosedur untuk memperoleh sampel random adalah dengan


menggunakan bilangan random. Bilangan random dapat diperoleh pada
tabel bilangan random, kalkulator atau program komputer.
Untuk melakukan random sampling dapat dikerjakan dengan tahapan
sebagai berikut:
(1) beri nomor semua anggota populasi secara berurutan

(2) bunakan tabel, kalkulator atau komputer untuk memilih bilangan random.

(3) buatlah sampel dengan menggunakan anggota populasi yang nomornya


berkaitan dengan bilangan random yang terpilih.

Contoh 2. Akan diambil sampel random berukuran 10 dari sebuah kelas yang
memiliki 50 siswa. Langkah-langkahnya adalah:

(1) Beri nomor urut pada setiap anggota kelas mulai nomor 1 sampai dengan
nomor 50.

(2) Gunakan tabel bilangan random, dengan cara: pertama tunjuk sebarang
bilangan pada tabel, kemudian diteruskan dengan menuliskan bilangan
random berikutnya secukupnya. Misal dalam contoh ini diperoleh bilangan
random mulai baris ke-7 dan kolom ke-9:
66 94730 95761 75023 48464 65544 96583 18911
16391 99938 90704 93621 66330 33393 95261
Karena banyaknya sampel merupakan bilangan dua digit, maka bilangan
random di atas dikelompokan menjadi dua digit :
66 94 73 09 57 61 75 02 34 84
64 65 54 49 65 83 18 91 11 63 91
99 93 89 07 04 93 62 16 63 30 33
39 39 52 61

(3) Daftarkan semua anggota kelas yang nomornya sesuai dengan nomor pada
bilangan random yang telah dikelompokan tersbut. Jika ditemui bilangan
yang lebih besar dari 50 maka diabaikan, dan jika diperoleh bilangan ran-
dom yang sudah terpilih sebelumnya, maka diabaikan. Anggota populasi
yang terpilih sebagai anggota sampel adalah yang bernomor:

09 02 34 49 18 11 07 04 16 30 33.
Stratified sampling adalah cara pengambilan sampel dari populasi yang
memiliki strata tertentu. Misalnya, pada populasi mahasiswa UM Palangkaraya,
stratanya dapat berupa lulusan SMA, sudah bekerja dan mahasiswa pindahan.
Pada teknik ini, populasi dibagi minimal dalam dua strata, kemudian pada se-
tiap strata pengambilan sampel dilakukan secara random sampling.
Pada metode sistematik sampling, anggota populasi disusun dengan
urutan tertentu. Kemudian dilakukan pengambilan satu individu secara ran-
dom, dan dilanjutkan dengan mengambil setiap anggota ke k dari sampel.
Pada metode cluster sampling dimulai dengan membagi wilayah men-
jadi beberapa bagian (cluster). Kemudian diambil secara random bagian-
bagian tersebut. Setiap anggota cluster menjadi anggota sampel.

1.3 Sifat variabel dalam penelitian


Didalam studi observasi, pengukuran terhadap anggota sampel dilakukan
sehingga tidak merubah respon atau variabel yang diteliti. Di dalam ekspe-
rimen, perlakuan diberikan pada individu untuk melihat perubahan respon
atau variabel yang diukur. Untuk memperoleh data, kadang-kadang peneliti
harus melakukan survey, yaitu mengambil data dari orang-orang dengan cara
memberikan pertanyaan.
Pengkategorian lain dari data adalah berdasarkan tingkat pengukuran,
dalam arti berdasarkan sifat aritmetika data. Berdasarkan tingkat menguku-
ran, data dikelompokan menjadi:

(1) Data nominal merupakan data yang tidak dapat (tidak berkmakna) jika
diurutkan secara aritmetika.

(2) Data ordinal, yaitu data yang bisa diurutkan tetapi tidak dapat (tidak
bermakna) jika dibandingkan.

(3) Data interval, yaitu data yang dapat urutkan dan perbedaan antara
nilai data ada maknanya.
(4) Data rasio, yaitu data yang dapat dirutkan, perbedan antara nilai data
bermakna dan rasio antar nilai data juga bermakna. Pada data rasio nilai
0 merupakan nilai sebenarnya.

Contoh 3. Suatu data berisi informasi nama hewan di suatu kebun binatang:

harimau
jerapah
buaya
unta

Data tersebut termasuk data nominal. Perhatikan bahwa data tersebut hanya
menyatakan nama, jadi jika diurutkan tidak ada artinya.

Contoh 4. Suatu penelitian bertujuan untuk mengetahui tingkat kesukaan


konsumen terhadap suatu produk.
Variabel yang diamati adalah sebagai berikut:

Suka
Sedang
Tidak suka

Perhatikan bahwa data ini dapat diurutkan, namun selisih antar tingkat ke-
sukaan tidak bermakna.

Contoh 5. Temperatur di kota Palangkaraya merupakan data interval, sebab


nilai temperatur dapat diurutkan dan selisih antara nilai temperatur memi-
liki makna. Misalnya pada pagi hari temperaturnya 23o dan pada siang hari
30o , perbedaaanya menyatakan bahwa pada siang hari temperaturnya 7o lebih
panas dibanding pagi hari. Perhatikan pula bahwa temperatur 0o tidak berarti
tidak ada panas, yakni nilai ini bukan nilai sebenarnya.

Contoh 6. Data penghasil 5 orang per bulan (dalam juta rupiah) adalah
sebagai berikut:
No. Urut. Penghasilan
1. 2
2. 4,5
3. 13
4. 0,5
5. 0,0

Sifat data ini dapat urutkan, dapat dikurangkan antar nilai-nilainya dan ni-
lai 0 adalah nilai yang sebenarnya, yaitu tidak punya penghasilan. Dengan
demikian data ini termasuk data rasio.
Bab 2

Penya jian
Data

2.1 Distribusi Frekuensi


Suatu data kuantitatif yang ukuran cukup besar akan lebih berguna jika data
tersebut dikelompokan menjadi interval atau kelas yang lebih kecil. Dalam
penyajian data dengan tabel frekuensi data dipartisi menjadi kelas atau in-
terval dan ditampilkan banyaknya nilai data yang termasuk pada setiap kelas.
Tabel frekuensi mencakup hal-hal berikut.

• Kelas atau interval dibentuk sehingga setiap nilai data termasuk


kedalam tepat satu kelas.

• Kelas berupa interval bilangan; jadi memiliki batas bawah dan batas
atas.

• Titik tengah kelas adalah bilangan yang posisinya di tengah kelas.

• Lebar kelas menyatakan selisih antara batas atas dan batas bawah
kelas tersebut.
Nilai data terb esar − Nilai data
Lebar kelas =
terkecil
banyaknya kelas

• Frekuensi kelas adalah banyaknya nilai yang termasuk suatu kelas.


• Frekuensi relatif adalah frekuensi dibagi banyaknya nilai data.
• Frekuensi Kumulatif suatu kelas adalah banyaknya seluruh nilai data
yang lebih kecil dari batas atas kelas tersebut.

• Frekuensi kumulatif relatif adalah frekuensi kumulatif dibagi


banyaknya data.

Contoh 7. Data hasil ujian mata kuliah Statistika 40 mahasiswa berikut akan
disajikan dalam bentuk frekuensi distribusi dengan 6 kelas.:

78 60 45 65 80 95 40 40 46 55
60 76 65 60 55 54 75 84 48 58
68 87 95 54 67 58 87 56 43 56
67 58 78 65 89 85 76 68 64 60
Langkah-langkah membentuk tabel frekuensi adalah sebagai berikut.
(1) Tentukan lebar kelas:
95 −
Lebar kelas = = 9.16,
40
6
dibulatkan menjadi 10.

(2) Tentukan kelas (interval kelas) sebagai berikut:

• ambil nilai data terkecil sebagai batas bawah kelas pertama, dalam
hal ini adalah 40,

• batas bawah kelas berikutnya = batas bawah nilai sebelumnya + 10.


Jadi batas bawah kelas kedua adalah 40 + 10 = 50,

• batas bawah kelas diperoleh dengan mengambil nilai tepat di bawah


batas atas kelas berikutnya, jadi batas kelas pertama adalah 59,

• proses ini dilanjutkan untuk kelas-kelas berikutnya.

(3) Sekarang setiap nilai data dapat dimasukan ke dalam kelas masing-masing.
Untuk menghitung frekuensi setiap kelas dapat menggunakan dengan ban-
tuan tally.

9
Dari langkah-langkah di atas, diperoleh tabel frekuensi sebagai berikut:

Frekuensi Frekuensi Frekuensi


Interval Kelas Frekuensi Relatif Kumulatif Kumulatif
Relatif
40-49 6 0.15 6 0.15
50-59 9 0.225 15 0.375
60-69 12 0.3 27 0.675
70-79 5 0.125 32 0.800
80-89 6 0.15 38 0.950
90-99 2 0.05 40 1.00
Jumlah 40 1

2.2 Histogram
Dari tabel frekuensi dapat disajikan bentuk visualnya. Histogram merupakan
cara yang cukup efektif untuk menyajikan data dalam bentuk visual. Pada
histogram:

• setiap kelas dinyatakan dengan sebuah batang,

• lebar batang menyatakan lebar kelas,

• tinggi batang menyatakan frekuensi kelas atau frekuensi relatif kelas,

• nilai dibawah setiap batang adalah titik tengah kelas.

Sebagai contoh, histogram frekuensi pada Contoh 7 dinyatakan pada Gambar


2.1.
Bentuk histogram dari suatu sampel random menggambarkan bagaimana
nilai data berdistribusi pada populasi. Bentuk histogram dapat dikelompokan
menjadi:

(1) Simetris, yaitu histogram yang bentuknya (hampir) simetris terhadap su-
atu sumbu.

10
12

10

Frekuensi
8

0
45.5 55.5 65.5 75.5 85.5 95.5
Nilai

Gambar 2.1: Histogram frekuensi

Gambar 2.2: Simetris Gambar 2.3: Seragam

(2) Seragam, yaitu histogram yang frekuensi setiap kelasnya sama atau hampir
sama.

(3) Menceng kiri atau menceng kanan, yaitu histogram yang ekornya menju-
lur lebih panjang ke satu sisi. Jika ekornya lebih menjulur kekiri maka
dinamakan menceng kekiri, jika ekornya lebih menjulur kekanan maka di-
namakan menceng kekanan.

(4) Bimodal, yaitu histogram yang memiliki dua kelas dengan frekuensi tertetinngi
yang dipisahkan oleh kelas lainnya.
Gambar 2.4: Menceng kiri Gambar 2.5: Menceng kanan

Gambar 2.6: Bimodal

Kadang-kadang suatu histogram ingin disajikan dengan bentuk tertentu.


Diagram pareto adalah grafik batang yang disajikan secara urut berdasarkan
tingginya. Sebagai contoh, diagram pareto untuk Contoh 7 disajikan pada
Gambar 2.7.
Grafik runtun waktu (time series) adalah grafik yang menggambarkan
bagaimana data berubah terhadap waktu.

Contoh 8. Misalnya hasil pengamatan populasi suatu spesies selama beberapa


tahun memberikan data sebagai berikut.
12

10

Frekuensi
8

0
65.5 55.5 45.5 75.5 85.5 95.5
Nilai

Gambar 2.7: Diagram Pareto

Tahun ke 0 1 2 3 4 5 6 7 8 9 10
Populasi (ribu) 45 42 33 36 30 31 32 34 35 40 42

Grafik runtun waktu data ini disajikan pada Gambar 2.8.

45

40

35

30
0 2 4 6 8 10

Gambar 2.8: Grafik runtun waktu

2.3 Diagram Batang dan Daun


Diagram batang dan daun menyajikan data dalam bentuk susunan dan kelom-
pok tertentu. Didalam tabel frekuensi dan histogram, informasi tentang nilai
data tidak dapat dilihat. Di dalam diagram batang dan daun, informasi men-
genai nilai data asli tidak hilang.
Diagram batang-daun dapat disusun dengan langkah-langkah sebagai berikut.

(1) Bagi digit tiap nilai data menjadi dua bagian. Bagian paling kiri dina-
makan batang dan bagian kanan dinamakan daun.

(2) Susun semua batang secara vertikal mulai dari nilai terkecil hingga nilai
terbesar.

(3) Tuliskan semua daun yang batangnya sama pada baris batang yang sama,
lalu susun daun dengan urutan makin membesar.

Contoh 9. Data nilai ujian Statistika pada Contoh 7 akan disajikan dalam
diagram batang daun. Digit pertama sebagai batang dan digit kedua sebagai
daun. Berdasarkan prosedur di atas diperoleh diagmar berikut.

4 0 0 3 5 6 8
5 4 4 5 5 6 6 8 8
6 0 0 0 0 4 5 5 5 7 7 8 8
7 5 6 6 8 8
8 0 4 5 7 7 9
9 5 5
Bab 3

Ringkasan Data

Selain dengan cara visual, data hasil observasi atau penelitian juga dapat
disajikan dengan membuat ringkasan. Ringkasan data memberikan gambaran
umum mengenai hasil observasi atau penelitian dalam bentuk numerik.

3.1 Ukuran Kecenderungan Pusat


Dalam keseharian orang sering mendengar ungkapan-ungkapan seperti:

• Umumnya orang Indonesia makan nasi.

• Sebagian besar siswa lulus UAN.

• Pendapatan per kapita rata-rata di Palangkaraya 4 juta rupiah per bulan.

Ungkapan-ungkapan tersebut merupakan ungkapan kecenderungan suatu pop-


ulasi. Di dalam bagian ini akan diperkenalkan cara menyampaikan ungkapan-
ungkapan tersebut dalam bahasa statistika.
Data hasil suatu observasi atau penelitian dinamakan data mentah (raw
data). Nilai tunggal observasi dinamakan nilai data. Data mentah tidak mudah
untuk dibaca maknanya, sehingga diperlukan cara penyajian agar data mentah
dapat lebih mudah difahami maknanya. Modus suatu data adalah nilai data
yang paling banyak frekuensinya.

Contoh 10. Data banyaknya anak 10 rumah tangga adalah sebagai berikut:

2 0 2 1 2 3 4 3 2 1.
Berdasarkan data tersebut, rumah tangga dengan 2 anak memiliki frekuensi
paling banyak, oleh karena itu modusnya adalah 2.

Ukuran kecenderungan lainnya yang sering digunakan di dalam mem-


buat ringkasan data adalah median. Median adalah nilai data yang posisinya
ditengah setelah data diurutkan. Median data dapat dicari sebagai berikut:

(1) urutkan data dari nilai terkecil hingga terbesar,

(2) jika banyaknya nilai data ganjil, maka median adalah nilai yang posisinya
ditengah,

(3) jika banyaknya nilai data genap, maka


jumlah dua nilai yang ditengah
median = .
2

Contoh 11. Hasil pengukuran tinggi badan 11 mahasiswa (dalam kg) adalah

67 60 70 55 58 76 63 76 81 65 72.

Setelah diurutkan dari nilai data terkecil sampai yang terbesar diperoleh

55 58 60 63 65 67 70 72 76 76 81.

Karena banyaknya nilai data ada 11, maka mediannya adalah nilai yang po-
sisinya ditengah, yaitu nilai ke 6. Dengan demikian mediannya adalah 67.

Contoh 12. Misalkan data pendapatan per bulan 10 orang adalah sebagai
berikut (dalam juta rupiah)

4 4 6 3 5 3 2 5 1 3.

Setelah diurutkan, data tersebut menjadi

1 2 3 3 3 4 4 5 5 6.

Karena banyaknya observasi 10 (genap), maka mediannya adalah


nilai ke 5 + nilai ke 6 3 + 4
median = = = 3.5.
2 2
Mean atau mean aritmetika atau rata-rata suatu sampel adalah jum-
lah seluruh nilai data dibagi ukuran sampel. Mean suatu sampel berukuran n
dengan nilai-nilai data x1 , x2 , · · · , xn , ditulis x¯. Jadi
x1 + x2 + · · · 1X n
mean = x¯ = xi .
+ xn n
=
n
i=1
Pn
Di dalam definisi mean, notasi dibaca ”sigma”, menyatakan jumlah
i=1

pengamatan dari nilai data ke-1 sampai dengan nilai data ke-n.

Contoh 13. Nilai rapor semua pelajaran seorang siswa adalah

7, 8, 6, 7, 6, 8, 7, 9, 6,
7.

Mean nilai rapornya adalah


X7
7+ 8+ 6+ 7+ 6+ 8+ 7+ 9+ 6+ 7
x¯ = 1 xi 71 = 7.1.
= =
7 i=1 10 10

Mean memiliki sifat sensitif terhadap nilai data ekstrim, dalam arti bahwa
jika terdapat nilai data yang sangat kecil atau sangat besar, maka mean mudah
berubah secara ekstrim.

Contoh 14. Data observasi tingkat penghasilan 10 orang di Palangkaraya per


bulan adalah sebagai berikut (dalam juta rupiah):

1, 3, 2, 4, 3, 100, 3, 4, 2, 4.

Di dalam contoh ini terdapat orang yang penghasilannya 100 juta per bulan.
Mean data ini adalah
1 + 3 + 2 + 4 + 3 + 100 + 3 + 4 + 2 + 4
x¯ = 12.6,
=
10
padahal umumnya ke 10 orang berpenghasilan dibawah 5 juta. Hal ini terjadi
karena ada nilai data yang ekstrim, yaitu 100.

Trimmed mean atau mean yang dipangkas relatif tidak sensitif


terhadap nilai data ekstrim. Trimmed mean adalah mean suatu data yang
telah dipangkas sebagian data, umumnya digunakan pemangkasan 5 persen.
Sebagai contoh, untuk mencari trimmed mean 5 persen dapat digunakan
prosedur berikut.
(1) Urutkan data dari nilai terkecil hingga nilai terbesar.

(2) Hapus 5 persen bawah dan 5 persen atas data. Jika 5 persen tersebut
tidak menghasilkan bilangan bulat, bulatkan ke bilangan bulat terdekat.

(3) Hitung mean 90 persen data yang tersisa.

Contoh 15. Data penghasilan per bulan 20 orang dalam juta rupiah adalah
sebagai berikut

3 2 3 1 4 5 4 6 3 5 4 100 4 5 7 8 4 6 7 6. Untuk

mencari trimmed mean 5 persen pertama-tama data diurutkan menjadi

1 2 3 3 3 4 4 4 4 4 5 5 5 6 6 6 7 7 8 100.

Banyaknya nilai data adalah 20, sehingga 5 persen dari 20 adalah 1. Oleh
karena itu dari data yang telah diurutkan, dihilangkan 5 persen (satu nilai
data) bawah dan atas data, sehingga menjadi

2 3 3 3 4 4 4 4 4 5 5 5 6 6 6 7 7 8.

Mean yang dipangkas adalah mean data terakhir, yaitu


1
x¯ (2 + 3 + 3 + 3 + 4 + 4 + 4 + 4 + 4 + 5 + 5 + 5 + 6 + 6 + 6 + 7 + 7 +
= 18 8) = 4.78.

Kadang-kadang terdapat data yang nilai-nilainya dapat dikelompokan


menjadi k nilai berbeda. Misalkan nilai data x1 , x2 , · · · , xk berturut-turut
Pk
memiliki frekuensi f1 , f2 , · · · , fk . Ini berarti data ini memiliki n = i=1 fi
nilai data dengan nilai xi terjadi fi kali. Mean data demikian dapat dihitung
sebagai berikut
1
x¯ = (f1 x1 + f2 x2 + · · · + fk xk ).
n
dengan n = fi + f2 + · · · + fk .

Contoh 16. Berikut adalah data hasil observasi usia mahasiswa pada suatu
kelas
Usia Frekuensi
16 2
17 4
18 7
19 8
20 6
21 3
22 2
Banyaknya observasi adalah

n = 2 + 4 + 7 + 8 + 6 + 3 + 2 = 32.
Dengan demikian mean data tersebut adalah
1 605
x¯ (2 · 16 + 4 · 17 + 7 · 18 + 8 · 19 + 6 · 20 + 3 · 21 + 2 · 22) = = 18.91.
= 32
32
Kadang-kadang nilai data yang akan dicari meannya nilai-nilai datanya
sangat besar. Untuk mempermudah mencari mean data yang nilai-nilainya
sangat besar dapat digunakan transformasi:

yi = xi − c

dengan c suatu konstanta. Dengan tranfomasi tersebut, maka diperoleh

x¯ = y¯ +
c.

Contoh 17. Suatu eksperimen untuk mengukur kecepatan cahaya menghasilkan


hasil pengukuran sebagai berikut (dalam km/detik):

300, 009 299, 999 299, 998 300, 099 300, 008.

Untuk mencari mean data tersebut dapat digunakan tranformasi

yi = xi − 300, 000,

dan diperoleh nilai-nilai yi :


9 −1 − 2 99 8,
dan
1
y¯ (9 − 1 − 2 + 99 + 8) = 22.6.
5
=
Dengan demikian, mean hasil pengukuran kecepatan cahaya tersebut adalah

x¯ = y¯ + 300, 000 = 22.6 + 300, 000 = 300,


022.6.

3.2 Varian
Ada beberapa pernyataan yang sering kita dengan, misalnya ”Tingkat pen-
dapatan orang Indonesia sangat bervariasi”, ”Hasil nilai ujian nasional cukup
beragam”, ”Tinggi tanaman padi di sawah sangat seragam”, dan sebagainya.
Ungkapan semacam ini merupakan suatu cara untuk menyatakan kecenderun-
gan perbedaan antara individu.
Range data x1 , x2 , · · · , xn adalah selisih antara nilai data terbesar dan
nilai data terkecil.

Contoh 18. Nilai ujian 10 orang siswa adalah

5, 6, 4, 7, 8, 7, 10, 6, 7,
4.

Range data tersebut adalah

range = nilai data terbesar − nilai data terkecil = 10 − 4 = 6.

Diketahui x1 , x2 , · · · , xn data sampel berukuran n dan x¯ mean data


terse- but. Deviasi atau penyimpangan nilai data xi terhadap mean x¯ adalah
selisih antara xi dan x¯, yaitu
deviasi = xi −
x¯.

Varian sampel, dituliskan s2 , dari data x1 , x2 , · · · , xn didefinisikan


n
2 1
sX= i − x¯)2 .
(x
n−1
i=1
Varian sampel menggambarkan variabilitas data sampel. Jika s2 adalah varian
sampel, maka s dinamakan deviasi standar sampel.
Contoh 19. Hitunglah varian sampel setiap data berikut:

• Data A: 5, 3, 4, 6, 2.

• Data B: -2, -1, 11, 4, 8.

Mean data A adalah x¯ = (5 + 3 + 4 + 6 + 2)/5 = 4; dengan


demikian varian sampel data A adalah

1
s2 = (5 − 4)2 + (3 − 4)2 + (4 − 4)2 + (6 − 4)2 + (6 − 4)2 + (2 − 4)2
4
10
= = 2.5,
4

dan deviasi standar data A adalah s = 2.5 = 1.58.

Mean data B adalah x¯ = (−2 − 1 + 11 + 4 + 8)/5 = 4; dengan


demikian varian sampel data B adalah

1
s2 = (−2 − 4)2 + (−1 − 4)2 + (11 − 4)2 + (4 − 4)2 + (8 − 4)2
4
126
= = 31.5
4

dan deviasi standar data B adalah s = 31.5 = 5.61.

Perhatikan bahwa meskipun data A dan data B memiliki mean sama,


namun variannya berbeda. Varian data B lebih besar dibanding varian data
A, yang berarti bahwa data B lebih bervariasi dibanding data A.

3.3 Persentil
Diketahui bilangan p dengan 1 ≤ p ≤ 99. Persentil ke p dari suatu data adalah
suatu nilai sehingga p persen data berada pada atau dibawah nilai tersebut
dan (100 − p) persen data berada pada atau di atas nilai tersebut.
Persentil yang sering digunakan adalah quartil. Quartil adalah persentil
yang membagi data menjadi empat.

21
(1) Quartil pertama dituliskan Q1 , adalah persentil ke 25 .

(2) Quartil kedua dituliskan Q2 , adalah median.

(3) Quartil ketiga dituliskan Q3 adalah persentil ke 75.

Jarak antara quartil ketiga dan quartil pertama dinamakan interquartil. Jadi

interquartil = Q3 − Q1 .

Untuk mencari quartil suatu data dapat ditempuk prosedur sebagai berikut:

(1) Urutkan data dari nilai terkecil sampai dengan nilai terbesar

(2) Posisi Q1 = 0.25(n + 1)

(3) Posisi Q2 = 0.5(n + 1)

(4) Posisi Q3 =0.75(n+1).

Contoh 20. Data hasil ujian 40 mahasiswa disajikan pada tabel berikut:

78 60 45 65 80 95 40 40 46 55
60 76 65 60 55 54 75 84 48 58
68 87 95 54 67 58 87 56 43 56
67 58 78 65 89 85 76 68 64 60

Setelah data diurutkan maka diperoleh :

Posisi Q1 = 0.25(40 + 1) = 10.25.

Q1 = nilai ke 10 + 0.25( nilai ke 11 − nilai ke 10)

= 55 + 0.25 = 55.25.
Posisi Q2 = 0.5(40 + 1) = 20.5
nilai ke 20 + nilai ke 21
Q2 =
2
64 + 65
= = 64.5.
2

Posisi Q3 = 0.75(40 + 1) = 30.75

Q3 = nilai ke 30 + 0.75( nilai ke 31 − nilai ke 30)

= 76 + 0.75(78 − 76) = 77.50.

Interquartil = Q3 − Q1 = 77.50 − 55.25 = 22.5.

3.4 Box Plot


Quartil bersama dengan nilai data terbesar dan terkecil menghasilkan ringkasan
lima bilangan dan sebaran data. Kelima bilangan yaitu:

(1) nilai data terkecil,

(2) Q1 ,

(3) median,

(4) Q3 dan

(5) nilai data terbesar.

Kelima bilangan dapat digunakan untuk membuat sketsa grafik data yang
dinamakan box plot, yang dapat dibuat dengan prosedur berikut:

(1) Gambarkan sebuah skala vertikal yang dapat mencakup nilai data terkecil
dan nilai data terbesar.

(2) Gambarkan sebuah kotak dari Q1 ke Q3 di sebelah kanan skala tersebut.


(3) Berilah garis mendatar pada kotak tersebut di ketinggian median.

(4) Gambarkan garis vertikal dari Q1 ke nilai data terkecil dan dari Q3 ke nilai
data terbesar.

Contoh 21. Grafik box-plot data hasil ujian 40 mahasiswa pada Contoh 7.

3.5 Teorema Chebyshev

Teorema 1. Diketahui x¯ dan s berturut-turut adalah mean sampel dan


deviasi standar sampel dengan s > 0. Jika k ≥ 1 maka setidaknya 100(1−1/k 2 )
persen data berada di dalam interval x¯ − ks sampai dengan x¯ + ks.

Contoh 22. Jika k = 2 maka setidaknya ada 100(1 − 1/22 ) = 100 · 3/4 =
75 persen data berada di dalam interval x¯ − 2s sampai dengan x¯ + 2s.

Contoh 23. Nilai ujian 20 siswa adalah sebagai berikut:

5 7 6 8 6 5 4 8 9 9 7 8 5 4 6 7 6 8 6 7.
Dari data tersebut diperoleh: x¯ = 6.55 dan s = 1.5035. Jika diambil k =
3/2,
maka setidaknya ada

100(1 − 1/(3/2)2 ) = 100 · 5/9 = 55.55

2 3
persen data berada di dalam interval 6.55 − 1.5035 sampai dengan 6.55
+

23
1.5035. Dengan kata lain setidaknya 55.55 persen data berada di dalam
interval 4.29475 sampai dengan 8.8052. Dapat diperiksa bahwa nilai data yang
berada di dalam interval tersebut adalah

5 7 6 8 6 5 8 7 8 8 6 7 6 8 7,

yaitu ada 15 (lebih dari 55.55 persen) nilai data yang berada di dalam interval
tersebut.
Bab 4

Peluang

4.1 Ruang Sampel


Suatu eksperimen dilaksanakan dengan tujuan untuk memperoleh hasil (out-
come). Eksperimen random adalah suatu eksperimen yang dapat dilakukan
berkali-kali pada kondisi yang sama dan hasilnya tidak dapat ditentukan den-
gan pasti sebelum eksperimen tersebut selesai. Ini berarti hasil yang akan
terjadi dari suatu eksperimen random menganndung suatu ketidakpastian.
Meskipun hasilnya tidak dengan secara pasti dapat ditentukan, namun kita
masih dapat menentukan semua hasil yang mungkin terjadi.

Definisi 2. Ruang sampel, dituliskan S, dari suatu eksperimen random


adalah himpunan semua hasil (outcome) yang mungkin terjadi.

Definisi 3. Peristiwa E adalah himpunan bagian dari ruang sampel S. Peri-


stiwa E dikatakan terjadi, jika E memiliki anggota.

Selanjutnya peristiwa akan dituliskan dangan huruf A, B, C, D, E, F dan


sebagainya. Karena peristiwa adalah himpunan, maka dua peristiwa atau lebih
dapat dioperasikan dengan operasi himpunan. Operasi himpunan ini memiliki
makna yang didefinisikan dalam definisi berikut.
Definisi 4. Diketahu S ruang sampel.

(1) Peristiwa E ∪ F adalah peristiwa terjadinya E atau F .

(2) Peristiwa E ∩ F adalah peristiwa terjadinya E dan F .

(3) Peristiwa E c adalah peritstiwa tidak terjadinya E.

(4) Dua peristiwa E dan F dikatakan salin asing jika E ∩ F = ∅, yakni jika
kedua peristiwa tidak memiliki anggota bersama.

Keempat peristiwa di dalam Definisi 4 diilustrasikan pada diagram Venn


berikut.

E F E F

E ∪F E ∩F

Ec
E F
E

E ∩F = ∅

Gambar 4.1: Operasi pada peristiwa

Definisi 5. Peristiwa elementer adalah peristiwa yang memiliki tepat satu


anggota.
Contoh 24. Suatu eksperimen random melontarkan dua mata uang logam
satu kali. Peristiwa yang diamati adalah sisi yang menghadap ke atas. Jika
sisi angka ditulis a dan sisi gambar ditulis g, maka ruang sampelnya adalah

S = {aa, ag, ga, gg}.

Jika E adalah peristiwa terjadinya sisi a tepat satu kali, maka dapat
dituliskan
E = {ag, ga}.

Jika F peristiwa terjadinya sisi gambar setidaknya satu kali, maka dapat dit-
uliskan
F = {ag, ga, gg}.

Peristiwa E ∩ F berarti peristiwa terjadi sisi angka sebanyak satu kali


dan gambar satu kali, yaitu

E ∩ F = {ag, ga}.

Peristiwa E c menyatakan peristiwa tidak terjadinya E, yaitu tidak terjadinya


sisi angka sebanyak satu kali, dan dapat dituliskan

E c = {gg, aa}.

Peristiwa elementernya adalah {ag}, {ga}, {aa}, dan {gg}.

Contoh 25. Sebuah dadu dilontarkan satu kali dan diamati banyaknya spot
sisi yang menghadap ke atas. Ruang sampelnya dapat dituliskan

S = {1, 2, 3, 4, 5, 6}.

Peristiwa elementernya adalah {1}, {2}, {3}, {4}, {5} dan {6}.
Jika A peristiwa terjadinya sisi genap dan B peristiwa terjadinya sisi ganjil,
yaitu
A = {2, 4, 6}

B = {1, 3, 5},

maka A dan B merupakan peristiwa yang saling asing, karena A ∩ B = ∅.


Contoh 26. Satu mata uang logam dilontarkan tiga kali. Ruang sampelnya
adalah
S = {aaa, aag, aga, gaa, agg, gag, gga, ggg}.

Jika E adalah peristiwa terjadinya sisi angka paling banyak satu kali, maka
dapat dituliskan
E = {agg, gag, gga, ggg}.

Jika F adalah peristiwa terjadinya sisi gambar satu kali, maka dapat
dituliskan

F = {aag, aga, gaa}.

Peristiwa E ∪ F adalah peristiwa terjadinya sisi angka paling banyak satu kali
atau peristiwa terjadinya sisi gambar dua kali. Jadi

E ∪ F = {agg, gag, gga, ggg, aag, aga, gaa}.

Contoh 27. Sebuah dadu dilontarkan dua kali. Pasangan (a, b) menyatakan
sisi yang terjadi pada lontaran a dan pada lontaran kedua b. Ruang sampelnya
adalah

S = { (1, 1), (1, 2), (1, 3), (1, 4), (1, 5), (1, 6),

(2, 1), (2, 2), (2, 3), (2, 4), (2, 5), (2, 6),

(3, 1), (3, 2), (3, 3), (3, 4), (3, 5), (3, 6),

(4, 1), (4, 2), (4, 3), (4, 4), (4, 5), (4, 6),

(5, 1), (5, 2), (5, 3), (5, 4), (5, 5), (5, 6),

(6, 1), (6, 2), (6, 3), (6, 4), (6, 5), (6,

6)}.

Jika E peristiwa terjadinya jumlah kedua lontaran 10, maka dapat dit-
uliskan
E = {(4, 6), (5, 5), (6, 4)}.

Jika F peristiwa terjadinya lontaran pertama spot 4, maka dapat dituliskan


F = {(4, 1), (4, 2), (4, 3), (4, 4), (4, 5), (4, 6)}.
Contoh 28. Misalkan ingin diketahui ketinggian sebuah roket yang ditem-
bakan dari permukaan bumi. Ruang sampelnya adalah semua bilangan pada
interval 0 sampai dengan tak hingga,

S = {x : 0 ≤ x < tak hingga}.

Jadi ruang sampel ini memiliki tak hingga anggota.

4.2 Peluang
Di dalam suatu percobaan random, akan terjadinya suatu peristiwa tidak da-
pat ditentukan secara pasti. Tingkat kepastian atau ketidakpastian ini diukur
dengan suatu ukuran yang dinamakan peluang (probability).

Definisi 6 (Pendekatan klasik). Diketahui peristiwa E dapat terjadi dalam n


cara berbeda dari seluruh N cara yang semuanya memiliki kemungkinan sama.
Peluang peristiwa E, dituliskan P (E), adalah

n
P (E) = .
N

Pengertian peluang secara klasik mengandung arti bahwa setiap peristiwa


1
elementer memiliki peluang yang sama, yaitu sebesar N .

Contoh 29. Sebuah mangkok berisi 5 bola merah dan 4 bola biru. Dari
mangkok tersebut diambil tanpa pilih-pilih sebuah bola. Peluang terambilnya
bola merah adalah
5
P (merah) = ,
9
dan peluang terambilnya bola biru adalah

4
P (biru) = .
9

30
Definisi 7 (Pendekatan frekuensi). Jika setelah diulang N percobaan, den-
gan N besar, suatu peristiwa diketahui terjadi n kali, maka peluang peristiwa
tersebut adalah n/N .

Contoh 30. Jika satu mata uang logam dilontarkan 1000 kali dan diper-
oleh sisi gambar terjadi 512 kali, maka peluang terjadinya sisi gambar adalah
512/1000 = 0.512.

Pada kenyataannya tidak semua peristiwa elementer memiliki peluang


yang sama, misalnya peluang sebuah mesin jet macet tentu tidak sama dengan
peluang mesin tersebut tidak macet. Oleh karena itu pengertian klasik peluang
kurang tepat untuk berbagai fenomena yang terjadi sehari-hari.
Perhatikan bahwa pada pengertian klasik, banyaknya anggota ruang sam-
pel berhingga. Pada kenyataannya ada ruang sampel yang jumlah anggotanya
tak hingga. Ini berarti pengertian klasik peluang tidak dapat digunakan jika
banyaknya anggota ruang sampel tak hingga.

Definisi 8. Diketahui S ruang sampel. Untuk setiap peristiwa E dihubungkan


dengan suatu bilangan yang dituliskan P (E) yang memenuhi sifat-sifat berikut:

(1) 0 ≤ P (E) ≤ 1.

(2) P (S) = 1.

(3) P (E1 ∪E2 ∪E3 ∪· · · ) = P (E1 )+P (E2 )+P (E3 )+· · · , dengan E1 , E2 , E3 , · ·
·
adalah peristiwa yang saling asing.

Jika P memenuhi ketiga sifat, maka P dinamakan peluang, dan P (E) dina-
makan peluang terjadinya peristiwa E.

Sifat (1) menyatakan bahwa peluang suatu peristiwa adalah suatu nilai
numerik yang besarnya dari 0 hingga 1. Sifat (2) menyatakan bahwa perstiwa
terjadinya ruang sampel adalah pasti, dan sifat (3) menyatakan bahwa peluang
gabungan peristiwa yang saling asing sama dengan jumlah peluang masing-
masing peristiwa.
Peluang merupakan ukuran numerik kemungkinan terjadinya suatu peri-
stiwa. Nilai peluang yang mendekati satu berarti semakin besar kemungkinan
persistiwa tersebut terjadi. Sebaliknya jika peluang suatu peristiwa mendekati
nilai nol, berarti semakin kecil kemungkinan peristiwa tersebut terjadi. Jika
suatu peristiwa memiliki peluang 1 artinya peristiwa tersebut pasti terjadi,
sedangkan jika suatu peristiwa memiliki peluang 0 artinya peristiwa tersebut
tidak mungkin terjadi.

Contoh 31. Frekuensi relatif pada contoh merupakan peluang. Pada kolom
tersebut nilai frekiensi relatif berada pada interval 0 hingga 1, jumlah semua
frekuensi relatif adalah 1 dan frekuensi relatif gabungan kelas interval sama
dengan jumlah frekuensi relatif kelas interval.

Contoh 32. Tiga mata uang dilontarkan satu kali dan diamati sisi yang meng-
hadap ke atas. Ruang sampelnya adalah

S = {aaa, aag, aga, gaa, agg, gag, gga, ggg}.

1
Dianggap setiap peristiwa elementer memiliki peluang sama, yaitu 8 . Jika
E menyatakan peristiwa terjadinya sisi angka satu kali dan F menyatakan
peristiwa terjadinya sisi gambar paling sedikit dua kali, maka E dan F dapat
dituliskan

E = {agg, gga, gag} dan F = {ggg, gga, gag,


agg}.
P (E) = P (agg, gga, gag)
= P (agg) + P (gga) + P (gag)
= 1
8
+ 1
8
+ 1
8
3
= 8
.
P (F ) = P (ggg, gga, gag, agg)
= P (ggg) + P (gga) + P (gag) + P (agg)
= 1
8
+ 1
8
+ 1
8
+ 1
8
1
= 2
.

Berdasarkan definisi peluang, dapat dibuktikan teorema berikut.

Teorema 2. Diberikan ruang sampel S.

(a) Jika E ⊂ F maka P (E) ≤ P (F ).

(b) Untuk sebarang peristiwa E berlaku P (E c ) = 1 − P (E).

(c) P (∅) = 0, dengan ∅ himpunan kosong.

(d) P (E ∪ F ) = P (E) + P (F ) − P (E ∩ F

).

Contoh 33. Diketahui S ruang sampel pada Contoh 26. Misalkan peluang se-
1
tiap peristiwa elementer adalah 36 . Jika E = {(1, 1), (2, 1), (2, 2), (4, 1), (5,
1)}
5
dan
3
F = {(1, 2), (2, 2), (3, 2)}, maka P (E) = , P (F ) = dan P (E ∩F ) = 1
36 36 . 36

Oleh karena itu


5 3 1 7
P (E ∪ F ) = + − = .
36 36 36 36
Contoh 34. Sebuah mangkok berisi 10 kelereng merah, 30 kelereng putih, 25
kelereng biru dan 15 kelereng orange. Akan diambil satu kelereng. Berapa
peluang terambilnya kelereng

(a) putih
(b) orange atau merah

(c) bukan biru

(d) merah, putih atau biru

(e) bukan merah dan bukan biru

Penyelesaian. Misalkan M, P, B dan O berturut-turut menyatakan


kelereng warna merah, putih, biru dan orange. Banyaknya seluruh
kelereng adalah
10 + 30 + 25 + 15 = 80.

30
(a) P (P ) = 80 = 0.375.

15+10
(b) P (O ∪ M ) = 80 = 0.3125.

(c) P (B c ) = 1 − P (B) = 1 −7520 = 1 − 0.3125 = 0.6875.

10+30+25
(d) P (M ∪ P ∪ B) = 80 = 0.8125.

(e) P (M c ∩ B c ) = P ((M ∪ B)c ) = 1 − P (M ∪ B) = 1 − 10+25


80 = 0.5625.

4.3 Peluang Bersyarat


Dalam suatu eksperimen random peluang terjadinya suatu peristiwa bisa ter-
gantung terjadinya peristiwa lain. Sebagi contoh, peluang lahirnya anak kedua
perempuan bisa tergantung apakah anak pertama laki-laki atau perempuan.
Diketahui peristiwa E dan F . Peluang terjadinya E jika diketahui peris-
tiwa F telah terjadi dinamakan peluang bersyarat (conditional probability
),
dituliskan P (E|F ), dan didefinisikan
P (E ∩ F )
P (E|F ) = .
(4.1)
P (F )
Contoh 35. Sebuah mata uang logam dilontarkan dua kali dan peluang setiap
peristiwa elementer sama. Berapa peluang terjadinya sisi a pada lontaran
kedua jika diketahui pada lontaran pertama sisi g telah terjadi?
Penyelesaian. Misalkan E peristiwa terjadinya sisi a pada lontaran kedua
dan F peristiwa terjadinya sisi g pada lontaran pertama. Jadi E = {aa, ga}
dan F = {gg, ga}. Peluang yang dicari adalah
P (E ∩ F ) P (g a) 1/4 1
P (E|F ) = = = = .
P (F ) P (gg, ga) 2/4 2
Contoh 36. Suatu mangkok berisi tujuh bola hitam dan lima bola putih.
Diambil dua bola dari dalam mangkok tersebut dan bola yang telah terambil
tidak dikembalikan ke dalam mangkok. Dianggap setiap bola memiliki peluang
sama untuk terambil. Berapa peluang bola yang terambil keduanya adalah
bola hitam?

Penyelesaian. Misalkan F dan E berturut-turut peristiwa bola pertama dan


bola kedua adalah hitam. Karena bola pertama yang terambil hitam, maka
ada enam bola hitam dan lima bola putih yang tersisa di dalam mangkok,
sehingga dengan demikian
6
P (E|F ) = .
11
7
Karena P (F ) = 12 , maka peluang terambilnya kedua bola hitam adalah
7 6 42
P (E ∩ F ) = P (F )P (E|F ) = = .
12 11 132
Contoh 37. Pada suatu ujian perguruan tinggi, 25 persen mahasiswa tidak
lulus matematika, 15 persen mahasiswa tidak lulus fisika, dan 10 persen maha
siswa tidak lulus matematika dan ilmu fisika. Seorang mahasiswa dipilih secara
random.

(a) Jika ia gagal fisika, berapa peluang ia tidak lulus matematika?

(b) Jika ia gagal matematika, berapa peluang ia tidak lulus fisika?

(c) Berapa peluang ia gagal matematika atau tidak lulus fisika?

Penyelesaian. Tuliskan M = peristiwa mahasiswa yang tidak lulus matem-


atika, F = persitiwa mahasiswa yang tidak lulus fisika. Diperoleh

P (M ) = 0.25, P (F ) = 0.15, P (M ∩ F ) = 0.10.


(a) Peluang ia tidak lulus matematika, diketahui ia tidak lulus fisika adalah
P (M ∩ F ) 0.10 2
P (M |F ) = = =
P (F ) 0.15 3

(b) Peluang ia tidak lulus fisika, diketahui ia tidak lulus matematika adalah
P (F ∩ M ) 0.10 2
P (F ∩ M ) = = =
P (M ) 0.25 5

(c) Peluang ia tidak lulus matematika atau tidak lulus fisika adalah

P (M ∪ F ) = P (M ) + P (F ) − P (M ∩ F ) = 0.25 + 0.15 − 0.10 = 0.30

Peristiwa E dan F dikatakan independen, jika peluang terjadinya peris-


tiwa E tidak tergantung apakah peristiwa F terjadi atau tidak terjadi. Dalam
hal ini P (E|F ) = P (E) dan berlaku

P (E ∩ F ) = P (E) · P (F ). (4.2)

Jadi peristiwa E dan F independen jika peluang terjadinya kedua peristiwa


bersamaan sama dengan hasil kali peluang terjadinya masing-masing peristiwa.

Contoh 38. Satu mata uang logam dilontarkan dua kali. E peristiwa ter-
jadinya sisi a pada lontaran pertama dan F peristiwa terjadinya sisi g pada
lontaran kedua, yaitu

E = {aa, ag} dan F = {ag, gg}.

Jika setiap peristiwa elementer memiliki peluang sama, maka

1
P (E ∩ F ) = P (ag) =
4
1 1 1
P (E) · P (F ) = P (aa, ag) · P (ag, gg) = · = ,
2 2 4
sehingga P (∩F ) = P (E) · P (F ), dengan kata lain E dan F adalah peristiwa
yang independen.
Contoh 39. Dua dadu dilontarkan satu kali. A menyatakan peristiwa ter-
jadinya jumlah spot kedua sisi adalah enam dan B menyatakan peristiwa ter-
jadinya spot sisi dadu pertama empat. Diperoleh
1
P (A ∩ B) = P ({4, 2}) =
36

dan
5 ·1 5
P (A) · P (B) = = ,
36 6 216
dan karena P (A∩ B) = P (A)P (B), maka peristiwa A dan B tidak
independen.

Definisi peristiwa independen dapat diperluas untuk lebih dari dua peri-
stiea. Peristiwa E1 , E2 , · · · , En dikatakan independen, jika untuk setiap
bilan- gan asli r ≤ n berlaku

P (E10 ∩ E20 ∩ · · · ∩ Er ) = P (E10 ) · P (E20 ) · · · P (Er


).

4.4 Prinsip Dasar Perhitungan


Dalam menghitung banyaknya anggota ruang sampel atau peristiwa, sering
dijumpai proses penghitungan yang tidak mudah. Dalam bagian ini akan
diuraikan prinsip dasar perhitungan yang bisa membantu dalam menghitung
banyaknya anggota ruang sampel.

Teorema 3 (Prinsip dasar perhitungan). Jika peristiwa E1 dapat terjadi n1


cara dan peristiwa E2 dapat terjadi n2 cara, maka kedua peristiwa E1 dan
E2 dapat terjadi dalam n1 · n2 cara.

Contoh 40. Diketahui E1 himpunan abjad a, b, c, d dan E2 himpunan bilangan


1, 2, 3. Ada berapa pasangan yang terdiri dari satu abjad dan satu angka dari
kedua himpunan?
Penyelesaian. Karena ada 4 abjad dan 3 bilangan, maka banyaknya pasangan
tersebut adalah 4 · 3 = 12. Kedua belas pasangan adalah:
(a,1) (a,2) (a,3)
(b,1) (b,2) (b,3)
(c,1) (c,2) (c,3)
(d,1) (d,2) (d,3)

Contoh 41. Ada 5 cara menuju kota B dari kota A dan ada 9 cara menuju
kota C dari kota B. Ada berapa cara menuju kota C dari kota A.

Penyelesaian. Ada 5 · 9 = 45 cara.

Teorema 4. Jika peristiwa E1 dapat terjadi dalam n1 cara, peristiwa E2 dapat


terjadi dalam n2 cara, · · · , peristiwa Ek dapat terjadi dalam nk cara, maka
ke k peristiwa dapat terjadi dalam n1 · n2 · · · nk cara.

Contoh 42. Suatu kotak berisi 5 bola putih dan 6 bola hitam. Diambil secara
random dua bola. Berapa peluang terambilnya satu bola putih dan satu bola
hitam?

Penyelesaian. Banyaknya seluruh bola adalah 11. Banyaknya cara mengam-


bil 2 bola dari 11 bola adalah 11 · 10 = 110. Jika bola pertama yang terambil
adalah putih, maka ada 5 · 6 = 30 cara. Jika bola pertama yang terambil
adalah hitam, maka ada 6 · 5 = 30 cara. Jadi peluang terambilnya satu bola
putih dan satu bola hitam adalah
30 + 30 6
= .
110 11

4.5 Permutasi
Diketahui n bilangan bulat positif. Notasi n! dibaca n faktorial, didefnnisikan
sebagai berikut,
n! = 1 · 2 · 3 · · · (n − 2) · (n − 1) · n,

dan 0! = 1.

38
Contoh 43.
2! = 1 · 2 = 2.

4! = 1 · 2 · 3 · 4 = 24.

5! = 1 · 2 · 3 · 4 · 5 = 120.

8! = 1 · 2 · 3 · 4 · 5 · 7 · 8 = 5! · 6 · 7 · 8 = 120 · 336 = 40320.


7! 4! · 5 · 6
= = 5 · 6 · 7 = 210.
· 7
4! 4!
13 · 12 · 11 · 13!
10!
13 · 12 · 11 = = .
10! 10!
Permutasi adalah susunan objek yang urutannya diperhatikan. Misal-
nya, susunan ab dan ba merupakan dua susunan berbeda. Jika dari objek
n objek diambil r objek, maka susunan r objek yang tebentuk dinamakan
permutasi n objek diambil r objek.

Contoh 44. Perhatikan empat abjad a, b, c dan d.

(a) abcd, bdca dan dcab merupakan permutasi 4 abjad.

(b) abc, acd, bda dan bca merupakan permutasi 4 abjad diambil 3 abjad.

Teorema 5. Banyaknya permutasi n objek diambil r objek dituliskan P (n, r),


adalah
n!
P (n, r) = .
(n − r)!

Contoh 45. Ada empat objek, namakan a, b, c dan d.

(a) Banyaknya permutasi 4 objek diambil 3 objek adalah


4!
P (4, 3) = = 24.
(4 − 3)!

(b) Banyaknya permutasi 4 objek diambil 2 objek adalah


4!
P (4, 2) = (4 − 2)!
= 12.
(c) Banyaknya permutasi 4 objek adalah
4!
P (4, 4) = = 24.
(4 − 4)!

4.6 Kombinasi
Kombinasi n objek adalah susunan n objek tanpa memperhatikan urutannya.
Jadi susunan abc dan bac merupakan kombinasi yang sama.

Contoh 46. Diketahui kumpulan objek a, b, c dan d.

(a) Kombinasi 2 objek dari keempat objek tersebut adalah

ab ac ad bc bd cd.

(b) Kombinasi 3 objek dari keempat objek adalah

abc abd bcd acd.

n
r
Teorema 6. Banyaknya kombinasi n objek diambil r objek dituliskan ,
adalah
n n!
= . (4.3)
r r!(n − r)!

Contoh 47. Ada berapa kombinasi yang bisa terjadi jika dari abjad-abjad
a, b, c, d dan e diambil 3 abjad?

Penyelesaian. Dalam contoh ini, n = 5 dan r = 3. Jadi banyaknya


kombinasi adalah
5 5! 3! · 4 · 5
= = = = 10.
3 3!(5 − 3)! 20
3! · 2! 2
Contoh 48. Akan dibentuk panitia dengan 3 anggota. Jika ada 8 orang, ada
berapa panitia berbeda yang dapat dibentuk?
Penyelesaian. Panitia tersebut merupakan kombinasi 8 objek diambil 3. Jadi
ada
8 8!
= = 56
3 3!(8 − 3)!
panitia berbeda yang dapat dibentuk.

Contoh 49. Tiga bola lampu diambil secara random dari 15 bola lampu yang
5 diantaranya rusak. Carilah peluang terambilnya :

(a) tidak ada bola rusak

(b) tepat satu bola lampu rusak

(c) sedikitnya satu bola lampu rusak


15
Penyelesaian. Ada = 455 cara memilih 3 bola lampu dari 15 bola
3
lampu.

(a) Ada 15 − 5 = 10 bola lampu yang tidak rusak. Karena itu cara memilih
3 bola lampu tidak rusak ada
10
= 120 cara,
3
sehingga peluangnya adalah

120 24
P (tidak ada yang rusak) = = .
455 91

10
2
(b) Ada 5 bola lampu rusak dan ada = 45 cara memilih dua bola lampu
yang tidak rusak. Dengan demikian ada 5 · 45 = 225 cara memilih 3 bola
lampu dengan satu bola rusak. Oleh karena itu peluangnya adalah
225 45
P (tepat satu rusak) = = .
455 91

(c) Peristiwa sedikitnya satu bola lampu rusak merupakan komplemen peri-
stiwa tidak ada bola lampu yang rusak. Dengan demikian
24 67
P (sedikitnya 1 rusak) = 1 − P (tidak ada bola rusak) = 1 − = .
91 91
Bab 5

Variabel Random

Dalam suatu eksperimen random dapat terjadi peneliti tidak tertarik pada
outcomenya tetapi barangkali lebih tertarik pada nilai numerik yang berkaitan
dengan outcome tersebut. Misalnya dalam percobaan melontarkan tiga mata
uang, mungkin peneliti lebih tertarik untuk mengamati banyaknya suatu sisi
terjadi dari pada mengamati sisi apa saja yang menghadap ke atas.

Definisi 9. Variabel random adalah suatu fungsi yang domainnya ruang


sampel dan nilainya bilangan real. Selanjutnya variabel random dituliskan den-
gan notasi X . Jika c adalah peristiwa elementer, maka nilai variabel random
X di c ditulis X (c). Jika nilai X (c) adalah x maka dituliskan X (c) = x.

Contoh 50. Dua mata uang logam dilontarkan satu kali. Jika X menyatakan
banyaknya sisi a terjadi, maka X merupakan variabel random. Nilai variabel
random pada setiap anggota ruang sampel adalah sebegai berikut:

X (gg) = 0, X (ag) = 1, X (ga) = 1, X (aa) =


2.

5.1 Variabel Random Diskrit


Variabel random X dinamakan variabel random diskrit jika nilai variabel
random tersebut terhitung, yakni banyaknya nilai berhingga atau dapat dit-
uliskan sebagai
x1 , x2 , x3 , · · · .

Pada Contoh 50, X merupakan variabel random diskrit.

Contoh 51. Tiga mata uang dilontarkan satu kali. Jika variabel random X
menyatakan banyaknya sisi angka terjadi, maka nilai-nilai X adalah

X (ggg) = 0 X (agg) = X (gag) = X (gga) =


1
X (aaa) = 3 X (aag) = X (aga) = X (gaa) =
2

Contoh 52. Dua dadu dilontarkan satu kali. Variabel random X menyatakan
banyaknya jumlah spot kedua sisi yang menghadap ke atas. Nilai-nilai variabel
random X aadalah

X ((1, 1)) = 2 X ((1, 2)) = 3 X ((1, 3)) = 4


X ((1, 4)) = 5 X ((1, 5)) = 6 X ((1, 6)) = 7
X ((2, 1)) = 3 X ((2, 2)) = 4 X ((2, 3)) = 5
X ((2, 4)) = 6 X ((2, 5)) = 7 X ((2, 6)) = 8
X ((3, 1)) = 3 X ((3, 2)) = 5 X ((3, 3)) = 6
X ((3, 4)) = 7 X ((3, 5)) = 8 X ((3, 6)) = 9
X ((4, 1)) = 5 X ((4, 2)) = 6 X ((4, 3)) = 7
X ((4, 4)) = 8 X ((4, 5)) = 9 X ((4, 6)) = 10
X ((5, 1)) = 6 X ((5, 2)) = 7 X ((5, 3)) = 8
X ((5, 4)) = 9 X ((5, 5)) = 10 X ((5, 6)) = 11
X ((6, 1)) = 7 X ((6, 2)) = 8 X ((6, 3)) = 9
X ((6, 4)) = 10 X ((6, 5)) = 11 X ((6, 6)) = 12.

Jika X variabel random diskrit, maka peluang variabel random X bernilai


x dituliskan P (X = x). Pada Contoh 51 misalnya, variabel random X
bernilai
2 jika dan hanya jika peristiwa {aag}, {aga} dan {gaa} terjadi. Ini berarti
peluang X = 2 sama dengan peluang terjadinya peristiwa {aag, aga, gaa},
yaitu
3
P (X = 2) = P ({aag, aga, gaa}) = .
8
Peluang (f (x))
1

0.8

0.6

0.4

0.2

0
0 1 2 3
Banyaknya sisi angka (X )

Gambar 5.1: Distribusi peluang

Perhatikan bahwa nilai P (X = x) tergantung pada peristiwa yang


dikaitkan dengan nilai variabel random x. Dengan demikian peluang variabel
random
X bergantung pada nilai x, dengan kata lain P (X = x) merupakan fungsi dari
x. Oleh karena itu dapat dituliskan

f (x) = P (X = x).

(5.1) Selanjutnya f (x) dinamakan fungsi peluang atau distribusi peluang

vari-
abel random X .

Contoh 53. Pada Contoh 51, distribusi peluangnya adalah

f (0) = P (X = 0) = P (ggg) = 8 1
f (1) = P (X = 1) = P (agg, gag, gga) =8
3

f (2) = P (X = 2) = P (aag, aga, gaa) =8


3

f (3) = P (X = 3) = P (aaa) = 8 1

Grafik distribusi peluangnya dapat dinyatakan dengan gambar berikut.


Contoh 54. Pada Contoh 52, distribusi peluangnya adalah

f (2) = P (X = 2) = P ((1, 1)) = 36 1


f (3) = P (X = 3) = P ((1, 2)(2, 1)) = 36 2
f (4) = P (X = 4) = P ((1, 3), (2, 2), (3, 1)) =36 3
4
f (5) = P (X = 5) = P ((1, 4), (2, 3), (3, 2), (4, 2)) =36
5
f (6) = P (X = 6) = P ((1, 5), (2, 4), (3, 3), (4, 2), (5, 1)) =36
6
f (7) = P (X = 7) = P ((1, 6), (2, 5), (3, 4), (4, 3), (5, 2), (6, 1)) =36
5
f (8) = P (X = 8) = P ((2, 6), (3, 5), (4, 4), (5, 3), (6, 2)) =36
4
f (9) = P (X = 9) = P ((3, 6), (4, 5), (5, 4), (6, 3)) =36
f (10) = P (X = 10) = P ((4, 6), (5, 5), (6, 4)) =36 3
f (11) = P (X = 11) = P ((5, 6), (6, 5)) = 36 2
f (12) = P (X = 12) = P ((6, 6)) = 36 1

Grafik fungsi peluangnya disajikan pada Gambar 5.2.

0.2
Peluang (f (x))

0.15

0.1

5 · 10−2

0
2 3 4 5 6 7 8 9 10 11 12
Jumlah kedua sisi dadu (X )

Gambar 5.2: Distribusi peluang jumlah kedua sisi dadu

Fungsi distribusi kumulatif atau fungsi distribusi, ditulis F (x), adalah


peluang variabel random X bernilai lebih kecil atau sama dengan x. Jadi

F (x) = P (X ≤ x). (5.2)


Contoh 55. Perhatikan kembali Contoh 51. Distribusi kumulatifnya dalah

F (0) = P (x ≤ 0) = P (X = 0) = 8 1
F (1) = P (x ≤ 1) = P (X = 0) + P (X = 1) =2 1
7
F (2) = P (x ≤ 2) = P (X = 0) + P (X = 1) + P (X = 2) =8
F (3) = P (x ≤ 3) = P (X = 0) + P (X = 1) + P (X = 2) + P (X = 3) = 1

Contoh 56. Distribusi kumulatif pada Contoh 52 adalah

F (2) = P (x ≤ 2) = P (X = 2) = 361
F (3) = P (x ≤ 3) = P (X = 2) + P (X = 3) = 36 3
6
F (4) = P (x ≤ 4) = P (X = 2) + P (X = 3) + P (X = 4) =36
F (5) = P (x ≤ 5) = P (X = 2) + P (X = 3) + P (X = 4) + P (X = 5) =36 10
F (6) = P (x ≤ 6) = P (X = 2) + P (X = 3) + P (X = 4) + P (X = 5) + P (X = 6)
= 15
36

F (7) = P (x ≤ 7) = P (X = 2) + P (X = 3) + P (X = 4) + P (X = 5) + P (X = 6)
21
+P (X = 7) = 36

F (8) = P (x ≤ 8) = P (X = 2) + P (X = 3) + P (X = 4) + P (X = 5) + P (X = 6)
+P (X = 7) + P (X = 8) =
26
36

F (9) = P (x ≤ 9) = P (X = 2) + P (X = 3) + P (X = 4) + P (X = 5) + P (X = 6)
+P (X = 7) + P (X = 8) + P (X = 9) =3630
F (10) = P (x ≤ 10) = P (X = 2) + P (X = 3) + P (X = 4) + P (X = 5) + P (X = 6)
+P (X = 7) + P (X = 8) + P (X = 9) + P (X = 10) =36 33
F (11) = P (x ≤ 11) = P (X = 2) + P (X = 3) + P (X = 4) + P (X = 5) + P (X = 6)
35
+P (X = 7) + P (X = 8) + P (X = 9) + P (X = 10) + P (X = 11) =36
F (12) = P (x ≤ 12) = P (X = 2) + P (X = 3) + P (X = 4) + P (X = 5) + P (X = 6)
+P (X = 7) + P (X = 8) + P (X = 9) + P (X = 10) + P (X = 11) + P (X =
12)
36
= 36
= 1.

5.2 Nilai Harapan Variabel Random Diskrit


Nilai harapan suatu variabel random menggambarkan nilai yang diharapkan
46
akan terjadi dari suatu eksperimen random atau kecenderungan hasil yang
akan terjadi.

Definisi 10. Nilai harapan suatu variabel random diskrit dituliskan E(X ) atau
µ, didefinisikan sebagai berikut
X
µ = E(X ) = xi .P (X = xi
),

Contoh 57. Pada percobaan melontarkan dua mata uang logam sebanyak
satu kali (Contoh 50), diperoleh
1 1 1
P (X = 0) = P (X = 1) = dan P (X = 2) = .
4 2 4

Dengan demikian nilai harapannya adalah

µ = E(X ) = 0 · P (X = 0) + 1 · P (X = 1) + 2 · P (X = 2)
= 0 · 41 + 1 · 21 + 2 ·4 1 = 1.

Karena µ adalah nilai harapan variabel random X , maka X − µ meru-


pakan deviasi X terhadap nilai harapannya. Ukuran yang menggambarkan
variabilitas suatu variabel random didefinisikan berikut.

Definisi 11. Varian variabel random diskrit X ditulis V ar(X ) atau σ 2 adalah
X
σ 2 = V ar(X ) = E((X − µ)2 ) = (xi − µ)2 .P (X = xi
),

Kuantitas σ = σ 2 dinamakan deviasi standar.

Berdasarkan definisi di atas, V ar(X ) merupakan nilai harapan kuadrat


deviasi X − µ; dengan demikian V ar(X ) ≥ 0. Semakin besar varian suatu

47
variabel random, semakin basar variabilitasnya. Nilai varian suatu variabel
random adalah 0 jika dan hanya jika variabel random tersebut nilainya tetap.

48
Contoh 58. Varian pada Contoh 50 di atas adalah

σ 2 = (0 − 1)2 · P (X = 0) + (1 − 1)2 · P (X = 1) + (2 − 1)2 · P (X = 2)


= 1
4
+ 0 + 2 · 14 = 0.5,

sehingga deviasi standarnya adalah σ = 0.5 = 0.7.

5.3 Variabel Random Kontinu


Diketahui X variabel random dengan peluang pada setiap titik tunggal x sama
dengan nol, yakni P (X = x) = 0. Variabel X dinamakan variabel random
kontinyu. Jika X variabel random kontinyu, maka ada fungsi f (x)
yang dinamakan fungsi densitas. Peluang variabel random X berada di
antara a dan b sama dengan luas daerah yang dibatasi oleh kurva f (x),
sumbu x, garis x = a dan garis x = b. Selanjutnya peluang X berada di
antara a dan b ditulis P (a < X < b).
Fungsi distribusi kumulatif variabel random kontinyu X , ditulis F
(x), didefinisikan sebagai peluang variabel random X bernilai lebih kecil atau
sama
dengan x atau
F (x) = P (X ≤ x)

Contoh 59. Diketahui variabel random kontinyu X memiliki fungsi densitas


f (x) = 5 dengan 0 ≤ x ≤ 5. Peluang variabel random X berada antara 1
1

dan 3 adalah luas daerah yang dibatasi oleh garis x = 1, garis x = 3, grafis
f (x) = 5 dan sumbu horitontal. Dengan demikian
1

2
P (1 ≤ X ≤ 3) = .
5

Secara grafik, peluang ini dijelaskan pada gambar berikut:


y

1
f (x) = 5
0.2

0 1 3 5 x

1
Distribusi kumulatif di x = 2.5 adalah luas daerah grafis f (x) = 5 , sumbu
horitontal dan daerah di sebelah kiri garis x = 2.5, yaitu

1
F (2.5) = .
2

Distribusi kumulatif ini dijelaskan pada gambar berikut:


y

1
f (x) = 5

0 2.5 5 x

5.4 Variabel Random Bersama


Di dalam suatu penelitian, peneliti sering tertarik pada dua variabel ran-
dom atau lebih. Misalnya dalam meneliti tentang penyakit jantung, mungkin
peneliti tertarik pada beberapa faktor penyebab seperti kebiasaan merokok
dan konsumsi alkohol.
Definisi 12. Diketahui X dan Y masing-masing variabel random disktrit.
Fungsi peluang bersama dari X dan Y didefinisikan

P (X = x, Y = y) = f (x, y). (5.3)

Peluang X = x dituliskan f1 (x), yaitu P (X = x) = f1 (x). Fungsi f1 (x)


dinamakan fungsi peluang marjinal X dan didefinisikan

f1 (x) = f (x, y1 ) + f (x, y2 ) + · · · + f (x, yn


).

Demikian pula, peluang Y = y dituliskan f2 (x), dinamakan peluang marjinal


Y dengan
f2 (y) = f (x1 , y) + f (x2 , y) + · · · + f (xm , y)

Variabel random X dan Y dikatakan independen jika berlaku

P (X = x, Y = y) = P (X = x) · P (Y = y).

Contoh 60. Tiga batere diambil secara random dari suatu keranjang yang
terdiri dari 3 batere baru, 4 batere bekas tetapi masih berfungsi dan 5 batere
rusak. Jika X dan Y berturut-turut menyatakan banyaknya batere baru dan
batere bekas yang masih berfungsi, maka fungsi peluang bersamanya dapat
ditulis
f (x, y) = P (X = x, Y = y)

Misalnya f (1, 0) = P (X = 1, Y = 0) berarti peluang terambilnya 1


batere baru dan 0 batere bekas, sama dengan peluang terambilnya 1 batere
baru dan
2 batere rusak.

Peluang bersama dapat dihitung sebagai berikut:

5
3
f (0, 0) = P (X = 0, Y = 0) = 12 = 10/220
3
4 5
1 2
f (0, 1) = P (X = 0, Y = 1) =12 =
40/220
3
4 5
2 1
f (0, 2) = P (X = 0, Y = 2) = 12 = 30/220
3
4
3
f (0, 3) = P (X = 0, Y = 3) = 12 = 4/220
3
3 5
1 2
f (1, 0) = P (X = 1, Y = 0) = 12 = 30/220
3
3 4
1 1
f (1, 1) = P (X = 1, Y = 1) = 12 = 60/220
3
3 4
1 2
f (1, 2) = P (X = 1, Y = 2) = 12 = 18/220
3
3 5
2 1
f (2, 0) = P (X = 2, Y = 0) = 12 = 15/220
3
3 4
2 1
f (2, 1) = P (X = 2, Y = 1) = 12 = 12/220
3
3
3
f (3, 0) = P (X = 3, Y = 0) = 12 = 1/220
3

Definisi 13. Diketahui variabel random X dan Y . Fungsi distribusi kumu-


latif bersama F (x, y) adalah

F (x, y) = P (X ≤ x, Y ≤ y). (5.4)

Berdasarkan definisi di atas, fungsi distribusi kumulatif bersama adalah


peluang variabel random X ≤ x dan Y ≤ y terjadi bersama-sama.
Dua variabel random kontinyu X dan Y dikatakan independent jika pelu-
ang terjadinya X tidak dipengaruhi apakah variabel random Y terjadi atau
tidak. Jika f (x, y) fungsi densitas variabel random kontinyu X dan Y dan
kedua variabel random independen, maka berlaku

f (x, y) = f1 (x) · f2 (y),

dimana f1 (x) dan f2 (y) berturut-turut fungsi peluang marjinal X dan Y .


Bab 6

Beberapa Distribusi Peluang

Pada bagian ini akan disampaikan beberapa distribusi peluang variabel ran-
dom diskrit dan kontinyu yang banyak digunakan didalam inferensi statistik.

6.1 Distribusi binomial


Diketahui suatu eksperimen random hanya memiliki dua hasil yang mungkin,
hasil pertama dinamakan sukses dan hasil kedua dinamakan gagal. Eksper-
imen tersebut diulang secara independen sebanyak n kali. Jika peluang suk-
ses setiap eksperimen adalah sama sebesar p maka peluang gagal pada setiap
eksperimen adalah p − 1. Jika X menyatakan banyaknya sukses dari n per-
cobaan (trial), maka peluang X = x diberikan oleh fungsi peluang berikut

x n−x
P (X = x) = n p (1 − p) , x = 0, 1, 2, 3, · · · , n.
x (6.1)

Variable random X dengan fungsi peluang 6.1 dinamakan berdistribusi bino-


mial dengan parameter n dan p.
Selanjutnya dapat dibuktikan bahwa nilai harapan dan varians distribusi
binomial adalah
µ = np dan σ 2 = np(1 − p) (6.2)

x
n
Di dalam fungsi peluang binomial 6.1, notasi menyatakan kombinasi
x objek dari n objek, yaitu

n n!
= , (6.3)
x x!(n − x)!

dengan n! = 1 · 2 · 3 · · · (n − 1) · n dan 0! =
1.
Contoh variabel random berdistribusi binomial adalah melontarkan mata
uang logam, cacat tidaknya suatu produk dan macet tidaknya suatu mesin jet.

Contoh 61. Diketahui peluang rusaknya satu telur asin yang diproduksi suatu
perusahaan memiliki 0.01 dan bersifat independen terhadap telor asin lainnya.
Jika diambil secara random sampel sebanyak 5 telor asin, (a) berapa peluang
telor asin yang rusak sebanyak satu? (b) berapa peluang telor asin yang rusak
paling banyak satu?

Penyelesaian. Jika X menyatakan banyaknya telor asin yang rusak, maka X


merupakan variabel random binomial dengan n = 5 dan p = 0.01. Dengan
demikian

(a) Peluang telor asin yang rusak sebanyak satu adalah

5
P (X = 1) = (0.01)1 (1 − 0.01)4 = 0.04803.
1

(b) Peluang telor asin yang rusak paling banyak satu adalah
P (X ≤ 1) = P (X = 0) + P (X = 1)
5 5
= (0.01)0 (1 − 0.01)5 + (0.01)1 (1 − 0.01)4
0 1
= 0.95099 + 0.04803 = 0.99902.

6.2 Distribusi Normal


Variabel random X dikatakan berdistribusi normal dengan mean µ dan varian
σ 2 jika fungsi densitasnya diberikan oleh
1
f (x) = √ e−(x−µ) /2σ
2 2
, (6.4)
σ 2π
dengan π = 2, 1415... dan e = 2,
718282....

Contoh variabel random yang berdistribusi normal adalah diameter lubang


yang dihasilkan mesin bor, skor suatu test, konsentrasi suatu bahan kimia pada
suatu jenis obat, dan hasil panen tanaman-tanaman pada suatu lahan.

Jika mean µ = 0 dan deviasi σ = 1, maka X dinamakan berdistribusi


normal standar. Grafik distribusi normal standar disajikan pada Gambar
6.1, yakni berupa kurva yang simetris terhadap garis x = 0. Pada grafik
ini sumbu horisontal x merupakan nilai variabel random dan sumbu vertikal
merupakan nilai fungsi densitas f (x). Nilai maksimum grafik ini dicapai pada
titik x = 0, semakin jauh dari titik x = 0 semakin kecil nilai fungsi ini dan
akan mendekati nol jika nilai x mendekatai tak hingga atau mendekati minus
tak hingga.

0.4

0.3

0.2

0.1

x
−4 −2 2 4
1
√ e−x
2
Gambar 6.1: Kurva normal standar f (x) =

Jika variabel random X berdistribusi normal standar, maka distribusi


kumulatifnya dituliskan dengan notasi Φ(x), yaitu

Φ(x) = P (X ≤ x) (6.5)

Gambar 6.2: P (X ≤ x) = Φ(x)

Karena kurva fungsi densitas normal standar simetris terhadap garis x =


0, dan luas seluruhnya adalah 1, maka

Φ(0) = 0.5.

Gambar 6.3: Φ(0) = 0.5

Luas daerah yang dibatasi oleh garis x = 0 dan x = a dengan luas daerah
yang dibatasi x = 0 dan x = −a adalah sama. Dengan demikian berlaku

Φ(−a) = 1 − Φ(a).
−a a

Gambar 6.4: Φ(−a) = 1 − Φ(a)

Untuk menghitung peluang variabel random X yang berdistribusi normal


standar dapat digunakan tabel normal standar. Peluang variabel random X
berada di antara a dan b, dengan a < b, sama dengan luas daerah di bawah
kurva normal yang dibatasi garis x = a dan x = b. Dengan demikian

P (a ≤ X ≤ b) = Φ(b) − Φ(a).

a b

Gambar 6.5: P (a ≤ X ≤ b) = Φ(b) − Φ(a)

Contoh 62. Diketahui X berdistibusi normal standar. Hitunglah peluang (a)


X lebih kecil 1.94, (b) X terletak antara 0.5 dan 1.4, (c) X berada antara −1.1
dan 1.5.

Penyelesaian. (a) P (X < 1.94) = P (X ≤ 1.94) = Φ(1.94) =


0.9738.

(b) P (0.5 ≤ X ≤ 1.4) = Φ(1.4) − Φ(0.5) = 0.9192 − 0.6915 = 0.2277.


(c) P (−1.1 ≤ X ≤ 1.5) = Φ(1.5) − Φ(−1.1) = Φ(1.5) − (1 − Φ(1.1)) =
0.9332 − (1 − 0.8643) = 0.7975.

6.3 Distribusi yang berhubungan dengan dis-


tribusi normal
6.3.1 Distribusi Chi-Square

Diketahui variabel random X1 , X2 , X3 , · · · , Xr adalah r variabel


independen yang masing-masing berdistibusi normal standar. Variabel
random

2 2 2 2
χ
2 = X + X + X + ···+ X (6.6)
1 2 3 r

memiliki distribusi yang dinamakan distribusi Chi-square dengan derajat be-


bas (degrees of freedom) r. Bentuk grafik fungsi densitas distribusi Chi-square
tergantung pada nilai derajat bebas.
f (x)
1
r = 1
0.8 r = 2
r = 3
0.6 r = 4
r =6
0.4

0.2

2 4 6 8 10 12 14 x

Gambar 6.6: Kurva densitas distribusi Chi-square

Distribusi kumulatif χ2 dengan derajat bebas r dituliskan P (χr2 ≤ x).


Nilai batas x untuk derajat bebas r dan distribusi kumulatif γ tertentu dapat
dicari pada suatu tabel yang dinamakan tabel Distribusi χ2 .
2
Contoh 63. Carilah x sehingga P (χ12 ≤ x) = 0.05.
Berdasarkan tabel dengan r = 12 dan γ = 0.05 diperoleh x = 5.226.

6.3.2 Distribusi t

Diketahui Y dan Z variabel random independen, dengan Y berdistribusi nor-


mal standar dan Z berdistribusi chi-square dengan derajat bebas r. Dapat
ditunjukan bahwa variabel random

Y
T=p (6.7)
Z/r

memiliki distribusi yang dinamakan distribusi t dengan derajat bebas r.


Nilai distribusi kumulatif variabel random berditribusi t dengan derajat
bebas r ditulis P (tr ≤ x). Nilai x untuk derajat bebas r dan distribusi kumu-
latif γ tertentu dapat dicari pada suatu tabel yang dinamakan tabel Distribusi
t.

Contoh 64. Carilah x sehingga P (t10 ≤ x) = 0.99.


Berdasarkan tabel dengan r = 10 dan γ = 0.99 diperoleh x = 2.7638.

6.3.3 Distribusi F

Diketahui variabel random X dan Y berdistribusi chi-square dengan derajat


bebas berturut-turut r1 dan r2 . Dapat dibuktikan bahwa variabel random

X/r1
F = (6.8)
Y /r2

memiliki suatu distribusi yang dinamakan distribusi F dengan derajat bebas


r1 dan r2 . Dalam hal ini r1 disebut juga derajat bebas pembilang dan r2
disebut juga derajat bebas penyebut. Distribusi kumulatif F dengan derajat
bebas r1 dan r2 , ditulis P (Fr1 ,r2 ≤ x). Nilai x untuk r1 dan r2 tertentu dan
distribusi kumulatif γ tertentu telah dihitung dan ditabelkan pada suatu tabel
yang dinamakan tabel F .

Contoh 65. Carilah x sehingga P (F4,10 ≤ x) = 0.95.


Berdasarkan tabel dengan r1 = 4, r2 = 10 dan γ = 0.95 diperoleh x = 3.4780.
Bab 7

Teori Sampling

Di dalam aplikasi sering dilakukan pengambilan kesimpulan dari suatu kelom-


pok individu atau populasi. Karena alasan tertentu, peneliti tidak mungkin
untuk mengamati seluruh anggota populasi, namun hanya mengamati bagian
dari populasi yang dinamakan sampel. Inferensi statistik adalah pengambi-
lan kesimpulan berdasarkan sampel.
Jika X variabel random dengan distribusi F dan dilakukan percobaan
random sebanyak n kali, maka diperoleh variabel random X1 , X2 , · · · , Xn .
Se- lanjutnya X1 , X2 , · · · , Xn dinamakan sampel random dari distribusi F .
Sampel yang banyaknya anggota n dinamakan sampel berukuran n. Jika
nilai sam- pel random tersebut berturut-turut adalah x1 , x2 , · · · , xn , maka
nilai-nilai ini dinamakan nilai eksperimen atau data sampel.
Suatu kuantitas yang dihitung dari data sampel dinamakan statistik,
sedangkan suatu kuantitas yang dimiliki oleh suatu populasi dinamakan pa-
rameter. Bisa terjadi nilai parameter suatu populasi diketahui atau tidak
diketahui.

Contoh 66. Misalkan variabel random X menyatakan usia bola lampu yang
diproduksi suatu perusahaan yang diasumsikan berdistribusi normal dengan
mean µ dan varian σ 2 yang tidak diketahui. Satu-satunya cara untuk mem-
peroleh informasi tentang µ dan σ 2 adalah dengan melakukan eksperimen
random. Misalkan dilakukan eksperimen dengan mengambil secara random
sebanyak n = 100 bola lampu, dan usia bola lampu yang tercatat adalah
X1 , X2 , X3 , · · · , X100 . Dalam hal ini X1 , X2 , X3 , · · · , X100 merupakan
sampel random yang berasal dari distribusi normal tersebut. Ke 100 bola
lampu terse- but dapat digunakan untuk memperoleh informasi tentang µ dan
σ 2 . Ukuran yang diperoleh dari ke 100 bola lampu tersebut merupakan
statistik, sedangkan
µ dan σ 2 merupakan parameter.

Misalkan suatu populasi memiliki distribusi tertentu dengan mean pop-


ulasi µ dan varian populasi σ 2 . Suatu sampel random X1 , X2 , · · · , Xn
diam- bil dari populasi tersebut. Ada dua statistik yang penting, yaitu mean
sampel dan varian sampel.

Definisi 14. Diketahui X1 , X2 , · · · , Xn adalah sampel random berukuran n.

(a) Mean sampel X didefinisikan


X1 + X2 + · · · + 1 X n
X = = Xi
Xn n
n i=1

(b) Varian sampel S 2 didefinisikan


n
1
S2 = i − X )2 ,
X
(X
n−1
i=1

dan S = S 2 dinamakan deviasi standar sampel.

Contoh 67. Suatu eksperimen random telah dilakukan sebanyak 5 kali dan
diperoleh X1 = 3.5, X2 = 3.2, X3 = 3.4, X4 = 3.3 dan X5 = 3.6. Mean
sampelnya adalah
X 5 Xi 3.5 + 3.2 + 3.4 + 3.3 +
X = 3.6
5
= = 3.4,
i=1
5
dan varian sampelnya adalah
X (X − X )2
S2 = 5 i

i=1
5−1
(3.5 − 3.4)2 + (3.2 − 3.4)2 + (3.4 − 3.4)2 + (3.3 − 3.4)2 + (3.6
=
− 3.4)2
4
= 0.025.

Dengan demikian deviasi standar sampel adalah S = 0.025 = 0.158.

Distribusi sampel adalah distribusi peluang suatu statistik. Sebagai


contoh, distribusi peluang X dinamakan distribusi sample mean.

Teorema 7. Jika X1 , X2 , · · · , Xn sampel random berukuran n dari suatu


dis- tribusi dengan mean µ dan varian σ 2 , maka

(a) nilai harapan X adalah E(X ) = µ


σ2
(b) varian X adalah V ar(X ) = .
n

Berdasarkan teorema di atas, nilai harapan X sama dengan mean populasi


µ, sedangkan varian X semakin kecil jika ukuran sampel n bertambah.

Teorema 8 (Teorema Limit Pusat). Jika X adalah mean sampel


random berukuran n dari suatu populasi dengan mean µ dan varian σ 2 , maka

X−
√ µ
Z =
σ n

mendekati berdistribusi normal standar jika n besar.

Umumnya Z mendekati distribusi normal untuk n ≥ 30. Teorema di atas


dapat digunakan untuk mencari nilai pendekatan peluang variabel random X¯
.
Contoh 68. Suatu perusahan memproduksi bola lampu yang usia hidupnya
berdistribusi mendekati normal dengan mean 800 jam dan deviasi standar 40
jam. Berapa peluang suatu sampel random sebanyak 16 bola lampu akan
berusia rata-rata kurang dari 775 jam?

Penyelesaian. Distribusi sampel X mendekati normal dengan µ = 800 dan



σ = 40/ 16 = 10. Peluang yang dicari adalah
X − µ 775 − 800
P (X < 775) = P √ < = P (Z < −2.5) = 0.0062.
σ n 10

Teorema 9. Jika X1 , X2 , · · · , Xn sampel random berukuran n dari suatu dis-


Pn 2
triibusi dengan mean µ dan varian σ 2 , maka nilai harapan S 2 = i=1 (Xn−1
i −X )

adalah

E(S 2 ) = σ 2 .

Teorema tersebut menyatakan bahwa nilai harapan dari varian sampel


sama dengan varian populasi.
Selanjutnya akan dibahas distribusi statistik suatu sampel random yang
berasal dari populasi berdistribusi normal.

Teorema 10. Jika X1 , X2 , · · · , Xn adalah sampel random dari populasi


berdis- tribusi normal dengan mean µ dan varian σ, dan mean sampel X ,
maka

Z = X−√µ (7.1)
σ/ n

berdistribusi normal standar.

Teorema 11. Jika X1 , X2 , · · · , Xn adalah sampel random dari populasi


berdis- tribusi normal dengan mean µ dan varian σ, maka
(a) X dan S 2 independen

(b) X berdistribusi normal dengan mean µ dan varian σ 2 /n

(c) (n − 1)S 2 /σ 2 berdistribusi chi-square dengan derajat bebas n − 1.

Dalam inferensi statistik, sampel random X1 , X2 , · · · , Xn sering diasum-


sikan bersifat independen. Jika ukuran populai berhingga, maka tidak ada
jaminan sampel random tersebut independen. Namun jika ukuran populasi re-
latif besar terhadap ukuran sampel, maka sampel random tersebut mendekati
independen.
Bab 8

Estimasi

Data sampel dari suatu populasi dapat digunakan untuk mencari informasi
tentang karakter pupulasi. Misalnya, jika mean populasi µ yang tidak dike-
tahui, maka untuk memperoleh informasi tentang parameter µ dapat digu-
nakan mean sampel x¯. Ini berarti statistik x¯ digunakan untuk
mengestimasi (meduga) parameter mean populasi µ. Dalam hal ini x¯
dinamakan estimator (penduga) untuk µ. Secara umum, jika θ parameter
populasi, maka estimator untuk θ ditulis θˆ. Jadi µˆ = x¯.
Estimator titik suatu parameter adalah estimator yang berupa sebuah
nilai tunggal. Sebagai contoh, dalam pernyataan ”rata-rata hasil penguku-
ran kecepatan cahaya adalah 301.000 km/detik”, nilai tersebut adalah suatu
estimator titik.

Definisi 15. Suatu statistik dikatakan estimator tak bias parameter θ jika
nilai harapannya sama dengan θ. Jika tidak demikian maka statisik tersebut
dikatakan bias.

Pada kuliah sebelumnya telah disampaikan bahwa statistik


Pn
i=1 Xi
X=
n
memiliki nilai harapan sama dengan mean populasi µ. Dengan demikian X
merupakan estimator tak bias untuk parameter µ . Demikian pula varian
sampel Pn
2
− X 2)
i=1 (Xi
S =
n−1
juga merupakan estimator tak bias parameter varian σ 2 .

Definisi 16. Suatu estimator θ1 dikatakan lebih efisien dari pada estimator θ2
jika varian θ1 lebih kecil dibanding varian θ2 .

Suatu estimator yang berupa interval dimana parameter diduga berada


dinamakan estimator interval. Sebagai contoh, pernyataan ”kecepatan ca-
haya berkisar antara 299.000 km/detik sampai dengan 305.000 km/detik”,
berarti nilai kecepatan cahaya yang sebenarnya dipercaya berada di antara
kedua batas interval.

Interval kepercayaan untuk suatu parameter adalah suatu inteval


dalam mana parameter dipercaya berada. Misalkan θ adalah parameter yang
tidak diketahui. Untuk membentuk interval kepercayaan θ, perlu dicari
statistik U dan L sehingga peluang

P (L ≤ θ ≤ U ) = 1 − α
adalah benar. Interval
L≤θ≤U (8.1)

dinamakan interval kepercayaan 100(1-α) persen untuk parameter θ.


Interval kepercayaan dapat diinterpretasikan sebagai berikut: jika kita
mengambil sampel random berulang-ulang, maka 100(1 − α) persen dari
semua nilai data akan memuat nilai θ yang sebenarnya.
Di dalam persamaan 8.1, L dan U berturut-turut dinamakan batas bawah
dan batas atas interval. Misalnya untuk α = 0.05, maka persamaan 8.1
dinamakan interval kepercayaan 95 persen untuk θ. Pada bagian berikut, kita
akan belajar membentuk interval kepercayaan untuk paramter mean
populasi
µ, varian populasi σ 2 dan selisih dua mean populasi.

66
8.1 Interval kepercayaan untuk µ dengan σ
dike- tahui
Diketahui X1 , X2 , · · · , Xn adalah sampel random dari populasi berdistribusi
normal dengan mean µ dan varian σ 2 . Telah disampaikan bahwa X
merupakan estimator µ. Namun demikian kita tidak dapat memastikan
bahwa X = µ, melainkan kita hanya dapat menyatakan bahwa µ berada di
dalam interval tertentu.
Karena X berdistribusi normal dengan mean µ dan varian σ 2 /n, maka
X−√µ
σ/ n
berdistribusi normal standar. Oleh karena itu

√ (X − = 0.95
P − 1.96 < n < 1.96
µ) σ
atau ekivalen dengan

σ σ
P X − 1.96 √ < µ < X + 1.96 = 0.95
n

Interval n
σ σ
X − 1.96 √ , X + 1.96
n

n
dinamakan interval kepercayaan 95 persen untuk µ.

Teorema 12. Jika x1 , x2 , · · · , xn adalah data sampel dari distribusi dengan σ


diketahui, dan x adalah rata-rata sampel, maka interval kepercayaan 95 persen
untuk µ adalah
σ σ
x − 1.96 √ , x + 1.96 √ .
n n

Contoh 69. Dari data sampel random berat badan 100 orang dewasa di
Palangka Raya diperoleh x = 67.45 kg dan penelitian sebelumnya menyatakan

67
bahwa σ 2 = 8.6136 kg. Carilah interval kepercayaan 95 persen rata-rata berat
badan orang dewasa di Palangkaraya.

68
Penyelesaian. Berdasarkan yang diketahui, interval kepercayaan 95
persen untuk mean populasi adalah

x − 1.96 √σn , x + 1.96√nσ = 67.45 − 1.96 √ 2.93


100
√ 2.93
, 67.45 + 1.96
100
= (66.8748, 68.0252) .

Ini berarti 95 persen dapat dipercaya bahwa berat badan rata-rata orang de-
wasa di Palangka Raya berada di antara 66.8748 kg sampai dengan 68.0252
kg.

Dengan cara yang serupa, interval kepercayaan 99 persen untuk mean


populasi µ adalah
σ σ
X − 2.58 √ , X + 2.58 √ .
n n
Secara umum, interval kepercayaan (1 − α) persen untuk mean populasi
µ jika σ diketahui adalah

σ σ
X − zα/2 √ , X + zα/2 √ .
n n
Nilai zα/2 untuk beberapa tingkat kepercayaan yang sering digunakan
adalah

Table 8.1: Tabel zα/2


Tingkat 99.73 % 99 % 98 % 96 % 95.45 % 95 % 90 %
kepercayaan
zα/2 3.00 2.58 2.33 2.05 2.00 1.96 1.645

8.2 Interval kepercayaan untuk µ dengan σ


tidak diketahui
Misalkan X1 , X2 , · · · , Xn sampel random dari populasi berdistribusi normal
dengan µ dan σ 2 keduanya tidak diketahui. Dapat dibuktikan bahwa

(X − µ) n
S
berdistribusi t dengan derajat bebas n − 1.
Interval kepercayaan (1 − α) persen untuk µ dapat dibentuk sebagai berikut.

(X − µ) n
P −tα/2,n−1 < < tα/2,n−1 = 1 − α
S

atau ekivalen dengan

P X − tα/2,n−1 √S < µ < X + tα/2,n−1 √


S
= 1 − α.
n n

Teorema 13. Diketahui x1 , x2 , · · · , xn adalah data sampel dari distribusi


den- gan σ tidak diketahui. Jika X = x dan S = s, maka interval
kepercayaan
100(1 − α) persen parameter µ adalah

x − tα/2,n−1 √S , x + tα/2,n−1 √
S .
n n

Contoh 70. Berdasarkan data sampel random pengukuran 10 diameter pipa


menghasilkan mean x = 2.38 cm dan deviasi standar s = 0.06 cm. Carilah
interval kepercayaan 95 persen untuk rata-rata diameter pipa yang sebenarnya.

Penyelesaian. Berdasarkan tabel t dengan α = 0.05 dan n = 10 diperoleh


t0.025,9 = 2.262. Interval kepercayaan 95 persen untuk diameter pipa yang
sebenarnya adalah

2.38 − 2.262√0.06 √0.06


10 , 2.38 + 2.262 10 = (2.38 − 0.04292, 2.38 + 0.04292)
= (2.3371, 2.4229)
yang berarti bahwa 95 persen dapat dipercaya diameter pipa yang sebenarnya
antara 2.3371 dan 2.4229.

8.3 Interval kepercayaan untuk σ 2


Diketahui X1 , X2 , · · · , Xn sampel random dari populasi berdistribusi normal
dengan mean µ dan varian σ 2 yang tidak diketahui. Dapat dibuktikan bahwa
S2
(n − 1)
σ2
berdistribusi Chi-square dengan dejarat bebas n − 1.
Interval kepercayaan (1 − α) persen untuk σ 2 dapat dibentuk sebagai berikut.

S2
P χ21−α/2,n−1 < (n − 1) < χ2α/2,n−1 = 1−α
σ2
atau ekivalen dengan
(n − 1)S 2 !
(n − 1)S 2
P 2 χ2
χ2α/2,n−1 < σ < 1−α/2,n−1 = 1 − α.

Teorema 14. Jadi jika S 2 = s2 , interval kepercayaan 100(1 − α) persen untuk


parameter varian populasi σ 2 adalah
!
(n − 1)S 2 (n − 1)S 2
, .
χ2α/2,n−1 χ21−α/2,n−1

Contoh 71. Kapasitas 10 batere diukur dan hasilnya sebagai berikut (dalam
ampere − jam):

140, 136, 150, 144, 148, 152, 138, 141, 143, 151.

(a) Carilah estimasi untuk varian populasi σ 2 , dan (b) hitunglah interval keper-
cayaan 99 persen untuk σ 2 .

Penyelesaian. (a) Dari data tersebut diperoleh x = 144.3. Estimasi untuk


varian populasi
X
10
(Xi − 2
2
S = = 32.23.
144.4)
i=1
10 − 1

(b) Karena 1 − α = 0.99 maka α/2 = 0.01/2 = 0.005. Berdasarkan tabel


Chi-square diperoleh χ20.005,9 = 23.589 dan χ21−0.005,9 = χ20.995,9 = 1.735.
Jadi interval kepercayaan 99 persen untuk σ 2 adalah
!
2 (n − 1)S 2 9 × 32.23 9 × 32.23
(n − 1)S
, 2 = , = (12.30, 167.19),
χα/2,n−1 χ1−α/2,n−1
2 23.589 1.735
yang berarti bahwa dapat dipercaya 99 persen nilai varian populasi be-
rada pada interval (12.30, 167.19).
8.4 Interval kepercayaan selisih dua mean
Dalam suatu penelitian mungkin peneliti ingin membentuk interval keper-
cayaan selisih dua mean populasi. Misalkan X1 , X2 , · · · , Xn adalah sampel
random dari populasi berdistribusi normal dengan mean µ1 dan varian σ12 ,
dan Y1 , Y2 , · · · , Ym adalah sampel random dari populasi berdistribusi
normal dengan mean µ2 dan
2 varian σ2 . Akan dibentuk interval
kepercayaan selisih kedua mean populasi, yaitu µ1 − µ2 .
Dari pembahasan sebelumnya berdistribusi normal dengan mean µ1

dan varian σ 2 /n; dan berdistribusi normal dengan mean µ2 dan varian
1

σ22 /m. Oleh karena itu X¯ − berdistribusi normal dengan mean µ1 − µ2 dan

varian σ12 /n + σ22 /m.
Pembahasan akan dibagi menjadi dua, yaitu jika σ12 dan σ22 diketahui dan
tidak diketahui.
Jika σ12 dan σ22 diketahui, maka
X¯ − Y¯ − (µ1 −
µ)
q 2
σ12 2

n
+ σm2
berdistribusi normal standar. Dengan demikian diperoleh hasil berikut.

Teorema 15. Interval kepercayaan 100(1-α) persen untuk µ1 − µ2 adalah


r r !
2 2 2 2
σ1 σ 2 σ1 σ 2
x¯ − y¯ − + x¯ − y¯ + + .
zα/2 , zα/2
n m n m

Contoh 72. Hasil pengamatan IQ yang diambil dari dua populasi anak yang
tinggal di perkotaan (A) dan di pedesaan (B) adalah sebagai berikut:

Sampel A : 100 104 108 99 115 120 103 112 124 120 110
Sampel B : 121 101 120 98 99 104 104 107 111 123
Jika diketahui varians IQ anak-anak di perkotaan dan pedesaan berturut-
turut adalah 7, 02 dan 6, 8, carilah interval kepercayaan 90 persen selisih rata-
rata kedua kelompok anak.
Penyelesaian. Diketahui n1 = 11, n2 = 10, σ12 = 7.02 dan σ22 = 6.8. Dapat
dihitung bahwa
x¯1 = x¯2 = 108.8
110.45

Karena zα/2 = z0.05 = 1.645, maka interval kepercayaan 90 persen untuk µ1 −µ2
adalah
q q
7.02 6.8 7.02
110.45 − 108.8 − (1.645) 11 + 10 , 110.45 − 108.8 + (1.645) 11 +106.8
= (−0.24, 3.54)

yang berarti bahwa 90 persen dapat dipercaya seleisih IQ anak di perkotaan


dan di pedesaan berada pada interval −0.24 sampai dengan 3.54.

Jika varian kedua populasi tidak diketahui, namun nilainya sama, maka
dapat digunakan varian sampel,
P P
s2x = n−1
1
i (xi −
2 sy2 = 1
m−1 i (yi −
2

x¯) y¯) (8.2)


2 +(m−1)s2
(n−1)sx
s2p = n+m−2
y
.

Teorema 16. Jika varian kedua populasi tidak diketahui, maka interval keper-
cayaan 100(1 − α) persen untuk µ1 − µ2 adalah
p p
x¯ − y¯ − tα/2, −2 sp 1/n + 1/m, (x¯ − y¯ α/2, n+m−2 sp 1/n + 1/m
n+m
+t

Contoh 73. Jika varian kedua populasi pada contoh 72 tidak diketahui tetapi
dianggap sama, carilah interval kepercayaan 90 persen untuk beda mean kedua
populasi.

Penyelesaian. Misalkan X dan Y berturut-turut menyatakan variabel ran-


dom IQ anak perkotaan dan anak pedesaan. Berdasarkan data diatas, n = 11
dan m = 10. Selanjutnya dapat dihitung bahwa
x¯ = 110.45 y¯ = 108.8

s2x = 73.2727 sy2 = 89.2889


(10)(73.2727 + (9)
s2 (89.2889)
p = = 80.8593, sp = 8.9923
19
Berdasarkan tabel, nilai tα/2, n+m−2 = t0.05, 19 = 1.729.
p q
tα/2, n+m−2 sp 1/n + 1/m = (1.729)(8.9923) 10 1+ 9
1

= 7.1437,

dan
x¯ − y¯ = 110.45 − 108.8 =
1.65.

Oleh karena itu interval 90 persen untuk µ1 − µ2 adalah

(1.65 − 7.1437, 1.65 + 7.1437) = (−5.4937, 8.7937) ,

yang berarti dapat dipercaya 90 persen bahwa selisih mean IQ antara anak
perkotaan dan anak pedesaan berada di antara -5.4937 dan 8.7937.
Bab 9

Uji Hipotesis

Dalam penerapan peneliti sering menyatakan suatu sifat populasi berdasarkan


informasi sampel. Suatu pernyataan atau klaim tentang parameter populasi
dinamakan hipotesis statistik. Dinamakan hipotesis statistik karena perny-
ataan tersebut bisa benar atau bisa tidak benar.

Definisi 17. Uji hipotesis adalah suatu aturan dimana setelah data sampel
diperoleh maka akan menuntun kepada diterima atau ditolaknya suatu hipote-
sis.

Suatu hipotesis yang akan diuji dinamakan hipotesis nol, ditulis H0 .


Hipotesis yang berbeda dengan hipotesis nol dinamakan hipotesis alternatif,
ditulis H1 .
Suatu hipotesis yang jika benar ternyata menggambarkan secara lengkap
distribusi populasi, dinamakan hipotesis sederhana. Jika tidak demikian maka
dinamakan hipotesis komposit. Sebagai contoh perhatikan dua hipotesis berikut.

(a) Rata-rata berat badan mahasiswa UM Palangkaraya adalah µ = 60

(b) Rata-rata berat badan mahasiswa UM Palangkaraya adalah µ ≤ 60

Hipotesis (a) merupakan hipotesis sederhana, sedangkan hipotesis (b) meru-


pakan hipotesis komposit. Perhatikan bahwa jika hipotesis (a) benar, maka
nilai parameter populasi secara tegas dinyatakan dengan µ = 60; sebaliknya
pada hipoteis (b) jika benar maka nilai parameter populasi µ tidak dapat
tergambar secara tegas.

Contoh 74. Kita klaim bahwa rata-rata berat badan mahasiswa UM Palangka
Raya adalah 60 kg. Untuk membuktikan benar atau tidaknya klaim terse-
but, maka perlu diuji. Dalam hal ini hipotesis nolnya adalah ”rata-rata berat
badan mahasiswa UM Palangkaraya adalah 60 kg”. Hipotesis alternatifnya
misalnya adalah ”rata-rata berat badan mahasiswa UM Palangkaraya tidak
sama dengan 60 kg”. Hipotesis alternatif lainnya misalnya adalah ”rata-rata
berat badan mahasiswa UM Palangkaraya adalah kurang dari 60 kg”.

Perhatikan kembali contoh 74. Jika hipotesis nolnya adalah ”rata-rata


berat badan mahasiswa UM Palangkaraya adalah 60 kg” dan hipotsis alternat-
ifnya adalah ”rata-rata berat badan mahasiswa UM Palangkaraya tidak sama
dengan 60 kg”, maka kita dituliskan

H0 : µ = 60
melawan hipotesis
H1 : µ = 60.

Karena H0 dan H1 merupakan pernyataan yang komplementer, maka mudah


dipahami bahwa jika kita menerima H0 tentu kita tidak menerima H1 atau
menolak H1 . Demikian pula jika kita menolak H0 berarti kita menerima H1 .
Untuk memberikan gambaran bagaimana suatu hipotesis diditerima atau
ditolak, diperlukan batasan yang jelas. Untuk menghuji hipotests H0 , di-
ambil sampel berukuran n. Misalkan hasil observasi memberikan nilai-nilai
X1 , X2 , · · · , Xn . Perhatikan bahwa (X1 , X2 , · · · , Xn ) merupakan titik
pada ruang berdimensi n. Nilai-nilai tersebut akan digunakan sebagai dasar
diter- imanya atau ditlaknya H0 . Untuk menguji H0 , dibentuk suatu daerah
berdi- meni n yang dinakaman daerah kritis , dituliskan dengan C . Ini
berarti uji statistik yang ditentukan oleh daerah kritis adalah

terima H0 jika (X1 , X2 , · · · , Xn ) ∈/ C,


dan
tolak H0 jika (X1 , X2 , · · · , Xn ) ∈ C.

Sebagai contoh, misalkan sampel berukuran n diambil dari suatu populasi


berdistribusi normal dengan varian σ 2 = 1. Perlu diingat bahwa

X¯ −
µ√
σ/ n

berdistribusi normal standar. Uji untuk hipotesis mean populasi µ = 1 dapat


digunakan daerah kritis
Pn i
X 1.96
C= (X1 , X2 , · · · , Xn ) : i=1
−1 > √ .
n n

Daerah ini berarti himpotesis nolditolah jika selisih mean populasi dengan 1
melebihi 1.96 dibagi akar dari ukuran sampel.
Karena data yang digunakan untuk menerima atau menolak suatu hipote-
sis adalah data sampel, maka tidak dapat dipastikan apakah hipotesisi terse-
but benar atau salah. Dalam pengambilan kesimpulan, kalaupun ada kesala-
han tentu kita berharap kesalahan tersebut sekecil mungkin. Menolak suatu
pernyataan yang benar tentu merupakan suatu kesalahan. Demikian pula,
menerima suatu pernyataan yang salah tentu merupakan suatu kesalahan.

Definisi 18. Kesalahan jenis I adalah ditolaknya H0 padahal H0 benar. Ke-


salahan jenis II adalah diterimanya H0 padahal H0 salah.

Definisi 19. Tingkat signifikansi suatu uji hipotesis, dituliskan α, adalah


peluang terjadinya kesalahan jenis I.
9.1 Uji tentang mean populasi normal
9.1.1 Uji hipotesis dengan σ 2 diketahui

Diketahui X1 , X2 , · · · , Xn adalah sampel random dari populasi berdistribusi


normal dengan mean µ dan varian σ 2 yang diketahui. Misalkan akan diuji
hipotesis
H0 : µ = µ0
melawan hipotesis
H1 : µ = µ0

dimana µ0 suatu konstanta.


Pn
Karena X = i=1 Xni adalah estimator untuk µ, maka cukup beralasan
bahwa H0 diterima jika X tidak berbeda jauh dengan µ0 . Karena X berdis-
tribusi normal dengan mean µ dan varian σ 2 /n, maka H0 benar asalkan

X − µ0
Z = √
σ/ n
berdistribusi normal standar.

Aturan 1. Untuk menguji hipotesis

H0 : µ = µ0
melawan hipotesis
H1 : µ = µ0

digunakan aturan

terima H0 jika z = n
X − µ0 ≤ zα/2
√σ
n
tolak H0 jika z=
σ X − µ0 > zα/2 .

dengan zα/2 diperoleh dari tabel normal standar sehingga

P (−zα/2 < Z < zα/2 ) = 1 − α.

Daerah kritis penerimaan hipotesis disajikan pada Gambar 9.1.


α/2 H0 diterima α/2

−zα/2 zα/2

Gambar 9.1: Daerah kritis

Contoh 75. Akan diuji suatu pernyataan bahwa rata-rata jumlah anak per
KK di Palangkaraya adalah 3. Diambil sampel random berukuran 100 dan
diperoleh rata-rata sampel x = 2.84. Jika diketahui σ = 0.8 akan diuji hipote-
sis tersebut pada tingkat signifikansi α = 0.05. Dalam hal ini hipotesis yang
akan diuji
H0 : µ = 3
melawan hipotesis
H1 : µ = 3.

Penyelesaian. Berdasarkan tabel normal standar, zα/2 = z0.025 = 1.96. Diper-


oleh √ √
n 100
z= X − µ0 = |2.84 − 3| = 2.0.
σ 0.8
Karena z > z0.025 ini berarti H0 ditolak dan disimpulkan bahwa rata-rata
banyaknya anak per KK di Palangkaraya tidak sama dengan 3.

Dapat terjadi H0 : µ ≤ µ0 dan hipotesis alternatifnya adalah H1 : µ > µ0 .


Untuk menguji hipotesis demikian kita gunakan aturan berikut.
Aturan 2. Untuk menguji hipotesis:

H0 : µ ≤ µ0
melawan hipotesis
H1 : µ > µ0

digunakan aturan

n
terima H0 jika z = X − µ0 ≤ zα
√σ
n
tolak H0 jika z = X − µ0 > zα
σ

Uji hipotesis demikian dinamakan uji hipotesis satu sisi.

Demikian pula dapat terjadi H0 : µ ≥ µ0 dan hipotesis alternatifnya


adalah H1 : µ < µ0 .

Aturan 3. Untuk menguji hipotesis:

H0 : µ ≥ µ0
melawan hipotesis
H1 : µ < µ0

digunakan aturan

n
terima H0 jika z = X − µ0 ≥ −zα
√σ
n
tolak H0 jika z = X − µ0 < −zα
σ

Contoh 76. Semua rokok yang beredar di pasaran mengandung nikotin pal-
ing sedikit 1.6 mg per batang rokok. Suatu perusahaan rokok mengklaim
dengan suatu metode tertentu dapat menurunkan kadar nikotin kurang dari
1.6 mg per batang rokok. Untuk menguji klaim tersebut, sampel berukuran
20 dari perusahaan tersebut dianalisis. Diketahui devisi standar nikotin pada
rokok adalah 0.8 mg. Jika rata-rata nikotin ke 20 rokok pada sampel tersebut
adalah 1.54, apakah klaim perusahaan tersebut dapat diterima pada tingkat
signifikansi 5 persen?

Penyelesaian. Akan diuji hipotesis

H0 : µ ≥ 1.6 melawan H1 : µ < 1.6.

Berdasarkan tabel normal diperoleh z−α = z−0.05 = −1.65. Berdasarkan data


di atas diperoleh
√ √
n
z= X − µ0 = 20 (1.54 − 1.6) = −0.336.
σ 0.8
Karena z ≥ z−0.05 maka H0 diterima, yang berarti klaim perusahaan tersebut
tidak benar pada tingkat signifikansi 5 persen.

9.1.2 Uji hipotesis dengan σ 2 tidak diketahui

Dalam situasi yang lebih umum, mean populasi µ dan varian populasi σ 2
biasanya tidak diketahui.

Aturan 4. Untuk menguji hipotesis

H0 : µ = µ0
melawan hipotesis
H1 : µ = µ0

digunakan aturan

n
terima H0 jika t = X − µ0 ≤ tα/2,n−1
√S
n
tolak H0 jika t =
S X − µ0 > tα/2,n−1

dimana S 2 adalah varian sampel dan n ukuran sampel.

Contoh 77. Pemerintah mengklaim bahwa kebutuhan air bersih rata-rata


rumah tangga adalah 350 galon per hari. Untuk membuktikan klaim terse-
but, suatu studi terhadap 20 rumah tangga dilaksanakan dan diperoleh data
berikut.

80
340 344 362 375
356 386 354 364
332 402 340 355
362 322 372 324
318 360 338 370
Berdasarkan data sampel tersebut, apakah klaim pemerintah dapat diterima
pada tingkat signifikansi 10 persen?

Penyelesaian. Akan diuji hipotesis

H0 : µ = 350 melawan H1 : µ = 350.

Berdasarkan data tersebut diperoleh

X = 353.8 dan S = 21.8478.


Dengan demikian

√ 20 |353.8 − 350| = 0.7778
t = n X − µ0 =
S 21.8478
Berdasarkan tabel t diperoleh tα/2,n−1 = t0.05,19 = 1.729. Karena t < t0.05,19
berarti H0 diterima, yang berarti bahwa klaim pemerintah dapat diterima
dengan tingkat signifikansi 10 persen.

Uji hipotesis satu sisi untuk varian populasi σ tidak diketahui diberikan
dalam aturan-aturan berikut.

Aturan 5. Uji hipotesis satu sisi:

H0 : µ ≤ µ0
melawan hipotesis
H1 : µ > µ0

digunakan aturan

terima H0 jika t = n X − µ0 ≤ tα,n−1
√S
n
tolak H0 jika t = X − µ0 > tα,n−1
S
dimana S 2 adalah varian sampel dan n ukuran sampel.

81
Demikian pula uji hipotesis satu sisi:
Aturan 6.
H0 : µ ≥ µ0

melawan hipotesis
H1 : µ < µ0

digunakan aturan

n
terima H0 jika t = X − µ0 ≥ −tα,n−1
S

n
tolak H0 jika t = X − µ0 < −tα,n−1
S
dimana S 2 adalah varian sampel dan n ukuran sampel.

9.2 Uji kesamaan mean dua populasi


Jika peneliti ingin mengetahui efek suatu jenis obat dalam menyembuhkan
suatu penyakit, maka setidaknya dia mencoba obat tersebut ke suatu sampel
dan membandingkan hasilnya dengan sampel lain yang tidak diberi obat, yakni
kita memiliki dua sampel yang mendapat perlakuan berbeda.
Untuk mengetahui apakah suatu metode belajar tertentu memberikan
hasil yang berbeda dengan metode belajar yang ada, tentu peneliti harus
mencobakan metode tertentu tersebut dan membandingkan hasilnya dengan
metode yang ada.
Dari kedua contoh di atas, yang akan diselidiki dapat berupa kesamaan
atau perbedaan mean kedua populasi.

9.2.1 Varian populasi diketahui

Misalkan X1 , X2 , · · · , Xn dan Y1 , Y2 , · · · , Ym adalah dua sampel


independen dari dua populasi yang berdistribusi normal, yang masing-
masing memiliki
mean µx dan µy yang tidak diketahui, dan varian σx2 dan σy2 yang diketahui.
Andaikan akan diuji hipotesis

H0 : µx = µy
melawan hipotesis
H1 : µx = µy

Karena X adalah estimator µx dan Y adalah estimator µy , maka X − Y dapat


digunakan untuk mengestimasi µx − µy . Karena H0 dapat dituliskan H0 :
µx − µy = 0, maka cukup beralasan untuk menerima H0 bilamana X − Y
tidak berbeda jauh dengan 0. Selanjutnya, karena X − Y berdistribusi normal
dengan mean µx − µy dan varian σ 2 /n + σ 2 /m, maka
x y

(X − Y ) − (µx −
µ )
q y 2
σ2x σ
n
+ my

berdistribusi normal standar. Ini berakibat jika H0 benar, yakni µx − µy = 0,


maka
X − Y
q
σ2x σ2
n
+ m
y

berdistribusi normal standar. Dengan demikian belaku


 
X − Y
P  −z α/2 ≤ q ≤ zα/s  = 1 − α.
σ2 σ2
n
x
+ my

Aturan 7. Untuk menguji


H0 : µx = µy

melawan hipotesis
H1 : µx = µy

dengan tingkat signifikansi α digunakan aturan


X − Y
terima H0 jika z =q ≤ zα/2
σx2 σ2
n
+ m
y

X − Y
tolak H0 jika z =q > zα/2 .
σx2 σ2
n
+ my

9.2.2 Varian populasi tidak diketahui


Misalkan X1 , X2 , · · · , Xn dan Y1 , Y2 , · · · , Ym adalah dua sampel
independen dari dua populasi yang berdistribusi normal, yang masing-
masing memiliki
mean µx dan µy yang tidak diketahui, dan varian σx2 dan σy2 juga tidak dike-
tahui. Lebih lanjut dimisalkan σx2 = σy2 = σ 2 . Andaikan akan diuji hipotesis

H0 : µx = µy
melawan hipotesis
H1 : µx = µy

Hipotesis H0 akan diterima jika X − Y tidak berbeda jauh dengan 0. Varian


masing-masing sampel adalah
Pn
2 i=1
(Xi − X 2
S =
)
x
n−1
Pm
i=1 (Yi− Y2
S2 )
y = .
m−1
Dapat ditunjukan bahwa
X − Y − (µx − µy
q)
p n
+ m

1 1
S2
berdistibusi t dengan dejarat bebas n + m − 2, dengan
(n − 1)S2x + (m − 1)S2 y
Sp2 = .
n+m−2
Oleh karen itu jika H0 benar, yakni jika µx − µy = 0, maka statistik
X − Y
t= q
p n + m

1 1
S2
berdistribusi t dengan dejarat bebas n + m − 2.
Aturan 8. (σ 2x dan σy2 sama dan tidak diketahui) Untuk menguji

H0 : µx = µy
melawan hipotesis
H1 : µx = µy

dengan tingkat signifikansi α digunakan aturan


|X − Y |
terima H0 jika |t| = q ≥ tα/2,n+m−2
1 1
S p2 n
+ m

|X − Y |
tolak H jika |t| = q > tα/2,n+m−2
0
p n
+ m

1 1
S2
Contoh 78. Dua puluh lima pria sebuah institusi dipilih secara random dan
diamati tekanan darah sistoliknya. Dari 25 pria tersebut tercatat 11 perokok
dan 14 bukan perokok, dan hasil pengamatan tekanan tersebut adalah sebagai
berikut:

Perokok Bukan perokok


124 120
134 130
136 122
125 128
133 129
127 118
135 122
131 116
133 127
125 135
118 120
122
120
115
123
Apakah ada perbedaan rata-rata tekanan darah sistolik antara perokok
dan bukan perokok pada tingkat signifinasi 5 persen? Bagaimana jika digu-
nakan tingkat signifikansi 1 persen?

Penyelesaian. Dalam soal ini hipotesis yang akan diuji adalah

H0 : µx = µy
melawan hipotesis
H1 : µx = µy .

Karena kedua sampel diambil dari sebuah institusi, maka varian populasi di-
anggap sama. Kita gunakan indeks x menyatakan prokok dan indeks y bukan
perokok. Berdasarkan data tersebut diperoleh

nx = 11 X x = 129.18 Sx2 = 32.76, ny = 14 X y = 123.36 Sy2 = 32.86,


(nx − 1)S2x + (my − 2
10 · 32.76 + 13 · 32.86
S2 y
1)S
p = = = 32.82
nx + my − 2 23
|X − Y | |129 − 123|
1 q r
|t| 1 = = 2.52
11
+ 14
1 1
Sp2 + 32.82
nx ny

Karena t0.025,23 = 2.069 (yang berarti t0.025,23 < |t|), maka H0 ditolak,
yang berarti bahwa rata-rata tekanan sistolik antara perokok dan bukan per-
okok berbeda pada tingkat signifikansi 5 persen.
Karena t0.005,23 = 2.807 (yang berarti t0.005,23 > |t|), maka H0 diterima,
dengan kata lain rata-rata tekanan sistolik antara perokok dengan bukan per-
okok tidak berbeda pada tingkat signifikansi 1 persen.

9.2.3 Varian tidak diketahui dan tidak sama

Dimisalkan varian populasi σx2 dan σy2 tidak diketahui dan tidak sama. Karena
S 2x adalah estimator untuk σx2 dan Sy2 estimator untuk σy2 maka uji hipotesis

H0 : µx = µy melawan H1 : µx = µy
bisa didasarkan pada statistik

X − Y
t= q 2
Sx S2
n
+ m
y

Jika n dan m cukup besar, maka t akan mendekati distribusi normal standar.

Aturan 9. (σ 2x dan σy2 tidak sama dan tidak diketahui) Untuk n dan m besar

X − Y
terima H0 jika |t| = q ≤ zα/2
Sx2 S2
n
+ my

X − Y
tolak H0 jika |t| = q > zα/2
Sx2 S2
n
+ my

9.3 Uji t berpasangan


Misalkan peneliti ingin mengetahui apakah ada perbedaan hasil pengukuran
berat antara neraca O-haus dengan neraca pegas. Untuk tujuan tersebut di-
ambil sampel n objek kemudian ditimbang beratnya dengan kedua alat. Oleh
karena itu didapatkan n pasang pengamatan yang dituliskan

(Xi , Yi ), i = 1, 2, · · · ,
n

dengan Xi dan Yi berturut-turut menyatakan hasil pengukuran dengan neraca


O-haus dan neraca pegas objek ke i.
Suatu cara untuk menguji hipotesis adanya perbedaan hasil penguku-
ran berat tersebut adalah dengan menghitung selisih kedua hasil pengukuran.
Misalkan Wi menyatakan selisih antara pengukuran dengan neraca o-haus dan
pengukuran dengan neraca pegas. Jika tidak ada perbedaan hasil pengukuran,
maka Wi akan memiliki mean 0. Oleh karena itu kita dapat menuliskan uji
hipotesisnya sebagai berikut.

Aturan 10. Uji t berpasangan (t paired test). Untuk menguji hipotesis

H0 : µw = 0 melawan H1 : µw = 0

terima H0 jika − tα/2, n−1 < n · SW
w
< tα/2, n−1
tolah H0 untuk yang lainnya

Contoh 79. Ingin diketahui apakah ada perbedaan hasil pengukuran berat
benda antara necara o-haus dan neraca pegas. Untuk itu diambil 8 sam-
pel benda dan timbang dengan kedua neraca. Misalkan hasil pengukurannya
(dalam newton) adalah sebagai berikut.

No. Objek 1 2 3 4 5 6 7 8
Neraca Ohaus 3.2 4.5 5.3 9.6 4.6 8.0 7.3 2.2
Necara pegas 3.1 4.6 5.1 9.5 4.7 8.1 7.1 2.0

Penyelesaian. Misalkan wi menyatakan selisih hasil pengukuran neraca ohaus


dan neraca pegas. Beradasarkan data di atas diperoleh

No. Objek 1 2 3 4 5 6 7 8
wi 0.1 -0.1 0.2 0.1 -0.1 -0.1 0.2 0.2
Dapat dihitung bahwa mean selisih kedua hasil pengukuran adalah w¯ =
0.0625 dan deviasi standarnya adalah sw = 0.1408. Selanjutnya, karena n = 8,
maka
√ 0.0625
√ w = 8 = 1.2555
n sw 0.1408
dan tα/2, n−1 = t0.025, 7 = 2.3646. Karena

√W
−tα/2, n−1 < n < tα/2, n−1
Sw
maka H0 diterima, yang berarti bahwa tidak ada perbedaan hasil pengukuran
kedua jenis alat pada tingkat signifikansi 5 persen.

9.4 Uji hipotesi tentang varian populasi nor-


mal
Dalam aplikasi peneliti sering ingin mengetahui apakah informasi yang tert-
era pada kemasan suatu produk cukup dapat dipercaya. Sebagai contoh,
apakah suatu jenis pupuk memiliki kadar seperti tertera pada labelnya, dan
apakah daya tumbuh benih sesuai dengan yang tertera di labelnya. Dalam hal
demikian, peneliti dapat menguji apakah varian kadar tersebut tidak berbeda
dengan standar varian yang diijinkan.
Misalkan X1 , X2 , · · · , Xn adalah sampel random dari populasi normal
dengan mean µ dan varian σ 2 yang keduanya tidak diketahui. Akan diuji
hipotesis
H0 : σ 2 = σ02

melawan hipotesis alternatif

H1 : σ 2 = σ02

dengan σ02 suatu nilai tertentu.


Perlu diingat kembali bahwa (n − 1)S 2 /σ 2 berdistribusi chi-square
dengan derajat bebas n − 1.
Aturan 11. Untuk menguji hipotesis

H0 : σ 2 = σ02

melawan hipotesis alternatif

H0 : σ 2 = σ02

digunakan aturan
2 2
terima H0 jika χ1−α/2,n−1 ≤ (n−1)S ≤ χ2α/2,n−1
σ02
tolak H0 untuk lainnya

Contoh 80. Ingin diketahui apakah varian kadar paracetamol suatu jenis obat
tidak melebihi batas yang diijinkan pihak berwenang. Misalkan kadar yang
ijinkan adalah memiliki varian 40 mg. Suatu sampel 12 obat diukur kadar
paracetamolnya dan hasilnya adalah sebagai berikut (dalam mg).

512 532 502 510 508 502 505 511 510 507 509 512

Apakah varian paracematmol dapat diterima pada tingkat signifikansi 1


persen?

Penyelesaian. Diketahui σ02 = 40, n = 12 dan α = 0.01. Berdasarkan data


dapat dihitung s2 = 60, α/2 = 0.005 sehingga 1 − α/2 = 0.995. Berdasarkan
tabel chi-square diperoleh χ20.995,11 = 2.603 dan χ0.005,11
2
= 26.757.

(n − 1)S 2 (12 − 1)
σ2 (60)
= = 16.5
0 40
Karena χ2 ≤ (n−1)S
2
≤ χ20.05,11 , maka H0 diterima. Ini berarti pada tingkat
0.95,11 σ02

signifikansi 1 persen, varian paracematol jenis obat tersebut tidak melebihi


batas yang diijinkan pihak berwenang.

9.5 Uji hipotesis kesamaan varian dua popu-


lasi normal
Jika peneliti memiliki dua populasi, maka mungkin ia tertarik untuk menge-
tahui apakah variabilitas kedua populasi sama atau berbeda. Sebagai contoh,
apakah variabilitas hasil panen padi lokal sama dengan variabilitas hasil panen
padi unggul nasional.
Diketahui X1 , X2 , · · · , Xn dan Y1 , Y2 , · · · , Ym dua sampel independen dari
dua populasi normal yang masing-masing memiliki parameter µx , σ 2x dan µy , σy2 .
Akan diuji
H0 : σ 2x = σy2 melawan H1 : σx2 = σy2 .

Varian masing-masing sampel adalah

n
1X

Sx2 = ¯ )2
(Xi − X
n−1 i

m
1X

Sy2 = ¯ )2 .
(Yi − Y
m−1 i

Ingat kembali bahwa (n − 1)S 2 /σ 2 dan (m − 1)S 2y /σy2 adalah variabel


x x

random indepnden dengan derajat bebas masing-masing n − 1 dan m − 1.


Oleh karena itu
Sx2 /σx2
Sy2 /σy2
berdistribsi F dengan derajat bebas pembilang n − 1 dan derajat bebas penye-
but m − 1.

Aturan 12. Untuk menguji hipotesis


H0 : σ 2x = σy2 melawan H1 : σx2 = σy2

pada tingkat signifikansi α digunakan aturan


terima H0 jika F1−α/2, n−1,m−1 < Sx2 /Sy2 < Fα/2,n−1,m−1
tolak H0 untuk yang lain

Contoh 81. Ingin diketahui apakah ada perbedaan variabilitas hasil panen
padi lokal dengan padi unggul nasional pada tingkat signifikansi 5 persen. Su-
atu sampel padi lokal berukuran 10 dan sampel padi unggul nasional berukuan
13 diambil. Hasil pengamatan (dalam ton per hektar) adalah sebagai berikut.

Padi lokal 1.5 2.3 2.5 1.9 3.0 2.5 1.7 1.8 2.0 2.3
Padi unggul nasional 3.9 4.0 4.2 4.1 4.0 3.8 3.9 4.3 4.5 4.4
3.8 3.9 4.0
Penyelesaian. Berdasarkan data di atas diperoleh

Sx2 = 0.205 Sy2 = 0.0509

Sx2 /Sy2 = 0.205/0.0509 = 4.0277

Dapat dicari dengan aplikasi Excell bahwa F0.975,9,12 = 0.26 dan F0.025,9,12 =
4.44, yang berarti H0 ditolak. Dengan demikian disimpulkan terdapat perbe-
daan variabilitas produktivitas kedua jenis padi.

9.6 Uji Goodness of Fit


Misalkan satu mata uang logam seimbang dilontarkan 1000 kali. Frekuensi
1
harapan terjadinya sisi angka tentu 1000 · 2 = 500 kali. Namun demikian
frekuensi terjadinya sisi angka hasil observasi bisa berbeda dengan frekuensi
harapan tersebut. Untuk menguji apakah hasil percobaan ini sesuai dengan
hasil teoritis, bisa digunakan satu uji statistik.
Goodness of fit adalah suatu uji statistik untuk menentukan apakah
suatu populasi memiliki distribusi tertentu.
Misalkan peneliti memiliki k persitiwa E1 , E2 , · · · , Ek yang masing-masing
dapat terjadi dengan peluang p1 , p2 , · · · , pk . Jika diambil sampel
random berukuran n dari populasi ini, nilai observasi untuk peristiwa E1 , E2 ,
· · · , Ek dapat dinyatakan sebagai variabel random X1 , X2 , · · · , Xk . Frekuensi
harapan peristiwa-peristiwa tersebut masing-masing adalah np1 , np2 , · · · , npk
. Dalam
bentuk tabel dapat dinyatakan sebagai berikut.

Peristiwa E1 E2 ··· Ek
Frekuensi observasi x1 x2 ··· xk
Frekuensi harapan np1 np2 ··· npk

Aturan 13. Untuk menguji apakah nilai observasi menyimpang terhadap nilai
harapan digunakan aturan sebagai berikut.
(X1 − np12
χ2 = + (X2 − (Xk − npk )
) 2 (9.1)
np2 )2 + ···+
np1 np2 npk
terima H0 jika χ2 < χα,k−1
2

tolak H0 jika χ2 ≥ χα,k−1


2

Contoh 82. Satu dadu dilontarkan 120 kali. Hasil observasi dan nilai harapan
setiap sisi dinyatakan dalam tabl berikut.

Sisi 1 2 3 4 5 6
Nilai observasi 22 23 18 19 21 17
Nilai harapan 20 20 20 20 20 20

Jika dadu tersebut seimbang, tentu peneliti berharap setiap sisi memiliki
peluang 1/6. Dengan demikian dalam 120 lontaran, setiap sisi diharapkan
1
terjadi 6 120 = 20 kali. Namun berdasarkan hasil observasi, ternyata
tidak semua sisi terjadi 20 kali. Apakah ini berarti dadu tersebut tidak
seimbang?
Untuk mengetahuinya kita gunakan uji chi-square.
(22−20)2 (23−20) (18−20) (19−20) (21−20) 2
χ2 = 20 + 2 2 2 2
(17−20)
20
= 1.4. 20
+ 20
+ 20
+ 20
+

2
Berdasarkan tabel, χ0.05,5 = 11.070. Karena nilai yang dihitung χ2 < χ20.05,5
maka hipotesis nol diterima, dengan kata lain tidak cukup bukti untuk men-
gatakan bahwa dadu tidak seimbang.

9.7 Uji Independen


Dalam fenomena sehari-hari, seseorang sering ingin mengetahui ada tidaknya
hubungan antara dua variabel. Sebagai contoh, apakah tingkat pendapatan
masyarakat independen terhadap keputusan untuk menolak atau menerima
kenaikan BBM. Misalkan ada 3 tingkat pendapatan: miskin, sedang dan kaya.
Dalam hal ini populasi memiliki dua karakteristik, yaitu yang setuju dan yang
tidak setuju dengan kenaikan BBM. Kedua karakteristik masyarakat terbagi
dalam 3 golongan, yaitu miskin, sedang dan kaya.
Misalkan kita memiliki suatu populasi yang dapat diklasifikasikan menjadi
dua karakteristik, namakan X dan Y . Misalkan ada r nilai yang mungkin
untuk kelas X dan ada s nilai yang mungkin untuk klas Y . Peluang kelas X
terjadi nilai i dan kelas Y terjadi nilai j ditulis Pij . Jadi

Pij = P (X = i, Y = j)

Setiap anggota populasi diasumsikan independen. Peluang sebarang anggota


populasi memiliki sifat X dengan nilai i adalah
Xs
pi = Pij
j=1

Peluang sebarang anggota populasi memiliki sifat Y dengan nilai j adalah


X
r
qj = Pij
i=1

Misalkan kita ingin menguji hipotsis bahwa anggota populasi dengan sifat X
dan Y independen, yaitu
H0 : pij = pi qj
melawan hipotesis
H1 : pij = pi qj

Karena nilai pi dan qi tidak dinyatakan secara spesifik di dalam hipotesis,


maka kita harus menduga nilai tersebut. Banyaknya anggota populasi dengan
karakteristik X dan berpendapat i adalah
Xr
Ni = Nij ,
j=1

dan estimator untuk pi adalah

Ni
pˆi =
n, i = 1, 2, · · · , r.

Banyaknya anggota populasi dengan karakeristik Y dan memilih j adalah


X
r
Mj = Nij
,
i=1
dan estimator untuk qi adalah

Mj
qˆi = , j = 1, 2, · · · , s.
n
Jika H0 benar, maka
E(Nij ) = npi qj

dan
Xs X
r
(Nij − npˆ2i qˆj )
T=
npˆi
j=1 i=1
qˆj

berdistribusi chi-square dengan derajat bebas (r − 1)(s − 1). Oleh karena itu
diperoleh aturan berikut.

Aturan 14. Untuk menguji hipotesis

H0 : pij = pi qj
melawan hipotesis
H1 : pij = pi qj

digunakan aturan
Xs X
r
(Nij − npˆ2i qˆj )
T=
npˆi
j=1 i=1
qˆj

2
terima H0 jika T ≥ χα,(r−1)(s−1)
tolak H0 untuk lainnya
Contoh 83. Untuk mengetahui apakah keputusan menolak atau menerima
kenaikan BBM independen terhadap tingkat pendapatan masyarakat, diambil
sampel random berukuran 200 orang. Hasil observasi diberikan dalam tabel
berikut (dinamakan tabel contingency).

Tingkat pendapatan Miskin Sedang Kaya Jumlah


Setuju 30 32 32 94
Tidak Setuju 44 35 27 106
Jumlah 74 67 59 200
Dari tabel tersebut diperoleh
94 = 0.47
pˆ1 = 200
2
pˆ = 106
200
= 0.53
74
qˆ1 = 200 = 0.37

qˆ2 = 67
200
= 0.335

59
= 0.295
qˆ3 = 200

npˆ1 qˆ1 = (200)(0.47)(0.37) =


34.78 npˆ1 qˆ2 = (200)(0.47)(0.335)
= 31.49 npˆ1 qˆ3 = (200)(0.47)
(0.295) = 27.73 npˆ2 qˆ1 = (200)
(0.53)(0.37) = 39.22 npˆ2 qˆ2 =
(200)(0.53)(0.335) = 35.51 npˆ2 qˆ3
= (200)(0.53)(0.295) = 31.27
(30−34.78)2 + (32−31.49) (32−27.73) 2
T = 34.78 2
2
31.49
+ 27.73 2
(44−39.22) (35−35.51)2 (27−31.27)
+ 39.22
+ 35.51 + 31.27

= 2.5415.
2
Karena (r − 1)(s− 1) = 2 dan χ0.05,2 = 5.911, maka H0 terima, yakni keputusan
untuk menerima atau menolak kenaikan BBM adalah independen.
Bab 10

Regresi Linear Sederhana

Di dalam bidang ilmu pengetahuan dan teknologi, peneliti sering mencari


hubungan antara dua variabel, misalnya hubungan antara tekanan gas dengan
temperatur, hubungan antara pendapatan dan konsumsi, hubungan antara
dosis pupuk dan produksi tanaman, dan sebagainya.
Hubungan di atas dapat dinyatakan sebagai hubungan dua variabel, yaitu
variabel repon atau variabel tak bebas, dan variabel penjelas (explanatory)
atau variabel bebas. Jika X menyatakan variabel bebas dan Y menyatakan
variabel respon, maka hubungan kedua variabel dapat dinyatakan sebagai
fungsi.
Di dalam bab ini dipelajari hubungan linear antara dua variabel. Hubun-
gan demikian selain hubungan yang mudah ditangani, juga ada banyak per-
soalan di dalam penerapan yang dapat dinyatakan dalam bentuk hubungan
linear.
Di dalam mencari hubungan antara variabel Y dan X biasanya dimu-
lai dengan melakukan observasi atau penelitian dan mencatat hasilnya dalam
bentuk pasangan nilai (Xi , Yi ).

Contoh 84. Hasil 10 observasi temperatur gas (X ) dan tekanan gas (Y ) diper-
oleh data berikut.
Observasi ke Temperatur (◦ C ) Tekanan (atm)
1 60 2.3
2 70 2.5
3 80 2.6
4 90 3.3
5 100 3.8
6 110 3.9
7 120 4.2
8 130 4.4
9 140 4.5
10 150 4.7

Untuk mencari hubungan antara tekanan dan temperatur, akan sangat


membantu jika dibuat terlebih dahulu diagram yang menggambarkan titik-
titik hasil observasi seperti gambar berikut, dinamakan diagram pencar (scater
diagram).
tekanan (atm)

4.5

3.5

2.5

60 80 100 120 140


temperatur (◦ C )

Hubungan linear antara variabl X dan Y dapat dituliskan dalam bentuk


persamaan linear (garis lurus)

Yˆ = α +
βX.

Tentu peneliti menginginkan agar garis lurus tersebut dapat mewakili titik-
titik pada diagram pencar tersebut. Garis ini tentu tidak bisa melewati semua
titik-titik pada diagam pencar tersebut. Oleh karena itu akan ada deviasi
antara titik-titik pada diagram dengan titik-titik pada garis tersebut.
Dalam hal yang lebih umum, misalkan peneliti telah melakukan n per-
cobaan yang datanya adalah sebagai berikut.

Observasi ke X Y
1 X1 Y1
2 X2 Y2
. . .
n Xn Yn .
Model regresi linear sederhana dapat dituliskan dengan

Yi = α + βXi + i
(10.1)

dengan:
Yi nilai variabel respon observasi ke i
α dan β adalah parameter
Xi nilai variabel bebas observasi ke i
i dinaman kesalahan random yang diasumsikan berdistribusi normal
dengan nilai harapan 0 dan varian σ 2
i = 1, 2, · · · , n.

Agar model tersebut dapat digunakan, parameter α dan β harus dies-


timasi. Peneliti tentu menghendaki agar suku kesalahan i dibuat sekecil
mungkin. Ada suatu metoda di dalam matematika untuk mencari parameter
ini sehingga jumlah kuadrat kesalan randomnya adalah minimal, yaitu least
square method. Dengan menggunakan metoda ini, dapat ditunjukkan bahwa
nilai parameter α dan β dapat diestimasi dengan menggunakan
P P
βˆ =
n Xi Yi −X n
i=1 i=1
Yi 2
Pn
i=1 X i2 −nX

(10.2)
αˆ = Y −
βˆX .

Contoh 85. Berdasarkan data pengamatan, pada Contoh 84 diperoleh


n n i n
n = 10, X = 105,
X X X
Yi = 36.2, X 2 = 118500, Xi Yi = 4038,
i=1 i=1 i=1
Oleh karena itu αˆ dan βˆ dapat dicari sebagai berikut

βˆ =118500−10×1052 = 0.0287
4038−105×36.2

αˆ = 3.62 − (0.0287)(105) = 0.6036.

Oleh karena itu hubungan antara temperatur X dan tekanan Y dapat diny-
atakan dengan persamaan linear

Yˆ = 0.6036 +
0.0287X.

10.1 Sifat estimator βˆ dan αˆ

Di dalam persamaan 10.2, nilai harapan dari βˆ dan αˆ berturut-turut


adalah

E(βˆ) = β
(10.3)
E(αˆ) = α

Dengan demikian βˆ dan αˆ masing-masing merupakan estimator tak


bias untuk parameter β dan α. Untuk mengetahui variabilitas kedua
estimator,
dapat dipelajari melalui varian kedua estimator. Varian βˆ dan αˆ adalah
V ar(βˆ) =P x−nx¯
2
σ2

2
i

P 2
xi (10.4)
V ar(αˆ) =n( x2 −nx¯
P
2
i
)

Selisih antara nilai respon Yi dengan nilai prediksi Yˆi dinamakan

residual, residual = Yi − αˆ − βˆxi

Untuk mengukur seberapa besar penyimpnagan nilai respon terhadap prediksi


diambil jumlah kuadrat residual. Jumlah kuadrat residual, ditulis SSR adalah
X 2
SSR = Yi − αˆ − βˆxi
Dapat dibuktikan bahwa
SSR
σ2
berdistribusi chi-square dengan derajat bebas n − 2. Oleh karena itu nilai
harapan SSR/(n − 2) adalah

SSR = σ2
E
(n − 2)
SS R
yang berarti (n−2) merupakan estimator tak bias untuk parameter σ 2 .

Untuk pembahasan selanjutnya, akan digunakan notasi berikut:


Pn Pn
Sxx = i=1 (xi − x¯)2 = i=1 x2 −
Pn Pn i 2
Syy = i=1 (yi − y¯)2 = i=1 nx¯ (10.5)
yi2 −
ny¯2
Pn
Sxy = i=1 (xi − x¯)(yi − y¯) = i=1 xi yi − nx¯y¯
Pn

10.2 Inferensi tentang parameter β dan α


Karena βˆ merupakan estimator, maka bisa dibentuk interval kepercayaan
pa- rameter β. Interval kepercayaan 100(1 − α) persen untuk β diberikan
oleh
s s !
SSR SSR
βˆ − , βˆ +
(n − 2)Sxx (n − 2)Sxx
tα/2,n−2 tα/2,n−2
Di dalam persamaan regresi

y = α + βx + e

penting untuk menguji hipotesis apakah β sama dengan 0, yaitu

H0 : β = 0 melawan H1 : β = 0

pada tingkat signifikansi α. Untuk menguji H0 pada tingkat signifikansi α


digunakan statistik penguji
r
(n − 2)Sxx
t= β
SSR
dimana H0 diterima jika |t| ≤ tα/2,n−2 dam ditolak jika |t| > tα/2,n−2 .
Interval kepercayaan untuk parameter intersep α adalah
s P s P !
i SS R i SS R
αˆ − t
x2 − 2)Sxx tα/2,n−2 , αˆ
n(n x2 − 2)Sxx α/2,n−2
n(n
(10.6)
+
10.3 Koefisien Determinasi
Berdasarkan data (X1 , Y1 ), (X2 , Y2 ), · · · , (Xn , Yn ), bisa dicari variasi
variabel respon Y yang disebabkan pengaruh variabel penjelas X . Variasi
variabel Y didefinisikan oleh

X
n
Syy = (Yi − Y¯ )2
(10.7)
i=1

Karena Y = α + βX + , maka variasi Y disebabkan oleh dua


komponen, yaitu

• komponen variasi yang disebabkan oleh variabel bebas X

• komponen variasi yang disebabkan oleh faktor kesalahan random .

Karena variasi yang sebabkan oleh faktor kesalahan random adalah SSR,
maka variasi yang disebabkan oleh variabel penjelas X = variasi Y - variasi
oleh kesalahan random.

Proporsi variasi yang disebabkan oleh variabel penjelas dinamakan koe-


fisien determinasi, dituliskan R2 . Dengan demikian
v ariasi S − SS R SS R
R2 = = yy = 1− (10.8)
X
variasi Y Syy Syy

Perhatikan bahwa 0 ≤ Syy − SSR ≤ Syy . Oleh karena itu nilai koefisien
determinasi memenuhi
0 ≤ R2 ≤ 1.

Nilai koefisien determinasi R2 dapat digunakan untuk menilai seberapa


tepat model regresi yang telah diperoleh. Nilai R2 = 1 menunjukan model
regresi yang diperoleh sangat baik, sedangkan nilai R2 = 0 menunjukan model
regresi yang diperoleh sangat jelek untuk menggambarkan hubungan kedua
variabel.
10.4 Korelasi
Korelasi merupakan ukuran keeratan hubungan antara dua variabel. Di
dalam korelasi tidak dipersoalkan hubungan sebab akibat. Dengan demikian
pernyataan ”korelasi antara variabel X dan Y ” sama saja dengan pernyataan
”korelasi antara variabel Y dan X ”.
Keeratan hubungan antara dua variabel dinyatakan dengan koefisien
ko- relasi. Jika (x1 , y1 ), (x2 , y2 ), · · · , (xn , yn ) adalah data sampel, maka
koefisien korelasi antara variabel X dan Y , ditulis r, didefinisikan
Pn
(xi − x¯)(yi − y¯)
r = pPn i=1 2
Pn (10.9)
i=1 (xi − x¯) i=1 (yi −
y¯)2
Nilai koefisien korelasi adalah antara −1 sampai dengan 1, yakni

−1 ≤ r ≤ 1

Variabel X dan Y dikatakan berkorelasi positif jika r > 0, dikatakan


berko- relasi negatif jika r < 0 dan dikatakan tidak berkorelasi jika r − 0.
Jika X dan Y berkorelasi positif, maka dengan meningkatnya nilai X , nilai
Y juga meningkat. Jika korelasi antara X dan Y negatif, maka semakin besar
nilai X semakin menurun nilai Y . Jika X tidak berkorelasi dengan Y maka
perubahan X tidak mempengaruhi perubahan Y . Nilai koefisien korelasi yang
mendekati
1 mengindikasikan hubungan kuat positif antara variabel X dan Y , nilai koe-
fisien korelasi yang mendekadi −1 menunjukan hubungan kuat negatif antara
X dan Y .
Dengan menggunakan notasi 10.5 di atas, persamaan 10.9 dapat dit-
uliskan sebagai
Pn
i=1 (xi
− x¯)(yi − y¯) S
r = p Pn Pn = p xy (10.10)
i=1 (xi − x¯)
2
i=1 (yi −
Sxx Syy
y¯)2
Sxx Sy y − S 2xy
Karena SSR = Sxx
, maka
2
r2 =
xy
Sxx Syy
S
Sxx Syy −SS RSxx
= Sxx Syy
SS R
= 1− Syy

= R2 ,
yakni

|r| = R2

Ini berarti nilai absolut koefisien korelasi sama dengan akar dua koefisien de-
terminasi. Tanda r sama dengan tanda koefisien βˆ didalam persamaan
regresi.
Daftar Pustaka

[1] Brase, C.H., and Brase, C.P., Understanding Basic Statistics., 4th ed.,
Houghton Mifflin Company, New York, 2007.

[2] Dekking, F .M., Kraaikamp, C., Lopuhaa, H.P., and Meester, L.E., A
Modern Introduction to Probability and Statistics, Springer-Verlag London
Limited, 2005.

[3] Feldman, R.M. and Valdez-Flores, C., Applied Probability and


Stochas- tic Processes, 2nd Ed., Springer Heidelberg Dordrecht London
New York,
2010.

[4] Hogg, R.V., and Craig, A.T., Introduction to Mathematical Statistics., 3rd
ed., Macmillan Publishing Co Inc., New York, 1970.

[5] Ross, S.M., Probability and Statistics for Engineer and Scientits., 3rd ed.,
Elsevier Academic Press, USA, 2004.
Lampiran Tabel
Tabel I. Distribusi Normal Standar
Kuantitas-kuantitas di dalam tabel adalah P (X ≤ x) = Φ(x)
x Φ(x) x Φ(x) x Φ(x) x Φ(x)
0.00 0.5000 0.31 0.6217 0.62 0.7324 0.93 0.8238
0.01 0.5040 0.32 0.6255 0.63 0.7357 0.94 0.8264
0.02 0.5080 0.33 0.6293 0.64 0.7389 0.95 0.8289
0.03 0.5120 0.34 0.6331 0.65 0.7422 0.96 0.8315
0.04 0.5160 0.35 0.6368 0.66 0.7454 0.97 0.8340
0.05 0.5199 0.36 0.6406 0.67 0.7486 0.98 0.8365
0.06 0.5239 0.37 0.6443 0.68 0.7517 0.99 0.8389
0.07 0.5279 0.38 0.6480 0.69 0.7549 1.00 0.8413
0.08 0.5319 0.39 0.6517 0.70 0.7580 1.01 0.8438
0.09 0.5359 0.40 0.6554 0.71 0.7611 1.02 0.8461
0.10 0.5398 0.41 0.6591 0.72 0.7642 1.03 0.8485
0.11 0.5438 0.42 0.6628 0.73 0.7673 1.04 0.8508
0.12 0.5478 0.43 0.6664 0.74 0.7704 1.05 0.8531
0.13 0.5517 0.44 0.6700 0.75 0.7734 1.06 0.8554
0.14 0.5557 0.45 0.6736 0.76 0.7764 1.07 0.8577
0.15 0.5596 0.46 0.6772 0.77 0.7794 1.08 0.8599
0.16 0.5636 0.47 0.6808 0.78 0.7823 1.09 0.8621
0.17 0.5675 0.48 0.6844 0.79 0.7852 1.10 0.8643
0.18 0.5714 0.49 0.6879 0.80 0.7881 1.11 0.8665
0.19 0.5753 0.50 0.6915 0.81 0.7910 1.12 0.8686
0.20 0.5793 0.51 0.6950 0.82 0.7939 1.13 0.8708
0.21 0.5832 0.52 0.6985 0.83 0.7967 1.14 0.8729
0.22 0.5871 0.53 0.7019 0.84 0.7995 1.15 0.8749
0.23 0.5910 0.54 0.7054 0.85 0.8023 1.16 0.8770
0.24 0.5948 0.55 0.7088 0.86 0.8051 1.17 0.8790
0.25 0.5987 0.56 0.7123 0.87 0.8078 1.18 0.8810
0.26 0.6026 0.57 0.7157 0.88 0.8106 1.19 0.8830
0.27 0.6064 0.58 0.7190 0.89 0.8133 1.20 0.8849
0.28 0.6103 0.59 0.7224 0.90 0.8159 1.21 0.8869
0.29 0.6141 0.60 0.7257 0.91 0.8186 1.22 0.8888
0.30 0.6179 0.61 0.7291 0.92 0.8212 1.23 0.8907
Lanjutan Tabel I. Distribusi Normal Standar
x Φ(x) x Φ(x) x Φ(x) x Φ(x)
1.24 0.8925 1.55 0.9394 1.86 0.9686 2.17 0.9850
1.25 0.8944 1.56 0.9406 1.87 0.9693 2.18 0.9854
1.26 0.8962 1.57 0.9418 1.88 0.9699 2.19 0.9857
1.27 0.8980 1.58 0.9429 1.89 0.9706 2.20 0.9861
1.28 0.8997 1.59 0.9441 1.90 0.9713 2.21 0.9864
1.29 0.9015 1.6 0.9452 1.91 0.9719 2.22 0.9868
1.30 0.9032 1.61 0.9463 1.92 0.9726 2.23 0.9871
1.31 0.9049 1.62 0.9474 1.93 0.9732 2.24 0.9875
1.32 0.9066 1.63 0.9484 1.94 0.9738 2.25 0.9878
1.33 0.9082 1.64 0.9495 1.95 0.9744 2.26 0.9881
1.34 0.9099 1.65 0.9505 1.96 0.9750 2.27 0.9884
1.35 0.9115 1.66 0.9515 1.97 0.9756 2.28 0.9887
1.36 0.9131 1.67 0.9525 1.98 0.9761 2.29 0.9890
1.37 0.9147 1.68 0.9535 1.99 0.9767 2.30 0.9893
1.38 0.9162 1.69 0.9545 2.00 0.9772 2.31 0.9896
1.39 0.9177 1.70 0.9554 2.01 0.9778 2.32 0.9898
1.40 0.9192 1.71 0.9564 2.02 0.9783 2.33 0.9901
1.41 0.9207 1.72 0.9573 2.03 0.9788 2.34 0.9904
1.42 0.9222 1.73 0.9582 2.04 0.9793 2.35 0.9906
1.43 0.9236 1.74 0.9591 2.05 0.9798 2.36 0.9909
1.44 0.9251 1.75 0.9599 2.06 0.9803 2.37 0.9911
1.45 0.9265 1.76 0.9608 2.07 0.9808 2.38 0.9913
1.46 0.9279 1.77 0.9616 2.08 0.9812 2.39 0.9916
1.47 0.9292 1.78 0.9625 2.09 0.9817 2.40 0.9918
1.48 0.9306 1.79 0.9633 2.10 0.9821 2.41 0.9920
1.49 0.9319 1.8 0.9641 2.11 0.9826 2.42 0.9922
1.50 0.9332 1.81 0.9649 2.12 0.9830 2.43 0.9925
1.51 0.9345 1.82 0.9656 2.13 0.9834 2.44 0.9927
1.52 0.9357 1.83 0.9664 2.14 0.9838 2.45 0.9929
1.53 0.9370 1.84 0.9671 2.15 0.9842 2.46 0.9931
1.54 0.9382 1.85 0.9678 2.16 0.9846 2.47 0.9932
Lanjutan Tabel I. Distribusi Normal Standar
x Φ(x) x Φ(x) x Φ(x) x Φ(x)
2.48 0.9934 2.79 0.9974 3.1 0.9990 3.41 0.9997
2.49 0.9936 2.80 0.9974 3.11 0.9991 3.42 0.9997
2.50 0.9938 2.81 0.9975 3.12 0.9991 3.43 0.9997
2.51 0.9940 2.82 0.9976 3.13 0.9991 3.44 0.9997
2.52 0.9941 2.83 0.9977 3.14 0.9992 3.45 0.9997
2.53 0.9943 2.84 0.9977 3.15 0.9992 3.46 0.9997
2.54 0.9945 2.85 0.9978 3.16 0.9992 3.47 0.9997
2.55 0.9946 2.86 0.9979 3.17 0.9992 3.48 0.9997
2.56 0.9948 2.87 0.9979 3.18 0.9993 3.49 0.9998
2.57 0.9949 2.88 0.9980 3.19 0.9993 3.50 0.9998
2.58 0.9951 2.89 0.9981 3.20 0.9993 3.51 0.9998
2.59 0.9952 2.90 0.9981 3.21 0.9993 3.52 0.9998
2.60 0.9953 2.91 0.9982 3.22 0.9994 3.53 0.9998
2.61 0.9955 2.92 0.9982 3.23 0.9994 3.54 0.9998
2.62 0.9956 2.93 0.9983 3.24 0.9994 3.55 0.9998
2.63 0.9957 2.94 0.9984 3.25 0.9994 3.56 0.9998
2.64 0.9959 2.95 0.9984 3.26 0.9994 3.57 0.9998
2.65 0.9960 2.96 0.9985 3.27 0.9995 3.58 0.9998
2.66 0.9961 2.97 0.9985 3.28 0.9995 3.59 0.9998
2.67 0.9962 2.98 0.9986 3.29 0.9995 3.60 0.9998
2.68 0.9963 2.99 0.9986 3.3 0.9995 3.61 0.9998
2.69 0.9964 3.00 0.9987 3.31 0.9995 3.62 0.9999
2.70 0.9965 3.01 0.9987 3.32 0.9995 3.63 0.9999
2.71 0.9966 3.02 0.9987 3.33 0.9996 3.64 0.9999
2.72 0.9967 3.03 0.9988 3.34 0.9996 3.65 0.9999
2.73 0.9968 3.04 0.9988 3.35 0.9996 3.66 0.9999
2.74 0.9969 3.05 0.9989 3.36 0.9996 3.67 0.9999
2.75 0.9970 3.06 0.9989 3.37 0.9996 3.68 0.9999
2.76 0.9971 3.07 0.9989 3.38 0.9996 3.69 0.9999
2.77 0.9972 3.08 0.9990 3.39 0.9997 3.70 0.9999
2.78 0.9973 3.09 0.9990 3.40 0.9997 3.71 0.9999
Tabel II. Distribusil Chi-Square
Kuantitas-kuantitas dalam tabel adalah bilangan x sehingga P (χ2 ≤ x) = λ
λ
r 0.99 0.975 0.95 0.05 0.025 0.01
1 6.6349 5.0239 3.8415 0.0039 0.0010 0.0002
2 9.2103 7.3778 5.9915 0.1026 0.0506 0.0201
3 11.3449 9.3484 7.8147 0.3518 0.2158 0.1148
4 13.2767 11.1433 9.4877 0.7107 0.4844 0.2971
5 15.0863 12.8325 11.0705 1.1455 0.8312 0.5543
6 16.8119 14.4494 12.5916 1.6354 1.2373 0.8721
7 18.4753 16.0128 14.0671 2.1673 1.6899 1.2390
8 20.0902 17.5345 15.5073 2.7326 2.1797 1.6465
9 21.6660 19.0228 16.9190 3.3251 2.7004 2.0879
10 23.2093 20.4832 18.3070 3.9403 3.2470 2.5582
11 24.7250 21.9200 19.6751 4.5748 3.8157 3.0535
12 26.2170 23.3367 21.0261 5.2260 4.4038 3.5706
13 27.6882 24.7356 22.3620 5.8919 5.0088 4.1069
14 29.1412 26.1189 23.6848 6.5706 5.6287 4.6604
15 30.5779 27.4884 24.9958 7.2609 6.2621 5.2293
16 31.9999 28.8454 26.2962 7.9616 6.9077 5.8122
17 33.4087 30.1910 27.5871 8.6718 7.5642 6.4078
18 34.8053 31.5264 28.8693 9.3905 8.2307 7.0149
19 36.1909 32.8523 30.1435 10.1170 8.9065 7.6327
20 37.5662 34.1696 31.4104 10.8508 9.5908 8.2604
21 38.9322 35.4789 32.6706 11.5913 10.2829 8.8972
22 40.2894 36.7807 33.9244 12.3380 10.9823 9.5425
23 41.6384 38.0756 35.1725 13.0905 11.6886 10.1957
24 42.9798 39.3641 36.4150 13.8484 12.4012 10.8564
25 44.3141 40.6465 37.6525 14.6114 13.1197 11.5240
26 45.6417 41.9232 38.8851 15.3792 13.8439 12.1981
27 46.9629 43.1945 40.1133 16.1514 14.5734 12.8785
28 48.2782 44.4608 41.3371 16.9279 15.3079 13.5647
29 49.5879 45.7223 42.5570 17.7084 16.0471 14.2565
30 50.8922 46.9792 43.7730 18.4927 16.7908 14.9535
Tabel III. Distribusi t-Student’s
Kuantitas-kuantitas dalam tabel adalah bilangan x sehingga P (tr ≤ x) = λ
λ
r 0.9 0.95 0.975 0.99 0.995
1 3.0777 6.3138 12.7062 31.8205 63.6567
2 1.8856 2.9200 4.3027 6.9646 9.9248
3 1.6377 2.3534 3.1824 4.5407 5.8409
4 1.5332 2.1318 2.7764 3.7469 4.6041
5 1.4759 2.0150 2.5706 3.3649 4.0321
6 1.4398 1.9432 2.4469 3.1427 3.7074
7 1.4149 1.8946 2.3646 2.9980 3.4995
8 1.3968 1.8595 2.3060 2.8965 3.3554
9 1.3830 1.8331 2.2622 2.8214 3.2498
10 1.3722 1.8125 2.2281 2.7638 3.1693
11 1.3634 1.7959 2.2010 2.7181 3.1058
12 1.3562 1.7823 2.1788 2.6810 3.0545
13 1.3502 1.7709 2.1604 2.6503 3.0123
14 1.3450 1.7613 2.1448 2.6245 2.9768
15 1.3406 1.7531 2.1314 2.6025 2.9467
16 1.3368 1.7459 2.1199 2.5835 2.9208
17 1.3334 1.7396 2.1098 2.5669 2.8982
18 1.3304 1.7341 2.1009 2.5524 2.8784
19 1.3277 1.7291 2.0930 2.5395 2.8609
20 1.3253 1.7247 2.0860 2.5280 2.8453
21 1.3232 1.7207 2.0796 2.5176 2.8314
22 1.3212 1.7171 2.0739 2.5083 2.8188
23 1.3195 1.7139 2.0687 2.4999 2.8073
24 1.3178 1.7109 2.0639 2.4922 2.7969
25 1.3163 1.7081 2.0595 2.4851 2.7874
26 1.3150 1.7056 2.0555 2.4786 2.7787
27 1.3137 1.7033 2.0518 2.4727 2.7707
28 1.3125 1.7011 2.0484 2.4671 2.7633
29 1.3114 1.6991 2.0452 2.4620 2.7564
30 1.3104 1.6973 2.0423 2.4573 2.7500
Lanjutan Tabel III. Distribusi t-Student’s
λ
r 0.9 0.95 0.975 0.99 0.995
31 1.3095 1.6955 2.0395 2.4528 2.7440
32 1.3086 1.6939 2.0369 2.4487 2.7385
33 1.3077 1.6924 2.0345 2.4448 2.7333
34 1.3070 1.6909 2.0322 2.4411 2.7284
35 1.3062 1.6896 2.0301 2.4377 2.7238
36 1.3055 1.6883 2.0281 2.4345 2.7195
37 1.3049 1.6871 2.0262 2.4314 2.7154
38 1.3042 1.6860 2.0244 2.4286 2.7116
39 1.3036 1.6849 2.0227 2.4258 2.7079
40 1.3031 1.6839 2.0211 2.4233 2.7045
41 1.3025 1.6829 2.0195 2.4208 2.7012
42 1.3020 1.6820 2.0181 2.4185 2.6981
43 1.3016 1.6811 2.0167 2.4163 2.6951
44 1.3011 1.6802 2.0154 2.4141 2.6923
45 1.3006 1.6794 2.0141 2.4121 2.6896
46 1.3002 1.6787 2.0129 2.4102 2.6870
47 1.2998 1.6779 2.0117 2.4083 2.6846
48 1.2994 1.6772 2.0106 2.4066 2.6822
49 1.2991 1.6766 2.0096 2.4049 2.6800
50 1.2987 1.6759 2.0086 2.4033 2.6778
51 1.2984 1.6753 2.0076 2.4017 2.6757
52 1.2980 1.6747 2.0066 2.4002 2.6737
53 1.2977 1.6741 2.0057 2.3988 2.6718
54 1.2974 1.6736 2.0049 2.3974 2.6700
55 1.2971 1.6730 2.0040 2.3961 2.6682
56 1.2969 1.6725 2.0032 2.3948 2.6665
57 1.2966 1.6720 2.0025 2.3936 2.6649
58 1.2963 1.6716 2.0017 2.3924 2.6633
59 1.2961 1.6711 2.0010 2.3912 2.6618
60 1.2958 1.6706 2.0003 2.3901 2.6603

110
Lanjutan Tabel III. Distribusi t-Student’s
λ
r 0.9 0.95 0.975 0.99 0.995
61 1.2956 1.6702 1.9996 2.3890 2.6589
62 1.2954 1.6698 1.9990 2.3880 2.6575
63 1.2951 1.6694 1.9983 2.3870 2.6561
64 1.2949 1.6690 1.9977 2.3860 2.6549
65 1.2947 1.6686 1.9971 2.3851 2.6536
66 1.2945 1.6683 1.9966 2.3842 2.6524
67 1.2943 1.6679 1.9960 2.3833 2.6512
68 1.2941 1.6676 1.9955 2.3824 2.6501
69 1.2939 1.6672 1.9949 2.3816 2.6490
70 1.2938 1.6669 1.9944 2.3808 2.6479
71 1.2936 1.6666 1.9939 2.3800 2.6469
72 1.2934 1.6663 1.9935 2.3793 2.6459
73 1.2933 1.6660 1.9930 2.3785 2.6449
74 1.2931 1.6657 1.9925 2.3778 2.6439
75 1.2929 1.6654 1.9921 2.3771 2.6430
76 1.2928 1.6652 1.9917 2.3764 2.6421
77 1.2926 1.6649 1.9913 2.3758 2.6412
78 1.2925 1.6646 1.9908 2.3751 2.6403
79 1.2924 1.6644 1.9905 2.3745 2.6395
80 1.2922 1.6641 1.9901 2.3739 2.6387
81 1.2921 1.6639 1.9897 2.3733 2.6379
82 1.2920 1.6636 1.9893 2.3727 2.6371
83 1.2918 1.6634 1.9890 2.3721 2.6364
84 1.2917 1.6632 1.9886 2.3716 2.6356
85 1.2916 1.6630 1.9883 2.3710 2.6349
86 1.2915 1.6628 1.9879 2.3705 2.6342
87 1.2914 1.6626 1.9876 2.3700 2.6335
88 1.2912 1.6624 1.9873 2.3695 2.6329
89 1.2911 1.6622 1.9870 2.3690 2.6322
90 1.2910 1.6620 1.9867 2.3685 2.6316

111
Tabel IV. Distribusi F
Kuantitas-kuantitas di dalam tabel adalah nilai x sehingga P (Fr1 ,r2 ≤ x) = 0.05
db db pembilang (r1 )
penyebut
1 2 3 4 5 6 7 8 9 10
(r2 )
1
161.4476 199.5000 215.7073 224.5832 230.1619 233.9860 236.7684 238.8827 240.5433 241.8817
2 18.5128 19.0000 19.1643 19.2468 19.2964 19.3295 19.3532 19.3710 19.3848 19.3959
3 10.1280 9.5521 9.2766 9.1172 9.0135 8.9406 8.8867 8.8452 8.8123 8.7855
4 7.7086 6.9443 6.5914 6.3882 6.2561 6.1631 6.0942 6.0410 5.9988 5.9644
5 6.6079 5.7861 5.4095 5.1922 5.0503 4.9503 4.8759 4.8183 4.7725 4.7351
6 5.9874 5.1433 4.7571 4.5337 4.3874 4.2839 4.2067 4.1468 4.0990 4.0600
7 5.5914 4.7374 4.3468 4.1203 3.9715 3.8660 3.7870 3.7257 3.6767 3.6365
11 8 5.3177 4.4590 4.0662 3.8379 3.6875 3.5806 3.5005 3.4381 3.3881 3.3472
2
9 5.1174 4.2565 3.8625 3.6331 3.4817 3.3738 3.2927 3.2296 3.1789 3.1373
10 4.9646 4.1028 3.7083 3.4780 3.3258 3.2172 3.1355 3.0717 3.0204 2.9782
11 4.8443 3.9823 3.5874 3.3567 3.2039 3.0946 3.0123 2.9480 2.8962 2.8536
12 4.7472 3.8853 3.4903 3.2592 3.1059 2.9961 2.9134 2.8486 2.7964 2.7534
13 4.6672 3.8056 3.4105 3.1791 3.0254 2.9153 2.8321 2.7669 2.7144 2.6710
14 4.6001 3.7389 3.3439 3.1122 2.9582 2.8477 2.7642 2.6987 2.6458 2.6022
15 4.5431 3.6823 3.2874 3.0556 2.9013 2.7905 2.7066 2.6408 2.5876 2.5437
16 4.4940 3.6337 3.2389 3.0069 2.8524 2.7413 2.6572 2.5911 2.5377 2.4935
17 4.4513 3.5915 3.1968 2.9647 2.8100 2.6987 2.6143 2.5480 2.4943 2.4499
18 4.4139 3.5546 3.1599 2.9277 2.7729 2.6613 2.5767 2.5102 2.4563 2.4117
19 4.3807 3.5219 3.1274 2.8951 2.7401 2.6283 2.5435 2.4768 2.4227 2.3779
20 4.3512 3.4928 3.0984 2.8661 2.7109 2.5990 2.5140 2.4471 2.3928 2.3479
Lanjutan Tabel IV. Distribusi F
db derajat bebas pembilang (r1 )
penyebut
1 2 3 4 5 6 7 8 9 10
(r2 )
1
4052.1807 4999.5000 5403.3520 5624.5833 5763.6496 5858.9861 5928.3557 5981.0703 6022.4732 6055.8467
2 98.5025 99.0000 99.1662 99.2494 99.2993 99.3326 99.3564 99.3742 99.3881 99.3992
3 34.1162 30.8165 29.4567 28.7099 28.2371 27.9107 27.6717 27.4892 27.3452 27.2287
4 21.1977 18.0000 16.6944 15.9770 15.5219 15.2069 14.9758 14.7989 14.6591 14.5459
5 16.2582 13.2739 12.0600 11.3919 10.9670 10.6723 10.4555 10.2893 10.1578 10.0510
6 13.7450 10.9248 9.7795 9.1483 8.7459 8.4661 8.2600 8.1017 7.9761 7.8741
7 12.2464 9.5466 8.4513 7.8466 7.4604 7.1914 6.9928 6.8400 6.7188 6.6201
8 11.2586 8.6491 7.5910 7.0061 6.6318 6.3707 6.1776 6.0289 5.9106 5.8143
11 9 10.5614 8.0215 6.9919 6.4221 6.0569 5.8018 5.6129 5.4671 5.3511 5.2565
3 10 10.0443 7.5594 6.5523 5.9943 5.6363 5.3858 5.2001 5.0567 4.9424 4.8491
11 9.6460 7.2057 6.2167 5.6683 5.3160 5.0692 4.8861 4.7445 4.6315 4.5393
12 9.3302 6.9266 5.9525 5.4120 5.0643 4.8206 4.6395 4.4994 4.3875 4.2961
13 9.0738 6.7010 5.7394 5.2053 4.8616 4.6204 4.4410 4.3021 4.1911 4.1003
14 8.8616 6.5149 5.5639 5.0354 4.6950 4.4558 4.2779 4.1399 4.0297 3.9394
15 8.6831 6.3589 5.4170 4.8932 4.5556 4.3183 4.1415 4.0045 3.8948 3.8049
16 8.5310 6.2262 5.2922 4.7726 4.4374 4.2016 4.0259 3.8896 3.7804 3.6909
17 8.3997 6.1121 5.1850 4.6690 4.3359 4.1015 3.9267 3.7910 3.6822 3.5931
18 8.2854 6.0129 5.0919 4.5790 4.2479 4.0146 3.8406 3.7054 3.5971 3.5082
19 8.1849 5.9259 5.0103 4.5003 4.1708 3.9386 3.7653 3.6305 3.5225 3.4338
20 8.0960 5.8489 4.9382 4.4307 4.1027 3.8714 3.6987 3.5644 3.4567 3.3682
Glosarium

binomial eksperimen yang hanya memiliki dua outcome. 52

daerah kritis kriteria diterimanya hipotesis. 75

data mentah data hasil pengamatan. 15

densitas fungsi yang terkait dengan variabel random kontinyu. 48

determinasi proporsi variasi yang disebabkan oleh variabel penjelas. 101

deviasi standar akar dua dari varian. 47

distribusi sampel distribusi peluang suatu statistik. 62

estimasi menduga nilai parameter menggunakan statistik. 65

frekuensi seringnya terjadi. 8

fungsi distribusi kumulatif peluang variabel random lebih kecil atau sama
dengan bilanga tertentu. 45
fungsi peluang distribusi peluang, peluang variabel random. 44

hipotesis pernyataan atau klaim tentang parameter populasi. 74

histogram cara penyajian grafik dengan batang. 10

independen terjadinya suatu peristiwa tidak tergantung peristiwa lain dan


sebalinknya. 36
inferensi statistik pengambilan kesimpulan berdasarkan data sampel. 60

interquartil selisih quartil ketiga dan quartil pertama. 22

interval kepercayaan interval dimana parameter diyakini berada. 66

kombinasi susunan objek yang tidak memperhatikan urutannya. 40

korelasi hubungan keeratan dua variabel. 101

114
linear hubungan dua vaariabel yang dinyatakan dalam persamaan linear. 96

mean rata-rata. 16

median nilai yang terletak di tengah data yang diurutkan. 16

Modus nilai yang paling sering terjadi. 15

nilai harapan nilai yang diharapkan terjadi. 46

parameter kuantitas yang dimiliki populasi. 60

pareto cara penyajian histrogram berdasarkan urutan tinggi. 12

peluang ukuran ketidakpastian terjadinya suatu peristiwa. 30

peluang bersama peluang yang didefinisikan pada dua atau lebih variabel
random. 50
peluang bersyarat peluang terjadinya suatu peristiwa jika diketahui peris-
tiwa lain telah terjadi. 34
peluang marjinal peluang bersama pada satu nilai variabel random ter-
tentu. 50
peristiwa bagian dari ruang sampel. 26

peristiwa elementer peristiwa yang hanya memiliki satu anggota. 27

permutasi susunan objek yang memperhatikan urutannya. 39

populasi kumpulan semua objek yang menjadi perhatian penelitian. 2

quartil pembagian data menjadi empat kelompok. 21

random acak, kesempatannya sama untuk terpilih. 3

range selisih nilai terbesar dan terkecil. 20

ruang sampel himpunan outcome peristiwa yang mungkin terjadi. 26

salin asing dua peristiwa yang tidak memiliki anggota yang sama. 27

sampel bagian dari populasi. 2

statistik sampel kuantitas yang diperoleh dari data sampel. 60

statistika studi tentang bagaimana mengumpulkan, mengorganisasi, men-


ganalisis dan menginterpretasikan data. 1
tak bias estimator yang nilai harapannya sama dengan parameter yang dies-
timasi. 65
tingkat signifikansi kesalahan jenis I. 76

uji hipotesis aturan yang menuntuk pada diterima atau ditolaknya hipotesis.
74

variabel random fungsi bernilai real yang domainnya ruang sampel. 42

variabel random diskrit variabel random yang nilai-nilainya dapat dituliskan


dengan x1 , X2 , · · · .. 42

varian garam, rata-rata jumlah kuadrat penyimpangan. 47


Indeks
bilangan random, 3 hipotesis statistik, 74
binomial, 52 histogram, 10
box plot, 23
independen, 36
Chi-square, 57 inferensi statistik, 60
interquartil , 22
daerah kritis, 75 interval kepercayaan, 66
data interval, 5
data niminal, 5 kelas, 8
data ordinal, 5 kesalahan jenis I , 76
data rasio, 6 kesalahan random, 98
data sampel, 2 koefisien determinasi, 101
densitas, 48 koefisien korelasi, 102
derajat bebas, 57 kombinasi, 40
deviasi, 20
deviasi standar, 20, 47 linear, 96
diagram badan dan daun, 13 median, 16
diagram pareto, 12 modus, 15
diagram pencar, 97
distribusi F , 58 nilai harapan, 46
distribusi t, 58 normal, 53
distribusi kumulatif, 45 normal standar, 54
distribusi kumulatif bersama, 51
observasi, 5
eksperimen, 5
parameter, 3, 60
eksperimen random, 26
peluang, 30
estimator, 65
peluang bersama, 50
estimator interval, 66
peluang bersyarat, 34
estimator tak bias, 65
peristiwa elementer, 27
estimator titik, 65
permutasi, 39
faktorial, 38 pertistiwa, 26
frekuensi, 8 populasi, 2
frekuensi kumulatif, 9
quartil, 21
frekuensi relatif, 8
fungsi peluang, 44 range, 20
fungsi peluang marjinal, 50 rata-rata, mean, 17
representatif, 3
goodness of fit, 91
ruang sampel, 26
runtun waktu, 12

saling saling, 27
sampel, 2
sampling, 3
statistik, 3, 60
survey, 5
tabel contingency, 94
tabel frekuensi, 8
tingkat signifikansi, 76
trimmed mean, 17
uji hipotesis, 74
ukuran populasi, 2
ukuran sampel, 2
variabel kualitatif, 2
variabel kuantitatif, 2
variabel penjelas, bebas, 96
variabel random, 42
variabel respon, tak bebas, 96
varian, 47
varian sampel, 20

Anda mungkin juga menyukai