Anda di halaman 1dari 41

STATISTIKA DASAR

OLEH:
I KOMANG GDE SUKARSA
I PUTU EKA NILA KENCANA

LABORATORIUM STATISTIKA
JURUSAN MATEMATIKA FMIPA
UNIVERSITAS UDAYANA
2015
KATA PENGANTAR

Puji syukur penulis sampaikan bahwa draf pertama dari modul atau bahan ajar mata kuliah
Statistika Dasar ini dapat dirampungkan. Modul ini diharapkan dapat dijadikan bahan acuan
untuk mahasiswa Jurusan Matematika dan mahasiswa jurusan lain di lingkungan Universitas
Udayana dalam memahami materi yang seharusnya mereka kuasai dalam mempelajari dasar
– dasar dalam Ilmu Statistika.
Modul ini berisi materi dasar seperti pengetian data, himpunan dan peluang yang harus
dipahami terlebih dahulu oleh mereka yang ingin mempelajari Statistika lebih lanjut.
Penyusunan modul Statistika Dasar ini dapat diselesaikan karena dorongan banyak fihak,
karena hal tersebut penulis ucapkan banyak terima kasih kepada fihak – fihak yang telah
memberikan dorongan dan semangat terutama istri dan anak – anak tercinta.
Tulisan ini tentunya tidaklah sempurna, banyak hal yang masih perlu disempurnakan, maka
bersama ini penulis harapkan masukan dan kritik dari pembaca agar tahap akhir dari
penulisan modul ini menjadi jauh lebih baik.
Demikian pengantar dari penulis semoga modul ini dapat dimanfaatkan untuk menambah
wawasan semua pembaca yang budiman.

Penulis
1

BAB I
DATA DALAM STATISTIKA
Pendahuluan
Statistika adalah suatu cabang ilmu matematika yang berkembang sejalan dengan adanya
kebutuhan alat untuk pengambilan keputusan, utamanya dalan suatu penelitian.
(Research Science Tool). Walaupun dipandang sebagai alat, namun karena digunakan
dalam hal pengambilan keputusan, dimana hasilnya dapat mempengaruhi banyak aspek
penting untuk langkah selanjutnya, maka segala kaidah yang ada dalam tahapan
pengambilan keputusan secara statistik ini harus benar-benar diperhatikan terutama
dalam hal yang menentukan tingkat ketelitian serta kevalidan analisis. Dalam kaitan
pengambilan keputusan ini, maka statistika sangat erat kaitannya dengan data. Apapun
keputusan yang akan diambil sangat tergantung dari data yang tersedia. Data akan sangat
menentukan suatu keputusan statistika dalam hal penentuan metode statistika yang akan
digunakan. Mengingat kebutuhan akan data yang sangat penting tersebut maka sebelum
mempelajari lebih jauh tentang metode statistika itu sendiri maka sangat dipandang perlu
Untuk diketahui aspek-aspek yang berhubungan dengan data.

Metode Pengumpulan Data


Pengumpulan data dari suatu populasi dalam ilmu statistka dapat dilakukan dengan dua
cara yaitu :
1. Sensus, yaitu pengumpulan data yang dilakukan dengan cara mengambil
informasi yang dibutuhkan dari semua anggota populasi.
2. Sampling, yaitu pengumpulan data yang hanya berasal dari hanya sebagian (tidak
seluruhnya) anggota populasi.
Dari kedua metode di atas jelas sekali terlihat adanya perbedaan yang menjolok yaitu dari
segi asalnya data. Selanjutnya dari perbedaan tersebut juga akan mengakibatkan adanya
perbedaan dalam hal yang sangat penting, yaitu di dalam metode pengambilan
keputusan. Perlu diketahui apapun metode pengumpulan data yang digunakan,
pengambilan keputusan tetap ditujukan untuk menyimpulkan kondisi real dari populasi.
Jadi keputusan adalah keputusan tentang populasi secara keseluruhan. Ketika
pengumpulan data dilakukan dengan cara sensus maka pengambilan keputusan menjadi

Modul Statistika Dasar Jurusan Matematika-UNUD


2

sah ketika hanya dilakukan secara deskriptif melalui gambaran umum data. ( Statistika
Kualitatif atau Statistika Deskriptif). Sebab apa yang disajikan nantinya sudah mewakili
populasi itu sendiri. Tetapi ketika data diambil melalui sampling, maka pengambilan
keputusan tentang populasi tidak cukup lagi dengan cara deskriptif tetapi harus dilakukan
dengan apa yang dikenal dengan Statistika kuantitatif atau Statistika Infrensia.
Statistika Inferensia adalah metode pengambilan keputusan statistika melalui uji formal
yang dikenal dengan pengujian hipotesis (akan dibahas kemudian). Secara gambaran
umum dalam metode ini akan dilakukan pengambilan keputusan tentang besaran pupulasi
(parameter) melalui besaran dalam sampel (data hasil sampling) yang dikenal dengan
istilah statistik. Tentunya dapat dibayangkan dalam hal ini akan terdapat resiko
kesalahan dalam pengambilan keputusan. Ketelitian dari metode ini nantinya akan sangat
ditentukan dari kesalahan ini.
Dari uraian di atas sudah terlihat bahwa pengambilan keputusan statistika mengandung
kaidah-kaidah yang harus diikuti sehingga suatu keputusan menjadi benar dan sahih.
Disamping itu juga dapat dilihat bahwa dalam mempelajari ilmu statistika memerlukan
pengetahuan tentang konsep himpunan (misalnya dalam memahami apa itu sampel dan
pupolasi) serta konsep-konsep peluang atau probabilitas (dalam menghitung resiko
kesalahan ). Sehingga sering sekali dikatakan “bahwa konsep dasar dari Statistika
adalah Himpunan dan Peluang”. Maka dari itu, bukan hal yang aneh pula sebelum
melangkah lebih jauh dalam mempelajari metode-metode statistika perlu juga dikenalkan
konsep-konsep dasar himpunan dan peluang.

Jenis Data Statistika


Ketika data dikumpulkan, baik itu melalui sensus maupun sampling, maka ada berbagai
macam data yang mungkin dapat dikoleksi, misalkan jenis kelamin, pangkat dan lain-lain
yang bersifat kualitatif ataupun misalnya umur, berat badan, tinggi badan dan lain-lain
yang bersifat kuantitatif. Jadi dapat dibayangkan bervariasinya jenis data yang dapat
dikumpulkan.
Berdasarkan Skala pengukuran data dalam statistika dapat dibedakan sebagai berikut :
1. Data kualitatif yaitu data yang bukan berupa angka. Contoh data ini adalah data
jenis kelamin, agama dan lain-lain.

Modul Statistika Dasar Jurusan Matematika-UNUD


3

2. Data Kuantitatif yaitu data yang berupa angka atau bilangan dimana secara rinci
dapat dibedakan lagi menjadi :
 Data dengan Skala Nominal
 Data Skala ordinal
 Skala Interval
 Skala Rasio
Data Kuantitatif dengan skala nominal biasanya berasal dari pengkuantitatifan data
kualitatif. Misalnya data jenis kelamin Laki-laki dikodekan dengan 1 dan perempuan
dengan 0. Dari data ini kita hanya bisa membedakan atau menggolongkan satu data
dengan yang lain tanpa mengandung pengertian urutan. Jadi 0 sebagai kode untuk
perempuan tidak berarti peringkatnya atau urutannya ada di bawah laki-laki yang
dikodekan dengan 1.
Seperti halnya data nominal data dengan skala ordinal biasanya juga pengkuantitatifan
data kualitatif, tetapi dalam skala ordinal ini disamping dapat membedakan juga dapat
dilihat adanya urutan dari masing-masing. Sebagai contoh ketika jenis pangkat dalam
TNI dikuantifikasi maka jika prajurit dikodekan dengan 0 dan perwira dengan 1
misalnya, maka disamping kita dapat membedakan satu anggota populasi dengan yang
lain kita juga tahu urutan atau peringkat dari data tersebut.
Data suhu yang tidak menpunyai titik nol yang pasti adalah salah satu contoh data
dengan skala interval. Tidak adanya titik nol yang tetap merupakan salah satu ciri data
dalam skala ini. Dari data ini disamping dapat membedakan, mengurutkan didalamnya
juga mengandung pengertian jarak antar data.
Data dengan skala paling tinggi adalah data skala rasio. Disamping dapat membedakan,
mengurutkan dan adanya pengertian jarak maka dalam data ini juga adanya pengertian
rasio. Contoh data dari kelompok ini adalah data berat badan, tinggi badan da lain-lain.
Rasio disini dapat dibayangkan bahwa orang yang beratnya 100 kg ketika ditimbang akan
sama dengan orang yang beratnya 50 kg sebangak 2 orang. Sangat berbeda ketika hal ini
dibawa pada data interval. Air yang suhunya 100oC tidak akan sama panasnya dengan 2
kali air yang suhunya 50oC. Pembeda yang lain dari data interval dan rasio adalah
bahwa data skala rasio mempunyai titik nol yang pasti.

Modul Statistika Dasar Jurusan Matematika-UNUD


4

Sedangkan berdasarkan jenis sebaran data maka data dapat dibedakan menjadi Data
Diskret dan Data Kontinu (akan dijelaskan kemudian)
Sangat penting pengguna statistika tahu jenis data ini, karena jenis data juga nanti akan
sangat menentukan dalam hal pemilihan jenis metode statistika yang tepat untuk
pengambilan keputusan. Kesalahan dalam menentukan metode dapat mengakibatkan
ketidak tepatan serta ketidaksahihan pengambilan keputusan.

Ukuran Pemusatan dan Penyebaran Data


Dalam Mengambil keputusan terhadap suatu populasi tentunya ada ukuran-ukuran yang
digunakan untuk hal tersebut. Dalam Statistika pengambilan keputusan terhadap
populasi dapat dilakukan dari aspek kesamaan antar anggota populasinya atau
perbedaannya. Ukuran ini secara statistika disebut ukuran pemusatan yang
mengindikasikan dimana letak persamaan dari populasi tersebut dan ukuran penyebaran
yang lebih mengindikasikan seberapa perbedaan antar anggota populasi.

1. Ukuran Pemusatan
Di Sekolah menengah mungkin anda pernah mengenal istilah modus, median,Kuartil
mean (rataan) baik untuk data tunggal maupun kelompok. Inilah yang dalam ilmu
statistika disebut ukuran pemusatan. Dalam tulisan ini tidak akan dijelaskan secara
sangat rinci tentang hal ini sebab pembaca diharapkan sudah sangat mengenal serta
sudah dapat menghitung dengan baik hal-hal di atas. Sebagai review yang disebut mean
atau rataan untuk data tunggal adalah :
n

X i
X i 1

n
Sedangkan median adalah data yang terletak di tengah ketika data yang didapat
diurutkan. Jadi lokasi median data tunggal mempunyai formula :
n 1
Lokasi Median =
2

Modul Statistika Dasar Jurusan Matematika-UNUD


5

Contoh 1.
Dari pengukuran tinggi badan terhadap 15 mahasiswa Jurusan Matematika didapat data
sebagai berikut : 165,166,170,168,175, 185,176,155,160,163,162,172,177,175,180.
Nilai rataan (mean) dan median data tersebut adalah :
n

X i
165  166  ...  180
X i 1
  169,93
n 15

n  1 15  1
Lokasi Median =  8.
2 2
Jadi Median data adalah data ke-8 setelah diurut yaitu 170

2. Ukuran Penyebaran
Ada berbagai ukuran penyebaran yang dikenal dalam ilmu statistika. Beberapa
diantaranya alasan Jangkauan (range), Jangkauan antar kuartil (Interquartile range),
serta Ragam (variance). Dari semua yang dikenalkan di atas ragam adalah ukuran yang
paling sering digunakan karena lebih mencerminkan gambaran umum kondisi data.
Seperti telah diutarakan di atas data dapat diambil melalui sensus, sehingga data yang
didapat adalah data populasi, dan dapat juga melalui sampling yang hanya menghasikan
data sampel. Sehubungan dengan hal tersebut maka ragam juga dibedakan atas ragam
populasi dan ragam sampel. Adapun definisi dari ragam tersebut adalah :

Definisi 1. Ragam Populasi


Misal x1, x2, x3, ….,xn adalah data dari n populasi dengan maka ragam populasi adalah :
n

(X i  X )2
2  i 1

Definisi 2. Ragam Sampel


Misal x1, x2, x3, ….,xn adalah data dari n sampel dengan maka ragam sampel adalah :

Modul Statistika Dasar Jurusan Matematika-UNUD


6

(X i  X )2
s2  i 1

n 1
Contoh 2.
Dari data contoh 1. tentang tinggi badan mahasiswa, maka dapat dihitung ragamnya
sebagai berikut :
n

(X i  X )2
(165  169,93)2  (166  169,93)2  ...(180  169,93)2
2  i 1
  63,129
n 15
n

(X i  X )2
(165  169,93) 2  (166  169,93) 2  ...(180  169,93) 2
s2  i 1
  67, 6379
n 1 14

Definisi 3. Standar Deviasi dan Koefesien Keraagaman


Misal x1, x2, x3, ….,xn adalah data dari n sampel dengan rataan dan ragam x dan s 2
maka Standar deviasi adalah :

s  s2
dan Koefesien keragaman adalah :
s
CV  (100)
x

Modul Statistika Dasar Jurusan Matematika-UNUD


7

BAB II
DESKRIPTIF STATISTIKA

Ketika data diambil dengan metode sensus, sehingga semua anggota populasi terambil
datanya, maka pengambilan kesimpulan tentang populasi itu sendiri dapat dilakukan
melalui cara deskriptif. Deskriptif Statistika adalah metode statistika dimana keputusan
diambil berdasarkan gambaran umum data melalui peringkasan data baik itu berupa hasil
tabulasi data maupun grafik-grafik. Dari peringkasan data tersebut akan terlihat
bagaimana karateristik populasi baik itu mengenai ukuran pemusatan dan penyebarannya
serta bagaimana bentuk distribusi data tersebut. Disamping itu dari hasil peringkasan data
tersebut dapat juga dilihat ada atau tidaknya data menyimpang (pencilan = outlier).
Di lain fihak ketika data dikoleksi dengan metode sampling, maka keputusan statistika
baru sah jika kesimpulan dilakukan melalui statistika inferensia. Dalam kasus ini
statistika deskriptif hanya dapat digunakan untuk eksplorasi awal dengan tujuan untuk
memeriksa asumsi-asumsi yang ada dalam statistika inferensia. Metode-metode dalam
Statistika Infernsia biasanya melekat dengan asumsi-asumsi yang harus dipenuhi agar
metode tersebut menjadi sah digunakan. Asumsi-asumsi tersebut sebagian besar
berhubungan dengan sebaran data.

Tabel Distribusi : Data Diskret


Seperti telah disinggung sedikit di dalam pembahasan data, berdasarkan sebaran data
berdasarkan distribusinya dapat dibedakan atas data Kontinu dan data Diskret. Data
diskret adalah data yang dapat diasumsikan terhingga jumlahnya (finite) atau jika tak
terhingga maka data tersebut dapat dihitung kemungkinan nilainya (countably infinite).
Sedangkan data kontinu adalah data yang kemungkinannya tidak dapat dihitung
(uncounttably). Ketika dilakukan percobaan pelemparan mata uang sebanyak 10 kali
dan kemudian dicatat jumlah munculnya sisi muka, maka kemungkinan dari jumlah
tersebut adalah 0, 1, 2, 3, ..., 10. Contoh data jumlah ini adalah merupakan data diskret
yang terhingga. Tetapi jika percobaan mata uang ini dilakukan dengan cara bahwa mata
uang dilempar terus sampai muncul sisi muka baru dihentikan, maka nilai kemungkinan
jumlah lemparan adalah 1, 2, 3, 4, .... Jadi kemungkinannya bisa tak terhingga tetapi

Modul Statistika Dasar Jurusan Matematika-UNUD


8

tetap masih mungkin dihitung. Data seperti ini juga data diskret tetapi jumlah
kemungkinan nilainya tak terhingga. Sedangkan contoh data kontinu misalnya adalah
data berat badan (kg), tinggi badan (cm) dan lain-lain yang semuanya mempunyai
kemungkinan nilai tak dapat dihitung yang secara otomatis juga jumlahnya tak terhingga.
Ketika data berupa data diskret maka peringkasan yang sering dilakukan untuk dapat
mempelajari karateristik populasi asal data tersebut dengan cara tabulasi distribusi.
Contoh 1.
Suatu studi dilakukan terhadap mahasiswa peserta OSPEK di Jurusan Matematika setelah
masa ospek selesai. Tujuan dari pengamatan adalah untuk melihat pengaruh secara
mental dan fisik mahasiswa setelah menjalani kegiatan tersebut. Adapun data yang
dikoleksi adalah jenis kelamin (L, P) diagnosa kondisi fisik dan mental (MS = stabil, MI
= Mental kurang baik, PI = fisik kurang baik) serta umur. Hasil studi dapat dilihat pada
tabel 1:
Tabel 1. Data Hasil Pengamatan Terhadap 40 Mahasiswa Peserta OSPEK Jurusan
Matematika
NO JK UMUR DIAGNOSA NO JK UMUR DIAGNOSA
1 L 20 MI 21 P 21 MI
2 L 18 MS 22 L 18 PI
3 P 19 PI 23 P 19 MS
4 L 18 MI 24 L 18 MS
5 P 22 PI 25 L 19 MS
6 P 20 PI 26 P 21 MS
7 P 18 MS 27 P 21 MS
8 P 19 MS 28 P 18 PI
9 L 23 MS 29 P 19 PI
10 L 22 PI 30 L 19 MS
11 P 21 MI 31 P 20 MS
12 L 20 PI 32 P 21 PI
13 L 18 MS 33 L 22 PI
14 P 19 MS 34 L 22 MI
15 P 20 MS 35 L 20 MS
16 P 18 MS 36 P 18 MS
17 L 22 PI 37 P 19 MS
18 P 20 MS 38 P 18 MS
19 P 19 MS 39 L 18 PI
20 L 21 MS 40 P 19 PI

Modul Statistika Dasar Jurusan Matematika-UNUD


9

Dari tabel 1 di atas, untuk melihat pengaruh ospek terhadap hasil diagnosa memtal dan
fisik akan sangat membantu jika dilakukan peringkasan data dengan tabel frekuensi
distribusi seperti tabel 2.
Tabel 2. Frekwensi Distribusi untuk Hasil Diagnosa
DIAGNOSA FREKUENSI FREKUENSI RELATIF
MS 22 22/40 = 0,55 = 55%
MI 5 5/40 = 0,125 = 12,5%
PI 13 13/40 = 0,325 = 32,5 %

Jika Kemudian ingin diamati juga pengaruh ospek terhadap hasil diagnosa untuk masing-
masing jenis kelamin maka dapat dilihat pada tabel 3.
Tabel 3. Frekuensi Distribusi Dua Arah untuk Hasil Diagnosa
DIAGNOSA
JENIS KELAMIN MS MI PI
L 8 3 6
8/17 = 0,47 3/17 = 0,18 6/17 = 0, 35
P 14 2 7
14/23 = 0,61 2/23 = 0.09 7/23 = 0,30

Dari tabel 2 dan 3 di atas dapat disimpulkan bahwa kegiatan ospek masih perlu banyak
perbaikan apalagi kalau dilihat dari faktor fisik. Rata-rata 32,5 % dari peserta mengalami
masalah fisik setelah kegiatan ospek selesai.

Diagram Dahan Daun


Metode statistika diskriptif yang juga sering digunakan untuk mempelajari karateristik
populasi adalah diagram dahan daun. Seperti namanya dahan daun maka dalam diagram
ini dikenal adanya bagian yang merupakan dahan dan juga daun. Diagram ini biasanya
digunakan untuk melihat kondisi umum sebaran data.
Contoh 2.
Suatu data didapat dari pengamatan terhadap gempa di California. Adapun data yang
didapat adalah (pada skala Richter) :

Modul Statistika Dasar Jurusan Matematika-UNUD


10

1,0 1,4 1,9 3,1 2,4 1,4 5,1 4,1


1,2 5,0 2,2 4,1 1,2 2,1 4,0 1,5
2,0 8,3 2,7 6,3 1,1 3,0 1,3
3,3 1,0 2,2 2,3 1,1 7,7 2,1
Dari data tersebut maka dapat dibuat diagram dahan daun dengan mengambil bilangan
bulatnya yaitu 1, 2, 3, 4, 5, 6, 7, dan 8 sebagai dahan dan angka dibelakang koma sebagai
daun. Adapun diagram yang didapat adalah :

11 1 00112234459
(8) 2 01122347
11 3 013
8 4 011
5 5 01
3 6 3
2 7 7
1 8 3

Gambar 1. Diagram dahan daun data gempa bumi di California


Seperti telah disinggung, diagram dahan daun sering digunakan untuk melihat sebaran
data Untuk tujuan tersebut, di dalam membuat diagram atau grafik diperlukan suatu
jumlah dahan yang ideal agar grafik yang dihasilkan cukup memadai untuk dapat
menggambarkan sebaran data. Ketika jangkauan data terlalu besar atau terlalu kecil
maka dahan yang digunakan mungkin tidak representatif jika diambil seperti contoh 1.
Dalam hal ini adakalanya yang digunakan sebagai dahan adalah suatu selang data.

Contoh 2.
Suatu studi terhadap pertumbuhan bayi dilakukan dengan cara mengukur lingkar
kepalanya pada saat lahir. Adapun data yang didapat adalah :
33,1 34,6 34,2 36,1 34,2 35,6
34,5 35,8 34,5 34,2 34,3 35,2
33,7 36,0 34,2 34,7 34,6 34,3
33,4 34,9 33,8 33,6 35,2 34,6
33,7 34,8 33,9 34,7 35,1 34,2
36,5 34,1 34,0 35,1 35,3

Modul Statistika Dasar Jurusan Matematika-UNUD


11

Dari data di atas, untuk membuat diagram dahan daun, jika puluhan 33, 4, 35, 36
dijadikan sebagai satu dahan, tidak akan cukup baik untuk dapat digunakan sebagai acuan
melihat sebaran. Cara yang lebih baik adalah dengan membuat dahannya dalam bentuk
selang, dimana data dengan nilai bulatnya 33, 34, 35, 36 tersebut dibagi 2 dahan Data
yang desimalnya 0, 1, 2, 3, 4 dan yang desimalnya 5, 6, 7, 8, 9 berada pada dahan yang
berbeda. Dari contoh di atas hasil diagram dahan daunnya adalah :

2 33 14
7 33 67789
16 34 012222233
(9) 34 556667789
10 35 11223
5 35 68
3 36 01
1 36 5

Gambar 2. Diagram Dahan Daun Data Lingkar Kepala Bayi


Dari 2 (dua) contoh di atas terlihat bahwa gambaran yang baik sangat ditentukan oleh
jumlah dahan yang digunakan. Untuk mendapatkan dahan yang ideal maka dapat
dilakukan langkah berikut:
1. Data di urut
2. Tentukan Jangkauan data (range) : R
3. Tentukan jumlah kelas atau dahan dengan rumus :
k  1  3,322 log n
4. Tentukan panjang selang kelas atau dahan dengan rumus :
R
i
k
Dalam mempelajari sebaran data, ada tiga kemungkinan yang dapat dilihat.
Kemungkinan tersebut (1) data menjulur ke kiri (2) data menjulur kekanan dan (3) data
menyebar normal. Adapun gambaran dari ketiga kasus di atas adalah :

Modul Statistika Dasar Jurusan Matematika-UNUD


12

(a) (b) (c)

Gambar 3. (a) Menjulur ke kanan (b) Menjulur ke kiri dan (c) Normal
Dari gambar 3 di atas data yang menjulur ke kanan mengindikasikan adanya data yang
merupakan pencilan pada nilai yang besar. Hal sebaliknya berlaku pada kasus menjulur
ke kiri. Diagram contoh 1 di atas adalah contoh kasus menjulur ke kanan. Sedangkan
untuk contoh 2 adalah salah satu contoh data normal (mendekati normal)

Diagram kotak Garis (Box-plot)


Seperti halnya diagram dahan daun, diagram kotak garis ini juga sering digunakan untuk
melihat sebaran data. Kelebihan dari diagram ini adalah dapat digunakan secara
langsung untuk melihat data pencilannya. Digram kotak garis ini, seperti namamya
terdiri dari bagian kotak dan bagian garis. Untuk menggambar digram ini diperlukan
data tentang nilai maksimum data, nilai minimum, median, serta nilai kuartil data.
Gambaran dari diagram kotak garis dapat dilihat pada gambar 4.

Gambar 4. Digram kotak garis.


Dari diagram di atas, ujung garis sebelah kiri menandakan data minimum, dan ujung
kanan data maksimum. Sedangkan kotak dibatasi sebelah kiri oleh Kuartil satu (Q1) dan
Sebelah kanan adalah kuartil tiga (Q3). Garis di tengah kotak adalah median data. Untuk
melihat data pencilan dari diagram ini dilakukan dengan memotong panjang garis di
Q1- 3/2 s atau Q1- 5/2 s dan Q3+ 3/2 s atau Q3+ 5/2 s ( s adalah simpangan deviasi).

Modul Statistika Dasar Jurusan Matematika-UNUD


13

Contoh 3.
Diagram kotak garis dari data contoh 1 dan 2 di atas adalah :

-------------------
--I + I------------------------ *
-------------------
--------+---------+---------+---------+---------+--------
1.5 3.0 4.5 6.0 7.5

Gambar 5. Diagram Kotak garis data contoh 1.

--------------
---------------I + I--------------------
--------------
--+---------+---------+---------+---------+---------+----
32.90 33.60 34.30 35.00 35.70 36.40

Gambar 6. Diagram Kotak garis data contoh 2.

Modul Statistika Dasar Jurusan Matematika-UNUD


14

BAB III
HIMPUNAN DAN PELUANG
(SET AND PROBABILITY)

Statistika Inferensia adalah metode mengambilan keputusan tentang populasi


berdasarkan data sampel. Jelas tentunya dalam hal ini akan terlibat adanya ukuran
keakuratan dari kesimpulan yang diambil. Keakuratan ini, dalam statistika akan dilihat
dari tingkat kesalahan, yang dihitung dengan menggunakan konsep peluang. Sedangkan
untuk mempelajari peluang itu sendiri memerlukan beberapa pengertian tentang konsep
himpunan. Jadi adalah hal yang tidak aneh kemudian jika konsep himpunan dan ilmu
peluang dikatakan sebagai konsep dasar dari statistika.

Himpunan
Definisi 1. Himpunan
Himpunan adalah suatu kumpulan dari individu atau obyek yang mempunyai syarat-
syarat keanggotaan tertentu. Syarat keanggotaan ini sangat penting dalam konsep
himpunan sebab tanpa adanya hal tersebut maka kita tidak dapat menentukan apakah
suatu obyek merupakan anggota dari satu himpunan atau tidak.
Himpunan biasanya dilambangkan dengan huruf besar (Kapital ), misalnya A, B dan lain-
lain. Sedangkan anggota himpunan dilambangkan dengan huruf kecil. Menuliskan suatu
anggota biasanya dibatasi oleh kurung kurawal.
Contoh :
1. A  a, b, c, d 

2. B  x;0  x  1, x 

Himpunan Kosong dan Himpunan Semesta


Definisi 2. Himpunan Kosong
Himpunan Kosong adalah suatu himpunan yang tidak mempunyai anggota. Penulisan
himpunan kosong biasanya adalah   atau  .

Modul Statistika Dasar Jurusan Matematika-UNUD


15

Definisi 3. Himpunan Semesta


Himpunan Semesta adalah himpunan terbesar (Universum) atau semesta dari
pembicaraan himpunan tersebut. Biasanya dilambangkan dengan S aatau U. Himpunan
semesta ini dapat berbeda bagi satu orang dengan orang lain, tergantung batasan yang
diambil ketika seseorang membahas masalah tertentu.

Himpunan Bagian
Jika setiap anggota himpunan A juga merupakan anggota himpunan B maka dikatakan A
sebagai himpunan bagian dari B dan dilambangkan A  B atau A  B . Jika A  B
dan B  A maka dikatakan A = B. Jadi dalam hal ini A dan B mempunyai anggota yang
sama persis.

Operasi Pada Himpunan


1. Gabungan (Union)
Gabungan dari himpunan A dan B yang dilambangkan dengan A  B adalah himpunan
yang anggotanya merupakan anggota dari himpunan A atau B. Pengertian atau dalam hal
ini adalah dapat menjadi anggota A saja, B saja atau keduanya (A dan B).
Contoh :
2. Irisan (Intersection)
Irisan dari himpunan A dan B yang dilambangkan dengan A  B adalah himpunan yang
anggotanya merupakan anggota dari himpunan A dan B. Jadi harus menjadi anggota
kedua himpunan tersebut. Dua himpunan yang mana irisan keduanya adalah himpunan
kosong disebut himpunan yang saling lepas (mutually exclusive)
3. Selisih (difference)
Suatu himpunan yang anggotanya merupakan anggota himpunan A tetapi bukan
merupakan anggota himpunan B disebut selisih dari himpunan A dan B. Operasi ini
dilambangkan sebagai A  B .
4. Komplemen (Complement)
Jika B  A maka A  B disebut komplemen dari B relatif terhadap A dan dilambangkan
sebagai BA' atau BAc . Jika A = S maka S  B disebut komplemen B saja dan disimbulkan

sebagai B ' atau B c .

Modul Statistika Dasar Jurusan Matematika-UNUD


16

Contoh :
s  3, 2, 1,0,1, 2,3

A  3, 1,0,1

B  3, 1,1, 2

maka :
A  B  3, 1,0,1, 2 B  A  2

A  B  3, 1,1 Bc  2,0,3

A  B  0 Ac  2, 2,3

Peluang (Probability)
Sebelum kita mempelajari peluang lebih jauh, ada beberapa istilah yang harus diketahui
dengan jelas sebagai dasar lebih lanjut. Istilah –istilah tersebut adalah Percobaan Acak
(Random Experiment), Ruang Sampel (Sample Space) dan Kejadian (Event)
Percobaan Acak
Percobaan acak adalah suatu percobaan dimana ketika percobaan tersebut diulang maka
hasilnya belum tentu sama dengan percobaan sebelumnya. Misalnya percobaan ketika
sebuah mata uang atau dadu dilempar.
Ruang sampel dan Kejadian
Ruang sampel adalah himpunan yang anggotanya semua kemungkinan yang mungkin
terjadi dari suatu percobaan acak. Sedangkan kejadian adalah himpunan bagian dari
ruang sampel.

Pengertian Peluang
Dalam statistika ada 2 (dua ) konsep yang digunakan sebagai pendekatan untuk
mendefinisikan peluang yaitu :
1. Pendekatan Klasik (Classical Approach)
Pendekatan ini memandang peluang suatu kejadian tertentu adalah banyaknya
kemungkinan dari kejadian tersebut dibagi dengan banyaknya kemungkinan dari
percobaan yang dilakukan. Jadi jika n(A) menyatakan banyaknya kemungkinan kejadian

Modul Statistika Dasar Jurusan Matematika-UNUD


17

A dan n(S) semua kemungkinan yang mungkin terjadi dari suatu percobaan yang
berkaitan dengan kejadian A, maka peluang kejadian A dapat dihitung dengan rumus :
n( A)
P( A) 
n( S )
2. Pendekatan Non-Klasik atau Pendekatan Frekuensi (Frequency Approach)
Pendekatan ini didasarkan pada kondisi dimana ketika suatu percobaan dilakukan
sebanyak n kali (n besar). Dari percobaan tersebut kemudian dihitung jumlah terjadinya
suatu kejadian A. (misalkan jumlahnya p). Maka peluang kejadian A adalah :
p
P ( A) 
n
Aksioma Peluang
Sebelum kita mempelajari peluang lebih jauh maka perlu diketahui beberapa kaidah dasar
peluang (Aksioma) yang nantinya dipakai sebagai landasan awal mempelajari peluang
selanjutnya. Jika A adalah himpunan dari kejadian A dan S adalah Himpunan semesta
atau ruang sampel dari suatu percobaan (himpunan dari semua kemungkinan suatu
percobaan), maka aksioma peluang adalah :
1. P( A)  0
2. P( S )  1
3. Jika A1 , A2 , A3 ,... An adalah kejadian yang saling lepas maka :

P( A1  A2  A3 ...  An )  P( A1 )  P( A2 )  P( A3 )  ...  P( An )
Dari aksioma ini kemudian dapat diturunkan bererapa teorema peluang yang sangat
penting dalam mempelajari peluang. Adapun teorema-teorema tersebut adalah :
1. Jika A  B maka P( A)  P( B) dan P( B)  P( A)  0
2. P ()  0
3. 0  P( A)  1
4. P( A  B)  P( A)  P( B)  P( A  B)
Peluang Bersyarat
Sebagai ilustrasi sebelum didefinisikan tentang peluang bersyarat, mari kita simak
percobaan dalam ilustrasi 1 berikut :

Modul Statistika Dasar Jurusan Matematika-UNUD


18

Ilustrasi 1.
Suatu kotak berisi 5 bola merah, 4 bola putih dan 3 bola biru. Kemudian dua bola
diambil satu persatu tanpa pengembalian (jadi bola pertama diambil tidak dikembalikan
ke kotak). Kemudian ingin diketahui berapa peluang terambil bola merah pada
pengambilan kedua?
Dari percobaan tersebut, maka sangat jelas bahwa untuk mengetahui peluang merah pada
pengambilan kedua memerlukan pengetahuan tentang kondisi pengambilan yang
pertama. Sebab jika yang pertama terambil merah misalkan akan berbeda kondisinya
dengan jika yang pertama terambil biru atau putih. Inilah ilustrasi penggunaan apa yang
disebut peluang bersyarat.
Definisi 1. Peluang Bersyarat
Ketika dua kejadian A dan B terjadi berurutan maka yang disebut peluang B dengan
syarat A telah terjadi ( P( B | A) ) adalah :
P( B  A)
P( B | A)  ........................................................................................(1)
P( A)
Dari definisi di atas dapat diturunkan bahwa :
P( B  A)  P( B | A).P( A) .................................................................................(2)
Jika kemudian dari kondisi di atas P( B | A)  P( B) maka (2) akan menjadi :
P( B  A)  P( B).P ( A) ......................................................................................(3)
Dua kejadianA dan B berurutan sedemikian sehingga
P( B  A)  P( B | A) P( A)  P( B) P( A)
disebut kejadian saling bebas .
Contoh 1.
Perhatikan kembali percobaan dari ilustrasi 1. di atas.
Jika P(M2|M1) , P(M2|P1) dan P(M2|B1) secara berturut-turut adalah peluang terambilnya
bola merah pada pengambilan kedua dengan syarat pada pengambilan pertama adalah
merah, putih dan biru maka :
4 5 5
P( M 2 | M 1 )  ; P( M 2 | P1 )  dan P ( M 2 | B1 ) 
11 11 11

Modul Statistika Dasar Jurusan Matematika-UNUD


19

Sehingga kemudian didapat :

P( M 2 )  P(M 2  M1 )  P(M 2  P1 )  P(M 2  B1 )

= P(M 2 | M1 ) P(M1 )  P(M 2 | P1 ) P( P1 )  P(M 2 | B1 ) P( B1 )

Contoh 2.
Perhatikan kembali ilustrasi 1. di atas. Sering sekali dalam kasus seperti ilustrasi di atas
pertanyaan yang dibuat adalah misalnya berapa peluang yang pertama merah jika yang
kedua merah ( P(M1 | M 2 ) ). Ini dimungkinkan jika misalkan bola yang diambil pertama
disembunyikan sehingga kita tidak tahu warnanya, kemudian baru dilakukan
pengambilan kedua dan diketahui warnanya merah.
Berdasarkan (1) maka:
P( M 1  M 2 ) P(M 2 M 1 ) P(M 1 )
P( M 1 | M 2 )  
P( M 2 ) P( M 2 )

Berdasarkan (2) dan contoh 1. kemudian didapat


P(M1  M 2 )  P(M 2 | M1 ) P(M1 )  20 /132
P(M 2 )  55/132
sehinggga akhirnya didapat
P( M 1  M 2 ) 20 /132
P( M 1 | M 2 )    20 / 55
P( M 2 ) 55 /132
Definisi 2. Aturan Bayes
Dari dua kejadian A dan B berurutan di mana P( B | A) diketahui maka :

P( B | A) P( A)
P( A | B) 
P( B)
disebut Aturan Bayes
Permutasi dan Kombinasi
Ketika melakukan perhitungan peluang seringkali dalam praktek lebih jauh dibutuhkan
pemahamam tentang prinsip permutasi dan kombinasi.

Modul Statistika Dasar Jurusan Matematika-UNUD


20

1. Permutasi
Permutasi adalah prinsip mengenai cara penyusunan obyek dengan memperhatikan
susunan obyek tersebut.

Contoh 3.
Ingin diketahui ada berapa cara susunan huruf yang berbeda dapat dibuat dari kata BASI
yang terdiri dari 4 huruf yang berbeda. Contoh ini adalah salah satu ilustrasi permutasi.
Dari kata BASI, jika kita perhatikan dapat dibuat susunan huruf sebanyak 24 sebagai
berikut :
BASI ABIS SIBA IABS
BAIS ABIS SIAB IASB
BIAS AIBS SAIB IBSA
BISA AISB SABI IBAS
BSAI ASIB SBIA ISBA
BSIA ASBI SBAI ISAB
Angka 24 didapat dari pengertian permutasi 4 atau biasa ditulis P44 = 4! = 4 x 3 x 2 x 1
Definisi 3.1. Permutasi
Permutasi n dari n obyek yang berbeda adalah :
Pnn  n !  n  (n  1)  (n  2)  ...... 1

ingat : 0!=1
Sedangkan permutasi q obyek dari n obyek yang berbeda adalah:
n!
Pqn 
(n  q)!
Contoh 4.
Ada berapa kemungkinan susunan huruf yang berbeda dapat dibuat dari kata BABI. Jika
kita senarai maka akan didapat kemungkinan sebagai berikut :
BBAI AIBB
BBIA ABBI
BIAB ABIB
BIBA IABB
BABI IBAB

Modul Statistika Dasar Jurusan Matematika-UNUD


21

BAIB IBBA
4!
Ternyata dari hasil senarai didapat  12 cara yang dapat diturunkan dari formula
2!
berdasarkan definisi 3.2 berikut.
Definisi 3.2. permutasi n dari n obyek dimana ada r obyek yang sama.
Jika ada n obyek dengan r obyek yang sama, maka permutasi adalah:
n!
Pnn r 
r!
2. Kombinasi
Kombinasi adalah prinsip mengenai cara penyusunan obyek dengan tanpa
memperhatikan susunan obyek tersebut. Contoh Ilustrasi dari penggunaan prinsip
kombinasi adalah ketika kita ingin memilih kemungkinan susunan pasangan yang dari
beberapa orang yang ada. Jelas disini bahwa ketika yang terpilih adalah si A dan si B
maka kita tidak membedakan AB dan BA karena itu adalah pasangan yang sama.

Definisi 4. Kombinasi
Kombinasi r obyek dari n obyek adalah :
n n!
Crn    
 r  r !(n  r )!
Contoh 5.
Tentukan jumlah cara yang dapat dibuat untuk memilih pasangan yang berbeda dari lima
orang yang disediakan. (1) dengan cara menyenaraikan pasangan yang ada (2) dengan
formula yang diberikan.

Jawab
(1) Misalkan lima orang tersebut adalah A, B, C, D, E. Maka pasangan yang dapat
dibuat adalah : (A;B), (A;C), (A;D), (A;E), (B;C), (B;D); (B;E), (C;D), (C;E) dan
(D;E). Jadi ada 10 pasangan yang berbeda dapat dibentuk.
5 5! 5!
(2) C25       10
 2  2!(5  2)! 2!3!

Modul Statistika Dasar Jurusan Matematika-UNUD


22

Contoh 6.
Dalam suatu kotak terdapat 4 bola merah dan 2 bola biru. Kemudian dari kotak tersebut
diambil 2 bola berapa peluang :
 keduanya adalah bola merah
 keduanya biru
 berbeda warna (satu merah dan satu biru)
 bukan merah keduanya (asal bukan merah kedua bola tersebut)

Jawab
 4  2 
  
P(2 M )     
2 0 6

6 15
 
 2

 4 2
  
P (2 B)      
0 2 1

6 15
 
 2

 4  2 
  
P(1M 1B)     
1 1 (4)(2) 8
 
6 15 15
 
 2
 P(bukan keduanya merah)  P(2 B)  P(1M 1B)  1/15  8 /15  9 /15 atau
1  P(2M )  1  6 /15  9 /15

Peubah Acak
Pengertian peubah acak adalah sesuatu yang sangat penting dalam statistika, terutama
dalam konsep peluang dan sebarannya. Peubah acak adalah suatu fungsi yang
memetakan setiap anggota ruang contoh dari suatu percobaan ke bilangan Real.
Sebagai ilustrasi tentang peubah acak ini, dapat diperhatikan percobaan pelemparan mata
uang sebanyak dua kali. Dari percobaan ini, ruang contohnya adalah
MM , MB, BM , BB . Kemudian jika definisikan X adalah jumlah munculnya sisi muka

Modul Statistika Dasar Jurusan Matematika-UNUD


23

(M) maka X  0,1, 2 . Dalam hal ini X adalah salah satu peubah acak yang dapat dibuat

dari percobaan tersebut. Peubah acak lainnya misalnya adalah Y, dimana Y menyatakan
jumlah munculnya sisi belakang (B).

Distribusi Peubah Acak


Peubah Acak Diskret
Seperti telah disinggung, peubah acak adalah fungsi atau pemetaan dari ruang contoh ke
bilangan Real. Jelas tergambar bahwa masing-masing nilai dari peubah acak mewakili
suatu kejadian yang tentunya memiliki peluang untuk terjadi. Misal X adalah munculnya
sisi belakang dari dua kali pelemparan mata uang, maka X = 0 adalah merupakan
pemetaan dari kejadian MM, yang mana P(MM) = 1/4 . Selanjutnya secara lengkap
dapat Dibentuk suatu fungsi dari nilai peluang untuk peubah acak X sebagai berikut :
1/ 4, x  0

f ( x)  P( X  x)  1/ 2, x  1 ......................................................................................(1)
1/ 4, x  2

fungsi (1) di atas disebut fungsi kepekatan peluang (density probability function) atau
disebut juga fungsi peluang saja.
Jika diingat kembali tentang data, menurut sebarannya dikenal data diskret dan data
kontinu. Dan telah dijelaskan bahwa percobaan pelemparan mata uang seperti di atas
menghasilkan data diskret. Selanjutnya untuk peubah acak seperti ini disebut peubah
acak diskret.
Berbeda dengan fungsi secara umum, jika diperhatikan dengan seksama, maka fungsi
peluang di atas mempunyai beberapa sifat khusus yang tidak dimiliki oleh setiap fungsi
yaitu :
1. f ( x)  0

2.  f ( x)  1
x

Peubah Acak Kontinu


Seperti halnya peubah acak diskret yang merupakan hasil dari percobaan yang
menghasilkan data diskret, maka peubah acak kontinu adalah peubah acak yang
dihasilkan dari suatu percobaan yang menghasilkan data kontinu. Dan selanjutnya peubah

Modul Statistika Dasar Jurusan Matematika-UNUD


24

acak kontinu ini juga mempunyai fungsi peluang yang bersifat identik dengan fungsi
peluang peubah acak diskret. Adapun sifat dari peubah acak kontinu adalah :
1. f ( x)  1

2. 
x 
f ( x)dx  1

Perbedaan yang prinsip dari fungsi peubah acak diskret dan kontinu adalah bahwa pada
peubah acak kontinu peluang dari suatu titik adalah 0. Maksud dari kalimat tersebut
adalah bahwa f ( x)  0, untuk x  c . Hal ni jelas sangat berbeda dengan kasus pada
peubah acak diskret dimana P ( X  c) masih mungkin tidak bernilai 0. Sebagai ilustrasi
dapat dilihat dari contoh pelemparan mata uang di atas, P(X = 0) = 1/4. Hal tersebut
juga dapat dijelaskan lebih jauh dengan memperhatikan bahwa pada peubah acak kontinu
b
P(a  X  b) didefinisikan sebagai P (a  X  b)   f ( x)dx . Sehingga jelaslah bahwa
a

c
f (c)  P( X  c)  P(c  x  c)   f ( x)dx  0 .
c

Distribusi Binomial
Perhatikan suatu percobaan acak berupa pelemparan mata uang sebanyak n kali. Dari
percobaan tersebut dapat kita perhatikan bahwa :
1. Jumlah percobaan terbatas (sebanyak n)
2. kejadian yang terjadi dapat dikotomi menjadi 2 yaitu munculnya sisi muka dan
munculnya sisi belakang . Atau secara umum jika peubah acak yang kita bentuk
adalah munculnya sisi muka (M) maka kejadiannya dapat dikotomi menjadi
“sukses”(jika muncul sisi muka) dan “gagal”(jika muncul sisi belakang).
3. Peluang sukses pada pelemparan pertama, kedua dan pelemparan berikutnya
tidak berubah (kejadian saling bebas).
Percobaan seperti ini disebut dengan percobaan yang berdistribusi binomial yang
merupakan salah satu contoh distribusi dari peubah acak diskret. Dan jika n = 1 disebut
percobaan Bernoulli.
Percobaan Binomial ini secara umum mempunyai fungsi peluang sebagai berikut :

Modul Statistika Dasar Jurusan Matematika-UNUD


25

n
f ( x)  P( X  x)    p x q n  x ; x  0,1, 2..., n dimana p adalah peluang sukses dan
 x
q = (1-p) adalah peluang gagal.

Contoh 1.
Sebuah dadu dilempar sebanyak 5 kali. Jika X adalah jumlah munculnya mata dadu
1(satu). Tentukanlah peluang (a) P(X = 2) (b) P(X ≤ 2).
Jawab
Percobaan di atas dapat dipandang sebagai percobaan binomial dengan p (peluang
sukses) adalah peluang munculnya mata dadu satu untuk setiap kali pelemparan dan q
(peluang gagal) adalah peluang munculnya bukan mata dadu satu. Jadi p =1/6 dan
q = 5/6.
5
(a) f (2)  P( X  2)    p 2 q 3
 2
5!
= (1/ 6) 2 (5 / 6)3
2!3!
= 1250/7776
= 0,161
(b) P( X  2)  P( X  0)  P( X  1)  P( X  2)

 5  5  5
=   (1/ 6)0 (5 / 6)5    (1/ 6)1 (5 / 6) 4    (1/ 6) 2 (5 / 6) 3
 0 1  2
= 3125/1776 +3125/1776 + 1250/7776 = 0.965
Distribusi Normal
Distribusi normal adalah salah satu contoh dari peubah acak kontinu. Distribusi ini
sangat penting dalam statistika. Hampir semua metode statistika parametrik dalam ilmu
statistika mengunakan distribusi ini sebagai salah satu asumsi. Peubah acak dengan
distribusi normal ini mempunyai fungsi peluang sebagai berikut :
1 X  2
1  ( )
f ( x)  e 2  ; dimana  dan  2 adalah ratan dan ragam dari X
 2
Dari fungsi distribusi tersebut jika ingin dihitung P(a  X  b) maka :

Modul Statistika Dasar Jurusan Matematika-UNUD


26

b
P (a  X  b)   f ( x)dx
a

b 1 X 
1  ( )2
= e 2 
dx
a  2
Secara matematika perhitungan di atas cukup sulit bagi sebagian besar orang, sehingga
selanjutnya diberikan bantuan lain untuk mempermudah perhitungan di atas dengan
menggunakan tabel distribusi normal baku (tabel A.1).
Untuk dapat menggunakan tabel tersebut maka perlu dilakukan pembakuan terhadap X
dengan cara :
X 
Z

sehingga Z adalah seuatu peubah acak baru dengan ratan 0 dan ragam 1 dan disebut
peubah acak normal baku.
Contoh 2.
Dari populasi mahasiswa jurusan biologi diketahui rataan dan ragam tinggi badannya
adalah 167 cm dan 100. Jika seorang mahasiswa diambil secara acak, tentukanlah
peluang tinggi badannya (a) terletak antara 165 cm s/d 170 cm (b) lebih besar daripada
180 cm.
Jawab
165  167 X   170  167
(a) P(165<X<170) = P(   )
10  10
= P(-0,2 < Z < 0,3)
Dengan menggunakan tabel A.1 maka dilakukan modifikasi sebagai berikut :
P( -0,2 < Z < 0, 3) = P( -0.2 < Z < 0 ) + P(0 <Z<0,3)
= P(0 < Z < 0,2 ) + P(0<Z<0,3) (karena Distribusi Z simetris terhadap
titik 0)
= 0,0793 + 0,1179
= 0,1972
(b) P(X>180) = P(Z>1,3) = P(Z>0) – P((0 <Z< 1, 3)
= 0,5 – 0, 4032 = 0,0968

Modul Statistika Dasar Jurusan Matematika-UNUD


27

Distribusi Rataan Sampel


Pada statistika inferensia, kesimpulan tentang populasi dilakukan melalui sampel yang
diambil. Kesimpulan biasanya dilakukan dengan mempelajari ukuran pemusatan dan
penyebaran data. Salah satu metode yang banyak digunakan adalah melalui pengamatan
terhadap rataan sampel. Agar kesimpulan kemudian memjadi sah atau valid, maka sangat
penting diketahui tentang distribusi rataan tersebut.
Teorema 1.
Misalkan sejumlah sampel diambil dari suatu populasi yang menyebar normal dengan
rataan µ dan ragam  2 , maka pembakuan dari peubah X (rataan sampel) yaitu :
X 
Z
 n
mempunyai sebaran mendekati normal dengan rataan 0 dan ragam 1.
Jika ragam populasi  2 tidak diketahui maka pembakuan di atas menjadi :
X 
T , dimana s adalah simpangan baku dari sampel.
 n
Peubah T di atas mempunyai sebaran t student(Student’s t distribution) atau disebut
sebaran t saja dengan derajat bebas (n-1).
Contoh 1.
Misalkan dari populasi masahiswa Universitas Udayana yang rataan tinggi badannya
adalah 68 inci dan ragamnya 9 inci serta menyebar normal, diambil sampel sebanyak 25
orang. Tentukan peluang bahwa rataan sampel ( X ) (a) terletak antara 66,8 s/d 68,3 (b)
kurang dari 66,4.
Jawab
66,8  68 68,3  68
(a) P(66,8  X  68,3)  P( Z )
3 / 25 3 / 25
= P (2  Z  0,5)
menggunakan tabel A.1. maka persamaan di atas menjadi :
= P(2  Z  0)  P(0  Z  0,5)
dengan mengingat bahwa sebaran normal baku simetrik terhadap 0 maka persamaan
tersebut menjadi :

Modul Statistika Dasar Jurusan Matematika-UNUD


28

= P(0  Z  2)  P(0  Z  0,5)


= 0,4772 + 0,1915 = 0,6687

Modul Statistika Dasar Jurusan Matematika-UNUD


29

BAB IV
PENGUJIAN HIPOTESIS I
Dalam suatu penelitian, ukuran-ukuran dalam populasi tidak selalu diketahui. Ukuran –
ukutan inilah yang justru akan kita cari atau simpulkan berdasarkan ukuran yang kita
dapat dari sampel. Jadi ketika hal ini yang kita hadapi, maka yang akan kita lakukan
adalah apa yang disebut dengan pengujian hipotesis. Jadi dari literatur atau pengalaman
terdahulu kita membuat suatu hipotesis terhadap besaran dalam pupulasi, kemudian dari
data yang kita dapat dari sampel dilakukan pengujian terhadap hipotesis yang dibuat.
Agar kemudian kesimpulan dapat dipercaya, maka kaidah kaidah pengujian hipotesis,
seperti asumsi sebaran harus dipenuhi.

Hipotesis Statistika
Hipotesis atau hipotesa dalam statistika adalah anggapan atau asumsi-asumsi yang
dibuat terhadap populasi. Asumsi ini pada umumnya tentang ukuran pemusatan dan
penyebaran data. Misalkan rataan kandungan logam pada aliran sungai Badung
diperkirakan sama dengan a ppm. Tentunya hipotesis tersebut dapat bernilai benar dapat
juga bernilai salah.
Dalam statistika hipotesis dibedakan menjadi dua (2) yaitu Hipotesis nol (Null
Hypothesis) yang biasanya dilambangkan dengan H 0 dan Hipotesis Alternatif

(Alternative Hypothesis) yang dilambangkan dengan H1 . Secara umum dalam statistika


hipotesis nol adalah hipotesis yang dibuat dengan tujuan untuk ditolak.

Kesalahan Jenis I dan II


Sebelum kita membahas tentang metode yang digunakan dalam pengujian hipotesis,
maka sangat penting untuk mamahami konsep-konsep penting yang dibutuhkan dalam
mempelajari masalah tersebut. Kesalahan Jenis I adalah kesalahan yang dibuat ketika
H 0 ditolak (dianggap salah ) padahal kenyataannya H 0 benar (seharusnya diterima).

Sedangkan Kesalahan Jenis II adalah kesalahan yang dibuat ketika kita menerima H 0
yang seharusnya ditolak. Dalam konsep peluang kesalahan ini dituliskan sebagai
peluang bersyarat berikut:

Modul Statistika Dasar Jurusan Matematika-UNUD


30

Kesalahan Jenis I = P(tolak H0 H0 Benar )

Kesalahan Jenis II = P(terima H0 H0 salah)

Dalam pengertian statistika kesalahan jenis I disebut juga sebagai taraf nyata (level
significance) yang secara pengertian umum menunjukkan kesalahan maksimum yang
boleh dibuat ketika kita mengambil kesimpulam menolak H 0 dan biasanya besarnya
dilambangkan dengan α. Kesalahan jenis II dilambangkan dengan β dan besaran (1- β)
disebut kekuatan uji (power of test) .
Berdasarkan pengertian hipotesis, dimana H 0 dibuat untuk ditolak maka jelas bahwa

kecendrungan suatu penelitian diarahkan untuk menolak H 0 . Sehingga kesalahan yang


umumnya dibuat adalah kesalahan jenis I (α) . Karena hal tersebut maka dalam suatu
penelitian yang sangat diperhatikan adalah kesalahan jenis ini.

Pengujian Hipotesis terhadap Rataan (Mean) Satu Populasi


Dari suatu populasi berukuran N diambil n sampel dimana n <<< N. Dari peristiwa
tersebut, jika ingin dilakukan penarikan kesimpulan mengenai populasi melalui sampel ,
maka dapat dilakukan apa yang disebut pengujian hipotesis. Karena populasi yang ingin
dipelajari hanya satu maka disebut pengujian hipotesis satu populasi. Dari kasus di atas
dapat dibuat hipotesis sebagai berikut :
H0 :   a
............................................................................................................1
H1 :   a
yang disebut hipotesis dua arah.
Atau
H0 :   a
.............................................................................................2
H1 :   a atau   a
yang disebut hipotesis satu arah.
Kata dua arah ini didasarkan oleh kenyataan dari tanda (  ) dapat berarti < atau >.
Jika diasumsikan populasi menyebar normal dan ragam populasi (  2 ) diketahui, maka
statistik uji (Test statistics) dari kasus di atas adalah :
X a
Z hit 
/ n

Modul Statistika Dasar Jurusan Matematika-UNUD


31

Jika α (Kesalahan jenis I = Kesalahan maksimum yang berani ditanggung atau boleh
dibuat ) diberikan , maka kesimpulan yang ditarik adalah tolak H0 jika :
 Zhit  Ztab( / 2) untuk bentuk hipotesis menurut (1)

 Zhit  Ztab ( ) untuk bentuk hipotesis menurut (2)

dimana Ztab diambil dari tabel normal baku (tabel A.1)


Jika dari populasi tidak ada informasi tentang  2 atau ragam populasitidak diketahui,
maka statistik ujinya adalah :
X a
thit  ; dimana s adalah simpangan baku dari data sampel .
s/ n
Kesimpulannya adalah tolak H0 jika :
 thit  ttab( / 2,n1) untuk bentuk hipotesis menurut (1)

 thit  ttab ( ;n1) untuk bentuk hipotesis menurut (2)

dimana ttab diambil dari tabel sebaran t (tabel A.2) dan (n-1) disebut derajat bebas

Contoh 1.
Suatu penelitian dilakukan untuk melihat kandungan polutan dalam bentuk nitrogen dari
air sungai yang dicemari limbah suatu peternakan babi . 10 sampel air diambil secara
acak dari sungai. Data hasil pengamatan dapat dlihat pada tabel 1.
Tabel 1. Data Pengamatan Jumlah Kandungan Nitrogen Dalam Air Sungai (pounds/hari)
No Sampel Kandungan Nitrigen No sampel Kandungan Nitrogen
1 4.9 6 5.0
2 5.8 7 5.6
3 5.9 8 6.0
4 6.5 9 5.7
5 5.5 19 5.5

Jika diketahui ambang batas dari kandungan nitrogen adalah 5 pounds/hari. Ujilah
apakah pencemaran tersebut sudah melebihi ambang batas yang ditentukan. Asumsikan
data berasal dari populasi normal.

Modul Statistika Dasar Jurusan Matematika-UNUD


32

Jawab
Dari percobaan tersebut di atas maka hipotesisnya adalah :
H0 :   5
H1 :   5
statistik ujinya adalah :
X a
thit 
s/ n
dengan s didapat dari
n

(X i  X )2
s2  i 1

n 1
dari data di atas didapat X = 5,64 sehingga
n

(X i  X )2
(4,9  5, 64) 2  (5,8  5, 64) 2  ...  (5,5  5, 64) 2
s2  i 1

n 1 9
= 0,218
s= 0, 218  0, 467

Jadi dari hasil tersebut didapat :


5, 64  5
thit  = 4,33
0, 467 / 10
Jika kemudian diambil α = 0,05 atau 5% maka dari tabel A.2 didapat ttab(0,05;9) = 1,83.
Kesimpulannya adalah Tolak H0 karena thit  ttab ( ;n1) . Artinya limbah nitrogen yang

dihasilkan oleh peternakan tersebut sudah melebihi ambang batas.

Modul Statistika Dasar Jurusan Matematika-UNUD


33

BAB V
PENGUJIAN HIPOTESIS II

Pengujian Hipotesis Beda Rataan Dua Popoulasi

Pada pengujian hipotesis terdahulu sudah dibahas mengenai rataan satu populasi. Sering
sekali di dalam masalah pengujian hipotesis kita dihadapkan pada kasus dimana kita
harus membandingkan pengaruh dua perlakuan yang berbeda terhadap suatu respon.
Misalnya jika dari suatui populasi diambil sejumlah sampel (sebanyak n) dan kemudian
sebagian diantaranya (sebanyak n1) diberi perlakuan A dan sebagian lagi (sebanyak n2)
diberikan perlakuan B. Kemudian dari kedua kasus diukur suatu respon untuk melihat
apakah ada perbedaan pengaruh antara perlakuan A dan B terhadap respon. Contoh lain
adalah misalkan dari n sampel penderita tekanan darah tinggi pada saat awal (sebelum
diberi obat ) diperiksa tekanan darahnya. Kemudian diberikan obat penurun tekana darah
dan seminggu lagi diukur lagi tekanan darahnya. Dari masalah ini ingin diketahui apakah
obat yang diberikan efektif tidak dalam menurunkan tekanan darah penderita seminggu
setelah diberi obat.
Kedua contoh di atas adalah suatu kasus dari apa yang kita sebut uji hipotesis dua
populasi .
Jika diperhatikan dengan seksama , pada contoh pertama terlihat bahwa individu sampel
yang diberi perlakuan A dan B berbeda. Sedangkan pada kasus kedua sampel untuk data
tekana darah sebelum dan sesudah diberikan obat adalah individu yang sama. Dalam hal
ini jelas kita harus membedakan kedua kasus ini dalam hal analisis karena dalam hal ini
ada masalah kebebasan yang terlibat.
Untuk lebih jelasnya akan diterangkan pada pembahasan berikutnya.

Uji Hipotesis Beda Rataan untuk Dua Populasi Saling Bebas.


Dari suatu populasi tanaman padi diambil sampel sebanyak n1 dan n2 (n1 dan n2 tidak
harus sama). Kemudian n1 sampel pertama diberikan diberikan perlakuan Zat tumbuh A
dan n2 sampel kedua diberikan Zat Tumbuh B. Kemudian setelah panen dicatat produksi
gabah dari masing-masing. Ingin diketahui apakah Zat tumbuh yang berbeda

Modul Statistika Dasar Jurusan Matematika-UNUD


34

memberikan produksi gabah yang berbeda atau tidak?. Dalam kasus ini jika ditabulasi
hasil pengamatannya dapat disajikan sebagai berikut :
Tabel 1. Tabulasi Data Hasil Pengamatan terhadap Produksi Gabah Akibat Perlakuan
Zat Tumbuh yang Berbeda.
Zat Tumbuh A (X1) Zat Tumbuh B (X2)
X11 X21
X12 X22
X13 X23
. .
. .
. .
X1n1 X2n2

Percobaan seperti di atas disebut percobaan dua populasi yang bebas (independence),
karena dapat diperhatikan bahwa data X1i tidak ada kaitannya dengan X2i .
Untuk kasus seperti ini uji hipotesis yang digunakan untuk menganalisis data hasil
percobaan adalah Uji Hipotesis Beda Rataan Dua Populasi Bebas.
Metode pengujian hipotesis ini dilakukan berdasarkan hipotesis statistika berikut :
H 0 : 1  2

H1 : 1  2
Kemudian untuk pengujiannya secara umum dibedakan menjadi dua kasus yaitu (1)
12 dan  22 diketahui dan (2) 12 dan  22 tidak diketahui.

Kasus 1.  12 dan  22 diketahui

Ketika kita mempunyai informasi tentang  12 dan  22 , biasanya dari penelitian terdahulu
maka statistik uji dari masalah di atas adalah:
X1  X 2
Z hit  ……………………………………………………………….(1)
 x x
1 2

 12  22
dimana  x1  x2  
n1 n2

Modul Statistika Dasar Jurusan Matematika-UNUD


35

Statistik uji (1) di atas mempunyai sebaran Normal Baku. Sehingga untuk pengambilan
keputusan maka harus dibandingkan dengan Z tab dari sebaran normal baku dengan α
yang diinginkan.
Keputusan tolak H0, yang artinya bahwa ada perbedaan pengaruh antara perlakuan A dan
B terhadap respon, diambil jika Z hit  Ztab .

Kasus 2.  12 dan  22 tidak diketahui.

Jika tidak ada infoermasi apa-apa tentang  12 dan  22 maka sebagai penduganya

digunakan ragam dari sampel yaitu s12 dan s22 dan statistik ujinya menjadi :

X1  X 2
thit  ………………………………………………………………..(2)
sx1  x2

dimana :

1 1 (n1  1) s12  (n2  1) s22


(i) sx1  x2 = sgab  dengan s 2
 jika diasumsikan 12 =  22 .
n1  n2  2
gab
n1 n2

dan

s12 s22
(ii) jika asumsinya adalah  12   22 maka sx1  x2 = 
n1 n2

Statistik uji (2) di atas mempunyai sebaran t (student’s t) dengan α tertentu dan derajat
bebas (db) = n1  n2  2 jika kondisi (i) dipenuhi .

s n1  s22 n2 
2 2

serta derajat bebas atau db 


1
juka kondisinya
 s 2 n 2 /  n  1    s 2 n 2 /  n  1 
 1 1 1
  2 2 2

adalah (ii).
Seperti halnya yang lain keputusan tolak H0 diambil jika thit  ttab

Modul Statistika Dasar Jurusan Matematika-UNUD


36

BAB VI
PENGUJIAN HIPOTESIS III

Pengujian Hipotesis Dua Populasi Tidak Bebas (Beda Berpasangan =Paired test)

Ketika berbicara dua populasi, maka seperti telah dibicarakan di awal, kita harus
memperhatikan adanya kemungkinan bahwa dua populasi tersebut tidak saling bebas.
Artinya, bahwa data obyek yang dihasilkan pada satu populasi tergantung dari data dari
obyek tersebut pada populasi lainya. Sebagai ilustrasi adalah ketika kita mengukur
tekanan darah seorang pasien pengidap tekanan darah tinggi setelah diberi obat penurun
tekanan darah. Untuk mengatakan bahwa obat tersebut manjur menurunkan tentunya
harus dilihat record atau data tekanan darah orang tersebut sebelum diberi obat. Jadi data
tekanan darah ini kalau diamati lebih seksama, maka untuk melihat apakah obat tersebut
baik atau tidak harus diamati secara berpasangan atau dalam hal ini data awal si A
haruslah dibandingkan dengan data si A setelah diberi obat. Tdak mungkin kita
membandingkannya secara silang. Dalam ksus seperti ini kita dihadapkan dengan apa
yang disebut uji beda berpasangan.
Mari kembali dilihat kasus tekanan darah di atas dan misalkan data yang didapat dari
hasil pemeriksaan pasien seperti pada tabel 1.
Tabel 1. Data Tekanan Darah Pasien Hipertensi
no Data tekanan darah Data tekanan darah setelah
sebelum minum obat (X1) minum obat (X2)
1 X11 X21
2 X12 X22
3 X13 X23
4 X14 X24
. . .
. . .
. . .
n X1n X2n

Modul Statistika Dasar Jurusan Matematika-UNUD


37

Dari data di atas, pada kasus populasi bebas kita melakukan uji dengan statistik uji yang
melibatkan rataan kedua populasi. Tetapi karena kedua populasi di atas tidak bebas maka
statistik uji seperti tersebut di atas sudah tidak valid lagi, maka dalam hal ini statistik
ujinya haruslah mencerminkan bahwa data yang dihasikan adalah data beda berpasangan.
Jika kita amati lagi, hipotesis dari uji untuk dua populasi saling bebas adalah :
H 0 : 1   2
H1 : 1   2
Pada kasus populasi yang tidak bebas maka hipotesis di atas sedikit dimodifikasi
menjadi:

H0 : d  0
H1 : d  0

dimana di  X 2i  X 1i .
Adapun statistik uji dari beda berpasangan ini adalah :
d
thit 
sd
n n

 di s  (d i  d )2
dimana d  i 1
dan sd  d dengan sd2  i 1

n n n 1

Keputusan yang diambil dari uji ini adalah tolak H0 jika thit  ttab . Nilai ttab diambil dari

tabel sebaran t (A.2) dengan α sesuai dengan yang diinginkan dan derajat bebas (db) n-1.

Contoh 1.
Untuk ilustrasi uji beda berpasangan mari dilihat pengamatan berikut. Suatu LSM ingin
membuktikan kebenaran klaim dari suatu produk obat yang menyatakan obat tekanan
darahnya sangat efektif menurunkan tekanan darah pasien seminggu setelah obat tersebut
diminum . Untuk membuktikan hal tersebut maka LSM mengambil sampel sebanyak 15
pasien penderita tekanan darah tinggi. Adapun kemudian data yang dicatat berupa
tekanan darah pasien sebelum diberi obat dan tekanan darah setelah seminggu minum
obat. Adapun datanya dapat dilihat pada tabel 2.

Modul Statistika Dasar Jurusan Matematika-UNUD


38

Tabel 2. Data Tekana darah pasien tekanan darah tinggi.


no Sebelum minum obat Sesudah minum obat d = X1-X2
(X1) (X2)
1 150 130 20
2 140 130 10
3 170 150 20
4 140 120 20
5 200 135 65
6 190 135 55
7 200 140 60
8 150 150 0
9 175 160 15
10 180 130 50
11 160 150 10
12 165 140 25
13 200 175 25
14 210 170 40
15 180 160 20

Dari data di atas jika dilakukan pengujian maka dilakukan uji beda berpasangan. Adapun
untuk melakukan uji tersebut maka dilakukan langkah sebagai berikut :
1. Tuliskan hipotesisnya yaitu :
H0 : d  0
H1 : d  0
2. Lakukan penghitung statistik ujinya.

 Hitung : d 
d i

150  140  ...  180
 29
n 15

Modul Statistika Dasar Jurusan Matematika-UNUD


39

 Hitung

: sd2 
 (d i  d )2

(150  29) 2  (140  29) 2  ....  (180  29) 2
 400,8004
n 1 15  1
d 29
 Hitung : thit    5, 61
sd 20, 02 15

3. Penarikan kesimpulan
 Bandingkan thit dengan ttab : thit  5,61  5,61 . Jika dibandingkan dengan nilai

tabel t dengan α = 0,05 dan derajat bebas (db) = 14 yang besarnya 1,761, maka
ternyata thit  ttabel . Maka kesimpulannya adalah tolak Hipotesis nol (H0).

Modul Statistika Dasar Jurusan Matematika-UNUD

Anda mungkin juga menyukai