28.03.19.metode Statistika

BEBERAPA KONSEP DASAR STATISTIKA
1. Konsep Statistika
STATISTIKA :
Kegiatan untuk :
KEGUNAAN
• mengumpulkan data
• menyajikan data
• menganalisis data dengan metode tertentu
• menginterpretasikan hasil analisis
Melalui fase
STATISTIKA DESKRIPTIF :
Berkenaan dengan pengumpulan, pengolahan, dan penyajian sebagian
atau seluruh data (pengamatan) tanpa pengambilan kesimpulan
dan fase
STATISTIKA INFERENSIAL:
Setelah data dikumpulkan, maka diterapkan berbagai metode statistika untuk
menganalisis data, kemudian dilakukan interpretasi serta diambil kesimpulan.
Statistika inferensi akan menghasilkan generalisasi (jika contoh representatif)
2. Statistika & Metode Ilmiah
METODE ILMIAH :
Adalah salah satu cara mencari kebenaran yang bila ditinjau dari segi
penerapannya, risiko untuk keliru paling kecil.
LANGKAH-LANGKAH DALAM METODE ILMIAH :

1. Merumuskan masalah
2. Melakukan studi literatur
3. Membuat dugaan-dugaan, pertanyaan-pertanyaan atau hipotesis
4. Mengumpulkan dan mengolah data, menguji hipotesis,

atau menjawab pertanyaan
5. Mengambil kesimpulan
INSTRUMEN
CONTOH
PERAN STATISTIKA
SIFAT DATA
PEUBAH
METODE ANALISIS
1
3.1 Data
DATA terbagi atas DATA KUALITATIF dan DATA KUANTITATIF
DATA KUALITATIF : DATA KUANTITATIF :

Data yang dinyatakan dalam bentuk Data yang dinyatakan dalam bentuk
bukan angka. angka
Contoh : jenis pekerjaan, status marital, Contoh : lama bekerja, jumlah gaji,
tingkat kepuasan kerja usia, hasil ujian
DATA
KUALITATIF JENIS KUANTITATIF

DATA
NOMINAL INTERVAL
ORDINAL RASIONAL
Tujuan statistika:
 Membuat kesimpulan mengenai populasi berdasarkan analisis terhadap informasi yang

terkandung dalam data. Inferensi ini akan melibatkan ketidakyakinan (peluang)
 Merancang proses perolehan data (penarikan contoh) agar data (hasil

pengamatan/pengukuran) yang diperoleh berkualitas baik dan dapat
dipertanggungjawabkan, sehingga kesimpulan yang sahih akan didapat
Definisi: Statistika (statistics) adalah metode ilmiah atau seni menyangkut data yang meliputi
proses untuk: mengumpulkan, mengorganisasikan, menyajikan dan menganalisis data, serta
menarik kesimpulan layak berdasarkan analisis yang dilakukan
 Memperoleh data, mengorganisir, menata, meringkas, mendeskripsikan (menjelaskan,

menyajikan data (statistika deskriptif)
 Menganalisis: menduga parameter, menguji hipotesis mengenai parameter, mengambil
kesimpulan dan membuat keputusan berdasarkan hasil analisis (statistika inferensial)
Statistika deskriptif bertujuan untuk meringkas sehingga didapatkan bentuk atau pola sebaran
data dan menyajikan informasi yang terkandung di dalam data tanpa pengambilan keputusan.
Peringkasan ini dimulai dari membuat:

1. Statistik tataan (ordered statistics)
2
2. Tabel
3. Diagram: dahan-daun, titik, balok, kotak-garis, kue pai, piktogram dll.
Untuk mendapatkan gambaran tentang bentuk sebaran data yang merupakan dasar pemilihan
metode analisis yang tepat (sesuai sebaran data atau asumsi).
Statistika inferensial menangani pendugaan parameter, pengujian hipotesis, pembuatan

keputusan, penarikan kesimpulan dan peramalan mengenai populasi berdasarkan contoh
(generalisasi).
Parameter: besaran/konstanta (yang tidak diketahui) dari suatu populasi dan memberikan ciri
(mengatur bentuk/pola) sebaran tersebut.
Statistik (statistic): adalah penduga bagi parameter dan merupakan fungsi dari nilai-nilai
pengamatan contoh.
Unsur-unsur statistika:
1. Populasi : himpunan semesta (kumpulan) semua individu/unit

biasanya manusia, obyek, kejadian
2. Contoh : sebagian anggota populasi (himpunan bagian

dari populasi)
3. Peubah (Variabel) : ciri, karakteristik atau sifat individu yang dapat

diamati atau dapat diukur.
Dap at diukur berarti karakteristik itu dapat dilambangkan atau

dijelaskan dengan bilangan, atau dinyatakan secara numerik.
Tipe data
Nominal Ordinal Interval Rasional
Diperoleh melalui Dipreroleh melalui Diperoleh dengan Dipertoleh dengan
kategorisasi atau kategorisasi atau cara pengukuran, di cara pengukuran, di
klasifikasi individu ke klasifikasi, tetapi di mana jarak antara mana jarak antara
dalam sifat (kelas). antara data tersebut dua titik skala sudah dua titik skala sudah
terdapat hubungan diketahui. diketahui dan
mempunyai titik 0
absolut.
posisi data setara posisi data tidak tidak ada kategorisasi tidak ada kategorisasi
setara
tidak bisa dilakukan tidak bisa dilakukan bisa dilakukan operasi bisa dilakukan operasi
operasi matematika operasi matematika matematika matematika
(+, -, x, :) (+, -, x, :)
jenis kelamin, kepuasan kerja, temperatur yang gaji, skor ujian,
0
jurusan, golongan motivasi, kelompok diukur berdasarkan C jumlah buku, lama
darah usia 0 perjalanan
dan F, sistem
kalender
3
Penjelasan:
1.Nominal: (berasal dari kata Latin “nomen” artinya nama). Hasil pengelompokkan
individu/obyek ke dalam sifat (nama) yang tidak memiliki tingkatan.
 Pemberian nama atau label pada berbagai kategori

 Hasil pengelompokkan mahasiswa menurut golongan darah, asal daerah,
fakultas, jenis kelamin
 Jarak antar dua data nominal tidak bermakna
 Tidak ada arti peringkat, tidak ada kemutlakan
 Status pria tidak lebih tinggi dari wanita (pria dapat diberi label 1, atau pun 2),
demikian pula label untuk wanita
 Gol darah O: 15 dan A: 20. Selisih 5 tidak bermakna
2.Ordinal: Hasil pengelompokkan individu/obyek ke dalam sifat yang memiliki tingkatan,

tetapi jarak/interval/selang antar tingkatan tidak memiliki arti
 Hasil pengelompokkan anggota batalyon menurut kepangkatan

 Tingkat Kejuaraan turnamen: Juara 1, 2, 3, harapan
 Penilaian pretastasi mahasiswa : A, B,...,E
 Sama seperti data nominal, jarak antar dua data ordinal tidak bermakna
 Jumlah letnan 10 dan jumlah mayor 12: selisih sebesar 2 orang tidak bermakna
(tidak dapat diinterpretasikan)
3.Interval: dapat menjelaskan besar kecilnya karakteristik yang diukur pada suatu individu
dibandingkan hasil pengukuran pada individu lain:
 Pengukuran suhu simpan pindang bandeng, lama perjalanan bus Patas ke

Surabaya yang berangkat dari Malang tepat jam 06.00 pagi (selama bulan Maret
2013)
 Memiliki arti selang yakni selisih antar data sehingga data dapat dikurangkan
 Selisih antara suhu 200C dan 180C sama dengan selisih antara 130C dan 110C,
Data interval berkualitas tinggi dibandingkan data ordinal, karena dapat
dijumlahkan dan dikurangkan tetapi mengalikan dan membagi belum dapat
diterapkan karena titik 0 tidak bermakna
 Suhu 00C bukanlah berarti bahwa tidak ada panas, suhu kurang dari 00C (misal -
100C) tidak berarti panas lebih sedikit
 Panas dari 1000C bukanlah dua kali panas 500C
4. Rasional: menjelaskan kelipatan suatu data dibandingkan data lain
 Penghasilan bulanan setiap rumah tangga di RW 007, laju pertambahan berat

kambing, banyaknya dosen wanita di setiap Program Studi Pascasarjana
Universitas Brawijaya
 Rasio antar dua data dapat diinterpretasikan, misal laju pertumbuhan kedelai
varietas Semar sebesar 0.6, dua kali lebih besar dari laju pertumbuhan kedelai
varietas Petruk yang hanya 0.3. Jumlah buku Pertanian di perpustakaan Brawijaya
5 kali lebih banyak dari jumlah jumlah buku Statistika.
 Data rasional memiliki sifat terlengkap (terkaya), karena semua operasi
aritmatika dapat diterapkan terhadapnya, sehingga bilangan 0 memiliki arti misal
pendapatan 0, tak satu pun dosen wanita bekerja di Universitas Maskulin atau
laju pertumbuhan 0 yang terjadi pada saat buah mangga menjadi ranum
Rangkuman
Cara memperoleh data Menghitung Mengukur
4
 Nominal  Interval
Skala pengukuran (Bentuk data)
 Ordinal  Rasional
 Label (nominal)  Beda (interval)

Ciri  Label verbal atau  Kelipatan
bilangan (ordinal) (rasional)
Operasi aritmatika (+-*/) Tidak dapat Semua dapat
 Diskret  Kontinu
Jenis peubah
 Kualitatif  Kuantitatif
Parameter/sebaran Tidak ada Ada, tertentu
Non parametrik (bebas

Metode analisis Parametrik
sebaran)
Tabel dan grafik (frekuensi  Deskriptif

Cara penyajian
relatif)  Inferensial
Sifat data Miskin Sangat kaya
STATISTIKA DESKRIPTIF
A. MENJELASKAN DATA DENGAN TABEL DAN GRAFIK
Bidang statistika ini menyangkut organisasi (penataan) data baik kualitatif maupun kuantitatif
yang diperoleh melalui penelitian (data mentah). Tujuan proses ini adalah untuk mendapatkan
gambaran kasar mengenai data.
1. Peubah diskret
Penyajian data disret sangatlah sederhana, hanya dengan menggunakan tabel untuk
memperlihatkan frekuensi dan grafik (histogram dan kue pai) untuk menunjukkan frekuensi
relatif suatu kategori.
Sebuah pengumpulan pendapat (pol) dilakukan di sebuah asrama kampus untuk mengetahui
sikap mahasiswa (penghuni) terhadap perubahan peraturan baru yang akan diterapkan di
asrama tersebut. Mereka diminta untuk menyatakan: setuju, netral atau menolak, dengan hasil
berikut:
Tabel 1. Ringkasan hasil pengumpulan pendapat

Frekuensi
Respons Frekuensi
Relatif
Setuju 152 152/280=0.543
Netral 77 77/280=0.275
Menolak 51 51/280=0.182
Total 280 1.000
Catatan: Frekuensi relatif menyediakan informasi mengenai pola atau bentuk sebaran suatu
data seperti terlihat pada Gambar 1.
5
200
152
150
Setuju
100 77 Series1 Netral
51 Menolak
50
0
Setuju Netral Menolak
Gambar 1. Tayangan grafis hasil pengumpulan pendapat
2. Peubah Kontinu
Hasil pengukuran terhadap peubah kontinu akan menghasilkan data yang variatif dan kaya.
Dengan hanya memperhatikan data mentah, sangatlah sulit bagi kita untuk menarik
kesimpulan yang berarti. Untuk memperoleh suatu gambaran yang baik, data mentah ini perlu
diolah terlebih dahulu.
Dua cara sederhana (langkah awal) yang dapat digunakan untuk meningkatkan kegunaan data
mentah adalah dengan membuat statistik tataan dan daftar frekuensi yang dapat memberikan
gambaran yang khas tentang bagaimana keragaman data.
Sifat keragaman data sangat penting untuk diketahui karena langkah selanjutnya dalam
pengujian hipotesis akan selalu mempergunakan sifat ini. Tanpa memperhatikan sifat
keragaman data, penarikan suatu kesimpulan pada umumnya tidaklah sahih.
Langkah-langkah dalam statistika deskriptif data adalah:

a) Meringkas data dan mendeskripsikan (menjelaskan) pola umum melalui:
¤ Penyajian tabel dan grafik

¤ Mengetahui keistimewaan data seperti kesetangkupan dan penyimpangan
terhadapnya
¤ Pendeteksian pencilan atau data yang berpengaruh (influential data)
b) Menghitung besaran numerik untuk mengetahui:
 Pusat data (tempat di mana sebagian besar data berkumpul atau nilai pengamatan
yang dimiliki oleh sebagian besar individu)
 Besarnya keragaman atau variasi yang terdapat dalam data (besarnya
penyimpangan/jarak antara setiap data ke pusat data)
Meringkas Data
Pandang data: Yi: Y1, Y2, Y3, …….., Yn (Yi adalah hasil pengamatan/pengukuran ke i, i
merupakan nomor urut atau indeks) 𝑌(𝑖) ≤ 𝑌(𝑖+1)

1. Statistik Tataan (Ordered Statistic)
 Data disusun/diurutkan dari nilai terkecil ke nilai besar (atau sebaliknya)

 Dihasilkan Y(i): Y(1), Y(2), Y(3), …….., Y(n) di mana berlaku hubungan berikut:
Y(1) ≤ Y(2) ≤ Y(3) ≤ …….. ≤ Y(n)
 Y(i) disebut statistik peringkat ke-i, Y(1) adalah statistik peringkat pertama atau
statistik minimum sedangkan Y(n) merupakan statistik peringkat akhir atau statistik
maksimum.
6
 Kisaran (Range) yang merupakan salah satu indikator bagi keragaman adalah fungsi
dari kedua statistik ini :
Kisaran = Y(n) – Y(1)
Tabel 2. Statistik tataan dan kisaran berat buah dua jenis mangga
Berat mangga per buah Gadung Harum Manis
(gram) 250, 225, 250, 200, 375 450, 395, 300, 400, 305
Statistik Tataan 200, 225, 250, 250, 375 300, 305, 395, 400, 450
Kisaran 375 – 200 = 175 450 – 300 = 150
Interpretasi Data menyebar Data lebih mengumpul
Berdasarkan fakta ini, lebih baik anda membeli mangga Harum Manis karena berat (ukuran)
mangga jenis ini relatif sama.
2. Diagram dahan-daun (Stem and leaf diagram/display)
 Salah satu bentuk statistik tataan yang telah dikelompokkan berdasarkan dahan
 Data asli masih tampak sehingga memudahkan pemeriksaan
 Pusat data mudah diketahui
 Penyimpangan terhadap kesetangkupan mudah dideteksi

Cara membuat diagram dahan-daun
(i) Daftarkan digit 0 – 9 dalam sebuah kolom yang disebut dahan (satuan, puluhan,
persepuluhan dll tergantung madnitude data)
(ii) Tempatkan digit kedua pada dahan yang sesuai
(iii) Untuk memudahkan penentuan ukuran pemusatan, tempatkan daun secara
berurutan (kecil-besar)
(iv) Dahan dapat diuraikan ke dalam beberapa buah sub-dahan
Misal untuk
1.5 24 1907
Dahan Daun Dahan Daun Dahan Daun
1 5 2 4 19 7
satuan sepersepuluh puluhan satuan raturan satuan
Tabel 3. Waktu yang diperlukan untuk mengolah tanah 21 petak sawah seluas 1 ha (hari)
2 1 7 8 6 3 3 5 7 8 3
1 2 3 3 5 10 13 17 4 2
7
Tabel 4. Diagram dahan-daun (urai 5 dan urai 3) yang dihasilkan adalah:
Frek Kum dahan daun

Frek Kum dahan daun
10 0 1122233333
2 0 11 16 0 455677
10 0 22233333 18 0 88
13 0 455 20 1 03
16 0 677 21 1 7
18 0 88
19 1 0
20 1 3
20 1
21 1 7
Penguraian dahan dapat dilakukan untuk membentuk sebaran sesuai keinginan. Makin banyak
penguraian terhadap dahan, akan semakin rendah pohon yang didapatkan, namun bentuk
sebenarnya dari data tidak akan berubah.
Frekuensi kumulatif menunjukkan peringkat data dan akan digunakan untuk menentukan
ukuran-ukuran pemusatan.
Kedua diagram ini memberikan informasi sebagai berikut:

a) Waktu tercepat untuk membajak 1 ha sawah adalah 1 hari dan terlama 17 hari
b) Kisaran data adalah 16 hari
c) Data menjulur ke kanan dan pusat data terdapat pada dahan pertama atau kedua
d) Lama membajak 1 ha sawah dapat dikatakan baik karena memerlukan waktu relatif
singkat (1, 2 sampai 3 hari)
e) Frekuensi terbesar adalah 3 hari (mengarah ke modus)
f) Menarik untuk mengetahui mengapa sawah seluas satu hektar memerlukan waktu
pengolahan 17 hari (pencilankah data ini?, tidaklah terjadi kesalahan pencatatan?
Apakah data ini berasal dari populasi yang sama dengan kedua puluh data lainnya?)
g) Hal ini diindikasikan oleh jaraknya yang terlalu jauh ke pusat (digambarkan dengan
jelas oleh diagram dengan uraian 5)
h) Diagram terurai 3 lebih padat sehingga sebaran berbentuk J sedangkan terurai 5
menunjukkan bentuk menjulur
3. Diagram titik (Dot Diagram)
 Data ditempatkan pada garis bilangan sesuai wilayah data

 Penempatan data dilakukan secara individual
 Baik untuk membandingkan beberapa populasi (contoh, perlakuan) apabila
menggunakan skala yang sama
 Pusat data diketahui dari tempat berkumpulnya data
 Penyebaran data (keragaman) juga terlihat pada diagram ini
 Adanya pencilan akan tampak
Untuk data pada Tabel 2 dihasilkan diagram titik di bawah ini:
. . : .
---+---------+---------+---------+---------+---------+--- GADUNG
.. .. .
---+---------+---------+---------+---------+---------+--- HARUM MANIS
200 250 300 350 400 450
Diagram menunjukkan bahwa secara umum mangga Harum Manis lebih berat dibandingkan
Gadung.
8
Sedangkan data yang disajikan pada Tabel 2 menampilkan diagram titik ini:
.
. :
: : : . : . : : . . .
-------+----------+----------+----------+----------+----------+-- HARI
3.0 6.0 9.0 12.0 15.0 18.0
4. Diagram balok (Histogram)
 Diagram jenis ini sudah lama dikenal (sebelum era komputer) karena lebih mudah
dibuat
 Data dikelompokkan ke dalam beberapa kelas
 Frekuensi tertinggi menunjukkan pusat data
 Pola sebaran data tampak jelas
15
Frequency
10
0
8,0 10,5 13,0 15,5 18,0 20,5
Diameter
Prosedur pembuatan diagram balok atau histogram frekuensi:
A. Membuat tabel frekuensi, melalui penataan turus, di mana data dikelompokkan ke dalam
kelas-kelas.
1. Tentukan jumlah kelas (k) berdasarkan:

 Kaidah Sturge:
9, n < 250
k=
1 + 3.3 log n, n ≥ 250
 Bilangan bulat terkecil yang memenuhi 2k ≥ n
Tabel 5. Banyaknya kelas untuk pembentukan tabel frekuensi

Banyaknya pengamatan Banyaknya kelas (k)
(n)
8 3
9 – 16 4
17 – 32 5
33 – 64 6
65 – 128 7
129 – 256 8
257 – 512 9
513 – 1024 10
> 1024 nilai terkecil k yang memenuhi 2k ≥ n
9
2. Buat sebaran frekuensi atau tabel frekuensi berdasarkan statistik tataan sengan
penataan turus. Proses ini menyangkut pengelompokkan individu ke dalam beberapa
kelas (jumlah kelas ideal bernilai ganjil, agar pusat sebaran mudah terlihat). Satu
individu masuk ke dalam satu dan hanya satu kelas saja menyebabkan terjadinya
kebebasan antar kelas.
3. Hitung selang (lebar/interval) kelas h = (Y(n) – Y(1))/k
4. Nyatakan kelas (atau rata-rata kelas) sebagai sumbu mendatar, dan frekuensi kelas
atau frekuensi relatif kelas sebagai sumbu tegak. Tinggi balok merupakan frekuensi
pada kelas tertentu.
Tabel 6. Daftar frekuensi (dengan penataan turus) dengan lebar kelas 1

Yi Turus Frekuensi
1 // 2
2 /// 3
3 //// 5
4 // 1
5 / 2
6 // 1
7 // 2
8 // 2
9 0
10 / 1
11 0
12 0
13 / 1
14 0
15 0
16 0
17 / 1
Jumlah frekuensi = n 21
Lebar kelas sebesar 1 menghasilkan 17 kelas (terlalu banyak), dan ada kelas tanpa anggota,
sehingga perlu diadakan pengelompokkan kelas atau peningkatan lebar kelas.
Karena n = 21 maka k = 5, sehingga dibuat tabel frekuensi dengan lebar (interval/selang)

kelas h = (Y(n) – Y(1))/k = (17 – 1)/5 = 3.2 ~ 3
Tabel 6. Daftar frekuensi dengan lebar kelas 3

Selang Rata-rata Frekuensi Frekuensi Frekuensi
Kelas Kelas Kumulatif Relatif
0–3 1.5 10 10 10/21
4–7 5.5 6 16 6/21
8 – 11 9.5 3 19 3/21
12 – 15 13.5 1 20 1/21
16 - 19 17.5 1 21 1/21
Jumlah 21 21/21
Berdasarkan Tabel 6 dapat dibuat histogram frekuensi, poligon frekuensi dan ogive. Poligon
frekuensi diperoleh dengan menghubungkan titik tengah puncak balok sehingga menyerupai
kurva patah-patah, sedangkan ogive dihasilkan dari tabel frekuensi kumulatif di mana kelas,
frekuensi dan yang bersifat kumulatif.
10
Ogive didasarkan pada selang kelas kumulatif seperti terlihat pada Tabel 7. Dua sumbu tegak
adalah frekuensi kumulatif dan persentasenya. Tetapkan titik 50% pada sumbu tegak kanan,
tarik garis mendatar sampai memotong ogive, kemudian tarik garis vertikal sampai memotong
sumbu mendatar di suatu titik. Pada umumnya ogive berbentuk sigmod (kurva berbentuk S).
Tabel 7. Daftar frekuensi kumulatif

Selang Frekuensi
Frekuensi
Kelas Kumulatif
Kumulatif
Kumulatif Relatif
3 10 10/21 = 0.48
7 16 16/21 = 0.76
 11 19 19/21 = 0.90
 15 20 20/21 = 0.95
 19 21 21/21 = 1.00
Interpretasi ogive: 50% dari petak-petak sawah (10 – 11 petak) diselesaikan dalam waktu
kurang dari (paling lambat) 4 hari.
B. UKURAN PEMUSATAN (measure of central tendency)
Gambar dan diagram yang disajikan sebelumnya telah menunjukkan letak (lokasi) pusat data.
Untuk itulah pusat yaitu suatu besaran (nilai) yang merupakan fungsi dari data perlu dihitung.
Pusat sebaran dijelaskan oleh besaran-besaran ini:
i. Rata-rata (hitung/artitmatika, geometrik dan harmonik) atau proporsi

ii. Median
iii. Modus
 Rata-rata merupakan fungsi dari semua data contoh dan merupakan statistik atau penduga
bagi parameter . Oleh karena itu besaran ini sensitif karena akan berubah apabila terjadi
perubahan pada data. Rata-rata berarti sebagian besar individu memiliki nilai pengamatan
sekitar atau sebesar rata-rata.
# Rata-rata hitung (rata-rata aritmatika ya ):

n
Y
i 1
i
ya = atau y untuk data aditif (deret hitung)
n
n
 Y  ny
i 1
i
# Rata-rata terboboti (sama dengan rata-rata aritmatika ya ):

n
 bY
i 1
i i
yb = n untuk data aditif, bi adalah bobot data ke i
b
i 1
i
# Rata-rata geometrik ( yg ):
yg = n
Y1 Y2 ......... Yn
 Y 
n 1/ n
= i
untuk data multiplikatif (deret ukur)
i 1
11
Disebut juga rata-rata logaritmik berdasarkan fakta berikut ini:
Y1 Y2 ......... Yn  Y1 Y2 ......... Yn 

1/ n
yg = n
Y Y2 ......... Yn 
1/ n
Log10 yg = log10 1
1
 log10 Y1 Y2 ......... Yn 
n
1
  log10 Y1  log10 Y2  ..........  log10 Yn 
n
1 n
  log10 Yi
n i1
Antilog rata-rata logaritmik akan menghasilkan rata-rata geometrik:
n

1
log10 Yi
n i 1
10 Log10 yg =10
# Rata-rata harmonik ( yh ) disebut juga rata-rata resiprok:
n
yh = n
untuk data multiplikatif
Y
i 1
i
1
Perbandingan antar rata-rata: ya  yb  yg  yh

Apa yang terjadi pada rata-rata, jika terhadap setiap data dilakukan penambahan,
pengurangan, perkalian atau pembagian dengan suatu konstanta?
 Median adalah salah satu ukuran pemusatan yang membagi data menjadi dua bagian yang
sama besar.
# Setengah (50%) dari data memiliki nilai di bawah median dan setengah berada di atas
median
# Karena berada di tengah-tengah statistik tataan, maka median adalah statistik peringkat
( n  1)
ke atau statistik Y((n+1)/2)
2
# Jika banyaknya data berjumlah genap maka median adalah rata-rata dari 2 statistik
tataan di tengah-tengah
# Jika n=ganjil maka median adalah pengamatan yang berada di tengah
# Median merupakan fungsi dari dua peringkat di tengah atau salah satu peringkat yang
memang benar-benar terletak di tengah
# Oleh karena itu, median bersifat kekar, tidak sensitif, karena bukan merupakan fungsi
dari seluruh data, dan pada sebaran menjulur, median lebih disukai dibandingkan rata-
rata.
Lihat kembali diagram dahan-daun bagi lama mengolah satu hektar sawah
i) Karena terdapat 21 petak sawah, median adalah peringkat ke (21+1)/2 atau

peringkat ke-11
ii) Gunakan frekuensi kumulatif untuk menempatkan lokasi median
12
iii) Median bernilai 4 hari
iv) 10 – 11 petak sawah diolah dalam waktu kurang dari 4 hari dan sisanya (juga 10
– 11) petak diselesaikan lebih dari 4 hari. Hasil ini sama dengan menggunakan
ogive.
 Modus adalah nilai pengamatan dengan frekuensi terbesar. Pentingnya mengetahui besaran
ini untuk mendeteksi apakah sebaran memiliki satu atau lebih puncak.
# Data dengan satu puncak disebut unimodal, dua puncak bimodal dan banyak puncak
atau multimodal
# Data yang bersifat bimodal mengindikasikan bahwa data (contoh) tidak berasal dari
populasi yang sama. Tindakan yang harus dilakukan dalam analisis adalah
memisahkan data berdasarkan dua puncak (pemotongan pada lembah) sehingga
diperoleh dua contoh yang saling bebas
Modus untuk lama mengolah sawah adalah 3 hari yang berarti bahwa lama pengerjaan
sawah terbanyak adalah 3 hari atau pada umumnya diperlukan waktu 3 hari untuk
mengolah sawah (Paling banyak petak sawah diselesaikan dalam waktu 3 hari).
Bentuk sebaran dapat diketahui melalui pembandingan antara rata-rata dan media:
< rata-rata, data menjulur ke kanan
Apabila Median = rata-rata, data berbentuk setangkup
> rata-rata, data menjulur ke kiri
C. UKURAN PENYEBARAN (measure of spread)
Besaran-besaran yang mengukur pusat data hanya menjelaskan data kuantitatif secara
sebagian (parsial) atau tidak lengkap. Besaran ini akan sia-sia apabila tidak diiringi oleh
besaran lain yang mengukur keragaman data.
Dua sebaran di bawah ini memiliki ukuran pemusatan sama (karena setangkup), namun
gambar menunjukkan adanya perbedaan keragaman. Data 1 lebih seragam sedang Data 2
lebih terpusat. Dengan alasan ini maka ukuran penyebaranlah yang memegang peranan
penting dalam memahami suatu sebaran.
0 1 2 3 4 5 0 1 2 3 4 5
Data 1 Data 2
Indikator Keragaman
1. Kisaran Y(n) – Y(1)
13
 Ukuran yang kasar untuk n besar
 Kurang sensitif
 Menyesatkan bila dua data memiliki kisaran sama tetapi ragam keduanya berbeda
(seperti diilustrasikan oleh ambar di atas)
 Tidak selalu dapat mendeteksi perbedaan keragaman data untuk n berukuran besar
Apakah ada besaran lain yang lebih sensitif dibandingkan kisaran?
Pandang teladan berikut, yaitu dua himpunan data yang memiliki pusat sama yakni 3. jarak
antar setiap data dengan pusat disajikan pula. Informasi apakah yang disajikan oleh jarak
ini? Apabila mereka cenderung terlalu besar (contoh 1), data akan lebih menyebar atau
mempunyai ragam besar, tetapi jika jarak bernilai kecil seperti contoh 2, data berkumpul di
sekitar rata-rata menghasilkan ragam kecil. Jadi jarak menyediakan informasi mengenai
keragaman data.
Tabel 8. Dua himpunan data hipotetik (data buatan)

1 2
Data 1, 2, 3, 4, 5 2, 3, 3, 3, 4
Rata-rata 1 2  3  4  5 2333 4
y = =3 y = =3
5 5
Jarak/simpangan
Yi ke y atau (Yi –
(1–3),(2–3),(3–3),(4–3),(5–3) atau (2–3),(3–3),(3–3),(3–3),(4–3)
y) 2, 1, 0, 1, 2 atau -1, 0, 0, 0, 1
.
. . . . . . : .
Diagram +-----+----+-----+-----+----+- +----+----+----+----+----+-----+
Titik Data1 Data2
Langkah selanjutnya:
 Menggunakan jarak-jarak ini (Yi – y ), yang juga merupakan peubah untuk menghitung
suatu nilai yang menjelaskan ragam
 Menghitung rata-rata peubah (Yi – y ) tidak membantu karena jarak negatif dan positif
saling meniadakan atau  (Yi – y )= 0
 Anggap jarak bernilai positif atau Yi – y
 Kuadratkan mereka untuk mengeliminir tanda negatif (Yi – y )2
 Peubah ini adalah landasan untuk perhitungan ragam
 Jumlah dari peubah ini disebut jumlah kuadrat JKy =  (Yi – y )2
2. Ragam contoh untuk suatu contoh berukuran n adalah jumlah dari kuadrat jarak ke
pusat dibagi n atau (n – 1). Dengan demikian ragam peubah Y merupakan fungsi dari 2
besaran yakni JKy dan n (atau derajat bebas, n – 1):
Ragam = fungsi(jumlah kuadrat, n). Besaran ini mengukur besarnya penyimpangan dari
setiap data ke pusat.
Rumus definisi n
 (Y  y )
i 1
i
2
s2 =
n 1
14
Rumus kerja (1) 2
n
 n 
 Yi    Yi 2  / n
2
 i 1 
s2 =
i 1 Jumlah Kuadrat
s2 =
n 1 Derajat bebas
Rumus kerja (2) n
Y
i 1
i
2
 ny 2
s2 =
n 1
 Ragam memiliki satuan berpangkat dua sesuai dengan proses pembentukan peubah,
misal ragam hari mengolah sawah adalah hari 2
 Akar pangkat dua bertanda positif dari ragam disebut simpangan baku: s = +(s2)1/2
2 2
atau s= + s
 Satuan simpangan baku sama dengan satuan data sehingga statistik ini lebih banyak
digunakan
Catatan:
Rata-rata contoh y akan digunakan untuk membuat inferensia mengenai rata-rata populasi .
Ragam contoh s2 harus didefinisikan sehingga dapat digunakan untuk membuat inferensia bagi
ragam populasi 2.
Y
i
i
= , i = 1, 2, ......, N (N=ukuran populasi)
N
Hubungan antar parameter dan statistik
μˆ  y dan σˆ  s
2 2
Parameter diduga dengan statistik:
Perhatikan bahwa 2 melibatkan kuadrat penyimpangan terhadap rata-rata populasi . Apabila
nilai  diketahui, ragam populasi dapat dinyatakan sebagai rata-rata kuadrat penyimpangan Yi
terhadap , atau
1 n
σ2 =
N

i 1
(Yi - )2
Namun, nilai parameter  hampir tidak pernah diketahui, sehingga jumlah dari kuadrat
penyimpangan terhadap statistik y harus digunakan. Tetapi Yi cenderung lebih dekat ke rata-
rata contoh y dibandingkan dengan jarak Yi ke rata-rata populasi , sehingga untuk
mengkompensasikan ini penyebut n – 1 digunakan dan bukan n.
Dengan kata lain, s2 yang diperoleh dengan penyebut n, cenderung menduga lebih rendah 2
(underestimate, menghasilkan nilai-nilai penduga yang secara rata-rata terlalu kecil),
sedangkan dengan penyebut n – 1 yang bernilai agak kecil akan mengoreksi pendugaan rendah
ini (underestimating corrections).
Ragam contoh s2 didasarkan atas derajat bebas (n – 1). Istilah ini timbul dari kenyataan bahwa
jika s2 dilandaskan pada n besaran (peubah):
Y1 – y , Y2 – y ,.........................., Yn – y
Jika -  < Yi < +  , -  < y < +  dan -  < Yi - y < + 
15
Jumlahnya akan bernilai 0, sehingga menentukan n – 1 buah nilai Yi – y , secara bebas, akan
menghasilkan satu nilai Yi – y sisa (manapun). Misal jika n = 4 dan Y1 – y = 8, Y3 – y = -6
dan Y4 – y = -4; maka secara otomatis Y2 – y = 2, jadi hanya 3 dari 4 nilai deviasi yang boleh
ditetapkan secara bebas (derajat bebas 3).
n n n n
 Yi  y    Yi   y   Yi  ny
i 1 i 1 i 1 i 1
n n n
karena  Yi  ny , maka
i 1
 Yi   Yi  0 atau ny  ny  0
i 1 i 1
Rata-rata (aritmatika) adalah titik keseimbangan, karena jumlah deviasi di kiri titik rata-
rata sama dengan jumlah deviasi di kanannya (jumlah deviasi bertanda – dan + sama,
saling meniadakan).
Yi +-----+----+-----+-----x-----+------+-----+---
2 4 6 7 8 9
Yi – y -4 -2 1 2 3
y  30  6 (titik keseimbangan)
5
Jumlah deviasi bertanda negatif : -4 + -2 = 6 saling meniadakan dengan Jumlah deviasi

bertanda positif : 1 + 2 + 3 = 6
Karena kenyataan ini, peubah deviasi Yi  y tidak digunakan, tetapi kuadrat dari peubah ini (
Yi  y )2 yang apabila dijumlahkan, akan menghasilkan statistik jumlah kuadrat yang baik
karena karena bersifat minimum.
n
Jumlah Kuadrat peubah Y  JK Y   (Yi  y ) 2
i 1
n n n n n
 (Yi  y )2  (Yi  2 yYi  y 2 )   Yi 2   2 yYi   y 2 

i 1 i 1 i 1 i 1 i 1
n n
Y i 1
i
2
 2 y  Yi  ny 2
i 1
16
Substitusi y , menghasilkan
2
 n
n

n n n  Yi n   Yi 

i 1
Yi  2 y  Yi  ny   Yi  2
2
i 1
2
i 1
2 i 1
n
i 1
Yi  n  i 1
 n
 

 
 
2
 n 
2 2
n
 n   n 
 Yi n   Yi   i  Y   Yi 
 
n n

i 1
Yi  2
2 i 1

n i 1
Yi  n  i 1
 n
   Yi  2
 i 1
2 i 1
n
 n  i 1
 n
 

   
   
2 2 2 2
 n   n   n   n 


 Yi 



 Y i 

  Yi    Yi 
  Yi  2  i 1    i 1  
n n

i 1
Yi  2
2 i 1
n
n i 1
n 2
i 1
2
n n
2 2 2 2
 n   n   n   n 
 i  Y   Yi   i  Y   Yi 
 2  i 1   n  i 1   2  i 1    i 1 
n n
 Yi 2
i 1 n n2
 Y
i 1
i
2
n n

Rumus Kerja ( a )
2
 n 
  Yi 
  i 1 
n n
JKY   (Yi  y ) 2 
i 1
Y
i 1
i
2
n
Substitusi  Y , menghasilkan
i 1
i
n n
 Yi 2  2 yny  ny 2 
i 1
Y
i 1
i
2
 2ny 2  ny 2 
Rumus Kerja (b)

n n
JKY   (Yi  y ) 2 
i 1
Y
i 1
i
2
 ny 2
Perubahan apa yang terjadi pada ragam atau simpangan baku, jika terhadap setiap data
dilakukan penambahan, pengurangan, perkalian atau pembagian dengan suatu konstanta?
Menambahkan konstanta c pada nilai-nilai peubah Y menggeser Yi dan y ke kanan sebesar c;

kisaran tetap, sehingga ragam juga tetap. Pengurangan konstanta c pada nilai-nilai peubah Y
menggeser Yi dan y ke kiri sebesar c; kisaran tetap, sehingga ragam juga tetap
17
X i  Yi  c
Kisaran  Y( n )  c   Y(1)  c   Y( n )  Y(1)  c m c  Y( n )  Y(1)
Rata  rata :
n n n n n
 (Y i  c) Y i  c Y i  nc Y i
nc
x  i 1
 i 1 i 1
 i 1
 i 1
  y c
n n n n n
Ragam :
n n n
 (Y i  c  ( y  c )) 2  (Y i  y  c m c) 2  (Y i  y )2
s2
 i 1
 i 1
 i 1
 sY2
n 1 n 1 n 1
X
Mengalikan konstanta c pada nilai-nilai peubah Y menggeser Yi dan y ke kanan sebesar

kelipatan sebesar c; kisaran berubah menjadi c kali kisaran semula, sehingga ragam juga
berubah sebesar c2 karena formula.
X i  cYi
Kisaran X   cY( n )    cY(1)   c Y( n )  Y(1)   c KisaranY
Rata  rata :
n n n
 cY i c  Yi Y i
x  i 1
 i 1
c i 1
 cy
n n n
Ragam :
n n n n
 (cY i  cy ) 2  (c(Y i  y )) 2 c 2
(Yi  y ) 2 c 2  (Yi  y ) 2
sX2  i 1
 i 1
 i 1
 i 1
n 1 n 1 n 1 n 1
n
 (Y i  y )2
 c2 i 1
 c 2 sY2
n 1
Membagi nilai-nilai peubah Y dengan konstanta c menggeser Yi dan y ke kiri dengan kelipatan
sebesar c-1; kisaran berubah menjadi c-1 kali kisaran semula (menyempit), sehingga ragam
juga berubah sebesar c-2 (jauh lebih kecil).
18
1
X i  c 1Yi  Yi
c
KisaranX   c 1Y( n )    c 1Y(1)   c 1 Y( n )  Y(1)   c 1 KisaranY
Rata  rata :
n n n
 c 1Yi c 1  Yi Y
1 i 1
i
x  i 1
 i 1
c  c 1 y
n n n
Ragam :
n n n n
 (c 1Yi  c 1 y )2  (c 1 (Yi  y )) 2  c 2 (Yi  y ) 2 c 2  (Yi  y ) 2

sX2  i 1
 i 1
 i 1
 i 1
n 1 n 1 n 1 n 1
n
 (Y i  y )2
 c 2 i 1
 c 2 sY2
n 1
Catatan: sifat aditifitas data tidak berubah dengan penambahan dan pengurangan, sehingga
statistik-statistik pun tak berubah.
Data aditif berubah menjadi multiplikatif akibat pengalian (dengan c atau c-1), dengan demikian
statistik-statistik menjadi c dan c2 kali lebih besar (atau kecil c dan c-2).
D. PROPORSI
Populasi (contoh) disebut dikhotom (di=2, bi=2) jika anggota populasi digolongkan ke dalam
2 sifat/karakteristik (tidak dapat diukur), setiap individu hanya memiliki 1 sifat saja.
 Setiap mahasiswa merupakan anak pertama atau bukan anak pertama, bergolongan
darah O atau lainnya, tinggal di rumah sendiri atau tidak
 Sifat tidak dapat diukur atau dihitung. Jenis kelamin tidak dapat diukur atau
dihitung. Yang dihitung adalah banyaknya individu yang memiliki sifat tertentu:
banyaknya mahasiswa bergolongan darah O, banyaknya peserta workshop
perempuan.
Ingin diketahui proporsi petani padi sawah yang menggunakan pupuk kimia. Kepada setiap
petani (sebagai contoh, mewakili semua petani di suatu desa) diajukan pertanyaan tentang
penggunaan pupuk kimia.
No 1 2 3 4 5 6 7 8 9 10 11 12
Jawab Ya Tidak Tidak Ya Ya Tidak Ya Ya Ya Ya Tidak Ya
Sandi 1 0 0 1 1 0 1 1 1 1 0 1
Xi X1 X2 X3 X4 X5 X6 X7 X8 X9 X10 X11 X12
 0, jika tidak memiliki sifat tertentu, tidak termasuk dalam kategori tertentu
Xi= 1, memiliki sifat itu, termasuk kelompok itu
Rata-rata contoh dikhotom disebut proporsi atau fraksi. Perhitungan rata-rata sama dengan
cara menghitung rata-rata aritmatika.
19
Ukuran Jumlah Proporsi Banyaknya Banyaknya
angka 1 angka 0
n n
Populasi N X
i 1
i Y X i
Y Y N-Y
P  i 1

N N
n n
Contoh n X
i 1
i y X i
y y n-y
p i 1

n n
Notasi perhitungan proporsi Populasi (Contoh)
Y (y): adalah banyaknya jawaban 1 (Ya), banyaknya anggota populasi (contoh) yang memiliki
sifat yang ditanyakan, banyaknya anggota populasi (contoh) yang termasuk dalam
kelompok tertentu (kelompok 1)
N – Y (n-y) : banyaknya jawaban 0 (Tidak), banyaknya anggota populasi (contoh) yang tidak
memiliki sifat yang ditanyakan, banyaknya anggota populasi (contoh) yang termasuk
dalam kelompok lain (kelompok 2)
Perhitungan dan interpretasi:

n
 Ada X
i 1
i  y  1  0  0  1  1  0  1  1  1  1  0  1  8 petani yang menggunakan
pupuk kimia dan n-y = 12-8 = 4 petani yang tidak menggunakan pupuk kimia
 Ingat y + (n-y) = n, 8 + (12-8) = 8 + 4 = 12
 Proporsi contoh p=y/n = 8/12 = 2/3, 2 dari 3 petani menggunakan pupuk kimia
 Dari setiap 3 petani, ada 2 petani yang menggunakan pupuk kimia
 Dalam persen: 2/3 x 100% = 66.67% (67 dari 100 petani menggunakan pupuk kimia)
 Proporsi disebut juga fraksi atau bagian
 Ilustrasi:
☺☺☻ ☺☻☺ ☻☺☺ ☺☻☺
E. APLIKASI SIMPANGAN BAKU DAN MEDIAN
1. Simpangan baku dapat digunakan untuk mengukur jarak relatif setiap hasil pengamatan
ke pusat data. Tentunya terkadang ingin diketahui pula, berapa persen data yang terletak
dalam kisaran k (k=1,2,3) simpangan baku dari pusat?
Apabila penyebaran data berbentuk setangkup, diketahui bahwa semua besaran yang
mengukur pusat sebaran bernilai sama, atau berhimpit di mana berlaku hubungan Rata-
rata = Median = Modus.
Dengan kenyataan ini, pemeriksaan terhadap kesetangkupan data dapat dilakukan dengan
menggunakan simpangan baku sebagai satuan. Aturan ini dikenal sebagai Aturan Empiris
68-95-99.7, karena didasarkan pada data (contoh).
Aturan Empiris:
Apabila data memiliki sebaran setangkup (normal), maka kira-kira:
 68.27% dari hasil pengukuran akan terletak dalam jarak 1 simpangan baku dari pusat
atau dalam selang y  s
 95.45% dari hasil pengukuran akan terletak dalam jarak 2 simpangan baku dari pusat
atau dalam selang y  2s
 Hampir semua pengamatan atau 99.73% dari data akan terletak dalam jarak 3
simpangan baku dari pusat atau dalam selang y  3s
20
Telah diketahui bahwa data pada Tabel 3 bersifat menjulur ke kanan, dengan aturan empiris
kenyataan ini dapat pula diperlihatkan, dengan:
y = 5.381 dan s = 4.105; maka y  s = (1.276;9.486)
Kita periksa berapa pengamatan yang terletak dalam selang ini. Karena diagram dahan-
daun merupakan statistik tataan, maka dengan mudah dapat dilihat bahwa hanya ada 5
data yang terletak di luar selang yaitu:
1 dan 1 (di kiri) dan 10, 13 dan 17 di kanan.
Dengan demikian terdapat 21 – 5 = 16 data yang masuk ke dalam selang ini, dan dalam
persen adalah 16/21 x 100% = 76.19%.
Karena yang diharapkan adalah 68,27%, maka dikatakan bahwa data tidak menyebar
normal dan menjulur ke kanan karena median < rata-rata.
2. Median dan simpangan baku dapat digunakan untuk mendeteksi kesetangkupan data
dengan menghitung indeks Pearson berdasarkan kriteria berikut:
< 1, sebaran menjulur ke kanan

3( y  median)
I= = 0, sebaran setangkup
s
> 1, sebaran menjulur ke kiri
F. UKURAN KEBERADAAN RELATIF (measure of relative standing)
Apabila simpangan baku digunakan untuk mengetahui penyebaran semua data ke pusat, maka
jarak atau letak suatu nilai pengamatan relatif (dibandingkan) terhadap letak nilai pengamatan
lain disebut besaran keberadaan relatif. Dua besaran ini adalah:
 Persentil ke 100p merupakan suatu nilai di mana paling tidak 100p% dari hasil
pengamatan bernilai lebih kecil atau sama dengan besaran ini dan paling sedikit 100(1-p)%
dari data berada di atas nilai ini.
# Kuartil bawah atau Q1 adalah persentil ke-25
# Kuartil tengah atau Q2 adalah persentil ke-50
# Kuartil atas atau Q3 adalah persentil ke-75
# Jarak antar kuartil atau simpangan kuartil adalah IQR = Q3 – Q1
# Kisaran ini akan mengandung 50% data
Untuk data pada Tabel 3 dihasilkan Q1 = 2.5; Q2 = 4 dan Q3 = 7.5

 Sekitar ¼ bagian dari 21 petak sawah (5 petak) diolah kurang dari 2.5 hari
 Kisaran kuartil sebesar 5 berarti ada 10 sampai 11 orang yang mengolah sawah selama
5 hari
 Skor baku untuk suatu nilai pengamatan adalah jarak antara nilai pengamatan ke pusat
data y sebesar simpangan baku s. Dengan demikian peubah ini yaitu Z i akan memiliki
wilayah data yang lebih sempit.
Yi  y
Skor baku: Zi =
s
Retransformasi akan menghasilkan nilai Yi = y + Zi xs
Disebut skor baku karena peubah Z memiliki rata-rata 0 dan ragam 1.
21
n
n n
Y  y 
 (Y i  y)
0

i 1
Zi    i
i 1  s 

i 1
s

s
0
0
z  0
n
 Yi  y 
2
n n n n
 n 
 ( Z i  z 2
)  Z i 
2
  1 2  (Yi  y ) 2
  (Yi  y )
2
 s2
 i 1   
s s 1
sz2  i 1  i 1 i 1
 2  i 1   2 1
n 1 n 1 n 1 n 1 s  n 1  s
 
 
Jika diketahui rata-rata jumlah ternak kambing 10 orang peternak di desa Dewata adalah
5 ekor dengan simpangan baku 2 ekor. Jika skor baku Pak Kurdi adalah 1.5 berapa ekor
kambing dimiliki pak Kurdi?
o Karena skor baku bertanda positif maka jumlah kambing pak Kurdi lebih banyak dari
rata-rata dengan jarak sebesar 1.5 simpangan baku
o Dengan retransformasi, pak Kurdi memiliki 5 + (1.5 x 2) = 8 ekor kambing
o Apabila skor baku bernilai 0, maka letak Yi berhimpit dengan y .
Aplikasi Persentil
Kesetangkupan dapat dideteksi dengan ringkasan 3-angka melalui kenyataan:
Median = (Q1 + Q3)/2
Aplikasi Skor Baku
1. Pemeriksaan kesetangkupan
Peubah skor baku dapat pula digunakan untuk melakukan pemeriksaan terhadap
kesetangkupan data berdasarkan interpretasi berikut:
(i) Selang (-1,1) akan mengandung sekitar 68.27% data
(ii) Selang (-2,2) akan mengandung sekitar 95.45% data
(iii) Selang (-3,3) akan mengandung hampir seluruh data (99.73%)
2. Pendeteksian pencilan
Suatu data dikatakan pencilan apabila skor baku data tersebut berada di luar selang (-
2,2). Kenyataan ini banyak digunakan dalam pemeriksaan asumsi kenormalan terhadap
sisaan (dalam regresi dan analisis ragam).
G. METODE UNTUK MENDETEKSI PENCILAN
Pencilan merupakan suatu hasil pengukuran atau pengamatan (data) yang bernilai sangat
besar atau sangat kecil relatif terhadap data lain. Adanya pencilan dapat dideteksi melalui
diagram kotak garis.
Diagram kotak garis atau diagram kotak (box-whisker diagram/box plot)
Pembuatan diagram ini dilandaskan pada ringkasan lima-angka (five-number summary) yaitu:
Q1 Q2 Q3
Y(1) Y(n)
22
Pagar Pagar Pagar Pagar
luar dalam dalam luar
kiri kiri kanan kanan
Y(1) Y(21)
Q1 Q2 Q3
pencilan pencilan
1.5 1QR 1.5

IQR IQR
3IQR 3IQR
Interpretasi diagram kotak garis:
Jika median terletak di tengah kotak dan panjang garis whisker sama, maka data
bersifat setangkup
Luas kotak menjelaskan keragaman data
Data yang terletak di antara dua pagar dalam merupakan data yang baik karena masih
merupakan anggota kelompok data
Pencilan merupakan data yang berada di luar pagar
Untuk membandingkan rata-rata dan ragam antar lebih dari 2 perlakuan
Berdasarkan statistik deskriptif untuk data pada Tabel 3:
n y s Y(1) Y(21) Q1 Q2 Q3
21 5.381 4.105 1 17 2.5 4 7.5
Dihasilkan:
IQR = Q3 – Q1 = 7.5 – 2.5 = 5 (1.5 IQR = 7.5 dan 3 IQR = 15)
Inner Fences (Pagar Dalam): 1.5 IQR di kiri-dari Q1 dan di kanan-dari Q3
* kiri: Q1 – 1.5 IQR = 2,5 – 1.5(5) = 2.5 – 7.5 = -5

kanan: Q3 + 1.5 IQR = 7.5 + 1.5(5) = 7.5 + 7.5 = 15
Outer Fences (Pagar Luar): 3 IQR di kiri-dari Q1 dan di kanan-dari Q3

* kiri: Q1 – 3 IQR = 2.5 – 3 (5) = 2.5 – 15 = -12.5
kanan: Q3 + 3 IQR = 7.5 + 3 (5) = 7.5 + 15 = 22.5
Garis Whisker: jarak data terdekat pagar dalam ke Q1 (kiri) dan Q3 (kanan)
* kiri: Q1 – 1 = 2.5 – 1 = 1.5
kanan: 13 – Q3 = 13 – 7.5 = 5.5
Mendeteksi pencilan
* Karena Y(21) = 17 terletak di luar pagar dalam maka data ini disebut pencilan (tanda bintang)
seperti terlihat pada Gambar 5.
Mendeteksi kesetangkupan
23
* Karena panjang garis whisker tidak sama, maka data tidak bersifat setangkup
* Karena median tidak terletak di tengah-tengah kotak, maka data tidak setangkup
* Data menjulur ke kanan karena garis whisker kanan lebih panjang dari kiri
* Data menjulur ke kanan karena median tidak terletak di tengah kotak dan bernilai lebih
dekat dengan Q1
1 2.5 4 7.5 13 15 17
5,38 (rata-rata)
Diagram kotak-garis sangat bermanfaat untuk membandingkan perlakuan, kelompok ataupun

populasi. Gambar 6 menyajikan diagram kotak-garis untuk suhu di lima kota di Amerika Serikat
selama 12 bulan (Farenheit) yang dapat digunakan untuk membandingkan suhu di 5 kota tersebut.
Suhu bulanan di 5 kota (Fahrenheit)
80
60
40
20
A tl anta B i s mark New Y ork S an Di ego P hoeni x
Gambar menunjukkan bahwa suhu di San Diego memiliki keragaman terkecil, keragaman suhu di
kota 3 kota lain relatif sama dan keragaman terbesar terjadi di Bismark yang mengindikasikan
bahwa temperatur di kota itu sangat fluktuatif.
Diskusikan kota manakah yang paling nyaman untuk dihuni?
24
Sebaran Penarikan contoh yang berhubungan dengan sebaran Normal
1. Sebaran Normal dan Normal Baku (Z)

Populasi: pandang sebaran populasi peubah acak Y ~ Normal (  , 2 ) sehingga
Y  Y 
 ~ Normal baku (0,1) untuk inferensia bagi  (1)
2 
2. Sebaran penarikan contoh bagi y yang berasal dari contoh acak berukuran n yang diambil dari
populasi normal (  , σ2).
 Sekali penarikan contoh menghasilkan satu y1 , penduga bagi 

 Contoh lain ditarik dari populasi yang sama, akan menghasilkan y2 penduga berbeda bagi

 Proses ini diulang hingga didapat y1 , y2 , y3 , y4 , ……….. yang membentuk sebuah peubah
baru y
 Seperti halnya sebaran Y, beberapa sifat sebaran peubah y ini adalah
2
y ~ Normal (  , )
n
Rata-rata dan ragam bagi peubah y adalah:
E ( y )   dan Var ( y )  
2
y  n  y    y  
  ~ Z (0,1) untuk inferensia bagi  (2)
2 /n   n
 Simpangan baku bagi y disebut salah (galat) baku bagi y ,

2  s2 s
Populasi: se( y ) = = yang diduga oleh se( y ) = =
n n n n
mengukur besarnya keragaman y yakni penyimpangan statistik y terhadap

s2
Salah baku rata-rata contoh = s y  s ( y )  se( y )  (apa satuan statistik ini?)
n
Besaran ini digunakan untuk mengetahui sebaik apa statistik y sebagai penduga bagi
parameter. Statistik yang baik bersifat takbias yang dalam praktek tidak terjadi. Dengan
demikian statistik yang baik adalah yang berjarak tidak terlalu jauh dari parameter. Jarak inilah
yang diukur oleh salah baku rata-rata contoh. Semakin kecil se( y ) semakin baik statistik y
sebagai penduga bagi  .
 Untuk memperoleh setengah salah baku, ukuran contoh (n) haruslah meningkat 4x, sedangkan
memperkecil salah baku menjadi 1/3 membutuhkan 9x peningkatan n
25
 Walaupun data asli tidak menyebar normal (sebaran) tidak diketahui, sebaran rata-rata contoh
akan kira-kira (mendekati) normal, asal n berukuran cukup besar (katakan >30). Sifat ini dikenal
sebagai Dalil Limit Pusat.
3. Sebaran penarikan contoh bagi p̂ yang berasal dari contoh acak berukuran n yang diambil dari
populasi binomial (n, p).
 Sekali penarikan contoh menghasilkan satu p̂1 , penduga bagi p

 Contoh lain ditarik dari populasi yang sama, akan menghasilkan p̂ 2 penduga berbeda bagi
p
 Pengulangan proses akan menghasilkan peubah p̂ : p̂1 , p̂ 2 , p̂3 , ………..
pq
 Jika contoh berukuran besar pˆ ~ Normal ( p, ) atau
n
pq
E ( pˆ )  p dan V ( pˆ ) 
n
pˆ  p
~ Normal baku (0,1) untuk inferensia bagi p (3)
pq
n
4. Peubah acak yang dibangkitkan dari Normal( Yi ~ N ( , 2 ) )

a. Peubah Khi-kuadrat:2
Y 
Pandang Z i  i , i  1,2,..., n

n Y   
 Yi   
2
n n
Maka  Z i ~  n atau  
2 2
 ~  2
atau  i
~  n2
i 1 i 1    n
i 1  2
 Y   
n
2
i n
Jumlah Kuadrat
i 1
~  n atau  (Yi   ) 2 ~  2  n2 atau
2
~  n2
 2
i 1  2

2
Menjumlahkan n peubah acak Z i akan menghasilkan peubah 2 (dengan derajat bebas
n)
 Yi  i 
2
~  n2 untuk inferensia bagi 

n

2
  (4)
i 1
 i 
Apa yang terjadi jika  tidak diketahui dan diduga oleh statistik y ? Parameter sebaran
 2
akan berkurang satu akibat pendugaan ini, menjadi n-1 (derajat bebas).
26
n
 Yi  y 
2
n Y  y  ~ 
   ~  n21 atau  i 2
i 1    i 1  2 n 1
Menjumlahkan sebanyak n, namun menghasilkan  n21 , untuk memudahkan pemahaman,

dilakukan penyederhanaan berikut:
Y  y 
2
1
 Y  y  ~ 
n n
 ~  n21
i 2 2
atau nyatakan sebagai fungsi dari s2
i 1  2
 2
i 1
i n 1
dengan mengalikan n -1 , menjadi:

n -1
(n - 1)  Y  y 
n
2
(n - 1) 1
x 2  Yi  y  ~  n21 atau
n i
~  n21
2 i 1
x
(n - 1)  i 1  2
n-1
(n - 1)s 2
~  n21 untuk inferensia bagi 
2
(5)
 2
c. Peubah t, dibangkitkan dari sebaran Z dan  n21 yang saling bebas berdasarkan
Z
~ tn1 substitusi Z menggunakan (2) dan  2 menggunakan (5)
 2
n 1
n y   /  y     y  
 n  s ~ t n 1
(n  1) s 2  s 
n
2
n 1
 y   ~ t
n 1 untuk inferensia bagi  , jika σ2 tidak diketahui 6)
s n
 Dalam praktek, jarang sekali ragam populasi σ2 diketahui

 Padahal parameter ini menjadi acuan dalam pengambilan contoh acak
 Untuk contoh berukuran n ≥ 30, penduga bagi σ2 yang baik adalah s2
 Apa yang terjadi dengan  y  μ  σ / n bila σ diganti s?  
 Selama s2 merupakan penduga yang baik bagi σ2, dan tidak berubah dari contoh ke contoh
(sifat konsisten), dan untuk n ≥ 30 nilai tersebut masih baik dihampiri dengan sebaran
normal baku Z
 Bila ukuran contoh kecil n < 30, nilai s berubah cukup besar dari contoh ke contoh dan nilai
tersebut tidak lagi menyebar secara Z, melainkan sebaran t
 Parameter sebaran t adalah derajat bebas yaitu besarnya penyebut yang digunakan untuk
menghitung s2
 s n  s ( y )  se( y )  s y adalah salah baku rata-rata contoh
27
d. Peubah F
Nisbah dua buah sebaran 2 yang saling bebas yang dibagi dengan derajat bebas akan
menghasilkan sebaran F
(n1  1) s 2 (n2  1)s 2

1
~  n 1 bebas terhadap
2 2
~  n2 1
1 2 1
2
2 2
(n1  1) s12
(n  1)
12 (n1  1)  12 1
  22  s12 
~ Fn 1,n 1 atau   2  2  ~ Fn 1,n 1
 22 (n2  1) (n2  1) s22 
(n2  1)  1  2 
1 2
s 1 2
2 2
  22  s12   22
 2  2  ~ Fn 1,n 1 untuk inferensia bagi 2
  1  s2  1
1 2
(7)
  1  s2 
2 2
 12
 2  2  ~ Fn 1,n 1 untuk inferensia bagi 2
  2  s1  2
2 1
28
PENDUGAN PARAMETER
I. Pendugaan Parameter Satu Populasi
A. Penduga titik merupakan suatu nilai statistik tunggal, seperti y sebagai penduga
parameter μ, p̂ penduga bagi p dan s2 sebagai penduga bagi parameter populasi σ2.
 Kedua statistika ini bersifat tak bias:
E ( y )   dan E ( s 2 )   2
Pendugaan selang bagi  (jika  diketahui)

2
B.
C.
Ukuran contoh Asumsi tambahan
n ≥ 30 Tak ada
a. Penduga selang (2 arah) bagi  dengan tingkat kepercayaan (1-α)100%:

Y 
 Sebaran yang mengandung  adalah ~Z

 Didasarkan pada pernyataan peluang:
P(Z /2  Z  Z /2 )  1  
Substitusi
Y 

Y 
P (  Z / 2   Z / 2 )  1  

Kalikan dengan setiap suku pertidaksamaan dengan σ
Y 
P ( Z / 2    Z / 2 )  1  

P ( Z / 2  Y    Z / 2 )  1  
Tambahkan dengan –Y, setelah direorganisirakan menghasilkan:
P (Y  Z / 2  Y  Y    Y  Z / 2 )  1  
P ((Y  Z / 2 )     (Y  Z / 2 ))  1  
Setelah dikalikan -1, didapat
P(Y  Z /2    Z /2 )  1  
29
Dengan keyakinan sebesar 95%,  akan berada dalam selang, atau selang akan
mengandung 95 dari 100 nilai y (jika penarikan contoh dilakukan 100 kali).
b. Penduga selang satu arah (<) bagi  dengan tingkat kepercayaan (1-α)100% :
 Didasarkan pada pernyataan peluang P(Z  Z )  1   :
Y 
P(   Z )  1  

Y 
P(    Z  )  1   P(Y     Z  )  1  

P(Y  Y    Y  Z  )  1   P (   (Y  Z  )  1  
P(  Y  Z )  1  
c. Penduga selang satu arah (>) bagi  dengan tingkat kepercayaan (1-α)100% :
 Didasarkan pada pernyataan peluang P(Z  Z )  1   :
Y 
P(  Z )  1  

Y 
P(   Z  )  1   P(Y    Z  )  1  

P(Y  Y    Y  Z  )  1   P(   (Y  Z  ))  1  
P(  Y  Z )  1  

Y 
P(   Z )  1  

Y 
P(    Z  )  1   P(Y     Z  )  1  

P(Y  Y    Y  Z  )  1   P (   (Y  Z  )  1  
P(  Y  Z )  1  
Pendugaan selang bagi  (jika  tidak diketahui)

2
D.

n < 30 Populasi normal
a. Penduga selang (2 arah) bagi  dengan tingkat kepercayaan (1-α)100% :
 y   ~ t
Sebaran yang mengandung  adalah n 1
s n
30
P(t / 2,n 1  t  t / 2,n 1 )  1  

substitusi
y
s n
P(t /2,n1 
 y    t )  1
 /2, n 1
s n
Kalikan dengan setiap suku pertidaksamaan dengan salah baku rata-rata: s n
y 
P(t /2,n1 s n s n  t /2,n1 s n)  1 
s n
P(t /2,n1 s n  y    t /2,n1 s n)  1 
Tambahkan dengan (– y ), setelah direorganisir akan menghasilkan:

P( y  t /2,n1 s n   y  y     y  t /2,n1 s n)  1
P(( y  t /2,n1 s n )     ( y  t /2,n1 s n ))  1  
P( y  t /2,n1 s n    y  t /2,n1 s n)  1 
Limit-limit kepercayaan bagi  adalah y  t /2,n1 s n atau y  t /2,n 1 s y
b. Penduga selang satu arah (<) bagi  dengan tingkat kepercayaan (1-α)100% :
 Didasarkan pada pernyataan peluang P(tn1  t ,n1 )  1   :
y 
P(  t ,n 1 )  1  
s n
y 
P( s n  t ,n 1 s n )  1   P ( y    t ,n 1 s n)  1 
s n
P (  y  y     y  t ,n 1 Z s n)  1 
P (    ( y  t ,n 1 s n)  1 
P(   ( y  t ,n1 s n)  1 
c. Penduga selang satu arah (>) bagi  dengan tingkat kepercayaan (1-α) :
 Didasarkan pada pernyataan peluang P(tn1  t ,n 1 )  1   :
31
y 
P(  t ,n 1 )  1  
s n
y 
P( s n  t ,n 1 s n )  1   P ( y    t ,n 1 s n)  1 
s n
P (  y  y     y  t ,n 1 Z s n)  1 
P (    ( y  t ,n 1 s n)  1 
P(   ( y  t ,n1 s n)  1 
E. Penduga selang bagi proporsi p

n cukup besar sehingga selang
ˆˆ Tak ada
pq
pˆ  2 tidak mengandung 0 atau 1
n
Penduga selang (2 arah) bagi p dengan tingkat kepercayaan (1-α)100%:
pˆ  p pˆ  p
 Sebaran yang mengandung p adalah ~ Z atau ~Z
pq  pˆ
n
ˆˆ
pq
 p tidak diketahui sehingga diganti oleh penduganya p̂ ,  pˆ =
n
P (  Z / 2  Z  Z / 2 )  1  
pˆ  p
 Substitusi , p pada penyebut diganti oleh penduganya p̂
pq
n
pˆ  p
P( Z /2   Z /2 )  1  
ˆpqˆ
n
ˆˆ
pq
 Kalikan dengan setiap suku pertidaksamaan dengan  pˆ 
n
32
ˆ ˆ pˆ  p
pq ˆˆ
pq ˆˆ
pq
P (  Z / 2   Z / 2 )  1
n ˆˆ
pq n n
n
ˆˆ
pq ˆˆ
pq
P (  Z / 2  pˆ  p  Z / 2 )  1
n n
 Kurangi dengan p̂ kemudian kalikan (-1), menghasilkan
ˆˆ
pq ˆˆ
pq
P( pˆ  Z /2   pˆ  pˆ  p   pˆ  Z /2 )  1
n n
ˆˆ
pq ˆˆ
pq
P(( pˆ  Z /2 )   p  ( pˆ  Z /2 ))  1  
n n
ˆˆ
pq ˆˆ
pq
P( pˆ  Z /2  p  pˆ  Z /2 )  1
n n
F. Penduga selang (2 arah) bagi  2 dengan tingkat kepercayaan (1-α)100%
semua n Populasi normal
 n - 1 s 2
~  n21
 Sebaran yang mengandung  2
adalah
 2
P( 12 /2,n1  n21  2/2,n1 )  1  

substitusi
 n - 1 s 2
2
P(  2

 n - 1 s 2
 2/2,n1 )  1  
1 /2, n 1
 2
 Bagi setiap suku pertidaksamaan dengan  n - 1 s 2
P( 
 n - 1 s
12 /2,n1 2

2/2,n1
)  1
 n - 1 s  n - 1  s 
2 2 2
 n - 1 s 2
12 /2,n1 1 2/2,n1

P(   )  1
 n - 1 s 2
2  n - 1 s 2
33
 Pangkatkan -1, akan menghasilkan
1 1
 12 /2,n1   1 
1
 2/2,n1 
P( 2 
 2   2 
)  1
  n - 1  s       n - 1 s 
  n - 1 s 2  n - 1 s 2 
P 2   2
2
  1  
  
  2,n1 1 2,n 1 
II. Pendugaan Parameter Dua Populasi
1  2
Anggap kedua populasi bebas, sebaran selisih adalah:
Y1 ~ N ( 1 , 12 )
Y1  Y2  Di ~ N ( 1  2 , 12   22 )
Y2 ~ N ( 2 ,  2 )
2
Sebaran penarikan contoh bagi selisih:
y1 ~ N ( 1 ,
 12 )
n  12  22
y1  y2 ~ N ( 1  2 , 
1
)
y2 ~ N (  2 ,
 2
2
)
n1 n2
n2
Dua contoh: Bebas dan Berpasangan
 Ingin dibandingkan dua metode pengeringan beton (A dan B)

 10 contoh campuran beton dipilih secara acak dari semua campuran, kemudian setiap
metode pengeringan diterapkan pada 5 contoh
 Kekuatan beton kedua metode bersifat bebas
 Metode penarikan contoh lain adalah memasangkan spesimen beton sesuai jenis
campuran
 Pada setiap pasang, satu spesimen dipilih secara acak untuk dikenai metode pengeringan
A dan specimen lain dikeringkan dengan metode B
 Kekuatan beton kedua metode bersifat tidak bebas (saling menentukan atau berpasangan)
A. Pendugaan selang bagi 1  2  d   populasi berpasangan (  tidak diketahui)

2

semua nd, jika nd≥30, t / 2 , nd mendekati Selisih Populasi Di menyebar normal
Z / 2
 Peubah selisih adalah Di  Y1i  Y2i menjadi peubah tunggal

 Statistik-statistik :
34
 D  d 
nd 2
sd2
ˆ d = d atau ˆ = d
i
ˆ d =sd 
2 2 i 1
ˆ d =sd 
nd  1 nd
 Sebaran penarikan contoh: d ~ Normal ( ,  d nd ) sehingga
2
d  d 
karena  d tidak diketahui, maka
2
~ Z ~ t n 1
d 2
ˆ d
2 d
nd nd
a. Penduga selang (2 arah) bagi parameter  d atau  dengan tingkat kepercayaan (1-α)100% :
d 
 Sebaran ~ tn 1 untuk inferensia bagi 
sd2
d
nd
P (t / 2,n d 1
 t  t / 2,n 1 )  1  
d
substitusi
d 
sd nd
d 
P(t /2,n 1  d
 t /2,n 1 )  1  
d
sd nd
Kalikan dengan setiap suku pertidaksamaan dengan salah baku rata-rata: sd nd
d 
P (t / 2,n 1 sd
d
nd  sd nd  t / 2,n 1 sdd
nd )  1  
sd nd
P (t / 2,n 1 sd
d
nd  d    t / 2,n 1 sd
d
nd )  1  
Tambahkan dengan (– d ), setelah direorganisir akan menghasilkan:

P(d  t /2,n 1 sd d
nd  d  d    d  t /2,n 1 sd d
nd )  1  
P((d  t /2,n 1 sd d
nd )    (d  t /2,n 1 sd d
nd ))  1  
P(d  t /2,n 1 sd d
nd )    d  t /2,n 1 sd d
nd )  1  
Limit-limit kepercayaan bagi  adalah d  t /2,n 1 sd

d
nd atau d  t /2,n 1 sd
d
B. Pendugaan selang bagi 1  2 populasi bebas (  12 dan  22 diketahui)

35
n1 ≥ 30, n2 ≥ 30 Tak ada
 12  22
y1  y2 ~ N ( 1  2 ,  )
n1 n2
 12   22  12   22   2
 y1  y2    1  2  ~ Z (0,1) atau
 y1  y2    1  2  ~ Z (0,1)
 12  22 1 1
 2  
n1 n2  1 n2 
n
 12  22 1 1
Lambangkan  y y =  atau  y y =  2   
n1 n2  n1 n2 
1 2 1 2
1. Kasus ragam dua populasi tidak sama (  1   22 ) dan sama  12   22

2
a. Dua arah
P(Z /2  Z  Z /2 )  1  
substitusi
y1
 y2    1  2  y 1
 y2    1  2 
atau
 12  22 1 1
 2 + 
n1 n2  1 n2 
n
P( Z /2 
y 1
 y2    1  2 
 Z /2 )  1  
 y y
1 2
 Kalikan dengan setiap suku pertidaksamaan dengan  y1  y2
P( Z /2 y  y 
y1
 y2    1  2 
 y  y  Z /2 y  y )  1  
1 2
 y y
1 2
1 2 1 2
P( Z /2 y  y   y1  y2    1  2   Z /2 y  y )  1  

1 2 1 2
 Tambahkan dengan –  y1  y2  , setelah direorganisirakan menghasilkan:

P(  y1  y2   Z /2 y  y    y1  y2    y1  y2    1  2     y1  y2   Z /2 y  y )  1  
1 2 1 2
P(( y1  y2   Z /2 y  y )    1  2   ( y1  y2   Z /2 y  y ))  1  

1 2 1 2
36
P(( y1  y2 )  Z /2 y  y  1  2  ( y1  y2 )  Z /2 y  y )  1  
1 2 1 2
b. Satu arah (<)

P(
y 1
 y2    1  2 
  Z )  1  
 y y 1 2
P(
y1
 y2    1  2 
 y  y   Z  y  y )  1  
 y y
1 2
1 2 1 2
P( y1  y2    1  2    Z  y  y )  1   1 2

P(  y1  y2    y1  y2    1  2     y1  y2   Z  y  y )  1   1 2
P(  1  2   ( y1  y2   Z  y  y ))  1   1 2
P( 1  2    y1  y2   Z y  y )  1   1 2
c. Satu arah (>)
 Didasarkan pada pernyataan peluang P(Z  Z )  1   :

P(
y 1
 y2    1  2 
 Z )  1  
 y y 1 2
P(
y1
 y2    1  2 
 y  y  Z  y  y )  1  
 y y
1 2
1 2 1 2
P( y1  y2    1  2   Z  y  y )  1   1 2

P(  y1  y2    y1  y2    1  2     y1  y2   Z  y  y )  1   1 2
P(  1  2   ( y1  y2   Z  y  y ))  1   1 2
P( 1  2    y1  y2   Z y  y )  1   1 2
C. Pendugaan selang bagi 1  2  d populasi bebas (  1

2
= 22   2 ) tidak diketahui
37
Salah satu n1 ≥ 30, n2 ≥ 30 atau Populasi normal dan ragam sama
keduanya
Yij , i  1,2 dan j  1,2,...., ni

Pandang data 2 populasi bebas:
ni  banyaknya pengamatan contoh ke - i
Contoh Yij ni Rata-rata Jumlah kuadrat

Y
 Y  y 
i ij
yi ni 2
j 1
ij i
j 1
 Y  y 
1 Y1j : Y11 , Y12 ,......., Y1n n1
1 n n1
Y
2
 Y1j  y1
1
1
1j 1j 1
j 1 n1 j 1 j 1
2
 Y  y 
Y2j : Y21 ,Y22 ,.......,Y2n n2
1 n n2 2
 Y2j  Y2j  y2
2
2
2j 2
j=1 n2 j=1 j=1
Ragam contoh ke-i
 Y  y 
ni 2
 Y  y    n  1 s ; JK  db s
ij i
JK ni 2
si 
2 j 1
= ; 2 2
ni  1
ij i i i i
db j 1
 Y - y   Y - y 
n1 2 n2 2
1j 1 2j 2
s12  j=1
dan s22 = j=1
n1 - 1 n2 - 1
Karena asumsi kesamaan ragam populasi, maka kedua ragam digabung kemudian
diduga berdasarkan penggabungan ragam dua contoh:
Penduga bagi ragam gabungan 

2
s 2

 n - 1 s
2
i
2
i

n 1
- 1 s12   n2 - 1 s22
gab
 n - 1
i=1
i  n1 - 1   n2 - 1
 Y  y 
ni 2
2 ij i 2 JK i JK1 + JK 2 JK gabungan
= j 1
  
i=1  n - 1 i
i=1 dbi db1 + db2 dbgabungan
dbgab   n - 1   n 1 2
- 1  n1  n2  2, penyebut sgab
2
Pandang sebaran penarikan contoh

  1 1 
y1  y2 ~ N  1  2 , 2  +  
  n1 n2  
38
Transformasi menghasilkan sebaran t-pasti
y 1
 y2    1  2 
~ tdbgab atau
y 1
 y2    1  2 
~ tdbgab
2  1 1 sy - y

1 2
sgab n n 
 1 2 
1 1
Lambangkan salah baku rata-rata contoh: sy - y = s2  gab + 
 1 n2 
n
1 2
a. Dua arah
P(ta/ 2,dbgab  t  ta/ 2,dbgab )  1  

substitusi
y 1
 y2    1  2 
sy - y 1 2
P(ta / 2,dbgab 
y 1
 y2    1  2 
 ta / 2,dbgab )  1  
sy  y 1 2
 Kalikan dengan setiap suku pertidaksamaan dengan sy  y

1 2
P(ta / 2,dbgab s y  y 
y 1
 y2    1  2 
s y  y  ta / 2,dbgab s y  y )  1  
1 2
sy  y 1 2
1 2 1 2
P(ta / 2,dbgab s y  y   y1  y2    1  2   ta / 2,dbgab s y  y )  1  

1 2 1 2
 Tambahkan dengan –  y1  y2  yang akan menghasilkan:
P(  y1  y2   ta / 2,dbgab s y  y    y1  y2    y1  y2    1  2     y1  y2   ta / 2,dbgab s y  y )  1  

1 2 1 2
P(( y1  y2   ta / 2,dbgab s y  y )    1  2   ( y1  y2   ta / 2,dbgab s y  y ))  1  

1 2 1 2
P(( y1  y2 )  ta / 2,dbgab s y  y  1  2  ( y1  y2 )  ta / 2,dbgab s y  y )  1  

1 2 1 2
b. Satu arah (<)

 Didasarkan pada pernyataan peluang P(t  ta,dbgab )  1   :
P(
y 1
 y2    1  2 
 ta,dbgab )  1  
sy  y 1 2

1 2
39
P(
y1
 y2    1  2 
s y  y  ta,dbgab s y  y )  1  
sy  y 1 2
1 2 1 2
P( y1  y2    1  2   ta,dbgab s y  y )  1   1 2

P(  y1  y2    y1  y2    1  2     y1  y2   ta,dbgab s y  y )  1   1 2
P(  1  2   ( y1  y2   ta,dbgab s y  y ))  1   1 2
P( 1  2    y1  y2   ta,dbgab sy  y )  1   1 2
c. Satu arah (>)
 Didasarkan pada pernyataan peluang P(t  ta,dbgab )  1   :
P(
y1
 y2    1  2 
 ta,dbgab )  1  
sy  y1 2

1 2
P(
y 1
 y2    1  2 
s y  y  ta,dbgab s y  y )  1  
sy  y 1 2
1 2 1 2
P( y1  y2    1  2   ta,dbgab s y  y )  1   1 2
 Tambahkan dengan –  y1  y2  , setelah reorganisasi akan menghasilkan:

P(  y1  y2    y1  y2    1  2     y1  y2   ta,dbgab s y  y )  1   1 2
P(  1  2   ( y1  y2   ta,dbgab s y  y ))  1   1 2
P( 1  2    y1  y2   ta,dbgab sy  y )  1   1 2
D. Penduga selang dua arah bagi selisih dua parameter binomial p1 - p2

n1 dan n2 cukup besar sehingga
selang-selang
pˆ qˆ pˆ qˆ Kedua contoh saling bebas
pˆ 1  2 1 1 dan pˆ 2 ± 2 2 2
n1 n2
tidak mengandung 0 atau 1
40
p1 q1
pˆ 1 ~ N( p1 , )
n1 p1 q1 p2 q2
pˆ 1 - pˆ 2 ~ N( p1 - p2 , + )
p2 q2 n1 n2
pˆ 2 ~ N( p2 , )
n2
 pˆ 1
- pˆ 2  -  p1 - p2 
~Z inferensia bagi p1 - p2
p1 q1 p2 q2
+
n1 n2
 p1 dan p2 tidak diketahui sehingga diganti oleh penduganya pˆ1 dan pˆ 2 ,
pˆ 1 qˆ1 pˆ 2 qˆ2
menghasilkan salah baku selisih 2 proporsi ng  pˆ1 - pˆ 2 = +
n1 n2
 Menggunakan pernyataan peluang: P(Z / 2  Z  Z / 2 )  1  
P (  Z / 2 
 pˆ1
- pˆ 2  -  p1 - p2 
 Z / 2 )  1  
pˆ 1 qˆ1 pˆ 2 qˆ2
+
n1 n2
P (  Z / 2 
 pˆ1
- pˆ 2  -  p1 - p2 
 Z / 2 )  1  
 pˆ - pˆ
1 2
 Kalikan dengan setiap suku pertidaksamaan dengan  pˆ1 - pˆ 2
P( Z /2 pˆ - pˆ 
 pˆ 1
- pˆ 2  -  p1 - p2 
 pˆ - pˆ  Z /2 pˆ - pˆ )  1  
1 2
 pˆ - pˆ1 2
1 2 1 2
P( Z /2 pˆ - pˆ   pˆ 1 - pˆ 2  -  p1 - p2   Z /2 pˆ - pˆ )  1  

1 2 1 2
 Kurangi dengan  pˆ 1
- pˆ 2  kemudian kalikan (-1), menghasilkan
P (  pˆ 1 - pˆ 2   Z / 2 pˆ - pˆ1 2
 -  p1 - p2     pˆ 1 - pˆ 2   Z / 2 pˆ - pˆ )  1   1 2
P (( pˆ 1 - pˆ 2   Z / 2 pˆ - pˆ )  -  p1 - p2   ( pˆ 1 - pˆ 2   Z / 2 pˆ - pˆ ))  1  
1 2 1 2
P( pˆ 1 - pˆ 2   Z /2 pˆ - pˆ   p1 - p2    pˆ 1 - pˆ 2   Z /2 pˆ - pˆ )  1  

1 2 1 2
E. Penduga selang (2 arah) bagi

 12 dengan tingkat kepercayaan (1-α)100%
 22
Semua ukuran n1 dan n2 Contoh bebas dari dua populasi normal
41
2   22  s12 
 Sebaran yang mengandung 1 adalah  2  2  ~ Fn 1,n 1
 22   1  s2 
1 2
 Untuk penyerdehanaan lambangkan v1 = n1 - 1 dan v2 = n2 - 1
 Tabel F hanya mendaftarkan titik kritis ekor atas Fa(v ,v

1 2 ) atau Fa / 2(v ,v
1 2 )
 F0.05(15,10) = 2.85 atau F0.025(5,19) = 3.33

 Titik kritis ekor bawah adalah
1 1
 F1-a(v ,v )  dan F1-a / 2(v2,v ) =
1 2
Fa(v ,v 2 1 )
1
Fa / 2(v1,v2)
1 1
 F1-0.05(17,12) = F0.95(17,12)   0.42 
F0.05(12,17) 2.38
1 1
 F1-0.025(20,60) = F0.975(20,60) = = = 0.45
F0.025(60,20) 2.22
F0.95(10,15) < F0.05(10,15)
 F0.05(15,10)   F0.05(10,15)
1
 F1-a(v ,v )  Fa(v ,v
1 2 1 2 ) yakni
 3.52 
1
 0.28  3.06
P( F1-a / 2(v ,v )  F  Fa / 2(v ,v ) )  1  

1 2 1 2
atau P(FL  F  FU )  1  
substitusi
  22   s12 
 2  2 
  1   s1 
  22  s12 
P( FL   2  2   FU )  1  
  1  s2 
s12
 Bagi setiap suku pertidaksamaan dengan 2
s2
s22  22 s22
P( 2 FL  2  2 FU )= 1- a
s1  1 s1
 Pangkatkan -1, akan menghasilkan
42
s12 1  12 s12 1
P( 2   )= 1- a
s2 FU  22 s22 FL
s12 1  12 s12 1
P( 2  2 2 )= 1- a
s2 Fa / 2(v ,v )  2 s2 F1-a / 2(v ,v )
1 2 1 2
1
 Mengganti F1-a / 2(v ,v ) dengan menghasilkan
1 2
Fa / 2(v ,v )
2 1
2
s1 1  1 s1
2 2
P(   Fa / 2(v ,v ) )= 1- a
s22 Fa / 2(v ,v )  22 s22
1 2
2 1
 Dengan cara yang sama akan didapat
s22 1  22 s22
P( 2   Fa / 2(v ,v ) )= 1- a
s1 Fa / 2(v ,v )  12 s12
2 1
1 2
43

28.03.19.metode Statistika

Diunggah oleh

Informasi Dokumen

Judul Asli

Hak Cipta

Format Tersedia

Bagikan dokumen Ini

Bagikan atau Tanam Dokumen

Opsi Berbagi

Apakah menurut Anda dokumen ini bermanfaat?

Apakah konten ini tidak pantas?

Hak Cipta:

Format Tersedia

28.03.19.metode Statistika

Diunggah oleh

Hak Cipta:

Format Tersedia

BEBERAPA KONSEP DASAR STATISTIKA

2. Statistika & Metode Ilmiah

LANGKAH-LANGKAH DALAM METODE ILMIAH :

4. Mengumpulkan dan mengolah data, menguji hipotesis,

DATA terbagi atas DATA KUALITATIF dan DATA KUANTITATIF

DATA KUALITATIF : DATA KUANTITATIF :

KUALITATIF JENIS KUANTITATIF

 Membuat kesimpulan mengenai populasi berdasarkan analisis terhadap informasi yang

 Merancang proses perolehan data (penarikan contoh) agar data (hasil

 Memperoleh data, mengorganisir, menata, meringkas, mendeskripsikan (menjelaskan,

Peringkasan ini dimulai dari membuat:

Statistika inferensial menangani pendugaan parameter, pengujian hipotesis, pembuatan

1. Populasi : himpunan semesta (kumpulan) semua individu/unit

2. Contoh : sebagian anggota populasi (himpunan bagian

3. Peubah (Variabel) : ciri, karakteristik atau sifat individu yang dapat

Dap at diukur berarti karakteristik itu dapat dilambangkan atau

 Pemberian nama atau label pada berbagai kategori

2.Ordinal: Hasil pengelompokkan individu/obyek ke dalam sifat yang memiliki tingkatan,

 Hasil pengelompokkan anggota batalyon menurut kepangkatan

 Pengukuran suhu simpan pindang bandeng, lama perjalanan bus Patas ke

4. Rasional: menjelaskan kelipatan suatu data dibandingkan data lain

 Penghasilan bulanan setiap rumah tangga di RW 007, laju pertambahan berat

 Label (nominal)  Beda (interval)

Operasi aritmatika (+-*/) Tidak dapat Semua dapat

Parameter/sebaran Tidak ada Ada, tertentu

Non parametrik (bebas

Tabel dan grafik (frekuensi  Deskriptif

Sifat data Miskin Sangat kaya

A. MENJELASKAN DATA DENGAN TABEL DAN GRAFIK

Tabel 1. Ringkasan hasil pengumpulan pendapat

Gambar 1. Tayangan grafis hasil pengumpulan pendapat

Langkah-langkah dalam statistika deskriptif data adalah:

¤ Penyajian tabel dan grafik

b) Menghitung besaran numerik untuk mengetahui:

merupakan nomor urut atau indeks) 𝑌(𝑖) ≤ 𝑌(𝑖+1)

 Data disusun/diurutkan dari nilai terkecil ke nilai besar (atau sebaliknya)

Kisaran = Y(n) – Y(1)

2. Diagram dahan-daun (Stem and leaf diagram/display)

Cara membuat diagram dahan-daun

Frek Kum dahan daun

Kedua diagram ini memberikan informasi sebagai berikut:

3. Diagram titik (Dot Diagram)

 Data ditempatkan pada garis bilangan sesuai wilayah data

Untuk data pada Tabel 2 dihasilkan diagram titik di bawah ini:

4. Diagram balok (Histogram)

Prosedur pembuatan diagram balok atau histogram frekuensi:

1. Tentukan jumlah kelas (k) berdasarkan:

1 + 3.3 log n, n ≥ 250

 Bilangan bulat terkecil yang memenuhi 2k ≥ n

Tabel 5. Banyaknya kelas untuk pembentukan tabel frekuensi

3. Hitung selang (lebar/interval) kelas h = (Y(n) – Y(1))/k

Tabel 6. Daftar frekuensi (dengan penataan turus) dengan lebar kelas 1

Karena n = 21 maka k = 5, sehingga dibuat tabel frekuensi dengan lebar (interval/selang)

Tabel 6. Daftar frekuensi dengan lebar kelas 3

Tabel 7. Daftar frekuensi kumulatif

B. UKURAN PEMUSATAN (measure of central tendency)

i. Rata-rata (hitung/artitmatika, geometrik dan harmonik) atau proporsi

# Rata-rata hitung (rata-rata aritmatika ya ):

# Rata-rata terboboti (sama dengan rata-rata aritmatika ya ):

Y1 Y2 ......... Yn  Y1 Y2 ......... Yn 

Perbandingan antar rata-rata: ya  yb  yg  yh

i) Karena terdapat 21 petak sawah, median adalah peringkat ke (21+1)/2 atau

< rata-rata, data menjulur ke kanan