Anda di halaman 1dari 6

LAPORAN RINGKASAN BUKU

INTRODUCTION TO PROBABILITY AND STATISTICS


CHAPTER 2: DESCRIBING DATA WITH NUMERICAL MEASUREMENT

Disusun oleh
Adinda Melinda Ceria Ajie (2216976)
Anita Fadhilah (221…)
Niva Nurjiwa (221…)

Mata Kuliah : Statistika Terapan


Dosen: Dr. Dadang Juandi , M. Si.

PROGRAM STUDI MAGISTER PENDIDIKAN KIMIA


DEPARTEMEN PENDIDIKAN KIMIA
FAKULTAS PENDIDIKAN MATEMATIKA DAN ILMU PENGETAHUAN ALAM
UNIVERSITAS PENDIDIKAN INDONESIA
2.4 Signifikansi praktis dari standar deviasi

Distribusi pengukuran berdasarkan 2 aturan, yakni 1) Teorema chebysheff’s dan 2) Aturan


Empiris.

1. Teorema Tchebysheff’s
Teorema ini digunakan pada set pengukuran apapun dan bisa digunakan untuk
mendeskripsikan baik sampel maupun populasi. Menurut teorema ini, suatu interval dibuat
dengan cara mengukur jarak k standar deviasi (k σ ¿ pada kedua sisi dari rata-rata/mean (µ). Nilai
k bisa berupa angka berapa saja asalkan lebih besar atau sama dengan 1. Lalu Tchebysheff’s
menyatakan bahwa setidaknya (1 – (1/k 2) dari total n pengukuran berada pada Interval yang
dibuat.

Teorema Tchebysheff’s berbunyi : “Jika suatu k (konstanta) angka lebih besar dibanding atau
sama dengan 1 dan ada n ukuran data, setidaknya (1 – (1/k 2)) dari pengukuran akan berada
dalam k standar deviasi rata-ratanya.”
Tabel perhitungan k
k 1 – (1/k2)
1 1–1
2 1–¼=¾
3 1 – 1/9 = 8/9
Berdasarkan tabel tersebut, Teorema Tchebysheff’s menyatakan bahwa;
1) Setidaknya 0 ukuran data berada pada interval µ ± σ atau ± s
2) Setidaknya ada ¼ ukuran data berada pada interval µ ± 2 σ atau ± 2 s
3) Setidaknya ada 8/9 ukuran data berada pada interval µ ± 3 σ atau ± 3 s
Walaupun pernyataan nomor satu tidak membantu sama sekali, namun 2 pernyataan lainnya
menyediakan informasi terkait proporsi pengukuran yang berada pada interval tertentu.

Contoh Soal:
Rata-rata (Mean) dan variansi (s2) dari suatu sampel yang berjumlah n= 25 pengukuran masing-
masing adalah 75 dan 100. Gunakan Teorema chebysheff’s untuk menjelaskan distribusi
pengukuran.
Jawab: = 75 dan s2 = 100, standar deviasinya s = √ s2 =√ 100= 10
Interval ± s = 75 ± 10
Interval ± 2 s = 75 ± 20
Interval ± 3 s = 75 ± 30
Berdasarkan Teorema chebysheff’s dapat dikatakan bahwa,
1) Setidaknya ada ¼ pengukuran pada interval 75 ± 20, yaitu antara 55 - 95
2) Setidaknya ada 8/9 pengukuran pada interval 75 ± 30, yaitu antara 45 - 105

Teorema Tchebysheff’s berlaku dan dapat digunakan untuk semua distribusi, maka hal ini
sangatlah tradisional. karenanya “setidaknya (1 – (1/k2))” sangat ditekankan.

2. Aturan Empiris
Aturan lain untuk mendeskripsikan variabilitas kumpulan data tidak berlaku untuk semua
kumpulan data namun berlaku sangat baik untuk data yang “menumpuk” pada bentuk simetris.
Semakin dekat distribusi data pada lengkungan simetris semakin akurat aturannya. Karena
distribusi data berbentuk simetris muncul cukup sering di alam, aturan ini biasa digunakan pada
aplikasi praktis. Karenanya, aturan ini disebut aturan empiris.

Distribusi berbentuk simetris pada gambar di atas biasa dikenal sebagai distribusi normal.

Aturan Empiris berdasarkan distribusi normal adalah sebagai berikut:


1) Interval (µ ± σ ) mengandung sekitar 68% dari pengukuran
2) Interval (µ ± 2σ ) mengandung sekitar 95% dari pengukuran
3) Interval (µ ± 3 σ ) mengandung sekitar 99,7% dari pengukuran

Contoh Soal:
Pada suatu waktu studi dilakukan pada pabrik manufaktor, lamanya waktu untuk menyelesaikan
operasi tertentu diukur untuk setiap n = 40 pekerja. Mean dan stardar deviasi diketahui sebesar
12,8 dan 1,7. Deskripsikan sampel data menggunakan aturan empiris.
Jawab: = 12,8 dan s=1,7
Interval ( ± s) = 12,8 ± 1,7 atau 11,1 – 14,5
Interval ( ± 2 s ) = 12,8 ± 3,4 atau 9,4 – 16,2
Interval ( ± 3 s ) = 12,8 ± 5,1 atau 7,7 – 17,9
Berdasarkan pada aturan empiris, sekitar 68% dari pengukuran ada pada interval 11,1 – 14,5 ,
sekitar95% ada pada interval 9,4 – 16,2 dan sekitar99,7% ada pada interval 7,7 – 17,9.
Jika ragu distribusi data pengukuran berbentuk simetris, atau untuk beberapa alasan memilih
menjadi konservatif, Teorema Tchebysheff dapat digunakan dan yakinlah dengan pernyataannya.
Teorema Tchebysheff menyatakan setidaknya ¾ dari pengukuran berada pada interval dari 9,4 –
16,2 dan setidaknya 8/9 berada pada interval 7,7 – 17,9.

3. Penggunaan Teorema Tchebysheff dan Aturan Empiris


Teorema Tchebysheff dapat dibuktikan secara matematik. Itu dapat diterapkan pada set
data apapun - sampel atau populasi, kecil atau besar, simetris atau tidak simetris.
Teorema Tchebysheff memberikan Batasan bawah dari bagian pengukuran dan ditemukan pada
interval yang dibuat sebagai ± ks . Setidaknya 1 - (1/k2 ) dari pengukuran akan berada pada
interval ini, dan mungkin lebih.
Aturan empiris bisa digunakan sebagai alat deskriptif hanya jika data cenderung simetris
(data cenderung menumpuk ke pusat distribusi).
Ketika menggunakan dua alat ini untuk mendeskripsikan suatu set pengukuran, Teorema
Tchebysheff akan selalu memuaskan, tapi ini sangat konservatif mengingat bagian dari
pengukuran berada pada interval tertentu. Jika memungkinkan untuk menggunakan aturan
empiris (data simetris), aturan ini akan memberikan estimasi akurat untuk bagian dari
pengukuran yang masuk ke dalam interval.
2.7 Ringkasan 5 – Angka dan Boxplot
Median dan kuartil atas dan kuartil bawah membagi data menjadi 4 set yang masing-masing
mengandung nilai pengukuran yang sama. Jika ditambahkan nilai terbesar (maks) dan terkecil
(min) pada set data kelompok ini, akan didapatkan seperangkat angka yang menyediakan
ringkasan kasar dan cepat dari distribusi data.
Ringkasan 5 – Angka terdiri dari nilai terkecil, kuartil bawah, median, kuartil atas, dan nilai
terbesar yang disajikan berurutan dari data terkecil ke terbesar.
Min ----- Q1 ----- Median ----- Q2 ----- Max
Menurut definisi, seperempat dari pengukuran dalam kumpulan data terletak di antara
masing-masing empat pasang bilangan yang berdekatan.
Ringkasan 5 – Angka dapat digunakan untuk membuat grafik sederhana yang disebut
boxplot untuk mendeskripsikan secara visual distribusi data. Dari boxplot dapat cepat
mendeteksi kecondongan apapun dalam bentuk distribusi dan melihat apa ada ouutlier/data
asing dalam kumpulan data. Data asing mungkin dihasilkan dari transpose angka saat
mengambil pengukuran, dari kesalahan pembacaan instrument, dari malfungsi bagian
instrument, dan dari masalah lain.
Bahkan ketika tidak ada kesalahan pengambilan data dan observasi, sekumpulan data
mungkin memiliki satu atau lebih pengukuran valid, yang karena satu dan lain hal, sangat
berbeda dari data lainnya. Data asing ini akan menyebabkan distorsi pada pengukuran angka
umum seperti mean dan median. Mengisolasi data asing, jika ada, merupakan Langkah penting
dari tahap preliminary analisis dari sekumpulan data. Boxplot digunakan untuk mendeskripsikan
hal ini.

Membuat boxplot
1) Hitung Median, Q1, Q3, dan IQR dari sekumpulan data
2) Menggambar garis horizontal yang merepresentasikan skala penggukuran. Buat kotak di
atas garis horizontal dengan ujung kanan dan bawah pada Q1 dan Q3. Gambar garis vertical
pada kotak di posisi median.

3) Boxplot menggunakan IQR untuk membuat pagar imajiner untuk memisahkan data asing
dari data lainnya.

Mendeteksi data asing (Outlier)


4) Batas pagar bawah : Q1 + 1,5(IQR)
5) Batas pagar atas : Q3 + 1,5(IQR)
6) Pengukuran di luar batas atas atau bawah merupakan data asing. Tandai data asing dengan
asterik (*) pada grafik.
7) Perpanjang garis horizontal pada boxplot ke arah data terkecil dan terbesar namun bukan
outlier/ data asing.

Contoh Soal:
Ketika konsumen Amerika menjadi lebih berhati-hati dengan makanan yang mereka makan, para
produsen makanan mencoba untuk tetap kompetitif dengan menghindari lemak, kolesterol, dan
natrium yang berlebihan dalam makanan yang mereka jual. Data berikut adalah jumlah natrium per
irisan (dalam miligram) untuk masing-masing dari delapan merek keju biasa Amerika. Buat plot kotak
untuk data dan cari outlier. 340, 300, 520, 340, 320, 290, 260, 330
Jawab:
Mengurutkan n=8 pengukuran dari urutan terkecil ke yang terbesar.
260, 290, 300, 320, 330, 340, 340, 520
Menentukan posisi Median, Q1, Q3
Median : ½ (n+1) = ½ (9) = 4,5 -> (320 +330)/2 = 325
Q1: ¼ (n+1) = ¼ (9) = 2,25 -> 290 + ¼ (10)= 292,5
Q3: ¾ (n+1) = ¾ (9) = 6,75 -> 340
IQR = Q3-Q1 = 340 – 292,5 = 47,5
Menghitung batas atas dan batas bawah
Batas bawah: 292.5 - 1.5(47.5) = 221.25
Batas atas: 340 - 1.5(47.5) = 411.25
Nilai 520 merupakan satu-satunya outlier, berada diluar batas.

Anda mungkin juga menyukai