Anda di halaman 1dari 8

4.

4 Measuring variance and standard deviation for a sample


Problem with sample variability

Sample secara konsisten akan memiliki variabilitias yang lebih sedikit dari populasi 
variabilitas dari sampel akan memberikan estimasi yang bias dari variabilitas populasi.
Tapi, bias ini bisa diprediksi sehingga bisa diperbaiki sehingga varians sampel bisa
merepresentasikan varians dari populasi secara akurat.
Formulas for sample variance and standard deviation
Standar deviasi:
1. Hitung total dari SS.
2. Hitung varians
3. Akarkan varians
Dalam menghitung SS sampel, caranya sama dengan SS populasi, hanya notasi yg berbeda.
Mean nya pake M bukan miu, dan jumlah data pake n bukan N

Cara hitung SS definitional :


1. Cari deviasi dari mean ke tiap skor  X-M
2. Pangkatkan tiap deviasi  squared deviation=(X-M)2
3. Tambahkan total dari squared deviation  sigma(X-M)2
Rumus yang computational juga sama dgn populasi, beda di notasi n saja. (biasa dipake kalau
mean nya itu dalam bentuk desimal)

Untuk menghitung varians sampel, s2, standar deviasi sampel : bagi SS dengan n-1
*kalo ngitung SS tetep pake n ya, JANGAN N-1 :D

Tujuan: memberikan adjustment sehingga meningkatkan nilai yang kita dapetin nantinya.
Membagi dengan n-1 bakal membuat varians sampel semakin akurat dan tidak bias terhadap
varians populasi
Contoh. Data sampel n=8 diambil dari populasi. Skornya: 4,6,5,11,7,9,7,3. Berapa varians dan
standar deviasinya?
Karna standar deviasi itu ngukur jarak dari mean. Kita cari meannya dulu, yaitu 6.5.
Jarak terdekat dari mean itu 0.5 dan jarak
terjauh adalah 4,5. Berarti standar
deviasinya antara di tengah 0,5-4,5, sekitar
2,5.
*ini untuk bantu kita tau patokannya aja.

Nah tahapannya

INGET: Rumus varians sampel dan standar deviasi di modif (jadi n-1) agar bisa estimasiin
variabilitas populasi dari variabilitas sampel.
Varians sample sering disebut estimated population variance
Standar deviasi sampel sering disebut estimated population standard deviation

Ketika kita cm punya sampel doang untuk dikerjakan, varians dan standar deviasi menyediakan
estimasi terbaik untuk variabilitas populasi.

Sample Variability and Degrees of Freedom


Degrees of freedom atau df dari sampel varians didegfinisikan dengan df= n-1. Df ini
menentukan banyaknya skor di sampel yang independent dan bisa bervariasi.
Contoh. n=3, M=5. 2 skor pertama dan kedua dalam sample tidak memiliki batasan atau
restriction, bisa independent dan nilainya bisa berapa aja. Misalnya kita asumsi skor X= 2 dan
skor kedua X=9. Nah khusus skor ketiga, kita gabisa nentuin sembarangan, tapi harus sesuai
dengan Meannya. Kalau diitung, harusnya skor ketiga adalah X=4.
Sehingga, untuk sample dari n skor, diberi kebebasan dengan menggunakan n-1 untuk memberi
adjustment sehingga hasilnya tidak bias terhadap populasi. (tapi bukan berarti sampel
individualnya bakal sama persis kayak varians populasi ya, sifatnya mengurangi bias ajah)
Rumus varians sampel :

Rumus standar deviasi


sampel:

4.5 Sample Variance as an Unbiased Statistic


Biased and Unbiased Statistics
Sample statistic dikatakan

 Biased: rata rata nilai dari statistic sifatnya underestimates/overestimates populasi


parameternya
 Unbiased: rata rata nilai dari statistic = parameter populasi (rata” nilai statistic didapat
dari semua sample yang mungkin ada dalam ukuran sample yang spesifik)
Contoh.
N= 3, skor : 0,3,9.
Kalau diitung kita bakal ketemu rata” μ= 4
dan variansnya σ 2=14.
Kita ambil n=2 skor dari populasi ini dan
mengambil semua sample yang possible dari
n=2 (ada kolom first score dan second score
nah itu dicoba satu” kombinasinya)

Bisa diliat ni bun di gambar ada kolom yang


biased variance ada yang unbiased.
 Yang biased: dari total sampel varians adalah 63 dan kalau dibagi 9, rata”nya jadi= 7.
Padahal varians originalnya =14. Kesimpulan Rata” varians sampel tidak sama dengan
varians populasi.
 Yang unbiased: meskipun gada sampel yang variansnya bernilai 14, tapi kalo kita totalin
semuanya hasilnya 126, kalo 126 dibagi 9 itu hasilnya 14. Rata” varians sampel
(diitung dengan n-1) hasilnya sama dengan varians populasi

Nah sekarang liat kolom dari mean


Total dari kombinasi skor itu ada 9 kombinasi. Total meannya 36. Kalau 36:9=4.  rata rata nilai
mean sample = mean populasi , yaitu 4.

Kesimpulan: Mean sampel dan varians sampel yang diitung dengan n-1 adalah contoh dari
unbiased statistics.
Meskipun gada sampel individual yang nilai mean atau variansnya sama dengan nilai populasi
tapi mean sampel dan varians sampel tersebut bisa hasilin estimasi akurat terhadap nilai
populasinya.

4.6 More about Variance and Standard Deviation


Presenting the Mean and Standard Deviation in a Frequency Distribution Graph
Contoh:

(a) Standar deviasi yang mengukur jarak dari mean direpresentasikan dengan garis
horizontal yang ditarik dari mean ke luar dan diberi notasi σ atau s.
(b) Garis vertical melambangkan mean, panjang dari garis standar deviasi kira kira
setengahnya dari titik mean ke skor ekstrim
Transformation of Scale
Yang harus diingat saat memikirkan apakah perubahan skor dapat berdampak pada standar
deviasi adalah standar deviasi itu mengukur JARAK.
1. Menambah nilai konstan pada tiap skor tidak akan mengubah standar deviasi.
Cnth. Dengan menambah 10 poin pada skor, maka skor pada grafik akan bergeser naik
10 poin, dan mean juga ikut bergerak. Tapi varibialitasnya ga berubah karena setiap
pengurangan (X-miu) nilainya sama.
2. Mengkalikan nilai konstan pada tiap skor akan mengubah standar deviasi.
Cnth. Kalau miu=40 dan σ = 10, standar deviasinya bakal berubah ga kalau skornya dikali
10?
Jawabannya iya karena misalnya tadi X = 41 dan skor X = 43 brati selisihnya 2 kan, tapi
setelah dikali 2 jadi X=82 dan X=86, nah jaraknya jadi 4 poin. Nah, karena jarak skornya
berubah, maka standar deviasinya juga akhirnya multiplied dengan nilai yang sama.

In the literature
Biasanya dalam laporan itu ada data yang disajikan berpasang-pasangan:
 Mean biasanya bareng dengan central tendency
 Standard deviation itu untuk mendeskirpsikan variabilitas
 Median itu bareng dengan interquartile range
Reporting the standard deviation
Simbol SD untuk standar deviation sampel

Reporting the Interquartile Range


Interquartile range disajikan bareng dengan median karena dua duanya mengukur rank
persentil yang saling berhubungan.

Pengukuran disajikan dengan grafik


Namanya BOX PLOT
Contoh. ada data begini

Box plotnya begini:

Tinggi dari box = Interquartile range


Bottom of the box = nilai X pada Q1
Top of the box = nilai X pada Q3

Garis horizontal yang ada di dalam box= median.

Garis vertical = range skor pada distribusi, yang paling atas


brati skor paling tinggi, paling bawah brati skor terendah.

Standar deviation and descriptive statistics


Standar deviasi merupakan pengukuran deskriptif yang menunjukkan seberapa padat atau
tersebar skor (variabillitas) pada distribusi yang dilihat dari jarak skor dari mean jarak yang
paling umum/standar dari mean
 Describing an entire distribution
Untuk visualisasiin data, penelliti menggunakan mean dan standar deviasi. Contoh ada
data dengan M=36 dan s=4.
Ada 1 teknik yaitu membayangkan/membuat histogram dimana tiap skor
direpresentasikan dengan kotak pada grafik.
Acuan : hamper 70% dari skor yang ada di distribusi ada di jangkauan jarak salah 1
standar deviasi dari mean, dan hampir 95% ada di antara 2 standar deviasi dari mean.

(kalo bingung, ini teks dari bukunya)


“roughly 70% of the scores in a distribution are located within a distance of one
standard deviation from the mean, and almost all of the scores (roughly 95%) are within
two standard deviations of the mean”

Jadi, kalo s=4, maka bisa dibayangin kalau kita harus punya sebagian besar kotak di 4
point jarak dari mean dan hampir semua box dapat dijangkau kedua sisi standar deviasi
yaitu 8 point
 Describing the location of individual scores
Posisi relative skor bergantung pada bagian dari standar deviasi.
Kalau gambar a, yang merupakan populasi perhitungan jarak 4 poin dari mean itu
terlihatnya kecil (hanya stengah dari standar deviasi)
Tapi gambar b, dimana itu merupakan sampel, jarak 4-point tuh gede, sampe dua
kalinya standar deviasi.
Kesimpulannnya : mean dan standar deviasi bukan konsep abstrak, tapi merupakan
pengukuran yang berguna banget untuk memahami data
Variance and inferential statistics
Variabilitas punya peran penting di statistic inferensial karena mempengaruhi seberapa mudah
kitab isa baca pola dalam datanya.
Low variability: pola yang ada bisa dilihat jelas
High variability: pola nya tidak jelas

Contoh: gimana varians bisa mempengaruhi persepsi pola : pertanyaan penelitian


 Is the mean level of depression lower after therapy than it was before therapy?
 Is the mean attitude score for men different from the mean score for women?

Contoh: data dimana kitab isa liat ana pola yang konsisten atau ngga

Kalo diliat, adanya perbedaan 5 poin itu mudah diliat di experiment A (low variability), kalau B
susah (variability high) , nah ini klo dlm grafik

Dalam statistic inferensial, varians yang ada pada data sampel dikategorikan sebagai error
variance. error variance: mengindikasi sampel varians tabg merepresentasikan perbedaan yang
sulit dijelaskan dan sulit dikontrol pada setiap skor.
Jika error variance makin tinggi, maka makin sulit untuk mencari pola data atau melihat
perbedaan rata rata antara 2 set skor.

Anda mungkin juga menyukai