Sample secara konsisten akan memiliki variabilitias yang lebih sedikit dari populasi
variabilitas dari sampel akan memberikan estimasi yang bias dari variabilitas populasi.
Tapi, bias ini bisa diprediksi sehingga bisa diperbaiki sehingga varians sampel bisa
merepresentasikan varians dari populasi secara akurat.
Formulas for sample variance and standard deviation
Standar deviasi:
1. Hitung total dari SS.
2. Hitung varians
3. Akarkan varians
Dalam menghitung SS sampel, caranya sama dengan SS populasi, hanya notasi yg berbeda.
Mean nya pake M bukan miu, dan jumlah data pake n bukan N
Untuk menghitung varians sampel, s2, standar deviasi sampel : bagi SS dengan n-1
*kalo ngitung SS tetep pake n ya, JANGAN N-1 :D
Tujuan: memberikan adjustment sehingga meningkatkan nilai yang kita dapetin nantinya.
Membagi dengan n-1 bakal membuat varians sampel semakin akurat dan tidak bias terhadap
varians populasi
Contoh. Data sampel n=8 diambil dari populasi. Skornya: 4,6,5,11,7,9,7,3. Berapa varians dan
standar deviasinya?
Karna standar deviasi itu ngukur jarak dari mean. Kita cari meannya dulu, yaitu 6.5.
Jarak terdekat dari mean itu 0.5 dan jarak
terjauh adalah 4,5. Berarti standar
deviasinya antara di tengah 0,5-4,5, sekitar
2,5.
*ini untuk bantu kita tau patokannya aja.
Nah tahapannya
INGET: Rumus varians sampel dan standar deviasi di modif (jadi n-1) agar bisa estimasiin
variabilitas populasi dari variabilitas sampel.
Varians sample sering disebut estimated population variance
Standar deviasi sampel sering disebut estimated population standard deviation
Ketika kita cm punya sampel doang untuk dikerjakan, varians dan standar deviasi menyediakan
estimasi terbaik untuk variabilitas populasi.
Kesimpulan: Mean sampel dan varians sampel yang diitung dengan n-1 adalah contoh dari
unbiased statistics.
Meskipun gada sampel individual yang nilai mean atau variansnya sama dengan nilai populasi
tapi mean sampel dan varians sampel tersebut bisa hasilin estimasi akurat terhadap nilai
populasinya.
(a) Standar deviasi yang mengukur jarak dari mean direpresentasikan dengan garis
horizontal yang ditarik dari mean ke luar dan diberi notasi σ atau s.
(b) Garis vertical melambangkan mean, panjang dari garis standar deviasi kira kira
setengahnya dari titik mean ke skor ekstrim
Transformation of Scale
Yang harus diingat saat memikirkan apakah perubahan skor dapat berdampak pada standar
deviasi adalah standar deviasi itu mengukur JARAK.
1. Menambah nilai konstan pada tiap skor tidak akan mengubah standar deviasi.
Cnth. Dengan menambah 10 poin pada skor, maka skor pada grafik akan bergeser naik
10 poin, dan mean juga ikut bergerak. Tapi varibialitasnya ga berubah karena setiap
pengurangan (X-miu) nilainya sama.
2. Mengkalikan nilai konstan pada tiap skor akan mengubah standar deviasi.
Cnth. Kalau miu=40 dan σ = 10, standar deviasinya bakal berubah ga kalau skornya dikali
10?
Jawabannya iya karena misalnya tadi X = 41 dan skor X = 43 brati selisihnya 2 kan, tapi
setelah dikali 2 jadi X=82 dan X=86, nah jaraknya jadi 4 poin. Nah, karena jarak skornya
berubah, maka standar deviasinya juga akhirnya multiplied dengan nilai yang sama.
In the literature
Biasanya dalam laporan itu ada data yang disajikan berpasang-pasangan:
Mean biasanya bareng dengan central tendency
Standard deviation itu untuk mendeskirpsikan variabilitas
Median itu bareng dengan interquartile range
Reporting the standard deviation
Simbol SD untuk standar deviation sampel
Jadi, kalo s=4, maka bisa dibayangin kalau kita harus punya sebagian besar kotak di 4
point jarak dari mean dan hampir semua box dapat dijangkau kedua sisi standar deviasi
yaitu 8 point
Describing the location of individual scores
Posisi relative skor bergantung pada bagian dari standar deviasi.
Kalau gambar a, yang merupakan populasi perhitungan jarak 4 poin dari mean itu
terlihatnya kecil (hanya stengah dari standar deviasi)
Tapi gambar b, dimana itu merupakan sampel, jarak 4-point tuh gede, sampe dua
kalinya standar deviasi.
Kesimpulannnya : mean dan standar deviasi bukan konsep abstrak, tapi merupakan
pengukuran yang berguna banget untuk memahami data
Variance and inferential statistics
Variabilitas punya peran penting di statistic inferensial karena mempengaruhi seberapa mudah
kitab isa baca pola dalam datanya.
Low variability: pola yang ada bisa dilihat jelas
High variability: pola nya tidak jelas
Contoh: data dimana kitab isa liat ana pola yang konsisten atau ngga
Kalo diliat, adanya perbedaan 5 poin itu mudah diliat di experiment A (low variability), kalau B
susah (variability high) , nah ini klo dlm grafik
Dalam statistic inferensial, varians yang ada pada data sampel dikategorikan sebagai error
variance. error variance: mengindikasi sampel varians tabg merepresentasikan perbedaan yang
sulit dijelaskan dan sulit dikontrol pada setiap skor.
Jika error variance makin tinggi, maka makin sulit untuk mencari pola data atau melihat
perbedaan rata rata antara 2 set skor.