Penghitungan
Dasar penghitungan varian dan standar deviasi adalah keinginan untuk mengetahui keragaman
suatu kelompok data. Salah satu cara untuk mengetahui keragaman dari suatu kelompok data adalah
dengan mengurangi setiap nilai data dengan rata-rata kelompok data tersebut, selanjutnya semua
hasilnya dijumlahkan.
Namun cara seperti itu tidak bisa digunakan karena hasilnya akan selalu menjadi 0.
Oleh karena itu, solusi agar nilainya tidak menjadi 0 adalah dengan mengkuadratkan setiap
pengurangan nilai data dan rata-rata kelompok data tersebut, selanjutnya dilakukan penjumlahan.
Hasil penjumlahan kuadrat (sum of squares) tersebut akan selalu bernilai positif.
Nilai varian diperoleh dari pembagian hasil penjumlahan kuadrat (sum of squares) dengan ukuran
data (n).
Namun begitu, dalam penerapannya, nilai varian tersebut bias untuk menduga varian populasi.
Dengan menggunakan rumus tersebut, nilai varian populasi lebih besar dari varian sampel.
Oleh karena itu, agar tidak bias dalam menduga varian populasi, maka nsebagai pembagi
penjumlahan kuadrat (sum of squares) diganti dengan n-1 (derajat bebas) agar nilai varian sampel
mendekati varian populasi. Oleh karena itu rumus varian sampel menjadi:
Nilai varian yang dihasilkan merupakan nilai yang berbentuk kuadrat. Misalkan satuan nilai rata-
rata adalah gram, maka nilai varian adalah gram kuadrat. Untuk menyeragamkan nilai satuannya
maka varian diakarkuadratkan sehingga hasilnya adalah standar deviasi (simpangan baku).
Untuk mempermudah penghitungan, rumus varian dan standar deviasi (simpangan baku) tersebut
bisa diturunkan :
Rumus varian :
Keterangan:
s2 = varian
s = standar deviasi (simpangan baku)
xi = nilai x ke-i
= rata-rata
n = ukuran sampel
Contoh Penghitungan
Misalkan dalam suatu kelas, tinggi badan beberapa orang siswa yang dijadikan sampel adalah
sebagai berikut.
172, 167, 180, 170, 169, 160, 175, 165, 173, 170
Dari data tersebut diketahui bahwa jumlah data (n) = 10, dan (n - 1) = 9. Selanjutnya dapat dihitung
komponen untuk rumus varian.
Dari nilai tersebut bisa langsung diperoleh nilai standar deviasi (simpangan baku) dengan cara
mengakarkuadratkan nilai varian.
Hasil tersebut bisa dibuktikan dengan menggunakan Microsoft Excel. Lihat artikel
Mengenal Expected Value (Nilai Harapan)
Dulu ketika zamannya saya ikut SRM top coder, kalau dapat soal dengan kalimat perintah "Find the expected value of ...", saya langsung merasa seram.
Alasannya karena saya tidak tahu apa itu expected number. Belum lagi tiba-tiba contoh keluaran yang ada adalah angka pecahan yang misterius,
contohnya:
1.12938104018102
Kemudian suatu ketika saya mendapatkan pencerahan, bahwa ternyata expected value adalah nilai harapan. Seketika saya langsung bisa mengerjakan
soal-soal dasar tentang expected value.
Tulisan ini akan menjelaskan apa itu expected value, supaya kalian para pembaca tidak merasa seram seperti saya dulunya.
Sebelum menjelaskan apa sebenarnya nilai harapan, ada baiknya kita melihat bentuk rumusnya terlebih dahulu.
E=∑x∈Sp(x)v(x)E=∑x∈Sp(x)v(x)
Dengan:
E: expected value
x: suatu kejadian
S={1,2,3,4,5,6}S={1,2,3,4,5,6}
Peluang untuk setiap kejadian tersebut adalah sama, yaitu 1/6. Sehingga:
p(1)=p(2)=p(3)=p(4)=p(5)=p(6)=16p(1)=p(2)=p(3)=p(4)=p(5)=p(6)=16
Yang mungkin asing bagi Anda adalah nilai dari kejadian. Secara sederhana, Anda dapat menganggapnya sebagai nilai yang diberikan atas suatu kejadian
(lho!). Pada kasus ini, nilai dari suatu kejadian adalah muka dadu yang menjadi hasil pelemparan. Sehingga v(1) = 1, v(2) = 2, v(3) = 3, dan seterusnya.
Dituliskan lebih formal:
v(x)=xv(x)=x
Jika dimasukkan ke dalam rumus, didapatkan:
E=p(1)v(1)+p(2)v(2)+p(3)v(3)+p(4)v(4)+p(5)v(5)+p(6)v(6)=161+162+163+164+165+166=3.5E=p(1)v(1)+p(2)v(2)+p(3)v(3)+p(4)v(4)+p(
5)v(5)+p(6)v(6)=161+162+163+164+165+166=3.5
Jadi nilai harapannya adalah 3.5
Artinya, bila aktivitas melempar dadu sebanyak 1 kali ini diulang berkali-kali dan hasilnya dirata-rata, maka nilai yang didapatkan akan mendekati 3.5. Bila
Anda perhatikan, perhitungan ini mirip sekali dengan rata-rata. Namun perbedaannya akan terlihat pada contoh berikutnya.
p(1)=0.2p(1)=0.2
p(2)=0.3p(2)=0.3
p(3)=0.1p(3)=0.1
p(4)=0.1p(4)=0.1
p(5)=0.2p(5)=0.2
p(6)=0.1p(6)=0.1
Penyelesaiannya serupa dengan sebelumnya, cukup masukkan ke rumus yang ada:
E=p(1)v(1)+p(2)v(2)+p(3)v(3)+p(4)v(4)+p(5)v(5)+p(6)v(6)=0.2×1+0.3×2+0.1×3+0.1×4+0.2×5+0.1×6=3.1E=p(1)v(1)+p(2)v(2)+p(3)v(3)+
p(4)v(4)+p(5)v(5)+p(6)v(6)=0.2×1+0.3×2+0.1×3+0.1×4+0.2×5+0.1×6=3.1
Nilainya 3.1, ternyata lebih kecil dari ketika dadunya tidak cacat. Masuk akal, karena kali ini peluang dadu menunjukkan angka yang kecil lebih besar
daripada angka besar.
Perhatikan pula perbedaannya dengan perhitungan rata-rata. Kita tidak semata-mata melakukan rata-rata, tetapi kita memperhatikan peluang setiap
kejadiannya. Rata-rata sejenis ini juga disebut dengan rata-rata berbobot (weighted average). Pada kenyataannya, konsep rata-rata yang diajarkan
semasa sekolah SD adalah kasus khusus dari rata-rata yang sebenarnya, yaitu ketika semua kejadian memiliki bobot yang sama.
Sejauh ini konsepnya cukup mudah. Kita cukup mencacah semua kemungkinan kejadian yang ada, menentukan peluangnya, menentukan nilainya, lalu
masukkan ke rumus. Apa yang bisa menjadi masalah? Ketika banyaknya kejadian yang ada sangat besar!
Secara sederhana, kita dapat merepresentasikan kejadian sebagai rangkaian aktivitas memakan biskuit. Misalnya N=5 dan K=4, maka contoh kejadiannya:
1111 => 1 setiap jamnya
1121 => 1 pada dua jam pertama, lalu 2 pada jam ke-3, dan 1 pada jam ke-4
1211
...
221 => 2 pada dua jam pertama, lalu 1 pada jam terakhir
Peluang setiap kejadian bergantung pada kondisi biskuit saat itu, apakah masih bersisa 1, 2, atau lebih.
Nilai dari suatu kejadian adalah jumlah angka pada rangkaian yang ada.
Masalah utama dari soal ini adalah besarnya ukuran himpunan semesta. Jika disadari, ukuran ruang semestanya memiliki pertumbuhan seperti bilangan
fibonacci ke-K. Artinya nilainya eksponensial, dan akan sangat besar bahkan untuk N dan K bernilai puluhan.
Strategi yang dapat digunakan adalah dengan tidak terpaku pada perumusan yang ada. Kita dapat memandang masalah perhitungan nilai harapan dari sisi
yang lain, yaitu secara rekursif.
0.5 peluang untuk memakan 2 biskuit, menyisakan N-2 biskuit pada jam ke-2
Misalkan kita anggap nilai harapan untuk kasus N-1 biskuit pada jam ke-2 adalah f(N−1,2)f(N−1,2), dan N-2 biskuit pada jam ke-2
adalah f(N−2,2)f(N−2,2). Dengan menganggap bahwa kejadian dari jam ke-2 sampai jam ke-K "dikompres menjadi sebuah nilai", dapat dipahami
bahwa nilai harapan untuk kasus N biskuit pada jam ke-1 adalah:
f(N,1)=0.5(1+f(N−1,2))+0.5(2+f(N−2,2))f(N,1)=0.5(1+f(N−1,2))+0.5(2+f(N−2,2))
Bagian ini memang cukup mengejutkan. Namun jika Anda bayangkan bahwa nilai harapan untuk jam ke-2 telah ditemukan (baik untuk bersisa N-1 atau N-
2 biskuit), maka rumus tersebut menjadi masuk akal.
Jadi dengan hanya fokus ke transisi dari jam ke-1 ke jam ke-2, kita mengubah permasalahan yang ada menjadi rekursif. Sebagai bonus, rumus rekursif ini
memungkinkan kita menyelesaikan perhitungannya dengan DP (dynamic programming). Rumus lebih lengkapnya:
f(x,t)=⎧⎪⎨⎪⎩0,(t>K)∨(x=0)1+f(x−1,t+1),(t≤K)∧(x=1)0.5(1+f(x−1,t+1))+0.5(2+f(x−2,t+1)),(t≤K)∧(x>1)f(x,t)={0,
(t>K)∨(x=0)1+f(x−1,t+1),(t≤K)∧(x=1)0.5(1+f(x−1,t+1))+0.5(2+f(x−2,t+1)),(t≤K)∧(x>1)
Penjelasan kasus basis: untuk kasus jam (t) telah melebihi K, atau biskuit telah habis, nilai harapan biskuit yang dimakan adalah 0.
Jawabannya ada di f(N, 1).
Rumusan DP lain yang juga benar, adalah dengan perhitungan nilai kejadiannya di basis:
f(x,t)=⎧⎪
⎪
⎪
⎪⎨⎪
⎪
⎪
⎪⎩N−x,t>Kf(x,t+1),(t≤K)∧(x=0)f(x−1,t+1),(t≤K)∧(x=1)0.5f(x−1,t+1)+0.5f(x−2,t+1),(t≤K)∧(x>1)f(x,t)={N−x,t>Kf(x,t+1),
(t≤K)∧(x=0)f(x−1,t+1),(t≤K)∧(x=1)0.5f(x−1,t+1)+0.5f(x−2,t+1),(t≤K)∧(x>1)
Bila Anda bayangkan percabangan dari pohon rekursifnya, dapat disadari bahwa pada akhirnya perkalian-perkalian peluang yang ada sampai ke basis
adalah peluang suatu rangkaian kejadian terjadi. Nilai tersebut kemudian dikalikan dengan nilai kejadiannya, yaitu banyaknya biskuit yang telah dimakan,
berupa N-x. Semuanya pada akhirnya dijumlahkan dan didapatkan jawaban pada f(N, 1).
Penggunaan DP untuk menyelesaikan soal ini memberikan kompleksitas O(NK), yang bekerja dengan cepat bahkan untuk N dan K bernilai ribuan.