Anda di halaman 1dari 7

PENGERTIAN STANDART DEVIASI

Diperbaharui pada August 21st, 2018 at 01:34 pm


Standar deviasi adalah nilai statistik yang digunakan untuk menentukan bagaimana sebaran data
dalam sampel, dan seberapa dekat titik data individu ke mean – atau rata-rata – nilai sampel.
Sebuah standar deviasi dari kumpulan data sama dengan nol menunjukkan bahwa semua nilai-nilai
dalam himpunan tersebut adalah sama. Sebuah nilai deviasi yang lebih besar akan memberikan
makna bahwa titik data individu jauh dari nilai rata-rata.
Dalam distribusi normal data, juga dikenal sebagai kurva lonceng, sebagian besar data dalam
distribusi – sekitar 68% – akan jatuh dalam, kurang atau lebih satu satu standar deviasi dari mean (-
σ atau +σ). Sebagai contoh, jika standar deviasi dari satu kumpulan data adalah 2, maka sebagian
besar data pada kumpulan akan berjarak plus atau minus 2 dari rata-rata. Sekitar 95,5% dari data
yang terdistribusi normal adalah dalam dua standar deviasi dari mean, dan lebih dari 99% berada
dalam jarak 3 standar deviasi dari rata-rata.
Untuk menghitung standar deviasi, ahli statistik pertama-tama menghitung nilai rata-rata dari semua
titik data. Rata-rata adalah sama dengan jumlah dari semua nilai dalam kumpulan data dibagi
dengan jumlah total titik data. Selanjutnya, penyimpangan setiap titik data dari rata-rata dihitung
dengan mengurangkan nilai dari nilai rata-rata. Deviasi setiap titik data akan dikuadratkan, dan
dicari penyimpangan kuadrat individu rata-rata. Nilai yang dihasilkan dikenal sebagai varians.
Deviasi standar adalah akar kuadrat dari varians.
Biasanya, ahli statistik menemukan deviasi standar sampel dari populasi dan menggunakan itu
untuk mewakili seluruh populasi. Menemukan data yang tepat untuk populasi yang besar tidak
praktis, dan juga agak mustahil, sehingga menggunakan sampel yang representatif sering digunakan
sebagai metode terbaik. Sebagai contoh, jika seseorang ingin menemukan jumlah orang dewasa di
negara bagian California yang beratnya antara 180 dan 200 pound, ia bisa mengukur bobot
sejumlah kecil pria dan menghitung rata-rata mereka, varians dan standar deviasi, dan nilai yang
diperoleh akan sama dan berlaku untuk
populasi secara keseluruhan.
Grafik ini menggambarkan penyebaran
data standar deviasi.
Selain menggunakan analisis statistik,
standar deviasi juga dapat digunakan
untuk menentukan jumlah risiko dan
volatilitas terkait dengan investasi
tertentu. Investor dapat menghitung
standar deviasi tahunan pengembalian
investasi dan menggunakan angka itu
untuk menentukan seberapa stabil
investasi tersebut. Sebuah standar
deviasi yang lebih besar akan berarti
investasi yang lebih berisiko, dengan
asumsi stabilitas itu adalah hasil yang diinginkan.
Varian dan Standar Deviasi (Simpangan Baku)
Varian dan standar deviasi (simpangan baku) adalah ukuran-ukuran keragaman (variasi) data
statistik yang paling sering digunakan. Standar deviasi (simpangan baku) merupakan akar
kuadrat dari varian.s=\sqrt{s^2}s=s2Oleh karena itu, jika salah satu nilai dari kedua ukuran
tersebut diketahui maka akan diketahui juga nilai ukuran yang lain.

Penghitungan

Dasar penghitungan varian dan standar deviasi adalah keinginan untuk mengetahui keragaman
suatu kelompok data. Salah satu cara untuk mengetahui keragaman dari suatu kelompok data adalah
dengan mengurangi setiap nilai data dengan rata-rata kelompok data tersebut, selanjutnya semua
hasilnya dijumlahkan.

Namun cara seperti itu tidak bisa digunakan karena hasilnya akan selalu menjadi 0.

Oleh karena itu, solusi agar nilainya tidak menjadi 0 adalah dengan mengkuadratkan setiap
pengurangan nilai data dan rata-rata kelompok data tersebut, selanjutnya dilakukan penjumlahan.
Hasil penjumlahan kuadrat (sum of squares) tersebut akan selalu bernilai positif.

Nilai varian diperoleh dari pembagian hasil penjumlahan kuadrat (sum of squares) dengan ukuran
data (n).

Namun begitu, dalam penerapannya, nilai varian tersebut bias untuk menduga varian populasi.
Dengan menggunakan rumus tersebut, nilai varian populasi lebih besar dari varian sampel.

Oleh karena itu, agar tidak bias dalam menduga varian populasi, maka nsebagai pembagi
penjumlahan kuadrat (sum of squares) diganti dengan n-1 (derajat bebas) agar nilai varian sampel
mendekati varian populasi. Oleh karena itu rumus varian sampel menjadi:

Nilai varian yang dihasilkan merupakan nilai yang berbentuk kuadrat. Misalkan satuan nilai rata-
rata adalah gram, maka nilai varian adalah gram kuadrat. Untuk menyeragamkan nilai satuannya
maka varian diakarkuadratkan sehingga hasilnya adalah standar deviasi (simpangan baku).
Untuk mempermudah penghitungan, rumus varian dan standar deviasi (simpangan baku) tersebut
bisa diturunkan :

Rumus varian :

Rumus standar deviasi (simpangan baku) :

Keterangan:
s2 = varian
s = standar deviasi (simpangan baku)
xi = nilai x ke-i
= rata-rata
n = ukuran sampel

Contoh Penghitungan

Misalkan dalam suatu kelas, tinggi badan beberapa orang siswa yang dijadikan sampel adalah
sebagai berikut.

172, 167, 180, 170, 169, 160, 175, 165, 173, 170

Dari data tersebut diketahui bahwa jumlah data (n) = 10, dan (n - 1) = 9. Selanjutnya dapat dihitung
komponen untuk rumus varian.

Dari tabel tersebut dapat ketahui:


Dengan demikian, jika dimasukkan ke dalam rumus varian, maka hasilnya adalah sebagai berikut.

Dari penghitungan, diperoleh nilai varian sama dengan 30,32.

Dari nilai tersebut bisa langsung diperoleh nilai standar deviasi (simpangan baku) dengan cara
mengakarkuadratkan nilai varian.

Hasil tersebut bisa dibuktikan dengan menggunakan Microsoft Excel. Lihat artikel
Mengenal Expected Value (Nilai Harapan)
Dulu ketika zamannya saya ikut SRM top coder, kalau dapat soal dengan kalimat perintah "Find the expected value of ...", saya langsung merasa seram.
Alasannya karena saya tidak tahu apa itu expected number. Belum lagi tiba-tiba contoh keluaran yang ada adalah angka pecahan yang misterius,
contohnya:
1.12938104018102
Kemudian suatu ketika saya mendapatkan pencerahan, bahwa ternyata expected value adalah nilai harapan. Seketika saya langsung bisa mengerjakan
soal-soal dasar tentang expected value.

Tulisan ini akan menjelaskan apa itu expected value, supaya kalian para pembaca tidak merasa seram seperti saya dulunya.

Permasalahan Motivasi 1: angka dadu


Mulai dari contoh sederhana, yaitu angka dadu:
Sebuah dadu memiliki 6 sisi, dengan angka dari 1 sampai dengan 6. Peluang setiap sisi untuk menjadi nilai hasil pelemparan sama, yaitu 1/6. Tentukan
nilai harapan hasil pelemparan dadu ini!

Untuk soal ini, Anda mungkin pernah mengerjakannya saat SMP.

Sebelum menjelaskan apa sebenarnya nilai harapan, ada baiknya kita melihat bentuk rumusnya terlebih dahulu.

E=∑x∈Sp(x)v(x)E=∑x∈Sp(x)v(x)
Dengan:
 E: expected value

 S: himpunan semesta dari semua kejadian yang mungkin

 x: suatu kejadian

 p(x): peluang kejadian x terjadi

 v(x): nilai dari kejadian x


Untuk persoalan dadu ini, semua kejadian yang mungkin adalah munculnya angka 1, 2, 3, 4, 5, dan 6. Sehingga:

S={1,2,3,4,5,6}S={1,2,3,4,5,6}
Peluang untuk setiap kejadian tersebut adalah sama, yaitu 1/6. Sehingga:

p(1)=p(2)=p(3)=p(4)=p(5)=p(6)=16p(1)=p(2)=p(3)=p(4)=p(5)=p(6)=16
Yang mungkin asing bagi Anda adalah nilai dari kejadian. Secara sederhana, Anda dapat menganggapnya sebagai nilai yang diberikan atas suatu kejadian
(lho!). Pada kasus ini, nilai dari suatu kejadian adalah muka dadu yang menjadi hasil pelemparan. Sehingga v(1) = 1, v(2) = 2, v(3) = 3, dan seterusnya.
Dituliskan lebih formal:

v(x)=xv(x)=x
Jika dimasukkan ke dalam rumus, didapatkan:

E=p(1)v(1)+p(2)v(2)+p(3)v(3)+p(4)v(4)+p(5)v(5)+p(6)v(6)=161+162+163+164+165+166=3.5E=p(1)v(1)+p(2)v(2)+p(3)v(3)+p(4)v(4)+p(
5)v(5)+p(6)v(6)=161+162+163+164+165+166=3.5
Jadi nilai harapannya adalah 3.5

Lalu apa maksud angka ini?

Artinya, bila aktivitas melempar dadu sebanyak 1 kali ini diulang berkali-kali dan hasilnya dirata-rata, maka nilai yang didapatkan akan mendekati 3.5. Bila
Anda perhatikan, perhitungan ini mirip sekali dengan rata-rata. Namun perbedaannya akan terlihat pada contoh berikutnya.

Permasalahan Motivasi 2: angka dadu peang


Ternyata ada kecacatan pada dadu yang dimiliki, sehingga peluang suatu muka dadu muncul tidak lagi sama dengan muka dadu lainnya.
Diketahui peluang kemunculan muka dadu untuk kali ini adalah:

p(1)=0.2p(1)=0.2
p(2)=0.3p(2)=0.3
p(3)=0.1p(3)=0.1
p(4)=0.1p(4)=0.1
p(5)=0.2p(5)=0.2
p(6)=0.1p(6)=0.1
Penyelesaiannya serupa dengan sebelumnya, cukup masukkan ke rumus yang ada:

E=p(1)v(1)+p(2)v(2)+p(3)v(3)+p(4)v(4)+p(5)v(5)+p(6)v(6)=0.2×1+0.3×2+0.1×3+0.1×4+0.2×5+0.1×6=3.1E=p(1)v(1)+p(2)v(2)+p(3)v(3)+
p(4)v(4)+p(5)v(5)+p(6)v(6)=0.2×1+0.3×2+0.1×3+0.1×4+0.2×5+0.1×6=3.1
Nilainya 3.1, ternyata lebih kecil dari ketika dadunya tidak cacat. Masuk akal, karena kali ini peluang dadu menunjukkan angka yang kecil lebih besar
daripada angka besar.

Perhatikan pula perbedaannya dengan perhitungan rata-rata. Kita tidak semata-mata melakukan rata-rata, tetapi kita memperhatikan peluang setiap
kejadiannya. Rata-rata sejenis ini juga disebut dengan rata-rata berbobot (weighted average). Pada kenyataannya, konsep rata-rata yang diajarkan
semasa sekolah SD adalah kasus khusus dari rata-rata yang sebenarnya, yaitu ketika semua kejadian memiliki bobot yang sama.
Sejauh ini konsepnya cukup mudah. Kita cukup mencacah semua kemungkinan kejadian yang ada, menentukan peluangnya, menentukan nilainya, lalu
masukkan ke rumus. Apa yang bisa menjadi masalah? Ketika banyaknya kejadian yang ada sangat besar!

Permasalahan Motivasi 3: cemilan kerja


Masalah kali ini tidak ada kaitannya dengan dadu:
Pak Dengklek memiliki N biskuit di meja kerjanya. Setiap jam, Pak Dengklek akan memakan 1 atau 2 biskuit. Peluang memakan 1 atau 2 biskuit seimbang,
yaitu 50%. Tentu saja ketika hanya bersisa 1 biskuit, peluang memakan 1 biskuit adalah 100%. Jika biskuit telah habis, Pak Dengklek berhenti memakan
biskuit. Setelah berlalu K jam, berapa nilai harapan dari banyaknya biskuit yang ia makan?

Secara sederhana, kita dapat merepresentasikan kejadian sebagai rangkaian aktivitas memakan biskuit. Misalnya N=5 dan K=4, maka contoh kejadiannya:
1111 => 1 setiap jamnya
1121 => 1 pada dua jam pertama, lalu 2 pada jam ke-3, dan 1 pada jam ke-4
1211
...
221 => 2 pada dua jam pertama, lalu 1 pada jam terakhir
Peluang setiap kejadian bergantung pada kondisi biskuit saat itu, apakah masih bersisa 1, 2, atau lebih.
Nilai dari suatu kejadian adalah jumlah angka pada rangkaian yang ada.

Masalah utama dari soal ini adalah besarnya ukuran himpunan semesta. Jika disadari, ukuran ruang semestanya memiliki pertumbuhan seperti bilangan
fibonacci ke-K. Artinya nilainya eksponensial, dan akan sangat besar bahkan untuk N dan K bernilai puluhan.

Strategi yang dapat digunakan adalah dengan tidak terpaku pada perumusan yang ada. Kita dapat memandang masalah perhitungan nilai harapan dari sisi
yang lain, yaitu secara rekursif.

Pada kondisi awal, terdapat N biskuit. Terdapat:


 0.5 peluang untuk memakan 1 biskuit, menyisakan N-1 biskuit pada jam ke-2

 0.5 peluang untuk memakan 2 biskuit, menyisakan N-2 biskuit pada jam ke-2
Misalkan kita anggap nilai harapan untuk kasus N-1 biskuit pada jam ke-2 adalah f(N−1,2)f(N−1,2), dan N-2 biskuit pada jam ke-2
adalah f(N−2,2)f(N−2,2). Dengan menganggap bahwa kejadian dari jam ke-2 sampai jam ke-K "dikompres menjadi sebuah nilai", dapat dipahami
bahwa nilai harapan untuk kasus N biskuit pada jam ke-1 adalah:

f(N,1)=0.5(1+f(N−1,2))+0.5(2+f(N−2,2))f(N,1)=0.5(1+f(N−1,2))+0.5(2+f(N−2,2))
Bagian ini memang cukup mengejutkan. Namun jika Anda bayangkan bahwa nilai harapan untuk jam ke-2 telah ditemukan (baik untuk bersisa N-1 atau N-
2 biskuit), maka rumus tersebut menjadi masuk akal.

Jadi dengan hanya fokus ke transisi dari jam ke-1 ke jam ke-2, kita mengubah permasalahan yang ada menjadi rekursif. Sebagai bonus, rumus rekursif ini
memungkinkan kita menyelesaikan perhitungannya dengan DP (dynamic programming). Rumus lebih lengkapnya:

f(x,t)=⎧⎪⎨⎪⎩0,(t>K)∨(x=0)1+f(x−1,t+1),(t≤K)∧(x=1)0.5(1+f(x−1,t+1))+0.5(2+f(x−2,t+1)),(t≤K)∧(x>1)f(x,t)={0,
(t>K)∨(x=0)1+f(x−1,t+1),(t≤K)∧(x=1)0.5(1+f(x−1,t+1))+0.5(2+f(x−2,t+1)),(t≤K)∧(x>1)
Penjelasan kasus basis: untuk kasus jam (t) telah melebihi K, atau biskuit telah habis, nilai harapan biskuit yang dimakan adalah 0.
Jawabannya ada di f(N, 1).

Rumusan DP lain yang juga benar, adalah dengan perhitungan nilai kejadiannya di basis:

f(x,t)=⎧⎪


⎪⎨⎪


⎪⎩N−x,t>Kf(x,t+1),(t≤K)∧(x=0)f(x−1,t+1),(t≤K)∧(x=1)0.5f(x−1,t+1)+0.5f(x−2,t+1),(t≤K)∧(x>1)f(x,t)={N−x,t>Kf(x,t+1),
(t≤K)∧(x=0)f(x−1,t+1),(t≤K)∧(x=1)0.5f(x−1,t+1)+0.5f(x−2,t+1),(t≤K)∧(x>1)
Bila Anda bayangkan percabangan dari pohon rekursifnya, dapat disadari bahwa pada akhirnya perkalian-perkalian peluang yang ada sampai ke basis
adalah peluang suatu rangkaian kejadian terjadi. Nilai tersebut kemudian dikalikan dengan nilai kejadiannya, yaitu banyaknya biskuit yang telah dimakan,
berupa N-x. Semuanya pada akhirnya dijumlahkan dan didapatkan jawaban pada f(N, 1).

Penggunaan DP untuk menyelesaikan soal ini memberikan kompleksitas O(NK), yang bekerja dengan cepat bahkan untuk N dan K bernilai ribuan.

Anda mungkin juga menyukai