Distribusi frekuensi menggambarkan sampel atau kumpulan data tertentu. Ini adalah
berapa kali setiap nilai yang mungkin dari suatu variabel muncul dalam kumpulan
data.
Berapa kali suatu nilai muncul dalam suatu sampel ditentukan oleh probabilitas
kemunculannya. Probabilitas adalah angka antara 0 dan 1 yang menunjukkan
seberapa besar kemungkinan terjadinya sesuatu:
1 berarti pasti.
Semakin tinggi probabilitas suatu nilai, semakin tinggi frekuensinya dalam suatu
sampel.
Lebih khusus lagi, probabilitas suatu nilai adalah frekuensi relatifnya dalam sampel
yang sangat besar.
Sampel yang sangat besar tidak mungkin dilakukan dalam kehidupan nyata, jadi
distribusi probabilitas bersifat teoritis. Ini adalah versi distribusi frekuensi ideal yang
bertujuan untuk mendeskripsikan populasi tempat sampel diambil.
Peternak menimbang 100 telur secara acak dan menjelaskan distribusi frekuensinya
menggunakan histogram:
Frekuensi_distribusi_contoh_berat_telur
Dia bisa mendapatkan gambaran kasar tentang kemungkinan ukuran telur yang
berbeda langsung dari distribusi frekuensi ini. Misalnya, dia dapat melihat bahwa
ada kemungkinan besar sebuah telur berukuran sekitar 1,9 ons, dan ada
kemungkinan kecil bahwa sebuah telur berukuran lebih besar dari 2,1 ons.
Misalkan petani menginginkan estimasi probabilitas yang lebih tepat. Salah satu
pilihannya adalah meningkatkan perkiraannya dengan menimbang lebih banyak
telur.
Pilihan yang lebih baik adalah dengan mengenali bahwa ukuran telur tampaknya
mengikuti distribusi probabilitas umum yang disebut distribusi normal . Peternak
dapat membuat versi distribusi bobot telur yang ideal dengan mengasumsikan
bobotnya terdistribusi normal:
Normal_distribution_example_egg_weight
Karena distribusi normal telah dipahami dengan baik oleh para ahli statistik, petani
dapat menghitung estimasi probabilitas secara tepat, bahkan dengan ukuran sampel
yang relatif kecil.
Variabel yang mengikuti distribusi probabilitas disebut variabel acak . Ada notasi
khusus yang dapat Anda gunakan untuk mengatakan bahwa variabel acak mengikuti
distribusi tertentu:
Misalnya, notasi berikut berarti “variabel acak X mengikuti distribusi normal dengan
rata-rata µ dan varians σ 2 .”
Distribusi probabilitas diskrit hanya mencakup probabilitas dari nilai yang mungkin.
Dengan kata lain, distribusi probabilitas diskrit tidak menyertakan nilai apa pun yang
probabilitasnya nol. Misalnya, distribusi probabilitas pelemparan dadu tidak
mencakup 2,5 karena ini bukan kemungkinan hasil pelemparan dadu.
Probabilitas semua nilai yang mungkin dalam distribusi probabilitas diskrit berjumlah
satu. Sudah pasti (yaitu probabilitas satu) bahwa suatu observasi akan mempunyai
salah satu nilai yang mungkin.
Bayangkan jumlah sweater yang dimiliki per orang di Amerika Serikat mengikuti
distribusi Poisson .
Di mana:
probabilitas_example_egg_weight
Perhatikan bahwa variabel hanya dapat memiliki nilai tertentu, yang diwakili oleh
lingkaran tertutup. Anda dapat memiliki dua sweter atau 10 sweter, tetapi Anda
tidak dapat memiliki 3,8 sweter.
Peluang seseorang tidak memiliki sweter adalah 0,05, peluang seseorang memiliki
satu sweter adalah 0,15, dan seterusnya. Jika kita menjumlahkan semua probabilitas
untuk setiap kemungkinan jumlah sweater yang dimiliki seseorang, hasilnya akan
sama dengan 1.
Variabel kontinu dapat mempunyai nilai berapa pun antara nilai terendah dan
tertingginya. Oleh karena itu, distribusi probabilitas kontinu mencakup setiap angka
dalam rentang variabel .
Peluang suatu variabel kontinu mempunyai nilai tertentu sangatlah kecil sehingga
dianggap mempunyai peluang nol. Namun, probabilitas bahwa suatu nilai akan
berada dalam interval nilai tertentu dalam rentangnya lebih besar dari nol.