NIM : 105361106517
BAB 7
Distribusi normal adalah tulang punggung statistik tradisional. Kita belajar sangat
awal dalam pelatihan statistik bahwa distribusi sampel berarti, terlepas dari bentuk
distribusi induk, mendekati distribusi normal ketika ukuran sampel meningkat. Fakta ini
memungkinkan kita untuk menggunakan distribusi dan distribusi normal yang secara
teoritis terkait dengannya, seperti t, F, dan X2 , untuk menguji hipotesis tentang rata-rata
dan fungsi sarana (seperti perbedaan antara dua rata-rata atau lebih rata-rata, atau varian,
mengetahui bahwa distribusi sampling rata-rata atau perbedaan antara rata-rata mengikuti
distribusi normal dengan ukuran sampel yang cukup. Kita bisa melihat di bab terakhir
bahwa kita dapat menggunakan distribusi normal untuk menyetujui distribusi binomial
ketika jumlah percobaan menjadi besar. Dalam Bab 7, kita belajar cara menggunakan
berbagai fungsi distribusi normal untuk menemukan area di bawah kurva normal, untuk
menemukan nilai kritis z, dan untuk membuat sampel acak dari distribusi normal. Anda
menghasilkan skor standar, dan bahwa pusat default adalah rata-rata dan nilai penskalaan
default adalah standar deviasi. Dengan demikian fungsi scale () secara default
menghasilkan skor z untuk setiap set data. Skor z adalah statistik "kombinasi", yang
menyediakan informasi tentang lokasi skor mentah relatif terhadap rata-rata dan jumlah
unit standar deviasi skor mentah jauh dari rata-rata. Kita dapat menggunakan skor z baik
sebagai statistik deskriptif maupun statistik inferensial. Ketika kita tahu (atau mau
berasumsi kita tahu) standar deviasi populasi, kita dapat menggunakan distribusi normal
standar untuk membuat kesimpulan tentang rata-rata dan perbedaan antara rata-rata. Kita
juga menggunakan distribusi normal standar untuk membuat kesimpulan dan membuat
interval kepercayaan untuk proporsi, seperti yang telah kita bahas sebelumnya.
probabilitas binomial dan Poisson yang Anda pelajari di bab sebelumnya. Fungsi-
Distribusi normal kontinu, dan jarang tertarik pada fungsi kerapatan per se, tetapi
lebih pada menemukan area di bawah kurva normal. Secara teknis, batas bawah dari
distribusi normal adalah –∞, dan batas atas adalah + ∞. Meskipun menemukan area di
meskipun Anda dapat melakukan integrasi dan diferensiasi sederhana. Namun, dengan
menggunakan fungsi R, kita dapat menghindari kesulitan menemukan area di bawah kurva
normal kontinu hanya dengan memanfaatkan sedikit aljabar dasar. (Clewer and
Scarisbrick 2013)
Untuk distribusi normal dengan standar deviasi bukan nol, fungsi densitas
probabilitas adalah :
Untuk distribusi normal standar dengan rata-rata nol dan standar deviasi 1, ini
di sederhanakan menjadi :
Distribusi normal standar juga sering disebut distribusi normal “unit” karena
memiliki standar deviasi 1, varian 1, dan seperti semua distribusi probabilitas, seluruh area
berada pada titik tertinggi pada rata-rata, bahwa itu akan simetris, dan bahwa probabilitas
akan berkurang di ekor. Inilah yang disebut "kurva berbentuk lonceng" yang dipelajari
siswa di kelas statistik mereka. Fungsi R untuk fungsi kerapatan adalah dnorm, dan kita
dapat menggunakannya untuk menggambar grafik dari distribusi normal. Mari kita
bandingkan dua distribusi normal, keduanya dengan rata-rata 20, dan satu dengan standar
deviasi 3 dan yang lainnya dengan standar deviasi 6. Dalam prosesnya, saya akan
menunjukkan kepada Anda bagaimana menempatkan kedua kurva pada plot yang sama,
yang merupakan sesuatu yang tidak kita bahas dalam Bab 5. Pertama, kita akan
menghasilkan vektor untuk sumbu x dengan urutan dari 0 hingga 40, menggunakan
kenaikan 0,5. Kemudian, kita akan menerapkan fungsi dnorm dengan rata-rata 20 dan
kepadatan sebagai sumbu y kami dan skor mentah sebagai sumbu x kami. Akhirnya, kita
akan menambahkan kurva kedua ke grafik yang sama menggunakan fungsi titik. Berikut
adalah kode dalam R. Perhatikan bahwa saya menggunakan atribut type = "l" (untuk garis)
dan menambahkan warna ke kurva kedua untuk penekanan. (Hayek and Buzas 2010)
Mengubah Distribusi Normal ke Distribusi Normal Standar
Seperti yang kita lihat, distribusi normal yang berbeda memiliki jumlah
penyebaran yang berbeda, berdasarkan ukuran standar deviasi. Seringkali membantu untuk
mengubah distribusi normal menjadi distribusi normal standar dan bekerja dengan skor z.
Kita dapat mengonversi distribusi normal apa pun menjadi distribusi normal standar
Menurut definisi, distribusi normal standar memiliki rata-rata 0 dan standar deviasi 1
(lihat Gambar ).
Fungsi pnorm menemukan probabilitas ekor kiri. Ingat pada Bab 3 bahwa
nilai kritis z untuk interval kepercayaan 95% adalah z = ± 1,96, dan bahwa area antara
−1,96 dan +1,96 sama dengan 95% dari distribusi normal standar. Fungsi pnorm default ke
rata-rata nol dan standar deviasi 1, yang tentu saja berarti kita akan bekerja dengan
distribusi normal standar secara default. Ketika kita perlu bekerja dengan distribusi normal
dengan mean dan standar deviasi yang berbeda, kita bisa menyediakan nilai-nilai ini
sebagai argumen kedua dan ketiga untuk fungsi tersebut.
sebelah kiri z = 1,96. Ini juga berarti bahwa .0250 dari distribusi normal standar terletak di
kanan di bawah kurva normal standar. Misalnya, area di sebelah kanan z = 1,96 akan
sangat dekat dengan 0,025, seperti yang disiratkan oleh diskusi sebelumnya.
Asumsikan jika anda mengikuti tes standar dengan rata-rata 500 dan deviasi
standar 100. Skor anda adalah 720, mari kita gunakan skala dan fungsi pnorm untuk
menemukan skor z anda dan kemudian untuk menemukan perkiraan persentil anda pada
tes.
Anda melakukannya dengan sangat baik pada tes standar, dan persentil anda
sekitar 98,6.
Kita dapat dengan mudah menemukan area di antara dua skor z dengan
strategi pengurangan sederhana. Misalnya, untuk menemukan area antara z = −1.96 dan z =
Kita mengkonfirmasi bahwa dua nilai kritis ini memisahkan 95% tengah dari
distribusi normal standar dari 5% ekstrim. Kita dapat menggunakan pendekatan yang
ditunjukkan di sini untuk menemukan area antara dua skor z, ingatlah untuk mengurangi
area di sebelah kiri skor z yang lebih rendah dari area di sebelah kiri skor z yang lebih
tinggi. Jika tidak, kita akan berakhir dengan probabilitas negatif yang secara teoritis tidak
mungkin.
Fungsi qnorm menemukan skor z yang terkait dengan probabilitas yang diberikan
(kuantil), dan dengan demikian dapat digunakan untuk menemukan nilai kritis z.
Penggunaan fungsi pnorm dan qnorm menjadikan penggunaan nilai tabel z, untuk menjadi
contoh, mari kita temukan skor z yang terkait dengan area 0,975 kumulatif dari kurva
normal (dari ekor kiri). Tentu saja, jawabannya akan sangat dekat dengan z = 1,96, seperti
ke fungsi qnorm. Untuk tes are kiri, ubah tanda skor z, kita akan menemukan nilai kritis
satu sisi dari z untuk pengujian dengan alpha sama dengan 0,05 sebagai berikut:
mean dan standar deviasi yang ditentukan. Jika argumen ini dihilangkan, mereka default ke
distribusi normal standar, menghasilkan 50 sampel acak dari distribusi normal dengan rata-
Seperti yang disebutkan di awal bab ini, distribusi sampling berarti mendekati
distribusi normal ketika ukuran sampel meningkat. Ini memungkinkan kita untuk
menggunakan distribusi normal untuk membuat kesimpulan tentang mean sampel bahkan
ketika distribusi induk tidak normal, dengan menggunakan fakta statistik ini ketika kita
membuat kesimpulan tentang cara atau tentang perbedaan cara. Secara khusus, distribusi
pengambilan sampel rata-rata untuk sampel dengan ukuran n memiliki rata-rata sama
dengan rata-rata populasi, μ, dan varian serta standar deviasi sama dengan.
And
error of the mean.” Dengan tidak adanya parameter populasi, kita menggunakan statistik
sampel sebagai penaksir yang masuk akal, dan kmenghitung kesalahan standar rata-rata
Clewer, Alan G. and David H. Scarisbrick. 2013. Practical Statistics and Experimental Design
Hayek, Lee-Ann C. and Martin A. Buzas. 2010. Surveying Natural Populations: Quantitative
Kokoska, Stephen and Daniel Zwillinger. 2000. “Standard Normal Distribution.” in CRC
Pace, Larry and Larry Pace. 2012. “Computing Normal Probabilities.” in Beginning R.