Anda di halaman 1dari 25

STASTISTIK PENDIDIKAN

Tugas Akhir Semester

Dosen Pembimbing: Umam Nugroho,M.Pd

Disusun oleh:
Suwarti (1821160034)

FAKULTAS KEGURUAN DAN ILMU PENDIDIKAN


PROGRAM STUDI PENDIDIKAN BIOLOGI
UNIVERSITAS MUHAMMADIYAH BENGKULU
2020
10.6 Distribusi Sampel Berarti
Kami sekarang siap untuk kembali ke anak 10 tahun kami dari Bagian 10.1 dan
membahas pertanyaan mendasar dalam inferensi statistik: Apa jenis hasil
sampel mungkin diperoleh sebagai hasil dari variasi pengambilan sampel acak?
Anda akan ingat bahwa untuk populasi nasional usia 10 tahun, rata-rata Skor IQ
Stanford-Binet adalah m = 100 dan standar deviasi adalah s = 16. Misalkan
bahwa sampel acak pertama Anda berukuran n = 64 menghasilkan rata-rata
sampel X1 = 103: 70. (Subskrip menunjukkan bahwa rata-rata ini dari sampel
pertama.) Anda merekam ini berarti, ganti sampel dalam populasi, dan pilih
sampel kedua n = 64. Sampel rata-rata ini adalah X2 = 98:58, yang dengan
patuh Anda rekam. Anda terus mengulangi latihan ini berulang-ulang, seperti
diilustrasikan pada bagian atas Gambar 10.2. Seandainya kamu adalah
mengulangi eksperimen pengambilan sampel ini tanpa batas waktu (proposisi
teoretis, menjadi yakin), dan jika semua mean sampel dimasukkan ke dalam
distribusi frekuensi relatif, Anda
Gambar 10.2 Pengembangan distribusi sampling rata-rata untuk ukuran sampel
n = 64 memiliki distribusi sampling cara. Kami menunjukkan ini di bagian
bawah Gambar 10.2
Distribusi sampling rata-rata adalah distribusi probabilitas. Itu adalah
saudara distribusi frekuensi cara yang diperoleh dari serangkaian
pengambilan sampel tanpa batal percobaan, masing - masing terdiri
dari sampel ukuran n dipilih secara acak dari populasi.

Seperti yang Anda lihat, distribusi sampling rata-rata pada Gambar 10.2
mengikuti kurva normal, dengan sampel berarti pengelompokan di sekitar rata-
rata populasi (m ¼ 100) dan meruncing ke kedua arah. Kami akan menjelajahi
properti ini sebentar lagi.
Tentu saja, tidak mungkin untuk benar-benar menghasilkan distribusi pada
Gambar 10.2 karena tak terbatas percobaan pengambilan sampel akan
diperlukan. Untungnya untuk kita semua, matematikawan telah mampu
memperoleh karakteristiknya yang menentukan — berarti, standar deviasi, dan
bentuk — dan karena itu dapat menyatakan apa yang akan terjadi jika suatu
serangkaian terbatas percobaan sampel acak dilakukan. Dan dengan mengetahui
distribusi sampel, Anda berada dalam posisi untuk menjawab pertanyaan
mendasar diajukan pada awal bagian ini: Seperti apa hasil sampel yang
mungkin terjadi diperoleh sebagai hasil dari variasi sampling acak?
10.7 Karakteristik Distribusi Sampling Berarti
Setiap distribusi sampling rata-rata dapat dicirikan dengan rata-rata, standar
penyimpangan, dan bentuk.
Sarana distribusi sampling berarti
Disimbolkan oleh mX, rata-rata distribusi sampling dari mean akan sama
sebagai rata-rata populasi skor (m):

Cara pengambilan sampel

Distribusi cara mx= m (10.1)

Ini mungkin sesuai dengan intuisi Anda. Secara kebetulan, beberapa sampel
berarti akan jatuh di atas m (mungkin sangat). Tetapi kesempatan tidak
memainkan favorit. Dengan infi Meskipun jumlah sampel, sampel berarti jatuh
di bawah m menyeimbangkan yang jatuh di atas, menghasilkan rata-rata untuk
seluruh distribusi rata-rata sama dengan m.
Standar Deviasi dari Distribusi Pengambilan Sampel Sarana
Simpangan baku rata-rata dalam distribusi sampel dikenal sebagai standar
kesalahan rata-rata, dilambangkan dengan sX. Ini mencerminkan jumlah
variabilitas di antara sarana sampel — yaitu, variasi pengambilan sampel.
Perhatikan bahwa istilah standar kesalahan digunakan sebagai pengganti standar
deviasi. Ini melayani pemberitahuan bahwa sX adalah standar deviasi dari jenis
distribusi khusus — distribusi sampel. Menghitung sX hanya membutuhkan s
dan n:
Sebagai contoh diilustrasikan pada bagian bawah Gambar 10.2, s =16 dan n =
64. Oleh

Kesalahan setandar rata-rata 10.2

Beberapa wawasan penting dapat diperoleh dari melihat lebih dekat pada
Formula (10.2)³.Pertama, sX tergantung pada jumlah variabilitas dalam
populasi. Karena s

³Sebenarnya, Formula (10.2) tidak tepat jika populasi terbatas dan sampel
diambil tanpa penggantian (mis., tidak ada individu yang dapat muncul dalam
sampel lebih dari sekali). Dalam praktiknya, ini bukan masalah ketika n kurang
dari 5% dari populasi — yang hampir selalu merupakan kasus dalam penelitian
sosial.
dalam pembilang, populasi yang lebih bervariasi akan menghasilkan kesalahan
standar yang lebih besar dari artinya. Kedua, sX tergantung pada ukuran sampel
yang dipilih. Akibatnya, di sana bukan hanya distribusi sampel tunggal sarana
untuk populasi tertentu; agak,ada yang berbeda untuk setiap ukuran sampel.
Artinya, ada keluarga sampel distribusi untuk populasi tertentu. Kami
menunjukkan dua anggota keluarga ini di Gambar 10.3, ditumpangkan pada
distribusi populasi.
Ketiga, karena n muncul dalam penyebut Formula (10.2), standar eror rata-rata
menjadi lebih kecil ketika n bertambah. Artinya, semakin besar sampel ukuran,
semakin dekat sampel berarti kluster di sekitar m (lihat Gambar 10.3). Ini, juga,
harus setuju dengan intuisi Anda. Sebagai contoh, faktor kebetulan membuatnya
mudah rata-rata sampel IQ yang sangat kecil (mis., n ¼ 3) berada jauh di atas
atau jauh di bawah angka 100. Tetapi dalam sampel yang jauh lebih besar, ada
peluang yang lebih besar untuk kesempatan untuk beroperasi \ secara
demokratis "dan menyeimbangkan IQ tinggi dan terendah IQ dalam sampel,
menghasilkan sampel berarti lebih dekat ke m. Sekali lagi paralel dalam
melempar koin: Anda tidak akan berpikir apa-apa untuk mendapatkan hanya
kepala setelah membalik koin dua kali (n ¼ 2), tetapi Anda akan sangat curiga
jika Anda membalik koin 100 kali (n ¼ 100) dan hanya melihat kepala⁴.
Bentuk Distribusi Pengambilan Sampel Sarana
Menurut teori statistik, jika populasi pengamatan normal didistribusikan,
distribusi sampling berarti yang berasal dari populasi itu juga akan
didistribusikan secara normal. Gambar 10.3 menggambarkan prinsip ini juga.
Distribusi sampel dari berarti
berdasarkan n = 9 (rata-rata = m,
kesalahan standar = s /√ 9)

Distribusi sampel dari berarti


berdasarkan n = 3 (rata-rata = m,
kesalahan standar = s /√3)

Populasi distribusi skor


(rata-rata = m, standar
deviasi = s)

Gambar 10.3 Populasi skor dan distribusi sampling rata-rata untuk n = 3 dan n
=9
⁴Anda mungkin akan menduga penipuan jauh sebelum lemparan ke-100!
Dengan hanya lima kali lemparan, misalnya kemungkinan mendapatkan semua
kepala hanya: 5: 5: 5: 5: 5 ¼: 03 (kan?).
Tetapi bagaimana jika distribusi populasi tidak mengikuti kurva normal?

Distribusi sampel berarti cenderung ke bentuk normal sebagai ukuran


sampel meningkat, terlepas dari bentuk distribusi populasi dari mana sampel
telah dipilih secara acak.

Dengan banyak populasi, distribusi skor cukup normal sehingga sedikit bantuan
dari teorema limit pusat diperlukan. Tetapi bahkan ketika populasi pengamatan
berangkat secara substansial dari distribusi normal, distribusi sampel cara dapat
diperlakukan seolah-olah terdistribusi secara normal jika n cukup besar. Apa
yang "cukup" besar? Tergantung pada derajat distribusi populasi yang tidak
normal, 25 hingga 30 kasus biasanya cukup. 10.4 mengilustrasikan
kecenderungan distribusi sampling dari sarana untuk mendekati normalitas
ketika n meningkat. Dua populasi skor ditunjukkan pada Gambar 10.4a: satu
persegi panjang, yang lainnya condong positif. Pada Gambar 10.4b,
pengambilan sampel distribusi muncul untuk sampel berdasarkan n = 2.
Perhatikan bahwa bentuk ini
a) Populasi dari skor

b)Sampling distribusi sarana

(Ukuran Sampel = 2)

c) sampling distribusi sarana

(Ukuran sampel = 25)

Gambar 10.4 Ilustrasi teorema limit pusat.


distribusi berbeda dari orang tua mereka dari skor dan bahwa Perbedaannya
adalah dalam arah normalitas. Pada Gambar 10.4c, di mana n ¼ 25, distribusi
sampel memiliki kemiripan yang luar biasa dengan distribusi normal.
Pentingnya teorema limit pusat tidak dapat dilebih-lebihkan. Karena teorema
limit pusat, kurva normal dapat digunakan untuk mendekati sampling distribusi
cara dalam berbagai situasi praktis. Jika tidak demikian, banyak masalah dalam
inferensi statistik akan sangat canggung untuk dipecahkan, untuk sedikitnya.
10.8 Menggunakan Distribusi Pengambilan Sampel Berarti untuk
Menentukan Kemungkinan
Distribusi sampling yang relevan dari sarana memberi Anda gambaran tentang
seberapa khas atau seberapa jarang rata-rata sampel tertentu mungkin.
Pemeriksaan Gambar 10.2, misalnya, mengungkapkan bahwa rata-rata 101
untuk sampel acak 64 IQ dapat dengan mudah terjadi, sedangkan sampel rata-
rata 106 sangat tidak mungkin. Untuk tujuan statistik, bagaimanapun,
dibutuhkan lebih banyak ketelitian daripada yang diberikan oleh frasa seperti\
dapat dengan mudah terjadi "dan \ sangat tidak mungkin." Yaitu, probabilitas
spesifik dibutuhkan. Probabilitas ini mudah ditemukan dalam distribusi sampel,
untuk semua distribusi sampel adalah distribusi probabilitas: Mereka
menyediakan frekuensi relatif dengan mana berbagai nilai sampel terjadi
dengan pengambilan sampel berulang selama jangka panjang.
Keempat masalah yang mengilustrasikan menggambarkan penggunaan
distribusi sampling dari berarti untuk menjawab pertanyaan probabilitas yang
mendasar untuk jenis yang Anda inginkan pertemuan dalam inferensi statistik.
Logika yang mendasari masalah ini identik dengan logika di balik delapan
masalah di Bab 6, di mana Anda menggunakan kurva normal untuk menentukan
area ketika skor diketahui (Bagian 6.6) dan untuk menentukan skor ketika area
diketahui (Bagian 6.7). Satu-satunya perbedaan adalah bahwa masalah Anda
sebelumnya adalah dengan skor individu, sedangkan sekarang dengan rata-rata
sampel. (Kami mendorong Anda untuk meninjau kembali masalah Bab 6
sebelum melanjutkan.)
Untuk setiap masalah yang terjadi, populasinya adalah distribusi skor IQ
Stanford untuk semua anak berusia 10 tahun di Amerika Serikat (m ¼ 100, s ¼
16). Menganggap bahwa Anda telah secara acak memilih sampel tunggal n=64
dari populasi ini pengamatan.
Masalah 1
Berapa probabilitas memperoleh sampel berarti IQ 105 atau lebih tinggi?
Pertama-tama mari kita perjelas pertanyaan ini dengan mengingat bahwa
kemungkinan suatu kejadian adalah sama dengan proporsi dari semua
kemungkinan hasil yang mendukung acara (Bagian 9.3).Pertanyaan di atas,
kemudian, dapat diulangi sebagai berikut: Apa proporsi semua

5 Populasi skor IQ Stanford-Binet cukup normal. Tetapi bahkan jika tidak,


Anda dijamin oleh teorema limit pusat bahwa, dengan ¼ 64, distribusi sampel
yang mendasarinya adalah — setidaknya cukup untuk menggunakan kurva
normal sebagai perkiraan distribusi sampling.
kemungkinan sampel n=64 memiliki sarana 105 atau lebih tinggi? Distribusi
sampling berarti menyediakan Anda dengan distribusi teoritis dari semua
sampel yang mungkin n=64. Tugas Anda adalah menentukan area dalam
distribusi sampel ini di atas X=105. Kami menyajikan solusi untuk masalah ini
dalam tiga langkah.
Langkah 1 Hitung kesalahan standar rata-rata

Langkah 2 Karena Anda akan menggunakan kurva normal untuk


memperkirakan distribusi sampling dari rata-rata, Anda sekarang harus
menyatakan kembali lokasi rata-rata sampel dari 105 sebagai skor z. Ingat dari
Formula (6.1) bahwa skor z diperoleh oleh mengurangi mean dari skor dan

membaginya dengan deviasi standar:


Dalam distribusi sampling rata-rata, mean sampel adalah \ skor, "the mean
populasi adalah \ mean, "dan standard error dari mean adalah\ standar deviasi.
"Yaitu:
Dalam contoh ini

z skor untuk rata-rata sampel (10.3)


Nilai z ini memberi tahu Anda bahwa mean sampel, X ¼ 105, jatuh dua dan a
setengah kesalahan standar di atas rata-rata populasi, m ¼ 100 (lihat Gambar
10.5).

Gambar 10.5 Menemukan proporsi rata-rata sampel yang berbeda dari rata-rata
populas di luar nilai yang diberikan.
Langkah 3 Temukan z: 50 2:50 di kolom 3 dari Tabel A (Lampiran C), di mana
Anda menemukannya area di luar nilai ini adalah 0,0062. Dengan demikian,
secara acak berulang sampel (n ¼ 64), proporsi kali Anda akan mendapatkan
sampel rata-rata IQ 105 atau lebih tinggi adalah 0,0062. (Dinyatakan secara
berbeda, dalam kondisi ini Anda akan melakukannya berharap mendapatkan
sampel rata-rata 105 atau lebih tinggi hanya dalam 62 dari setiap 10.000 sampel
acak yang Anda gambar. Tidak mungkin, memang!) Jawab: Kemungkinan
mendapatkan sampel rata-rata IQ 105 atau lebih tinggi adalah 0,0062.
Masalah 2
Berapa probabilitas memperoleh sampel mean IQ yang berbeda dari rata-rata
populasi sebesar 5 poin atau lebih?
Masalah ini, tidak seperti yang sebelumnya, membutuhkan probabilitas dua sisi
karena rata-rata sampel dapat setidaknya 5 poin di bawah atau di atas m =100.
Anda sudah tahu bahwa z =þ2: 50 untuk IQ 105 dan bahwa area di atas 105
adalah 0,0062.(Perhatikan bahwa karena s dan n sama dengan pada Masalah 1,
sX tidak berubah.)Karena 95 jauh di bawah m seperti 105 di atas m, skor z
untuk 95 adalah 2,50. Dan karena kurva normal simetris, area di atas 95 juga
adalah 0,0062 (lihat Gambar10.6). Untuk menemukan probabilitas yang
diperlukan, cukup gunakan aturan OR / penambahan dangandakan area di luar
105:: 0062 þ: 0062 =: 0124.
Jawab: Peluang memperoleh sampel mean IQ yang berbeda dari rata-rata
populasi sebesar 5 poin atau lebih adalah 0,0124.
Masalah 3
Apa artinya sampel IQ sangat tinggi sehingga probabilitasnya hanya 0,05 untuk
mendapatkan satu sebagai tinggi atau lebih tinggi dalam pengambilan sampel
acak?
Proses sekarang terbalik: Anda diberi probabilitas dan harus menentukan mean
sampel. Dari Tabel A, cari skor z di luar yang hanya 0,05 area di bawah kurva
normal jatuh. Ini adalah z dari 1,65. Tanda aljabar positif karena Anda hanya
tertarik pada sisi kanan distribusi sampel—\ setinggi atau lebih tinggi. "(Seperti
yang Anda lihat dari Tabel A, nilai z tepat berada di suatu tempat antara dua
nilai yang diajukan, 1.64 dan 1.65. Kami pergi dengan yang lebih besar, lebih
konservatif, dari keduanya.)

Gambar 10.6. Menemukan proporsi sampel berarti yang berbeda dari rata-rata
populasi lebih dari jumlah yang diberikan.
Gambar 10.7 Menemukan nilai di luar proporsi yang
diberikan sampel berarti akan jatuh.

Berarti sampel yang diinginkan, maka, harus 1,65 kesalahan standar di atas m =
100.Sekarang, ubah skor z kembali menjadi rata-rata sampel. Dari Formula

(10.3), berikut bahwa X = m þ zsX.6 Oleh karena itu.


Dengan demikian, dengan pengambilan sampel acak tak terbatas (n ¼ 64) dari
populasi skor Stanford Binet IQ, Anda hanya mengharapkan 5% dari sampel
berarti menjadi 103,3 ataulebih tinggi (lihat Gambar 10.7). Jawab:Memperoleh
sampel berarti IQ 103,3 atau lebih tinggi membawa kemungkinan 0,05.
Masalah 4
Dalam batas apa 95% sampel pusat akan jatuh?
Jika 95% dari sampel berarti untuk jatuh di tengah distribusi sampling, 5%
sisanya harus dibagi rata antara dua ekor distribusi. Artinya, 2,5% harus jatuh di
atas batas atas dan 2,5% di bawah batas bawah (lihat Gambar 10.8). Maka tugas
pertama Anda adalah menentukan nilai z.
Gambar 10.8 Menemukan
yang terpusat batas skor
terletak di antaranya
proporsi tertentu dari sampel
berarti akan jatuh.

6.Butuh bantuan? Lipat gandakan kedua sisi Formula (10.3) dengan sX, yang
memberi Anda zsX ¼ X m. Sekarang tambahkan m ke kedua sisi (dan mengatur
ulang persyaratan) untuk mendapatkan X ¼ m þ zsX.
Di luar mana 0,025 area di bawah kurva normal berada. Dari Tabel A,Anda
menemukan bahwa nilai ini adalah z ¼ 1:96. Sekarang selesaikan untuk yang
lebih rendah (XL) dan atas (XU) batas:

Jawab: 95% dari sampel berarti jatuh antara 96,08 dan 103,92. Dengan sampel
acak tunggal (n = 64), maka probabilitasnya adalah 0,95 untuk mendapatkan
sampel berarti antara batas-batas ini. Anda mungkin tidak terkejut mengetahui
bahwa probabilitasnya adalah 0,05 untuk memperoleh mean sampel di luar
batas ini.
10.9 Pentingnya Ukuran Sampel (n)
Seperti yang baru saja Anda lihat, sebagian besar — 95% —dari semua sampel
yang memungkinkan berarti dalam Masalah 4 berada dalam kisaran 4 poin m
ketika n = 64. Dari Formula (10.2) dan Gambar 10.3, Anda tahu bahwa akan
ada penyebaran yang lebih besar di antara rata-rata sampel ketika n lebih kecil.
Mari kita hitung ulang batas bawah dan atas dari 95% pusat sampel berarti,
tetapi kali ini berdasarkan pada ukuran sampel kecil n = 4 yang tidak realistis.
Bisa ditebak, kesalahan standar rata-rata jauh lebih besar dengan pengurangan

ini di n:
Sekarang pasang sX baru untuk mendapatkan batas bawah (XL) dan atas (XU):

Daripada jatuh dalam kira-kira empat poin m (Masalah 4), 95% dari semua
kemungkinan sampel berarti sekarang berada di antara 84,32 dan 115,68 —
hampir 16 (!) menunjuk ke kedua sisi dari m. Sekali lagi, sampel berarti
menyebar lebih banyak tentang m ketika ukuran sampel kecil, dan, sebaliknya,
mereka menyebar lebih sedikit ketika ukuran sampel besar.Tabel 10.1
menunjukkan tingkat variasi pengambilan sampel untuk nilai n yang berbeda di
mana m = 100 dan s = 16. Untuk ukuran sampel terbesar (n = 256), 95% dari
semua kemungkinan.
Tabel 10.1 Variasi Pengambilan Sampel Di Antara Sarana
untuk Nilai Berbeda n (m = 100, s = 16)

berarti sampel akan jatuh kurang dari 2 poin dari m. Tabel ini menggambarkan
penting prinsip dalam inferensi statistik:
Kami akan mengeksplorasi hubungan ini lebih lanjut dalam bab-bab berikutnya

Ketika ukuran sampel meningkat, demikian juga keakuratan statistik


sampel sebagai estimasi parameter populasi.

10.10 Umumitas Konsep Distribusi Sampel


Sejauh ini fokusnya adalah pada distribusi sampel cara. Namun, konsep
distribusi sampling bersifat umum dan dapat berlaku untuk setiap statistik
sampel. Misalkan Anda telah menentukan median IQ Stanford-Binet, daripada
rata-rata, dari jumlah sampel acak yang tidak terbatas pada anak berusia 10
tahun. Distribusi frekuensi relatif dari median sampel yang diperoleh untuk
serangkaian pengalaman pengambilan sampel seperti itu akan disebut, cukup
wajar, distribusi sampling median. Dan jika Anda menghitung r Pearson antara
dua variabel yang sama secara tak terbatas serangkaian sampel acak, Anda akan
memiliki distribusi sampel korelasi koefisien. Secara umum:
Distribusi sampling dari statistik adalah distribusi frekuensi relatif dari itu
statistik, yang diperoleh dari serangkaian percobaan sampel identik yang
tidak terbatas.
Tentu saja, agar eksperimen pengambilan sampel identik, ukuran sampel harus
tetap sama dan sampel harus dipilih (dengan penggantian) dari populasi yang
sama.Untuk saat ini, kami akan terus mengembangkan konsep dan prosedur
inferensi statistik yang diterapkan pada masalah yang melibatkan sarana
tunggal. Ketika kita beralih ke kesimpulan tentang parameter populasi lain,
seperti perbedaan antara dua cara atau koefisien korelasi, Anda akan
menemukan bahwa secara umum prinsip yang sekarang sedang dikembangkan
masih berlaku, meskipun detailnya mungkin berbeda.
10.11 Ringkasan
Asumsi pengambilan sampel acak mendasari sebagian besar prosedur inferensi
yang digunakan oleh para peneliti dalam ilmu behavioral, dan itu adalah model
pengambilan sampel acak yang dikembangkan dalam buku ini. Meskipun
sampel yang digunakan dalam penelitian pendidikan sering tidak dipilih secara
acak, penerapan prosedur inferensi yang menganggap pengambilan sampel acak
bisa sangat berguna, menyediakan interpretasi yang dilakukan dengan hati-hati.
konsep dasar untuk pengambilan sampel acak model:
a) Populasi — seperangkat pengamatan tentang yang mana penyelidik ingin
menarik kesimpulan. Karakteristik inflasi disebut parameter.
b) Sampel — bagian dari populasi. Karakteristik sampel disebut statistik.
c) Sampel acak — sampel yang dipilih masing-masing kemungkinan
sampel dengan ukuran yang ditentukan (n) memiliki probabilitas seleksi
yang sama. Ketika kondisi ini terpenuhi, juga benar bahwa setiap elemen
populasi akan memiliki peluang yang sama dimasukkan dalam sampel.

Pertanyaan kunci dari inferensi statistik adalah, \ Apa Apakah probabilitas


memperoleh berbagai hasil sampel di bawah pengambilan sampel acak?
"Jawabannya pertanyaan disediakan oleh distribusi sampel yang relevan. Ini
bisa menjadi distribusi sampel sampel berarti, median, korelasi, atau statistik
lainnya. Semua distribusi sampling adalah distribusi probabilitas.Distribusi
sampling rata-rata adalah distribusi frekuensi relatif dari semua kemungkinan
sampel dengan ukuran tertentu yang diambil dari population yang diberikan.
Mean dari distribusi sampling dari berarti dilambangkan dengan mX dan sama
dengan m. Itu standar deviasi dari distribusi ini (disebut standard error dari
mean) dilambangkan dengan sX dan sama dengan s = ffiffiffi n p. Rumus untuk
sX menunjukkan itu variasi pengambilan sampel di antara rata-rata akan lebih
sedikit untuk sampel lar thanger daripada yang kecil. Bentuk distribusi akan
normal jika populasinya normal atau, karena teorema batas pusat, jika sampel
ukurannya relatif besar. Konsekuensinya, normal kurva dapat digunakan
sebagai model matematika untuk menetralkan probabilitas memperoleh mean
sampel dari berbagai nilai.

Membaca Penelitian: Kesalahan Standar Mean


Baker et al. (2000) melaporkan nilai rata-rata membaca dan matematika untuk
subkelompok siswa Hispanik kelas delapan dari seluruh negara. Untuk setiap
mean (M), ini penulis juga menyajikan kesalahan standar (SE) yang
menyertainya. Seperti yang Anda lihat Tabel 10.2, ns yang lebih besar dikaitkan
dengan UK yang lebih kecil, dan, sebaliknya, ns yang lebih kecil ditemukan
dengan SES yang lebih besar. Pertimbangkan sampel siswa Kuba yang relatif
kecil (n ¼ 35), untuk yang membaca SE kira-kira delapan kali lebih besar dari
SE untuk sampel yang cukup besar dari siswa Meksiko (n ¼ 1571). Hanya ada \
sampling yang lebih besar variasi "untuk sampel kecil dibandingkan dengan
sampel besar. Akibatnya,

Tabel 10.2 Cara dan Kesalahan Standar untuk Subkelompok Siswa Hispanik
Kelas Delapan

Sumber: Tabel 3 di Baker et al. (2000). (Dicetak ulang atas izin Sage, Inc).
sarana membaca dan matematika untuk sampel siswa Kuba yang lebih kecil
kurang tepat perkiraan populasi berarti (mis., kinerja membaca dan matematika
semua) Siswa kelas delapan Kuba di Amerika Serikat) dibandingkan dengan
sampel yang lebih besar Siswa meksiko. Anda akan melihat implikasi dari
kesalahan standar rata-rata lebih jelas dalam Bab 12, di mana kita membahas
estimasi interval
Sumber: Baker, B. D., Keller-Wolff, C., & Wolf-Wendel, L. (2000). Dua
langkah maju, satu langkah mundur: Ras / etnis dan prestasi siswa dalam
penelitian kebijakan pendidikan. Kebijakan Pendidikan, 14 (4), 511–529.
Studi Kasus: Keberuntungan Undian
Undang-Undang No Child Left Behind Act (NCLB) mengharuskan sekolah
umum di setiap negara bagian untuk menyelenggarakan tes standar di bidang
mata pelajaran inti membaca dan matematika. Oleh Tahun ajaran 2007–2008,
ujian sains harus ditambahkan ke dalam campuran. Banyak negara bagian
menguji domain lain juga. Misalnya, Missouri dan Rhode Island mengelola
penilaian dalam pendidikan kesehatan dan fisik, dan tes Kentucky dalam seni.
Beberapa negara bagian menyatakan ujian studi sosial. Tentu saja ada banyak
manfaat dari program pengujian negara. Tetapi mereka juga bisa menjadi usaha
mahal dalam hal waktu dan uang.
Bagaimana jika suatu negara ingin memperluas program penilaiannya untuk
memasukkan tes tambahan di,katakanlah, seni? Anggap lebih jauh keadaan ini,
dalam upaya meminimalkan biaya dan ketidaknyamanan, memutuskan untuk
menguji hanya sampel sekolah setiap tahun. Itu adalah,alih-alih menjalankan tes
tambahan ini di setiap sekolah, sampel acak berjumlah 300 sekolah dipilih
untuk berpartisipasi dalam penilaian seni negara. Ketertarikan negara di sini
bukan untuk meminta pertanggungjawaban setiap sekolah (dan siswa) terhadap
standar kinerja seni; melainkan untuk melacak tren umum dalam kinerja di
seluruh negara bagian. Informasi tersebut dapat digunakan untuk
mengidentifikasi bidang-bidang yang memiliki kekuatan dan kelemahan relatif
dan, pada gilirannya, memandu inisiatif reformasi yang disponsori negara.
Menguji siswa dalam sampel yang representatif sekolah (daripada setiap
sekolah) cukup konsisten dengan tujuan ini.
Dengan menggunakan pendekatan ini, apakah kinerja rata-rata, berdasarkan
sampel 300 ini sekolah, memberikan dasar yang kuat untuk membuat
kesimpulan tentang kinerja semua sekolah di negara bagian? Apa kemungkinan
itu, secara kebetulan, sampel seperti itu akan termasuk jumlah sekolah dengan
skor tinggi (atau skor rendah) yang tidak proporsional, dengan demikian salah
menggambarkan populasi semua sekolah?
Untuk mengeksplorasi pertanyaan seperti itu, kami membuat set data yang
berisi hasil penilaian seni di seluruh negara bagian untuk 1574 sekolah dasar.
Data tersedia dalam persentase siswa yang berprestasi di tingkat mahir atau di
atas (variabel yang kita sebut PROFIC).Kami kemudian menghitung rata-rata
dan standar deviasi PROFIC, diperoleh m = 78:39 dan s = 14:07. Artinya, rata-
rata sekolah kelas tiga di negara bagian ini sedikit lebih dari 78% siswa kelas
tiga yang memiliki kecakapan atau lebih tinggi, dengan a standar deviasi sekitar
14 poin persentase. Perhatikan penggunaan m dan s kami,karena kami memiliki
data populasi (mis., semua sekolah kelas tiga di negara bagian ini).
Mari kita kembali ke pertanyaan dasar kita: Apakah mean, berdasarkan sampel
acak dari n = 300 sekolah, dasar yang kuat untuk membuat kesimpulan tentang
populasi sekolah di negara bagian ini? Karena kita tahu bahwa = 14:07, kita
dapat menggunakan Formula (10.2) untuk menentukan standard error dari
mean:

Ini memberitahu kita jumlah variasi pengambilan sampel dalam cara yang kita
harapkan, diberikan sampel acak tak terbatas dengan ukuran n = 300. Sekarang,
karena kita tahu bahwa m = 78:39,kami juga dapat menentukan pusat 95% dari
semua mean sampel yang akan diperoleh dengan pengambilan sampel berulang
populasi ini:

Jadi, kita melihat bahwa bagian terbesar dari sampel acak — 95% — akan
termasuk dalam a hanya titik setengah (tepatnya 1,59) dari rata-rata populasi.
Dinyatakan lebih lanjut secara formal, probabilitas 0,95 bahwa kinerja rata-rata
sampel acak 300 sekolah akan jatuh dalam 1,59 poin dari kinerja rata-rata
semua sekolah. Didalam hal ini, rata-rata berdasarkan sampel acak dari 300
sekolah akan cenderung memperkirakan populasi sekolah dengan akurasi yang
cukup besar!
Bayangkan bahwa tujuan dalam keadaan ini adalah bahwa skor PROFIC rata-
rata di seluruh negara bagian akan menjadi setidaknya 80%. Mengingat m =
78:39, yang kurang dari sasaran ini, apa probabilitas bahwa sampel acak dari
300 sekolah akan menghasilkan a berarti skor PROFIC 80% atau lebih tinggi?
(Sayangnya, hasil ini akan mengarah untuk perayaan prematur.) Jawabannya
ditemukan dengan menerapkan Formula (10.3):
Meskipun dimungkinkan untuk mendapatkan sampel rata-rata 80% atau lebih

tinggi (ketika m = 78:39),sangat tidak mungkin: hasil ini sesuai dengan skor z
dari 1,99, yang membawa a probabilitas hanya 0,03333. Sangat tidak mungkin
bahwa sampel acak 300 sekolah akan mengarah pada kesimpulan yang salah
bahwa tujuan di seluruh negara bagian telah.
Sebagai pertimbangan terakhir, anggaplah seorang pembuat kebijakan
merekomendasikan itu saja 100 sekolah diuji, yang akan menghemat lebih
banyak uang. Seperti yang Anda ketahui,mengurangi n akan meningkatkan
kesalahan standar rata-rata: Dengan n = 100, kesalahan standar meningkat
menjadi sX = 1:41, dan pusat 95% dari semua sampel yang mungkin berarti
sekarang meluas dari 75,63 ke 81,15. Saksikan pengorbanan antara presisi dan
biaya: Dengan sampel yang lebih kecil, seseorang mendapatkan jangkauan yang
lebih luas dari sarana yang memungkinkan. Demikian pula, akan ada
probabilitas yang lebih besar (0,0793) dari kesimpulan yang salah, pada
berdasarkan sampel tunggal, bahwa tujuan seluruh negara bagian 80% telah
terpenuhi — fakta Anda dapat memverifikasi dengan memasukkan sX baru ke
Formula (10.3).
Kita harus menekankan bahwa, karena kita sudah tahu, studi kasus ini tidak
realistis. Dalam praktik sebenarnya, negara hanya akan memiliki sampel acak
dari 300 sekolah dan, dari sini, membuat kesimpulan yang masuk akal tentang
kemungkinan kinerja semua sekolah — seandainya semua sekolah diuji. Tetapi
dengan melibatkan Anda dalam fantasy kami, kami dapat menunjukkan
seberapa dekat rata-rata sampel tersebut dengan Populasi berarti dimaksudkan
untuk memperkirakan.
Latihan Komputer yang Disarankan
Akses file data mahasiswa kedua.
Hitung skor CGPA rata-rata untuk keseluruhan populasi 521 siswa;
menghasilkan histogram untuk CGPA.
sampel acak dari 25 kasus dari populasi 521 siswa. Untuk melakukannya,
gunakan Pilih Prosedur kasus, yang terletak di dalam Data Tidak bisa. Hitung
rata-rata untuk CGPA. Ulangi ini seluruh proses 19 kali dan catat hasil Anda.
Buka file data baru (kosong) di SPSS. Masukkan 20 sampel berarti dalam
sebuah kolom, menamai S_MEANS yang bervariasi. Hitung mean dan
standarnya deviasi (mis., mean dan standar deviasi dari sampel berarti). Juga
menghasilkan histogram untuk S_MEANS dan membandingkannya dengan
histogram dari populasi skor CGPA yang Anda buat Latihan 1 di atas.
Latihan
Identifikasi, Tentukan, atau Jelaskan
Ketentuan dan Konsep
Pertanyaan dan Masalah
Catatan: Jawaban untuk item yang berkilau bintangnya (*) disajikan dalam
Lampiran B
*1. " Rata-rata orang di jalan tidak bahagia, "atau begitu yang dikatakan oleh
penyiar mewawancarai pengunjung sebuah bar olahraga lokal mengenai sanksi
berat yang telah dijatuhkan dikenakan pada universitas negeri untuk
pelanggaran NCAA.
a) Populasi apa yang tampaknya dimiliki oleh penyiar berita?
b) Apa sampel dalam hal ini?
c) Apakah Anda yakin sampel ini mewakili populasi yang tampak? Jika
tidak, dalam hal apa sampel ini bias?
2. Setelah mempertimbangkan masalah pengambilan sampel yang terkait
dengan Masalah 1, teman Anda memutuskan untuk mewawancarai orang-orang
yang benar-benar berada di jalan. bahwa ia mungkin mengancingkan mereka
untuk wawancara. Sebutkan empat sumber bias yang Anda yakini mungkin
mencegahnya untuk mendapatkan sampel yang benar-benar acak dari orang
yang diwawancarai.
3. Seorang peneliti yang melakukan penelitian tentang sikap terhadap
"homeschooling" meminta asistennya memilih sampel acak 10 anggota dari
sebuah gereja pinggiran kota besar. Sampel yang dipilih terdiri dari sembilan
wanita dan satu pria. Setelah melihat distribusi yang tidak merata jenis kelamin
dalam sampel, asisten mengeluh, \ Sampel ini tidak bisa acak — hampir semua
wanita! "Bagaimana tanggapan Anda terhadap asisten peneliti?
4. Populasi pengamatan tertentu adalah bimodal (lihat Gambar 3.10b).
a) Misalkan Anda ingin memperoleh gambaran distribusi sampling yang
cukup akurat sarana untuk sampel acak ukuran 3 yang diambil dari
populasi ini. Andaikan juga Anda memiliki waktu dan sumber daya yang
tidak terbatas. Jelaskan bagaimana, melalui diulang sampling, Anda bisa
sampai pada gambar seperti itu.
b) yang Anda harapkan dari distribusi sampling sarana untuk terlihat untuk
sampel ukuran 150 yang dipilih dari populasi ini? Nyatakan prinsip yang
digunakan untuk tiba atas jawaban Anda.
* 5 Misalkan Anda tidak tahu Formula (10.2) untuk sX. Jika Anda memiliki
waktu dan sumber daya tidak terbatas, bagaimana Anda akan mendapatkan
estimasi empiris sX untuk sampel tiga kasus masing-masing diambil dari
populasi Soal 4?
6. Jelaskan secara intuitif mengapa distribusi sampling dari alat untuk n = 2
dipilih dari distribusi \ flat "pada Gambar 10.4a memiliki lebih banyak kasus di
tengah daripada di luar. (Petunjuk: Bandingkan jumlah cara yang sangat tinggi
atau sangat rendahnberarti bisa diperoleh dengan jumlah cara rata-rata menuju
pusat bisa diperoleh.)
7. Apa tiga karakteristik pendefinisian dari distribusi sampling cara?
* 8 Apa saja pertanyaan kunci yang harus dijawab dalam masalah inferensi
statistik?
* 9 Mengingat:. m = 100 dan s = 30 untuk populasi pengamatan yang
terdistribusi normal. Misalkan Anda memilih secara acak dari populasi ini
sampel berukuran 36.
a) Hitung kesalahan standar rata-rata.
b) probabilitas bahwa mean sampel akan jatuh di atas 92?
c) Berapa probabilitas bahwa mean sampel akan jatuh lebih dari 8 poin di
atas rata-rata populasi 100?
d) Berapakah probabilitas bahwa mean sampel akan berbeda dari populasi
maksud dengan 4 poin atau lebih (ke salah satu arah)?
e) Apa yang dimaksud dengan sampel memiliki nilai yang sedemikian
tinggi sehingga probabilitasnya adalah 0,01 untuk memperoleh satu
setinggi atau lebih tinggi?
f) Dalam batas berapa 95% pusat dari semua sampel yang mungkin berarti
jatuh?

* 10. Misalkan Anda mengumpulkan jumlah sampel acak tak terbatas ukuran 36
dari populasi pada Soal 9.
a) Apa artinya rata-rata dari sampel yang dihasilkan?
b) Apa yang akan menjadi standar deviasi sampel berarti?
c) Apa yang akan menjadi bentuk distribusi sampel berarti? (Bagaimana
kamu tahu?)
11. Populasi peringkat sebaya dari ketertarikan fisik sekitar normal dengan m =
5: 2 dan s = 1: 6. Sampel acak dari empat peringkat dipilih dari populasi ini.
a) Hitung sX. Apa probabilitas memperoleh sampel berarti:
b) di atas 6,6?
c) ekstrim seperti 3,8?
d) di bawah 4.4?
e) antara rata-rata populasi dan 0,5 poin di bawah rata-rata?
f) tidak lebih dari 0,5 poin dari rata-rata populasi (di kedua arah)?
g) Apa yang dimaksud dengan sampel memiliki nilai yang sangat rendah
sehingga probabilitasnya adalah 0,05 untuk memperoleh satu serendah
atau lebih rendah?
h) saja batas yang ditempatkan secara terpusat sedemikian sehingga
probabilitasnya adalah 95 sehingga mean rata-rata akan jatuh dalam batas
itu?

12. Ulangi Masalah 11j menggunakan sampel ukuran 100.


a) Apa pengaruh sampel yang lebih besar ini terhadap kesalahan standar
rata-rata?
b) Apa efek dari sampel yang lebih besar ini pada batas-batas di mana pusat
95% sampel berarti jatuh?
c) XcDapatkah Anda melihat keuntungan menggunakan sampel besar dalam
upaya memperkirakan mean populasi dari rata-rata sampel acak?
(Menjelaskan.)
13. Misalkan Anda tidak tahu apa-apa tentang bentuk distribusi populasi tikus
yang digunakan dalam Masalah 11 dan 12. Apakah kurangnya pengetahuan ini
memiliki implikasi untuk memecahkan Masalah 11? Masalah 12?
(Menjelaskan.)
* 14. Misalkan untuk populasi pengamatan yang terdistribusi normal, Anda tahu
bahwa s = 15 tetapi Anda tidak tahu nilai m. Anda berencana untuk memilih
sampel acak (n = 50) dan gunakan mean sampel untuk memperkirakan mean
populasi.
a) Hitung sX.
b) Berapa probabilitas bahwa mean sampel akan jatuh dalam 5 poin (dalam
keduanya arah) dari nilai m yang tidak diketahui?
c) Berapa probabilitas bahwa mean sampel akan jatuh dalam 2 poin m
(dalam salah satu arah)?
d) Probabilitasnya adalah .95 bahwa mean sampel akan jatuh dalam ______
poin m (dalam baik arah)
* 15. Anda secara acak memilih sampel (n = 50) dari populasi pada Soal 14 dan
mendapatkan a mean sampel X = 108. Ingat: Meskipun Anda tahu itu s = 15,
Anda tidak tahu nilai m.
a) Apakah 107 masuk akal sebagai nilai yang mungkin untuk m dalam
terang rata-rata sampel 108? (Jelaskan dalam hal probabilitas.
b) Dalam hal ini, akankah 100 masuk akal sebagai nilai yang mungkin dari
m?

16. Populasi skor tes kepribadian normal dengan m = 50 dan s = 10.


a) Jelaskan operasi yang akan Anda lalui untuk mendapatkan gambaran
yang cukup akurat dari distribusi sampling median untuk sampel ukuran
25. (Asumsikan Anda miliki waktu dan sumber daya tak terbatas.)

b) Diketahui dari teori statistik bahwa jika distribusi populasi normal,


kemudian Apa artinya sMdn berdiri (beri nama)? Dalam istilah
konseptual, apa itu sMdn?

c) Jika Anda memilih sampel secara acak (n = 25), berapa probabilitas


sampel itu median akan jatuh di atas 55 (menganggap distribusi sampling
normal)?
d) Untuk populasi normal di mana m tidak diketahui, yang kemungkinan
merupakan estimasi yang lebih baik dari m: mean sampel atau median
sampel? (Menjelaskan.)

Anda mungkin juga menyukai