Dalam ilmu sosial, kita sering ingin menemukan sesuatu tentang sekelompok orang
tertentu. Misalnya, kami mungkin ingin mengetahui orang-orang partai mana yang
berencana untuk memilih hari sebelum pemilihan, atau proporsi orang dewasa percaya
bahwa ganja harus dilegalisir.
Kita bisa bertanya kepada semua orang di negara ini pertanyaan ini. Namun akan agak
tidak praktis; Biaya akan sangat besar! Kabar baiknya adalah bahwa kita tidak perlu,
seperti yang dicapai dengan benar, sampel perwakilan bervariasi dengan cara yang
sistematis dan membuat perkiraan yang baik dari hal-hal dalam populasi yang ingin kami
cari tahu. Dengan menggunakan sampel untuk memperkirakan nilai populasi
menghemat sejumlah besar waktu dan uang.
Terjemahan :
1.Apa pendapatan rata-rata pekerja penuh waktu di Inggris Raya? Populasi: Semua
pekerja penuh waktu di Inggris Raya. Contoh: 1000 pekerja penuh waktu dipilih secara
acak oleh nomor asuransi nasional mereka.
2.Berapa banyak waktu remaja Inggris yang melakukan gks menghabiskan pekerjaan
rumah setiap hari? Populasi: Semua remaja Inggris di tahun 10 dan 11. Sampel: Sampel
dari 600 remaja di tahun 10 dan 11 dari pilihan sekolah yang berbeda di seluruh negeri.
3.Proporsi MP Inggris akan memilih masuk ke Euro? Populasi: Semua anggota parlemen
Inggris. Contoh: 100 MPS dengan terampil dipilih untuk mencerminkan anggota
parlemen di berbagai pihak dan wilayah Inggris.
SAMPLING (contoh)
Pertama, populasi harus sangat jelas didefinisikan. Misalnya, tentang pekerja ‘penuh
waktu’:
Kedua, properti minat harus jelas didefinisikan dengan jelas. Misalnya, ambil
‘Pendapatan rata-rata’:
Ketiga, sampel harus mewakili populasi. Meminta 1000 orang di Aberdeen, misalnya,
pendapatan rata-rata mereka tidak akan mewakili Inggris Raya secara keseluruhan.
Kita perlu memilih sampel kita dengan sangat hati-hati untuk meminimalkan:
• Kesalahan sampling
• Kode variabilitas sampling.
BEGINNING STATISTICS
(Statistik Awal)
Mantan direktori. Kesalahan sampling dapat dikurangi dengan menggunakan metode
optimum untuk memilih sampel.
Ada sejumlah besar teori statistik yang ditujukan untuk memperkirakan kesalahan
sampling dan merekomendasikan strategi sampling optimal yang meminimalkan
kesalahan. Jika ragu menghubungi ahli !! Bagian selanjutnya menjelaskan beberapa
strategi sampling yang paling umum digunakan.
THE SAMPLING DISTRIBUTION FOR THE MEAN (Distribusi sampling untuk rata-rata)
Jangan ditunda dengan judul bagian ini: Ini tidak seburuk kedengarannya!
Kami telah mengatakan bahwa jika kita mengambil banyak sampel dari populasi, sarana
setiap sampel akan sedikit berbeda.
Misalkan kita mengambil lima sampel A ke E, masing-masing dari lima wanita, dan
menanyakan berapa banyak anak yang mereka miliki. Data hipotetis ditunjukkan pada
Tabel 8.1.
Tabel 8.1 Data hipotetis untuk lima sampel dari lima wanita who’s meminta HOP
banyak anak yang mereka miliki
BEGINNING STATISTICS
(Statistik Awal)
Kita kemudian bisa menghitung jumlah rata-rata anak untuk setiap sampel, seperti pada
Tabel 8.2. Misalnya, jumlah rata-rata anak-anak di sampel A akan menjadi:
Tabel 8.2 Jumlah anak-anak untuk lima sampel wanita.
fakta yang menakjubkan nomor 2 Mean sampel berarti akan kira-kira sama dengan
populasi sejati sebenarnya.
Jika Anda bingung dengan semua cara yang berbeda ini, lihat kembali contoh wanita dan
jumlah anak mereka. Lima berarti pada Tabel 8.2 adalah contohnya. Untuk menemukan
mean sampel ini berarti, kami menambahkan lima sarana bersama dan membagi lima:
Jadi, rata-rata sampel berarti adalah 1,36 anak-anak, dan dari fakta yang menakjubkan 2
sehingga oleh karena itu kita dapat mengatakan bahwa mean populasi mungkin akan
sekitar 1,36 juga.
Dengan kata lain, perkiraan terbaik dari jumlah anak-anak yang rata bagi semua wanita
Inggris adalah 1,36. Sekarang pertimbangkan sampel yang berarti: Apakah mereka akan
bervariasi sebanyak nilai sebenarnya dalam populasi? Pada Gambar 8.2, baris mana
yang menunjukkan distribusi semua nilai pada populasi dan yang menunjukkan
distribusi sampel berarti?
Distribusi dengan penyebaran yang jauh lebih luas adalah distribusi keseluruhan
populasi. Distribusi dengan rentang yang jauh lebih sempit adalah distribusi sampel
berarti.
Mengapa ini?
Nilai untuk keseluruhan populasi akan mencakup beberapa nilai ekstrim
BEGINNING STATISTICS
(Statistik Awal)
Yang membuat jangkauan yang lebih luas. Tapi sarana sampel berarti \ sehingga oleh
pada menghitungnya, Anda akan secara efektif menyingkirkan nilai ekstrim.
Untuk menggambarkan hal ini, jika sampel dari lima wanita memiliki 2, 0,1,1 dan 9 anak-
anak masing-masing:
• Distribusi populasi akan mencakup nilai ekstrim 9.
• Masa sampel E masih akan menjadi 2,6, yang tidak terlalu ekstrem sama sekali.
Mengambil rata-rata moderat efek nilai ekstrim.
Jadi sampel berarti kurang bervariasi daripada nilai sebenarnya pada populasi. Ini berarti
bahwa standar deviasi sampel berarti lebih kecil dari standar deviasi keseluruhan
populasi.
Sebenarnya, sebuah formula untuk menghitung standar deviasi sampel yang berarti.
Deviasi standar dari sampel berarti dikenal sebagai kesalahan standar (SE):
Dengan kata-kata, kesalahan standar sama dengan standar deviasi penduduk yang
dibagi dengan akar kuadrat dari ukuran sampel.
Kami menyebut standar deviasi sampel berarti kesalahan standar (SE) membedakannya
dari standar penyimpangan sampel atau populasi biasa.
Kesalahan standar sangat berguna. Misalnya, karena kita tahu bahwa sampel berarti
mengikuti distribusi normal, kita dapat mengatakan bahwa 68% dari semua sarana
sampel akan terbentang antara rata-rata dan satu kesalahan standar di kedua sisi,
seperti pada Gambar 8.3. Ide ini memungkinkan kita untuk memperkirakan kemungkinan
sampel tertentu berarti jauh lebih besar atau lebih kecil dari rata-rata populasi. Kita dapat
Forantsia Teorema Nomor 1: Teorema batas pusat jika sampel ukuran N dipilih dari
populasi, sarana sampel kira-kira didistribusikan secara normal
Terjemahan:
EXAMPLE: THE IQ OF STUDENTS
(Contoh: IQ siswa)
IQS pada populasi umum biasanya didistribusikan dengan rata-rata 100 dan deviasi
standar 15. Anda mengambil sampel acak dari 40 siswa dan menemukan bahwa Feir
Mean K3 adalah 107. Mengingat bahwa seseorang siap menerima tindakan FKAT K3,
apakah siswa benar-benar lebih cerah daripada populasi rata-rata?
Apa yang sebenarnya kita coba cari tahu di sini adalah kesempatan sampel dari 40 siswa
yang memiliki IQ rata-rata 107 atau lebih karena kebetulan (bukan kecerdasan yang lebih
tinggi). Hal ini dapat ditunjukkan pada diagram, seperti pada Gambar 8.4.
BEGINNING STATISTICS
(Statistik Awal)
Pertama kita harus mengetahui distribusi sampling untuk cara sampel ukuran 40.
Menurut teorema batas pusat, sarana sampel akan didistribusikan secara normal
dengan:
Skor Z 2,95 cukup tinggi. Melihat up Z = 2.95 pada tabel normal (Tabel al.l) memberikan
area 0,4984 antara rata-rata dan Z = 2.95. Jadi area di atas Z = 2.95 akan 0,5 – 0.4984 =
0.0016.
Ini memberitahu kita bahwa probabilitas mendapatkan sampel 40 orang dengan IQ rata-
rata 107 atau lebih hanya kebetulan sangat rendah (kurang dari 1%). Oleh karena itu, kita
dapat menyimpulkan bahwa kita memiliki bukti bahwa siswa benar-benar mendapat
kecerdasan yang lebih tinggi daripada populasi umum.
Perhatikan bahwa meskipun kesempatan mendapatkan sampel dari 40 siswa dengan IQ
rata-rata 107 atau lebih sangat rendah, kesempatan untuk mendapatkan individu dengan
IQ 107 atau lebih jauh lebih tinggi, karena individu bervariasi lebih dari sekedar sampel.
Z-score untuk individu dengan skor 107 akan menjadi:
Terjemahan:
Contoh: Bobot siswa.
Anda memiliki BEPER mengatakan bahwa bobot siswa laki-laki biasanya didistribusikan
dengan rata-rata 70,31 kg dan standar deviasi 2,74 kg. Anda memutuskan bahwa Kuliah
Anda mewakili siswa laki-laki dan bahwa, berat badan, siswa laki-laki akan duduk secara
acak di sekitar teater kuliah. Anda mencontoh barisan belakang dan saat Anda
menimbang sembilan pria yang duduk di sana, berat rata-rata mereka adalah 72,22 kg.
Bisakah hasil ini hove terjadi ove untuk kebetulan, atau tim rugby duduk bersama di
barisan belakang?)
Menurut badan-badan teorema benturan, bobot rata-rata sampel sembilan pria akan
didistribusikan secara normal dengan:
Apa probabilitas memiliki sampel rata-rata 72,22 kg atau lebih? Ini adalah area yang
teduh pada Gambar 8.5.
BEGINNING STATISTICS
(Statistik Awal).
Daerah antara rata-rata dan Z = 2,09 adalah 0,4817 (dari tabel normal, tabel al.l), dan
begitu luas di atas Z = 2,09 akan menjadi 0,5 – 0,4817 = 0,0183.
Kemungkinan sampel pria dari populasi biasa siswa laki-laki yang memiliki berat rata-
rata 72,22 kg atau lebih banyak adalah 0.0183 atau 1,83%; Dengan kata lain
probabilitasnya sangat kecil. Kita harus menyimpulkan bahwa mungkin ada sekelompok
orang yang tidak normal di deretan belakang, mungkin tim rugby (apakah mereka takut
atau apa?).
Terjemahan:
Contoh: pengisian botol
Sebuah peraturan Uni Eropa baru menyatakan bahwa produsen anggur harus memberi
Anda 750 ml di setiap botol jika tidak mereka mendapatkan kesedihan dari Brussels.
Sayangnya mesin pengisian botol tunduk pada variabilitas. Untuk berada di sisi yang
aman, Monsieur de Vin menetapkan mesin pembotolannya hingga memasukkan 755 ml
anggur di setiap botol. Mesin ini memiliki variasi alami yang memberikan standar deviasi
18 ml.
Yang ingin kita ketahui adalah proporsi sampel yang akan mengandung kurang dari 750
ml anggur rata-rata, karena Monsieur de Vin akan berada dalam masalah jika rata-rata
sampelnya kurang dari 750 ml. Proporsi adalah bagian yang teduh pada Gambar 8.6.
(Selalu menggambar diagram untuk membantu pertanyaan-pertanyaan ini.)
Kita bisa menggunakan teorema batas pusat, meski kita tidak tahu apakah jumlah dalam
setiap botol biasanya didistribusikan, karena n = 36. Ingatlah bahwa populasi dalam
kasus ini (dimana kita berarti contoh ini daripada 12 botol!) Apakah semua botol
Monsieur de Vin, dan sampel adalah 36 botol yang dipilih secara acak.
Dari tabel normal, area antara rata-rata dan z = -1,67 adalah 0.4525. Jadi daerah di bawah
z = -1.67 akan menjadi 0,5 – 0.4525 = 0,0475. Oleh karena itu kemungkinan botol
Monsieur de Vin gagal dalam tes tersebut adalah 0,0475 atau 4,75%.
Apa yang akan kamu lakukan Risiko itu? Beli mesin yang lebih andal? Tingkatkan jumlah
mesin yang harus diberikan? Salah satu strategi ini mungkin berhasil. Dalam statistik,
kita sering menggunakan risiko 5% sebagai titik cut-off. Dalam contoh ini, kemungkinan
sampel gagal kurang dari 5%, jadi Monsieur de Vin bisa lebih dari 95% yakin sampelnya
akan lulus. Jika dia ingin lebih percaya diri, dia harus mengatur ulang mesinnya untuk
memasukkan lebih banyak anggur di setiap botol (tapi ini akan meningkatkan biaya).
Seperti dalam hidup, ini adalah pertanyaan tentang menimbang risiko, biaya dan
manfaat strategi yang berbeda.
Guidelines for using the sampling distribution for the mean
(Pedoman untuk menggunakan distribusi sampling untuk mean)
Dari ketiga contoh tersebut, harus jelas bahwa strategi untuk menjawab pertanyaan yang
melibatkan distribusi sampling untuk mean adalah:
1.Temukan ratanya rata dan standar sampel.
2.Buatlah diagram.
3.Hitung Z-Score.
4.Lihatlah ke atas probabilitas di meja normal dan menarik kesimpulan.
Terjemahan:
Pertanyaan praktek
8.1 Pekerja santai dalam pekerjaan tertentu dibayar dengan upah rata-rata £ 4,60 per jam
dengan standar deviasi sebesar £ 0,40. Upah biasanya didistribusikan.
(a) Apa probabilitas pekerja individu yang menghasilkan £ 4,50 atau kurang per jam?
BEGINNING STATISTICS
(Statistik Awal)
Terjemahan:
(b) Apa probabilitas mendapatkan satu sampel 20 pekerja dengan upah rata-rata £ 4,50
atau kurang?
(c) Apa probabilitas mendapatkan contoh 50 pekerja dengan upah rata-rata £ 4,50 atau
kurang?
(d) Mengapa jawaban Anda ke bagian (a), (b) dan (c) berbeda?
8.2 Pekerja santai di industri lain dibayar rata-rata £ 5,10 per jam dengan standar deviasi
sebesar £ 0,50. Pekerja di perusahaan tertentu percaya bahwa mereka sedang buzep.
Sampel dari 30 pekerja santai dari perusahaan ini memiliki upah per jam rata-rata £ 4,50.
Apakah ini upah rata-rata yang rendah kemungkinan akan terjadi karena kebanyakan atau
pekerja di perusahaan ini benar-benar sulit dilakukan?
Petunjuk: Temukan ratanya rata dan standar sampel dari sampel. Gambarlah diagram
dan temukan Z-Score untuk sampel. Apa probabilitas mendapatkan sampel dengan rata-
rata £ 4,50 atau kurang kebetulan?
8.3 Usia rata-rata saat lahir di Inggris dan Wales adalah 28,5 tahun (kantor untuk statistik
nasional, 1997E). Deviasi standar sekitar 4,6 tahun. Anda percaya bahwa wanita di
daerah yang direbus memiliki kelahiran mereka pada usia yang lebih muda daripada rata-
rata. Anda mengambil sampel 100 kelahiran dari rumah sakit setempat dan menemukan
usia ibu pada saat lahir. Usia rata-rata dalam sampel adalah 28,0 tahun. Apakah wanita-
wanita ini benar-benar memiliki kelahiran pada usia yang lebih muda atau mungkin
bedanya karena variabilitas sampling?