Anda di halaman 1dari 7

Teknik kuasa analisis statistik, anggaran saiz sampel, dan teknik-teknik canggih untuk anggaran selang keyakinan dibincangkan

di sini. Matlamat utama pertama dua teknik adalah untuk membolehkan anda untuk membuat keputusan, manakala dalam proses merekabentuk eksperimen, (a) berapa besarkah sampel yang diperlukan untuk membolehkan pertimbangan statistik yang tepat dan boleh dipercayai dan (b) bagaimana mungkin statistik anda ujian akan mengesan kesan saiz yang diberikan dalam keadaan tertentu. Teknik ketiga ialah berguna dalam melaksanakan objektif a dan b dan dalam menilai saiz kesan eksperimen dalam amalan.

Melaksanakan analisis kuasa dan sampel anggaran saiz adalah satu aspek penting dalam reka bentuk eksperimen, kerana tanpa pengiraan ini, saiz sampel mungkin terlalu tinggi atau terlalu rendah. Jika saiz sampel adalah terlalu rendah, eksperimen akan kekurangan ketepatan untuk memberikan jawapan yang boleh dipercayai kepada soalan-soalan yang ia sedang menyiasat. Jika saiz sampel adalah terlalu besar, masa dan sumber akan siasia, sering untuk gain.In minimum beberapa program perisian analisis kuasa, beberapa alat grafik dan analitikal adalah disediakan untuk membolehkan penilaian tepat faktor-faktor yang mempengaruhi kuasa dan saiz sampel dalam banyak yang paling biasa dihadapi analisis statistik. Maklumat ini boleh menjadi penting untuk reka bentuk kajian yang kos efektif dan saintifik berguna. Noncentrality prosedur anggaran selang dan lain-lain prosedur canggih selang keyakinan menyediakan beberapa kaedah selang keyakinan yang canggih untuk menganalisis kepentingan hasil eksperimen yang diperhatikan. Peningkatan bilangan perangkawan berpengaruh mencadangkan bahawa anggaran selang keyakinan perlu menambah atau menggantikan pendekatan pengujian hipotesis tradisional dalam analisis data uji kaji. n kebanyakan situasi di analisis statistik, kami tidak mempunyai akses kepada penduduk keseluruhan statistik kepentingan, sama ada kerana penduduk adalah terlalu besar, tidak bersedia untuk diukur, atau proses pengukuran adalah terlalu mahal atau memakan masa untuk membenarkan lebih daripada segmen kecil penduduk yang perlu dipatuhi. Hasilnya, kita sering membuat keputusan penting tentang penduduk statistik berdasarkan jumlah yang agak kecil sampel data.Typically, kita mengambil sampel dan mengira kuantiti dipanggil statistik untuk menganggarkan beberapa ciri-ciri populasi dipanggil parameter Sebagai contoh, andaikan seorang ahli politik berminat dalam perkadaran orang yang kini memihak kepada kedudukan beliau mengenai isu tertentu. Kawasan beliau adalah sebuah bandar besar dengan penduduk kira-kira 1,500,000 pengundi berpotensi. Dalam kes ini, parameter kepentingan, yang kita mungkin panggilan, adalah bahagian

orang di seluruh penduduk yang memihak kepada kedudukan politik. Ahli-ahli politik akan tinjauan pendapat suruhanjaya, di mana sampel (diharapkan) rawak orang akan ditanya sama ada atau tidak mereka memihak kepada kedudukan beliau. Nombor (memanggilnya N) orang yang akan ditemubual akan menjadi agak kecil, relatif kepada saiz penduduk. Apabila orang-orang ini telah ditinjau, bahagian mereka memihak kedudukan politik akan dikira. Ini perkadaran, yang merupakan statistik, boleh dipanggil p. Satu perkara yang hampir pasti sebelum kajian yang pernah dilakukan: p tidak akan sama dengan! Kerana p melibatkan "nasib menarik," ia akan menyimpang dari. Jumlah di mana p adalah salah, iaitu, jumlah yang mana ia menyimpang dari, dipanggil pensampelan error.In apa-apa sampel satu, ia adalah hampir pasti akan ada beberapa kesilapan pensampelan (kecuali dalam beberapa keadaan yang sangat luar biasa), dan bahawa kita tidak akan tertentu tepat bagaimana besar kesilapan ini. Jika kita tahu jumlah ralat pensampelan, ini akan membayangkan bahawa kita juga tahu nilai sebenar parameter, di mana kita tidak perlu untuk melakukan tinjauan pendapat di place.In umum pertama, saiz sampel yang lebih besar N, ralat pensampelan yang lebih kecil cenderung untuk menjadi. (Anda tidak boleh pasti apa yang akan berlaku dalam eksperimen tertentu, sudah tentu.) Jika kita ingin membuat keputusan yang tepat mengenai parameter seperti, kita perlu mempunyai N cukup besar supaya ralat pensampelan akan cenderung untuk menjadi "semunasabahnya kecil. " Jika N adalah terlalu kecil, tidak banyak adalah titik dalam mengumpul data, kerana keputusan akan cenderung untuk menjadi terlalu tidak tepat untuk penggunaan banyak. Sebaliknya, terdapat juga titik pulangan berkurangan luar yang meningkat N memberi manfaat sedikit. Setelah N adalah "cukup besar" untuk menghasilkan tahap ketepatan yang munasabah, membuat ia lebih besar hanya sisa masa dan money.So beberapa keputusan penting dalam perancangan apa-apa ujikaji, "Bagaimana tepat anggaran parameter saya akan cenderung untuk menjadi jika saya memilih sampel tertentu saiz? " dan "Bagaimana besar sampel yang saya perlukan untuk mencapai tahap ketepatan yang wajar?" Tujuan Analisis Kuasa dan Contoh Anggaran Saiz adalah untuk menyediakan anda dengan kaedah statistik untuk menjawab soalan-soalan dengan cepat, mudah, dan tepat. Satu program perisian statistik yang baik akan menyediakan dialog yang mudah untuk melaksanakan pengiraan kuasa dan anggaran saiz sampel untuk banyak prosedur klasik statistik serta khas rutin pengedaran noncentral untuk membenarkan pengguna maju untuk melaksanakan pelbagai pengiraan tambahan.

Perhatikan bahawa terdapat dua jenis kesilapan yang diwakili dalam jadual. Banyak statistik buku teks hadir pandangan yang biasa dalam sains sosial, iaitu, bahawa, Jenis I kadar kesilapan, mesti disimpan pada atau di bawah 0,05, dan yang, jika pada semua kemungkinan, kadar ralat Jenis II, mesti disimpan rendah serta. "Kuasa Statistik," yang adalah sama dengan 1 - mesti disimpan sepadan tinggi. Sebaik-baiknya, kuasa hendaklah sekurangkurangnya 0,80 untuk mengesan berlepas munasabah dari konvensyen hipotesis nol adalah, sememangnya, lebih tegar berkenaan dengan daripada berkenaan dengan. Sebagai contoh, dalam sains sosial jarang, jika pernah, dibenarkan sesat di atas 0,05 tanda ajaib.

Kepentingan Ujian (RS / AS). Dalam konteks ujian kepentingan, kita boleh menentukan dua jenis asas situasi, menolak sokongan (RS) (dibincangkan di atas) dan menerima menyokong (AS). Dalam ujian RS, hipotesis nol adalah bertentangan dengan apa yang penyelidik sebenarnya percaya, dan menolak ia menyokong teori penyelidik. Dalam satu eksperimen dua RS kumpulan yang melibatkan perbandingan cara-cara kumpulan eksperimen dan kawalan, penguji kaji percaya rawatan mempunyai kesan, dan bertujuan untuk mengesahkannya melalui ujian kepentingan yang menolak hypothesis.In batal keadaan RS, Jenis I kesilapan mewakili, dalam erti kata, "positif palsu" untuk teori penyelidik. Dari sudut pandangan masyarakat, seperti positif palsu adalah amat tidak diingini. Mereka menyebabkan banyak usaha sia-sia, terutama apabila positif palsu adalah menarik dari segi teori atau politik (atau kedua-duanya), dan hasilnya merangsang sejumlah besar penyelidikan. Seperti mengikuti penyelidikan akan biasanya tidak meniru kerja (tidak betul) asal, dan banyak kekeliruan dan kekecewaan akan result.In ujian RS, ralat Jenis II adalah satu tragedi dari sudut pandangan penyelidik, kerana teori yang benar adalah, oleh kesilapan , tidak disahkan. Jadi, sebagai contoh, jika satu dadah yang direka untuk memperbaiki keadaan perubatan yang didapati (dengan tidak betul) tidak untuk menghasilkan satu peningkatan berbanding dengan kumpulan kawalan, satu terapi berbaloi akan hilang, sekurang-kurangnya buat sementara waktu, dan idea berbaloi satu kaji itu akan akan didiskaunkan.

Akibatnya, di RS ujian, masyarakat, orang editor dan pengulas jurnal, berkeras untuk menjaga rendah. Penyelidik statistik berpengetahuan menjadikan ia satu keutamaan untuk menjaga rendah serta. Akhirnya, sudah tentu, semua orang mendapat faedah jika kedua-dua kebarangkalian ralat disimpan rendah, tetapi malangnya terdapat sering, dalam amalan, trade-off antara dua jenis keadaan RS error.The adalah dengan jauh lebih biasa, dan konvensyen yang berkaitan ia telah datang untuk menguasai pemandangan

popular pada ujian statistik. Hasilnya, pandangan semasa terhadap kadar kesilapan yang santai di luar tahap tertentu tidak dapat difikirkan, dan bahawa ia adalah terpulang kepada penyelidik untuk membuat kuasa statistik pasti adalah mencukupi. Anda mungkin berpendapat bagaimana pandangan-pandangan ini sesuai dalam konteks ujian RS, tetapi mereka tidak sama sekali unreasonable.In SEBAGAI ujian, pandangan biasa pada kadar kesilapan yang kita diterangkan di atas adalah jelas tidak sesuai. Dalam SEBAGAI ujian, H0 adalah apa yang penyelidik sebenarnya percaya, jadi menerima ia menyokong teori penyelidik. Dalam kes ini, ralat Jenis I adalah negatif palsu untuk teori penyelidik, dan ralat jenis II merupakan positif palsu. Oleh itu, bertindak dalam cara yang boleh ditafsirkan sebagai sangat mulia dalam keadaan RS, sebagai contoh, mengekalkan Jenis sangat rendah saya ralat kadar seperti 0,001, adalah sebenarnya "menyusun dek" memihak teori penyelidik SEBAGAI ujian.

Dalam kedua-dua AS dan RS situasi, ia adalah mudah untuk mencari contohcontoh di mana ujian kepentingan kelihatan tegang dan tidak realistik. Pertimbangkan pertama keadaan RS. Dalam sesetengah situasi sedemikian, ia adalah semata-mata tidak mungkin untuk mempunyai sampel yang sangat besar. Satu contoh yang datang ke fikiran adalah sosial atau klinikal penyelidikan bidang psikologi. Penyelidik dalam bidang ini kadang-kadang menghabiskan beberapa hari menemuramah subjek tunggal. Penyelidikan Setahun hanya boleh menghasilkan data yang sah daripada 50 mata pelajaran. Ujian korelasi, khususnya, mempunyai kuasa yang sangat rendah apabila sampel yang kecil. Dalam kes sedemikian, ia mungkin tidak masuk akal untuk berehat di luar .05, jika ia bermakna bahawa kuasa yang munasabah boleh achieved.On Sebaliknya, ia adalah mungkin, dalam erti kata yang penting, untuk mempunyai kuasa yang terlalu tinggi. Sebagai contoh, anda mungkin menguji hipotesis bahawa dua min populasi adalah sama (iaitu, Mu1 = Mu2) dengan saiz sampel juta dalam setiap kumpulan. Dalam kes ini, walaupun dengan perbezaan remeh antara kumpulan, hipotesis nol hampir sentiasa akan menjadi keadaan rejected.The menjadi lebih luar biasa di AS ujian. Di sini, jika N adalah terlalu tinggi, penyelidik hampir pasti memutuskan terhadap teori, walaupun ia ternyata, dalam erti kata yang penting, untuk menjadi penghampiran cemerlang data. Nampaknya paradoks bahawa sesungguhnya dalam konteks ini tepat eksperimen seolah-olah berfungsi terhadap penyelidik.

Untuk meringkaskan: Dalam penyelidikan Tolak-Sokongan: Pengkaji mahu menolak H0. Society mahu mengawal ralat Jenis I. Penyelidik mestilah sangat bimbang tentang ralat Jenis II. Saiz sampel Tinggi berfungsi untuk penyelidik.

Jika terdapat "terlalu banyak kuasa," kesan remeh menjadi "sangat penting." Dalam penyelidikan Terima-Sokongan: Pengkaji mahu menerima H0. "Masyarakat" perlu bimbang tentang mengawal ralat Jenis II, walaupun ia kadang-kadang mendapat keliru dan mengekalkan konvensyen berkenaan untuk ujian RS. Penyelidik mestilah sangat berhati-hati untuk mengawal ralat Jenis I. Saiz sampel Tinggi berfungsi terhadap penyelidik. Jika terdapat "terlalu banyak kuasa," teori penyelidik boleh "ditolak" oleh ujian kepentingan walaupun ia sesuai dengan data yang hampir sempurna.

Mengira PowerProperly direka eksperimen mesti memastikan kuasa yang akan menjadi agak tinggi untuk mengesan penyimpangan yang munasabah dari hipotesis nol. Jika tidak, satu eksperimen adalah tidak bernilai lakukan. Buku teks Elementary mengandungi perbincangan terperinci faktor-faktor yang mempengaruhi kuasa dalam ujian statistik. Ini termasuk Apakah jenis ujian statistik yang sedang dilakukan. Beberapa ujian statistik sememangnya lebih kuat daripada yang lain. Saiz sampel. Secara umumnya, lebih besar saiz sampel, semakin besar kuasa. Walau bagaimanapun, sampel umumnya meningkatkan saiz melibatkan kos yang ketara, kedua-duanya dalam masa, wang, dan usaha. Oleh itu, ia adalah penting untuk membuat saiz sampel yang "cukup besar," tetapi tidak wastefully besar. Saiz kesan eksperimen. Jika hipotesis nol adalah salah oleh jumlah yang besar, kuasa akan menjadi lebih tinggi daripada jika ia adalah salah dengan jumlah yang kecil. Tahap kesilapan dalam ukuran eksperimen. Ralat pengukuran bertindak seperti "bunyi" yang boleh mengebumikan "isyarat" kesan sebenar eksperimen. Oleh itu, apa-apa yang meningkatkan ketepatan dan ketekalan pengukuran boleh meningkatkan kuasa statistik.

Mengira Diperlukan Contoh SizeTo memastikan ujian statistik akan mempunyai kuasa yang mencukupi, anda biasanya perlu melakukan analisis khas sebelum menjalankan eksperimen, untuk mengira berapa besar N adalah required.Let 's mengkaji secara ringkas jenis teori statistik yang terletak pada asas pengiraan digunakan untuk menganggar kuasa dan saiz sampel. Return to contoh asal ahli politik, menimbang bagaimana besar tinjauan pendapat harus diambil untuk memenuhi teori purposes.Statistical beliau, sudah tentu, tidak boleh memberitahu kita apa yang akan berlaku dengan mana-mana tinjauan pendapat tertentu. Walau bagaimanapun, melalui konsep taburan pensampelan, ia boleh memberitahu kita apa yang akan cenderung untuk berlaku dalam jangka masa panjang, lebih banyak undian pendapat saiz tertentu.

Satu taburan pensampelan adalah taburan statistik ke atas sampel diulangi. Pertimbangkan p sampel perkadaran disebabkan daripada tinjauan pendapat saiz N, dalam situasi di mana perkadaran penduduk adalah tepat 0,50. Persampelan teori pengedaran memberitahu kita bahawa p akan mempunyai taburan yang boleh dikira dari teorem binomial. Ini pengedaran, N agak besar, dan bagi nilai p tidak terlalu dekat dengan 0 atau 1, kelihatan sangat seperti taburan normal dengan min dan sisihan piawai (dipanggil "ralat piawai bahagian") ofsp = ( p (1-p) / N) ** 1/2Suppose, sebagai contoh, ahli politik mengambil tinjauan pendapat berdasarkan N sebanyak 100. Kemudian pengagihan p, lebih sampel berulang, akan kelihatan seperti ini jika = .5.

Nilai-nilai yang berpusat di sekitar .5, tetapi peratusan kecil daripada nilai adalah lebih besar daripada 0,6 atau kurang daripada 0,4. Ini pengedaran nilai mencerminkan hakikat bahawa tinjauan pendapat yang berdasarkan sampel 100 merupakan petunjuk yang tidak sempurna daripada perkadaran populasi. Jika p adalah "sempurna" anggaran, ralat piawai bahagian, akan menjadi sifar dan taburan pensampelan akan kenaikan terletak pada 0.5. Penyebaran taburan pensampelan menunjukkan berapa banyak "bunyi" dicampur dengan "isyarat" yang dijana oleh parameter.Notice daripada persamaan untuk ralat standard perkadaran bahawa, sebagai kenaikan N, ralat piawai nisbah menjadi lebih kecil . Jika N menjadi cukup besar, kita boleh menjadi sangat tertentu bahawa p anggaran kami akan menjadi sangat tepat one.Suppose ahli politik menggunakan kriteria keputusan seperti berikut. Jika nilai cerapan p adalah lebih besar daripada 0,58, dia akan memutuskan bahawa hipotesis nol bahawa adalah kurang daripada atau sama dengan 0,50 adalah palsu.

ou boleh, dengan menambah sehingga semua kebarangkalian (dihitung dari taburan binomial), menentukan bahawa kebarangkalian menolak hipotesis nol apabila p 0,50 = 0,044. Oleh itu, peraturan ini keputusan mengawal I Jenis Ralat kadar,, pada atau di bawah 0,044. Ternyata, ini adalah kriteria keputusan terendah yang mengekalkan pada atau di bawah 0,05. Walau bagaimanapun, ahli politik juga bimbang tentang kuasa dalam situasi ini, kerana ia adalah dengan menolak hipotesis nol bahawa dia mampu untuk menyokong tanggapan bahawa dia mempunyai pendapat awam terhadapnya side.Suppose bahawa 55% rakyat menyokong ahli politik, iaitu, bahawa = 0,55 dan hipotesis nol sebenarnya adalah palsu. Dalam kes ini, keputusan yang betul adalah untuk menolak hipotesis nol. Apakah kebarangkalian bahawa dia akan mendapatkan perkadaran sampel yang lebih besar daripada "cut-off" nilai 0,58 diperlukan untuk menolak hipotesis nol? Dalam rajah di bawah, kami telah ditindihkan taburan pensampelan bagi p apabila = 0,55.

Jelas sekali, hanya peratusan kecil masa ahli politik akan mencapai keputusan yang betul bahawa dia mempunyai sokongan majoriti. Kebarangkalian mendapatkan ap lebih daripada 0,58 adalah hanya 0,241.

Tidak perlu dikatakan, tidak ada gunanya dalam menjalankan eksperimen di mana, jika kedudukan anda adalah betul, ia hanya akan mengesahkan 24.1% masa! Dalam kes ini, perangkaan akan mengatakan bahawa ujian kepentingan mempunyai "kuasa yang mencukupi untuk mengesan berlepas 5 mata peratusan daripada nilai hipotesis nol." The crux masalah terletak dalam lebar kedua-dua agihan dalam angka sebelumnya. Jika saiz sampel adalah lebih besar, ralat piawai bahagian akan menjadi lebih kecil, dan akan terdapat sedikit bertindih antara pengagihan. Maka ia akan menjadi mustahil untuk mencari kriteria keputusan yang menyediakan soalan power.The rendah dan tinggi, "Bagaimana N besar adalah perlu untuk menghasilkan kuasa yang agak tinggi" dalam situasi ini, di samping mengekalkan pada nilai yang agak rendah.

Anda mungkin juga menyukai