P. 1
Sebuah Uji Hipotesis Statistik Adalah Metode Membuat Keputusan Menggunakan Data

Sebuah Uji Hipotesis Statistik Adalah Metode Membuat Keputusan Menggunakan Data

|Views: 455|Likes:
Dipublikasikan oleh Bayu Triatmaja Nak Bali

More info:

Published by: Bayu Triatmaja Nak Bali on Oct 03, 2011
Hak Cipta:Attribution Non-commercial

Availability:

Read on Scribd mobile: iPhone, iPad and Android.
download as DOCX, PDF, TXT or read online from Scribd
See more
See less

07/11/2013

pdf

text

original

Sebuah uji hipotesis statistik adalah metode membuat keputusan menggunakan data, baik dari eksperimen terkontrol atau

studi observasional (tidak terkontrol). In statistics , a result is called statistically significant if it is unlikely to have occurred by chance alone, according to a predetermined threshold probability, the significance level . Dalam statistik , hasil ini disebut statistik signifikan jika tidak mungkin untuk terjadi secara kebetulan saja, menurut yang ditentukan ambang batas probabilitas-pra, pada tingkat signifikansi . The phrase " test of significance " was coined by Ronald Fisher : "Critical tests of this kind may be called tests of significance, and when such tests are available we may discover whether a second sample is or is not significantly different from the first." [ 1 ] Ungkapan "uji signifikansi" diciptakan oleh Ronald Fisher : "tes Kritis semacam ini dapat disebut uji signifikansi, dan ketika tes tersebut tersedia kita dapat mengetahui apakah sampel kedua atau tidak secara signifikan berbeda dari yang pertama."
[1]

Hypothesis testing is sometimes called confirmatory data analysis , in contrast to exploratory data analysis . Pengujian hipotesis kadang-kadang disebut analisis data konfirmasi, berbeda dengan analisis data eksplorasi . In frequency probability , these decisions are almost always made using null-hypothesis tests (ie, tests that answer the question Assuming that the null hypothesis is true, what is the probability of observing a value for the test statistic that is at least as extreme as the value that was actually observed? ) [ 2 ] One use of hypothesis testing is deciding whether experimental results contain enough information to cast doubt on conventional wisdom. Dalam probabilitas frekuensi , keputusan ini hampir selalu dibuat dengan menggunakan null-hipotesis tes (yaitu, tes yang menjawab pertanyaan asumsi bahwa hipotesis nol benar, berapakah probabilitas mengamati nilai bagi statistik uji yang setidaknya seekstrim nilai yang benar-benar diamati)? [2] Salah satu penggunaan pengujian hipotesis adalah memutuskan apakah hasil eksperimen mengandung informasi yang cukup untuk meragukan kebijaksanaan konvensional. A result that was found to be statistically significant is also called a positive result ; conversely, a result that is not unlikely under the null hypothesis is called a negative result or a null result . Hasil yang ditemukan secara statistik signifikan juga disebut hasil positif, sebaliknya, hasil yang tidak mungkin di bawah hipotesis nol disebut hasil negatif atau hasil null. Statistical hypothesis testing is a key technique of frequentist statistical inference . pengujian hipotesis statistik adalah teknik kunci dari frequentist inferensi statistik . The Bayesian approach to hypothesis testing is to base rejection of the hypothesis on the posterior probability . [ 3 ] Other approaches to reaching a decision based on data are available via decision theory and optimal decisions . Pendekatan Bayesian untuk pengujian hipotesis adalah dengan dasar penolakan hipotesis pada probabilitas posterior . [3] Pendekatan-pendekatan lain untuk mencapai suatu keputusan berdasarkan data yang tersedia melalui teori keputusan dan keputusan yang optimal . The critical region of a hypothesis test is the set of all outcomes which, if they occur, will lead us to decide that there is a difference. Daerah kritis dari pengujian hipotesis adalah himpunan semua hasil yang, jika itu terjadi, akan membawa kita untuk memutuskan bahwa ada perbedaan. That is, cause the null hypothesis to be rejected in favor of the alternative hypothesis . Artinya, menyebabkan hipotesis nol harus ditolak berpihak pada hipotesis alternatif . The critical region is usually denoted by the letter C . Daerah kritis biasanya dinotasikan dengan huruf C.

Contoh 1 - sidang Ruang Sidang
A statistical test procedure is comparable to a trial ; a defendant is considered not guilty as long as his guilt is not proven. Sebuah prosedur uji statistik sebanding dengan persidangan , terdakwa dianggap tidak bersalah selama kesalahannya tidak terbukti. The prosecutor tries to prove the guilt of the defendant. Jaksa mencoba membuktikan kesalahan terdakwa. Only when there is enough charging evidence the defendant is convicted. Hanya ketika ada cukup bukti pengisian terdakwa dihukum. In the start of the procedure, there are two hypotheses H 0 : "the defendant is not guilty", and H 1 : "the defendant is guilty". Di awal prosedur, ada dua hipotesis H 0: "terdakwa tidak bersalah", dan H 1: "terdakwa bersalah". The first one is called null hypothesis , and is for the time being accepted. Yang pertama disebut hipotesis nol , dan untuk saat ini diterima. The second one is called alternative (hypothesis) . Yang kedua disebut alternatif (hipotesis). It is the hypothesis one tries to prove. Ini adalah hipotesis yang mencoba untuk membuktikan. The hypothesis of innocence is only rejected when an error is very unlikely, because one doesn't want to convict an innocent defendant. Hipotesis tidak bersalah hanya ditolak saat kesalahan sangat tidak mungkin, karena kita tidak ingin menghukum seorang terdakwa bersalah. Such an error is called error of the first kind (ie the conviction of an innocent person), and the occurrence of this error is controlled to be rare. Kesalahan seperti itu disebut kesalahan jenis pertama (yaitu keyakinan dari orang yang tidak bersalah), dan terjadinya kesalahan ini dikendalikan menjadi langka. As a consequence of this asymmetric behaviour, the error of the second kind (acquitting a person who committed the crime), is often rather large. Sebagai konsekuensi dari perilaku asimetris, kesalahan jenis kedua (membebaskan orang yang melakukan kejahatan), sering agak besar. Alternative Hypothesis (H 1 ) is Null Hypothesis (H 0 ) is true true Hipotesis Alternatif (H 1) Hipotesis null (H 0) benar benar He truly is not guilty Dia He truly is guilty Dia benar-benar benar-benar tidak bersalah bersalah Accept Null Hypothesis Terima Hipotesis Null Acquittal Pembebasan Reject Null Hypothesis Tolak Hipotesis Null Conviction Keyakinan Right decision Kanan keputusan Wrong decision Salah keputusan Type I Error Kesalahan tipe I Wrong decision Salah keputusan Type II Error Kesalahan tipe II Right decision Kanan keputusan

[ edit ] Example 2 - Clairvoyant card game [ edit ] Contoh 2 - permainan kartu peramal
A person (the subject) is tested for clairvoyance. Seseorang (subyek) diuji untuk kewaskitaan. He is shown the reverse of a randomly chosen play card 25 times and asked which suit it belongs to. Dia menunjukkan kebalikan dari kartu bermain yang dipilih secara acak 25 kali dan bertanya

a false positive . Demikian juga dengan 24 atau 23 hits. Thus also with 24 or 23 hits. Dengan hanya 5 atau 6 hits. As we try to find evidence of his clairvoyance. hits. Artinya. the probability (relative frequency) of guessing correctly is 1/4. The alternative is. Dalam kasus pertama hampir tidak ada subjek tes akan diakui untuk menjadi peramal. are: Hipotesis. kemudian. c. Ketika subjek tes dengan benar memprediksi semua 25 kartu. If the alternative is valid. tentu saja: orang itu (lebih kurang) peramal. With only 5 or 6 hits. For every card. kita akan menganggap dia peramal. of hits. Jumlah hits. dan menolak hipotesis nol. untuk sementara hipotesis nol adalah bahwa orang tersebut tidak peramal. satu memutuskan betapa pentingnya satu akan. The number of hits. (Waskita When the test subject correctly predicts all 25 cards. atau jawaban yang benar. The hypotheses. dalam kasus kedua. one decides how critical one will be. atau Tipe I kesalahan. we will consider him clairvoyant.yang sesuai ini berada. the only thing the test person can do is guess. one decides how often one accepts an error of the first kind . Alternatifnya adalah. probabilitas (frekuensi relatif) dari menebak dengan benar adalah 1 / 4. at which point we consider the subject to be clairvoyant? Berapa jumlah kritis. atau 17 hits? What is the critical number. But what about 12 hits. di sisi lain. is called X . With c = 25 the probability of such an error is: Dengan c = 25 kemungkinan seperti kesalahan adalah: . Kami akan memanggil kemungkinan menebak dengan benar p. That is. tidak ada alasan untuk menganggap dia begitu. c . beberapa nomor lagi akan lulus tes. some number more will pass the test. di mana titik kami anggap subjek yang akan peramal? How do we determine the critical value c ? Bagaimana kita menentukan nilai kritis c? It is obvious that with the choice c =25 (ie we only accept clairvoyance when all cards are predicted correctly) we're more critical than with c =10. We will call the probability of guessing correctly p . then. In practice. Untuk setiap kartu. for the time being the null hypothesis is that the person is not clairvoyant. the test subject will predict the suit correctly with probability greater than 1/4. of course: the person is (more or less) clairvoyant. Jika hipotesis nol ini berlaku. adalah:  null hypothesis hipotesis nol (just guessing) (Hanya menebak) and dan  alternative hypothesis Hipotesis alternatif sejati). subyek tes akan memprediksi sesuai dengan benar dengan probabilitas lebih besar dari 1 / 4. on the other hand. in the second case. In the first case almost no test subjects will be recognized to be clairvoyant. there is no cause to consider him so. or Type I error. Ketika kami mencoba untuk menemukan bukti clairvoyance-nya. disebut X.yang positif palsu . Hal ini jelas bahwa dengan pilihan c = 25 (yaitu kami hanya menerima clairvoyance ketika semua kartu diperkirakan benar) kita lebih kritis dibandingkan dengan c = 10. or 17 hits? Tapi bagaimana dengan 12 hits. If the null hypothesis is valid. (true clairvoyant). or correct answers. Dalam prakteknya. satu-satunya orang yang pengujian dapat lakukan adalah menebak. and reject the null hypothesis. Jika alternatif tersebut valid. satu memutuskan seberapa sering orang menerima kesalahan jenis pertama .

the critical value c is calculated. dan karenanya. the result would suggest a trait on the subject's part of avoiding calling the correct card. if we select an error rate of 1%.and hence. A test of this could be formulated: for a selected 1% error rate the subject would have to answer correctly at . Being less critical. Before the test is actually performed. we select: c = 12 . The probability of a false positive is the probability of randomly guessing correctly all 25 times. Setelah nol jawaban yang benar jelas keanehan juga. Hal ini sangat tidak mungkin (kurang dari 1 dalam kesempatan 1000). very small. in order to minimize the probability of a Type II error. The probability of guessing incorrectly once is equal to p'=(1-p)=3/4. kemungkinan yang diinginkan dari sebuah kesalahan Tipe I ditentukan. Untuk contoh di atas. Typically. menolak H 0 dalam mendukung H 1 akan menjadi kesalahan. But what if the subject did not guess any cards at all? Tapi bagaimana jika subjek tidak menebak kartu apapun sama sekali? Having zero correct answers is clearly an oddity too. c dihitung demikian: From all the numbers c. dismissing H 0 in favour of H 1 would be an error. In fact. c =10 yields a much greater probability of false positive. sangat kecil. Sementara subjek tidak dapat menebak kartu dengan benar. dengan c = 10. gives: Menjadi kurang kritis. a false negative . Sebelum ujian sebenarnya dilakukan. the desired probability of a Type I error is determined. untuk meminimalkan kemungkinan kesalahan Tipe II. Kemungkinan positif palsu adalah probabilitas acak menebak dengan benar semua 25 kali. with this property. we choose the smallest. nilai-nilai dalam kisaran 1% sampai 5% yang dipilih. hasilnya akan menunjukkan ciri pada bagian subjek menghindari memanggil kartu yang benar. jika kita memilih tingkat kesalahan 1%. Depending on this desired Type 1 error rate. memberikan: Thus. For the above example. Bahkan. While the subject can't guess the cards correctly. dengan properti ini. kita memilih yang terkecil. Tergantung pada tingkat kesalahan ini Tipe 1 yang diinginkan. with c =10. nilai kritis c dihitung. Dengan demikian. Biasanya. c = 10 menghasilkan lebih banyak peluang positif palsu. c is calculated thus: Sebagai contoh. For example. Kemungkinan menebak salah sekali sama dengan p '= (1-p) = 3 / 4. kita pilih: c = 12. sebuah negatif palsu . values in the range of 1% to 5% are selected. Using the same approach we can calculate that probability of randomly calling all 25 cards wrong is: Menggunakan pendekatan yang sama kita dapat menghitung bahwa kemungkinan secara acak memanggil semua 25 kartu yang salah: This is highly unlikely (less than 1 in a 1000 chance). Dari semua c angka.

dan ada kemungkinan faktor lain yang bertanggung jawab untuk menghasilkan pengukuran. Salah satu karakteristik dari tes ini adalah keputusan garing nya: untuk menolak atau tidak menolak hipotesis nol. Kita kemudian dapat menghitung berapa besar kemungkinan bahwa kami akan amati 10 hitungan per menit jika hipotesis nol benar. [ edit ] Example 4 . pertimbangkan untuk menentukan apakah sebuah koper berisi beberapa bahan radioaktif. Statistical significance is a possible finding of the test. which is determined from the tolerable risk of error. menghasilkan 10 hitungan per menit. before seeing any evidence. hanya saja kami tidak memiliki cukup bukti untuk menunjukkan ada). Sebuah tes ini dapat dirumuskan: untuk tingkat kesalahan dipilih 1% subjek harus menjawab benar setidaknya dua kali. jika hipotesis nol memprediksi 3 hitungan per menit dan deviasi standar 1 hitung per menit. menyatakan bila diamati sampel tidak mungkin terjadi secara kebetulan jika hipotesis nol benar. We can then calculate how likely it is that we would observe 10 counts per minute if the null hypothesis were true. maka kita mengatakan bahwa koper tersebut kompatibel dengan hipotesis nol (ini tidak menjamin bahwa tidak ada bahan radioaktif. Hipotesis nol adalah tidak ada bahan radioaktif dalam koper dan bahwa semua jumlah diukur adalah karena radioaktivitas lingkungan khas dari udara sekitarnya dan benda-benda berbahaya. If the null hypothesis predicts (say) on average 9 counts per minute and a standard deviation of 1 count per minute. and there are likely other factors responsible to produce the measurements. sebelum melihat bukti. The test described here is more fully the null-hypothesis statistical significance test. The null hypothesis is that no radioactive material is in the suitcase and that all measured counts are due to ambient radioactivity typical of the surrounding air and harmless objects. signifikansi statistik adalah menemukan kemungkinan tes. consider determining whether a suitcase contains some radioactive material. Jika hipotesis nol memprediksi (katakanlah) rata-rata 9 hitungan per menit dan standar deviasi dari 1 hitung per menit. The name of the test describes its formulation and its possible outcome. then we say that the suitcase is compatible with the null hypothesis (this does not guarantee that there is no radioactive material. for us to believe that card calling is based purely on guessing.koper Radioaktif As an example. just that we don't have enough evidence to suggest there is). Di sisi lain. Sebagai contoh. Nama tes menggambarkan formulasi dan hasil yang mungkin. One characteristic of the test is its crisp decision: to reject or not reject the null hypothesis.least twice. Ditempatkan di bawah counter Geiger .Lady mencicipi teh . A calculated value is compared to a threshold. declared when the observed sample is unlikely to have occurred by chance if the null hypothesis were true. maka koper yang tidak kompatibel dengan hipotesis nol. Sebuah nilai yang dihitung dibandingkan dengan ambang batas. yang ditentukan dari risiko kesalahan ditoleransi.Lady tasting tea [ sunting ] Contoh 4 .Radioactive suitcase [ edit ] Contoh 3 . then the suitcase is not compatible with the null hypothesis. Hipotesis nol mewakili apa yang kita percaya secara default. it produces 10 counts per minute. if the null hypothesis predicts 3 counts per minute and a standard deviation of 1 count per minute. Placed under a Geiger counter . On the other hand. Tes dijelaskan di sini adalah lebih lengkap nol-hipotesis uji signifikansi statistik. The null hypothesis represents what we would believe by default. [ edit ] Example 3 . bagi kita untuk percaya bahwa kartu panggil didasarkan murni pada menebak-nebak.

Artikel ini kurang dari 10 halaman panjang dan terkenal karena kesederhanaan dan kelengkapan mengenai terminologi. Fisher kemudian dibahas manfaat lebih percobaan dan tes berulang-ulang. Kita mulai dengan hipotesis penelitian yang kebenaran tidak diketahui. [ edit ] The testing process [ sunting ] Proses pengujian In the statistical literature. If and only if the 8 trials produced 8 successes was Fisher willing to reject the null hypothesis – effectively acknowledging the Lady's ability with > 98% confidence (but without quantifying her ability). [ 5 ] Lady membuktikan bahwa dia salah. 3. Uji statistik adalah hitungan sederhana jumlah sukses dalam 8 persidangan.The following example is summarized from Fisher. calculations and design of the experiment. the null hypothesis allows to attach an attribute: it should be chosen in such a way that it allows us to conclude whether the . Hal ini penting sebagai salah menyatakan hipotesis akan berlumpur sisa proses . Contoh berikut ini diringkas dari Fisher. Specifically. Hipotesis nol adalah bahwa Lady tidak memiliki kemampuan seperti itu. The test statistic was a simple count of the number of successes in 8 trials. [4] Fisher menjelaskan secara menyeluruh metodenya dalam percobaan yang diusulkan untuk menguji Lady's mengklaim kemampuan untuk menentukan cara persiapan teh dengan rasa. 5. Distribusi terkait dengan hipotesis null adalah distribusi binomial akrab dari percobaan membalik koin. The null hypothesis was that the Lady had no such ability. The Lady proved him wrong. [ 6 ] The usual line of reasoning is as follows: Dalam literatur statistik. Langkah pertama adalah negara null relevan dan hipotesis alternatif. Fisher later discussed the benefits of more trials and repeated tests. Wilayah kritis adalah kasus tunggal 8 keberhasilan dalam 8 percobaan berdasarkan kriteria probabilitas konvensional (<5%). Fisher asserted that no alternative hypothesis was (ever) required. pengujian hipotesis statistik memainkan peranan penting. The first step is to state the relevant null and alternative hypotheses . statistical hypothesis testing plays a fundamental role. [5] 1. Contohnya adalah longgar didasarkan pada peristiwa dalam kehidupan Fisher. and is known as the Lady tasting tea example. 4. Jika dan hanya jika 8 uji coba menghasilkan 8 kesuksesan adalah Fisher bersedia untuk menolak hipotesis nol . The distribution associated with the null hypothesis was the binomial distribution familiar from coin flipping experiments. [6] Garis biasa penalaran adalah sebagai berikut: 1. This is important as mis-stating the hypotheses will muddy the rest of the process . 2. We start with a research hypothesis of which the truth is unknown.efektif mengakui kemampuan Lady dengan> 98% confidence (tapi tanpa mengukur kemampuan dirinya). [ 4 ] Fisher thoroughly explained his method in a proposed experiment to test a Lady's claimed ability to determine the means of tea preparation by taste. The article is less than 10 pages in length and is notable for its simplicity and completeness regarding terminology. perhitungan dan desain eksperimen. The example is loosely based on an event in Fisher's life. The critical region was the single case of 8 successes in 8 trials based on a conventional probability criterion (< 5%). 2. Fisher menegaskan bahwa tidak ada hipotesis alternatif (pernah) diperlukan. dan dikenal sebagai Lady mencicipi teh misalnya.

gagasan "menerima" hipotesis nol mungkin membahayakan. the idea of "accepting" the null hypothesis may be dangerous. The distribution of the test statistic partitions the possible values of T into those for which the null-hypothesis is rejected. Turunkan distribusi dari statistik uji di bawah hipotesis nol dari asumsi. and to accept or "fail to reject" the hypothesis otherwise. Decide which test is appropriate. Distribusi dari statistik partisi menguji nilai yang mungkin T menjadi mereka dimanahipotesis null ditolak. Memutuskan mana tes yang sesuai. [7] The second step is to consider the statistical assumptions being made about the sample in doing the test. asumsi tentang kemerdekaan statistik atau tentang bentuk distribusi dari pengamatan. Aturan keputusan untuk menolak hipotesis nol H 0 jika nilai t obs diamati adalah di daerah kritis. Hal ini sama pentingnya sebagai asumsi yang tidak valid akan berarti bahwa hasil tes tidak valid. a logical fallacy known as the argument from ignorance . This is equally important as invalid assumptions will mean that the results of the test are invalid. [ 7] Secara khusus. Penting untuk dicatat perbedaan filosofis antara menerima hipotesis nol dan hanya gagal untuk menolaknya. Misalnya uji statistik dapat mengikuti distribusi t Siswa atau distribusi normal . Nonetheless the . The "fail to reject" terminology highlights the fact that the null hypothesis is assumed to be true from the start of the test. 8. hipotesis nol memungkinkan untuk melampirkan atribut: itu harus dipilih sedemikian rupa sehingga memungkinkan kita untuk menyimpulkan apakah hipotesis alternatif bisa diterima atau tetap ragu seperti sebelum ujian. 4. The phrase "accept the null hypothesis" may suggest it has been proved simply because it has not been disproved. Decide to either fail to reject the null hypothesis or reject it in favor of the alternative. The decision rule is to reject the null hypothesis H 0 if the observed value t obs is in the critical region. dan mereka yang tidak. and stating the relevant test statistic T . Dalam kasus standar ini akan menjadi hasil yang terkenal. Kecuali tes dengan sangat tinggi daya yang digunakan.3. 5. Ungkapan "menerima hipotesis nol" mungkin menyarankan telah terbukti hanya karena belum dibuktikan. yang penting daerah disebut demikian. jika ada kekurangan bukti menentangnya. the so called critical region. dan menyatakan yang bersangkutan uji statistik T. The "gagal untuk menolak" terminologi menyoroti fakta bahwa hipotesis nol dianggap benar dari awal pengujian. it simply continues to be assumed true. It is important to note the philosophical difference between accepting the null hypothesis and simply failing to reject it. ia hanya terus menjadi dianggap benar. In standard cases this will be a well-known result. assumptions about the statistical independence or about the form of the distributions of the observations. logis kesalahan dikenal sebagai argumen dari kebodohan . Memutuskan apakah akan gagal menolak hipotesis nol atau menolaknya mendukung alternatif. Derive the distribution of the test statistic under the null hypothesis from the assumptions. Langkah kedua adalah untuk mempertimbangkan asumsi statistik yang dibuat tentang sampel dalam melakukan tes. Unless a test with particularly high power is used. if there is a lack of evidence against it. misalnya. Hitung dari pengamatan t obs nilai yang diamati dari statistik T uji. Compute from the observations the observed value t obs of the test statistic T . and those for which it is not. for example. 6. dan untuk menerima atau "gagal untuk menolak" hipotesis sebaliknya. alternative hypothesis can either be accepted or stays undecided as it was before the test. 7. For example the test statistics may follow a Student's t distribution or a normal distribution .

Untuk hipotesis sederhana.β) The test's probability of correctly rejecting the null hypothesis. β . Set nilai-nilai yang kita gagal untuk menolak hipotesis nol. Most powerful test Uji paling kuat . Statistical test Uji statistik A decision function that takes its values in the set of hypotheses. This fact expresses that our procedure is based on probabilistic considerations in the sense we accept that using another set could lead us to a different conclusion. Sebuah fungsi keputusan yang mengambil nilai-nilai di set hipotesis. The complement of the false negative rate. The false positive rate. this is the test's probability of incorrectly rejecting the null hypothesis. Region of rejection / Critical region Daerah penolakan / wilayah Kritis The set of values of the test statistic for which the null hypothesis is rejected. we can accept the alternative hypothesis (H-alt)and we conclude that the research hypothesis is supported by the data. ini adalah tes yang probabilitas dari salah menolak hipotesis nol. Setiap hipotesis yang tidak menentukan distribusi penduduk sepenuhnya. Region of acceptance Daerah penerimaan The set of values for which we fail to reject the null hypothesis. jika prosedur pengujian memaksa kita untuk menolak hipotesis nol (H-null). Size / Significance level of a test ( α ) Ukuran / Signifikansi tingkat tes (α) For simple hypotheses. Set nilai dari uji statistik yang hipotesis nol ditolak. Atau. Fakta ini mengungkapkan bahwa prosedur kita didasarkan pada pertimbangan probabilistik dalam arti kita menerima bahwa menggunakan satuan lain bisa membawa kita pada kesimpulan yang berbeda. Meskipun demikian terminologi adalah lazim di seluruh statistik. where its meaning is well understood. The false positive rate. Composite hypothesis Komposit hipotesis Any hypothesis which does not specify the population distribution completely. Setiap hipotesis yang menentukan distribusi penduduk sepenuhnya. if the testing procedure forces us to reject the null hypothesis (H-null). dimana artinya dipahami dengan baik. Komplemen dari false negative rate. For composite hypotheses this is the upper bound of the probability of rejecting the null hypothesis over all cases covered by the null hypothesis. Power of a test (1 − β ) Kekuatan tes (1 . [ edit ] Definition of terms [ sunting ] Definisi istilah The following definitions are mainly based on the exposition in the book by Lehmann and Romano: [ 8 ] Definisi berikut ini terutama didasarkan pada eksposisi dalam buku oleh Lehmann dan Romano: [8] Simple hypothesis Hipotesis sederhana Any hypothesis which specifies the population distribution completely. Alternatively. kita dapat menerima hipotesis alternatif (H-alt) dan kami menyimpulkan bahwa hipotesis penelitian didukung oleh data. Uji's probabilitas dengan benar menolak hipotesis nol.terminology is prevalent throughout statistics. β. Untuk hipotesis komposit ini adalah batas atas probabilitas menolak hipotesis nol atas semua perkara yang tercakup dalam hipotesis nol.

tes dikatakan tidak memihak ketika probabilitas menolak hipotesis nol tidak kurang dari tingkat signifikansi ketika alternatif adalah benar dan kurang dari atau sama dengan tingkat signifikansi ketika hipotesis nol adalah benar. when constructed for a given nominal significance level. the true probability of incorrectly rejecting the null hypothesis is never greater than the nominal level. Untuk tingkat ukuran atau signifikansi diberikan. kekuatan tetap terhadap setiap alternatif pendekatan 1 di batas. uji adalah konservatif jika. Sebuah tes dengan kekuatan terbesar untuk semua nilai dari parameter yang diuji. untuk ukuran tetap tes. Conservative test Konservatif uji A test is conservative if. Uniformly most powerful test (UMP) Seragam yang paling kuat uji (UMP) A test with the greatest power for all values of the parameter being tested. The most stringent test Tes yang paling ketat here to read It is better to refer to [ 10 ] sini untuk membaca Lebih baik untuk mengacu [10] [ edit ] Interpretation [ sunting ] Interpretasi The direct interpretation is that if the p-value is less than the required significance level. Interpretasi langsung adalah bahwa jika nilai p kurang dari tingkat signifikansi yang dibutuhkan. Sebuah tes yang UMP di set semua tes yang tidak bias. Consistent test Uji Konsisten When considering the properties of a test as the sample size grows. [ 9 ] Ketika mempertimbangkan sifat dari tes sebagai ukuran sampel tumbuh. Probabilitas. Kritik pada interpretasi ini dapat ditemukan di bagian yang sesuai . tes dikatakan konsisten jika. Uniformly most powerful unbiased (UMPU) Seragam yang paling kuat tidak memihak (UMPU) A test which is UMP in the set of all unbiased tests. dengan asumsi hipotesis nol adalah benar. maka kita mengatakan bahwa hipotesis nol ditolak pada tingkat signifikansi tertentu. Untuk hipotesis alternatif yang spesifik. then we say the null hypothesis is rejected at the given level of significance. Criticism on this interpretation can be found in the corresponding section . p-value p-value The probability. a test is said to be unbiased when the probability of rejecting the null hypothesis is not less than the significance level when the alternative is true and is less than or equal to the significance level when the null hypothesis is true. a test is said to be consistent if.For a given size or significance level . ketika dibangun untuk signifikansi tingkat nominal yang diberikan. assuming the null hypothesis is true. uji dengan kekuatan terbesar. mengamati hasil setidaknya ekstrim sebagai uji statistik. [9] Unbiased test Netral uji For a specific alternative hypothesis. [ edit ] Common test statistics [ sunting ] statistik uji umum . the test with the greatest power. for a fixed size of test. kemungkinan benar salah menolak hipotesis nol tidak pernah lebih besar dari tingkat nominal. the power against any fixed alternative approaches 1 in the limit. of observing a result at least as extreme as the test statistic.

equal variances* Dua-sampel dikumpulkan t-test . Normal population and independent observations and σ 1 and σ 2 are known populasi normal dan pengamatan independen dan σ 1 dan σ 2 dikenal (Normal populations or n 1 + n 2 > 40) and independent observations and σ 1 = σ 2 and σ 1 and σ 2 unknown (Normal populasi atau n 1 + n 2> 40). varian yang sama * Two-sample unpooled t-test. unequal variances* Dua-sampel unpooled t-test. Many other tests can be found in other articles . Banyak tes lainnya dapat ditemukan di artikel lainnya . Dalam tabel di bawah ini. dan pengamatan yang independen dan σ 1 = σ 2 dan σ 1 dan σ 2 tidak diketahui (Normal populations or n 1 + n 2 > 40) and independent observations and σ 1 ≠ σ 2 and σ 1 and σ 2 unknown (Normal populasi atau n 1 + n 2> 40). dan pengamatan yang independen dan σ 1 ≠ σ 2 dan σ 1 dan One-sample z-test Satu-sample z-test Two-sample z-test Dua-sample z-test Two-sample pooled t-test . (Z adalah jarak dari ratarata sehubungan dengan standar deviasi dari mean). varian yang tidak [ 11 ] [11] . (Normal populasi atau n> 30) dan σ diketahui. the symbols used are defined at the bottom of the table. ( z is the distance from the mean in relation to the standard deviation of the mean). Untuk distribusi non-normal adalah mungkin untuk menghitung proporsi minimum dari suatu populasi yang termasuk dalam k standar deviasi untuk setiap k (lihat: 's ketidaksamaan Chebyshev ).In the table below. Name Nama Formula Rumus Assumptions or notes Asumsi atau catatan (Normal population or n > 30) and σ known. simbol yang digunakan didefinisikan di bagian bawah meja. For non-normal distributions it is possible to calculate a minimum proportion of a population that falls within k standard deviations for any k (see: Chebyshev's inequality ).

n 1 p 1> 5 dan n 1 (1 . p 0> 10 dan n (1 . see notes . n). see notes .p 1)> 5 dan n 2 p 2> 5 dan n 2 (1 . Secara umum. n 1 .p 1)> 5 dan n 2 p 2> 5 dan n 2 (1 . .p 2)> 5 dan independen pengamatan. n 1 − variances * Dua1.. lihat catatan . lihat catatan .sama * σ 2 tidak diketahui [ 11 ] [11] One-proportion ztest Satu-proporsi z-test Two-proportion ztest. n 2 . One of the following Salah satu berikut • All expected counts are at least 5 • Semua jumlah yang diharapkan paling tidak 5 • All expected counts are > 1 and no more than 20% of expected counts are less than 5 • Semua jumlah yang diharapkan adalah> 1 dan tidak lebih dari 20% dari jumlah diperkirakan kurang dari 5 One-sample chisquare test Satusampel uji chikuadrat *Two-sample F Arrange so Atur sehingga > > test for equality of and reject H 0 for F > F (α / 2.1. see notes . lihat catatan .. pooled untuk d 0 = 0 Two-proportion ztest.p 0> 10 dan itu adalah SRS (Simple Random Sample).p 2)> 5 dan independen pengamatan. n 2 − 1) [ 12 ] dan menolak H 0 sampel F uji untuk untuk> F F (α / 2. subskrip 0 . pooled for d 0 = 0 Dua-proporsi z-test.1) [12] kesamaan varians In general. n 1 p 1 > 5 and n 1 (1 − p 1 ) > 5 and n 2 p 2 > 5 and n 2 (1 − p 2 ) > 5 and independent observations. n 1 p 1> 5 dan n 1 (1 . unpooled for | d 0 | > 0 Duaproporsi z-test. n 1 p 1 > 5 and n 1 (1 − p 1 ) > 5 and n 2 p 2 > 5 and n 2 (1 − p 2 ) > 5 and independent observations. p 0 > 10 and n (1 − p 0 ) > 10 and it is a SRS (Simple Random Sample). the subscript 0 indicates a value taken from the null hypothesis . which should be used as much as possible in constructing its test statistic. H 0 . unpooled untuk | d 0 |> 0 n .

Jerzy Neyman .menunjukkan nilai yang diambil dari hipotesis nol . . maka probabilitas dari sampel X / n = sampel 2 Tipe I kesalahan (menolak  s = sample proporsi . Definitions of other symbols: Definisi simbol lain:  α . H 0. Jerzy Neyman . Fisher was an agricultural statistician who emphasized rigorous experimental design and methods to extract a result from few samples . unless hypothesis when it is in fact standar deviasi specified otherwise = true) α.. kecuali hipotesis nol bila ternyata variance s 2 = ditentukan lain benar) varians sampel  p 0 = hypothesized  n = sample size n = ukuran  s 1 = sample 1 population proportion sampel standard deviation p 0 = proporsi  n 1 = sample 1 size n 1 = 1 s 1 = sampel populasi hipotesis ukuran sampel standar deviasi 1  p 1 = proportion 1 p 1  n 2 = sample 2 size n 2 =  s 2 = sample 2 = proporsi 1 sampel 2 ukuran standard deviation  p 2 = proportion 2 p 2  = sample mean = mean s 2 = 2 standar = proporsi 2 sampel deviasi sampel  d p = hypothesized  μ 0 = hypothesized population  t = t statistic t = difference in mean μ 0 = hipotesis mean statistik t proportion d = p populasi  d f = degrees of hipotesis perbedaan  μ 1 = population 1 mean μ 1 = freedom d f = dalam proporsi mean populasi 1 derajat kebebasan  min{ n 1 . yang harus digunakan semaksimal mungkin dalam membangun statistik uji-nya.. Karl Pearson and (son) Egon Pearson . n 2 } =  μ 2 = population 2 mean μ 2 = minimum of n 1 and n  = sample mean mean populasi 2 of differences = 2 min {n 1. Karl Pearson dan (anak) Egon Pearson . the probability of Type I  s = sample standard  = x/n = sample error (rejecting a null deviation s = proportion . n 2} =  σ = population standard Mean sampel minimum n 1 dan n 2 deviation σ = deviasi standar perbedaan  x1=n1p1x1=n1p populasi  d 0 = hypothesized 1 2 2  σ = population variance σ population mean  x2=n2p2x2=n2p = varians populasi difference d 0 = 2 2 populasi hipotesis  χ = Chi-squared perbedaan mean statistic χ 2 = statistik  s d = standard Chi-squared deviation of  F = F statistic F = F differences d statistik standar deviasi = perbedaan [ edit ] Origins [ sunting ] Asal-usul Hypothesis testing is largely the product of Ronald Fisher . Pengujian hipotesis sebagian besar merupakan produk dari Ronald Fisher .

Lehmann (1992) in a review of the fundamental paper by Neyman and Pearson (1933) says: "Nevertheless. menggunakan tingkat α 5%. Neyman (yang bekerja sama dengan Pearson muda) menekankan kekakuan matematika dan metode untuk mendapatkan hasil yang lebih dari banyak sampel dan berbagai distribusi yang lebih luas. Modern hypothesis testing is an (extended) hybrid of the Fisher vs Neyman/Pearson formulation. dan banyak perkembangan yang dilakukan dalam kerangka yang terus memainkan peran sentral baik dalam teori dan praktek statistik dan dapat diharapkan untuk melakukannya di masa mendatang ". dalam studi perbandingan dua puluh." yang kemudian dikutip oleh orang lain sebagai "mereka menemukan bahwa ada perbedaan. meskipun kekurangan mereka. the new paradigm formulated in the 1933 paper. [ edit ] Potential misuse [ sunting ] Potensi penyalahgunaan One of the more common problems in significance testing is the tendency for multiple comparisons to yield spurious significant differences even where the null hypothesis is true. Fisher adalah seorang ahli statistik pertanian yang menekankan rancangan percobaan ketat dan metode untuk mengekstrak hasil dari beberapa sampel dengan asumsi distribusi Gaussian. using an α-level of 5%." Namun perangkap lain yang umum sering terjadi ketika seorang peneliti menulis pernyataan yang memenuhi syarat "kami tidak menemukan perbedaan yang signifikan. Yet another common pitfall often happens when a researcher writes the qualified statement "we found no statistically significant difference. and the many developments carried out within its framework continue to play a central role in both the theory and practice of statistics and can be expected to do so in the foreseeable future". Neyman (who teamed with the younger Pearson) emphasized mathematical rigor and methods to obtain more results from many samples and a wider range of distributions. pengujian hipotesis statistik memainkan peranan penting dalam seluruh statistik dan statistik inferensi . metode dan terminologi dikembangkan di awal abad 20. methods and terminology developed in the early 20th century." which is then misquoted by others as "they found that there was no difference. statistics cannot be used to prove that there is exactly zero difference . satu perbandingan kemungkinan akan menghasilkan hasil yang signifikan meskipun hipotesis nol yang benar. [ edit ] Importance [ sunting ] Pentingnya Statistical hypothesis testing plays an important role in the whole of statistics and in statistical inference . despite their shortcomings. For example. Misalnya. Lehmann (1992) dalam review kertas mendasar oleh Neyman dan Pearson (1933) mengatakan: "Namun demikian. one comparison will likely yield a significant result despite the null hypothesis being true. In these cases p-values are adjusted in order to control either the familywise error rate or the false discovery rate . Dalam kasus ini p-nilai yang disesuaikan untuk mengontrol baik tingkat kesalahan familywise atau tingkat penemuan palsu . paradigma baru dirumuskan dalam kertas 1933.assuming Gaussian distributions. Salah satu masalah umum yang lebih dalam pengujian signifikansi adalah kecenderungan untuk beberapa perbandingan untuk menghasilkan perbedaan yang signifikan palsu bahkan di mana hipotesis nol adalah benar. pengujian hipotesis modern adalah hibrida (diperpanjang) dari Fisher vs Neyman / Pearson formulasi. For instance. Sebagai contoh." Actually. in a study of twenty comparisons.

Please see the discussion on the talk page ." [ 14 ] and "Statistical Significance Tests are Unnecessary Even When Properly Done. and meta-analyses . Please help add inline citations to guard against copyright violations and factual inaccuracies. statistical significance tests are of no value. ( Discuss ) ( Diskusikan ) A concern has been raised that this article's Criticism section may be compromising the article's neutral point of view of the subject . [ 16 ] Armstrong suggests authors should avoid tests of statistical significance." [13] According to J. ulangan / ekstensi . Possible resolutions may be to integrate the material in the section into the article as a whole. Scott Armstrong . Artikel ini tidak ada kutipan atau kebutuhan catatan kaki . Ia telah mengemukakan bahwa artikel atau bagian ini akan digabung ke Penyalahgunaan statistik . This principle is sometimes described by the maxim "Absence of evidence is not evidence of absence. Sebenarnya. (Januari 2008) . (August 2009) Silakan lihat diskusi di halaman pembicaraan ." [15] Armstrong membuat kasus bahwa bahkan ketika dilakukan dengan benar. Sebuah keprihatinan telah dibangkitkan itu Kritik bagian artikel ini mungkin mengkompromikan artikel sudut pandang netral subjek. they should report on effect sizes . [16] Armstrong menyarankan penulis harus menghindari uji signifikansi statistik. or to rewrite the contents of the section. Scott Armstrong . instead. Failing to find evidence that there is a difference does not constitute evidence that there is no difference. Gagal untuk menemukan bukti bahwa ada perbedaan bukan merupakan bukti bahwa tidak ada perbedaan. uji signifikansi statistik tak bernilai.between two populations. (Agustus 2009) This article is missing citations or needs footnotes ." [14] dan "Tes Signifikansi statistik yang tidak penting Bahkan Ketika Benar Selesai. replications / extensions . Di koran "Tes Kemajuan Signifikan Harm di Peramalan. Tests of statistical significance are harmful to the development of scientific knowledge because they distract researchers from the use of proper methods." [ 15 ] Armstrong makes the case that even when done properly. melainkan mereka harus melaporkan efek ukuran . upaya untuk mendidik peneliti tentang bagaimana untuk menghindari perangkap menggunakan signifikansi statistik memiliki sedikit keberhasilan. A number of attempts failed to find empirical evidence supporting the use of significance tests. statistik tidak dapat digunakan untuk membuktikan bahwa ada persis nol perbedaan antara dua populasi. Sejumlah usaha yang gagal untuk menemukan bukti empiris mendukung penggunaan tes signifikansi. atau untuk menulis ulang isi bagian tersebut. Pengujian signifikansi statistik berbahaya bagi pengembangan ilmu pengetahuan. In the papers "Significance Tests Harm Progress in Forecasting. Menurut J. Kemungkinan resolusi mungkin untuk mengintegrasikan materi di bagian ke dalam artikel secara keseluruhan. confidence intervals . karena mereka mengalihkan perhatian para peneliti dari penggunaan metode yang tepat. interval keyakinan . [ edit ] Criticism [ sunting ] Kritik It has been suggested that this article or section be merged into Misuse of statistics . attempts to educate researchers on how to avoid pitfalls of using statistical significance have had little success. dan meta-analisis ." [ 13 ] Prinsip ini kadang-kadang digambarkan oleh pepatah "Tidak adanya bukti bukan merupakan bukti ketiadaan. (January 2008) Harap membantu menambah inline citations untuk mencegah pelanggaran hak cipta dan ketidakakuratan faktual.

dan signifikansi statistik mengatakan apa-apa tentang makna praktis dari perbedaan. Jumlah dan sifat perbedaan. as it can cause false hypotheses to be accepted and true hypotheses to be rejected. [ 19 ] Many researchers also feel that hypothesis testing is something of a misnomer. Beberapa ahli statistik telah berkomentar bahwa murni "pengujian penting" memiliki apa sebenarnya tujuan agak aneh untuk mendeteksi adanya perbedaan "nyata" antara dua populasi. Kesalahpahaman yang umum adalah bahwa hasil statistik yang signifikan selalu signifikansi praktis. Use of the statistical significance test has been called seriously flawed and unscientific by authors Deirdre McCloskey and Stephen Ziliak . [21] [22] Lihat Bayes faktor untuk rincian. karena dapat menyebabkan hipotesis palsu untuk diterima dan hipotesis benar untuk ditolak. in other words.[ edit ] Significance and practical importance [ sunting ] Signifikansi dan kepentingan praktis A common misconception is that a statistically significant result is always of practical significance. The typically more relevant goal of science is a determination of causal effect size . Unfortunately. [20] An additional problem is that frequentist analyses of p-values are considered by some to overstate "statistical significance". is what should be studied. and propose that the scientific community should abandon usage of the test altogether. Masalah tambahan adalah bahwa frequentist analisis p-nilai yang dianggap oleh beberapa untuk melebih-lebihkan "signifikansi statistik". [ 17 ] Given a sufficiently large sample. [ 17 ] [ 18 ] Mereka menunjukkan bahwa "tak berarti" bukan berarti tidak penting. Sayangnya. They point out that "insignificance" does not mean unimportant. [ 21 ] [ 22 ] See Bayes factor for details. [17] [18] Some statisticians have commented that pure "significance testing" has what is actually a rather strange goal of detecting the existence of a "real" difference between two populations. [ edit ] Meta-criticism [ sunting ] Meta-kritik . [ 20 ] Dalam praktek uji statistik tunggal dalam sebuah studi tunggal tidak pernah "membuktikan" apa-apa. In practice a single statistical test in a single study never "proves" anything. masalah ini yang biasa ditemui dalam penulisan ilmiah. dan mengusulkan bahwa masyarakat ilmiah harus meninggalkan penggunaan tes sama sekali. atau menunjukkan efek yang besar dalam populasi. In practice a difference can almost always be found given a large enough sample. Dalam prakteknya perbedaan hampir selalu bisa ditemukan diberi sampel yang cukup besar. The amount and nature of the difference. and statistical significance says nothing about the practical significance of a difference. [17] Mengingat sampel yang cukup besar. this problem is commonly encountered in scientific writing. adalah apa yang harus dipelajari. [19] Banyak peneliti juga merasa bahwa pengujian hipotesis adalah sesuatu yang keliru. Yang relevan tujuan lebih biasanya ilmu merupakan suatu penentuan kausal efek ukuran . sangat kecil dan perbedaan non-terkenal dapat ditemukan secara statistik signifikan. extremely small and non-notable differences can be found to be statistically significant. Penggunaan uji signifikansi statistik telah disebut cacat serius dan tidak ilmiah oleh penulis Deirdre McCloskey dan Stephen Ziliak . or demonstrates a large effect in the population. dengan kata lain.

was to plan the experiment and to easily assess the information content of the small sample. I find it difficult to imagine a less insightful means of transiting from data to conclusions. Serangan paling gigih berasal dari bidang Psikologi. [ citation needed ] of the formulation in its original context.. "Despite the stranglehold that hypothesis testing has on experimental psychology. complaints focus on flawed interpretations of the results and overdependence/emphasis on one test. the terminology and confusion about the interpretation of results. Numerous attacks on the formulation have failed to supplant it as a criterion for publication in scholarly journals. The most persistent attacks originated from the field of Psychology. Dalam konteks lain.The criticism here is of the application. [ rujukan? ] [ edit ] Pedagogic criticism [ sunting ] kritik pedagogik Pedagogic criticism of the null-hypothesis testing includes the counter-intuitive formulation. [ citation needed ] Penerapan dari-pengujian hipotesis null untuk publikasi observasional (sebagai kontras dengan eksperimental) studi diragukan. kritik pedagogik pengujian hipotesis null-termasuk perumusan kontra-intuitif." [ 24 ] . [ rujukan? ] dengan Asosiasi Psikolog Amerika tidak secara eksplisit mencela penggunaan hipotesis signifikansi pengujiannull. tetapi mengadopsi pedoman publikasi disempurnakan yang secara implisit mengurangi kepentingan relatif dari pengujian tersebut. terminologi dan kebingungan tentang interpretasi hasil. [23] The original purposes of Fisher's formulation. [ citation needed ] the American Psychological Association did not explicitly deprecate the use of nullhypothesis significance testing. The International Committee of Medical Journal Editors recognizes an obligation to publish negative (not statistically significant) studies under some circumstances. [ rujukan? ] dari formulasi dalam konteks aslinya. sebagai alat untuk eksperimen. rujukan? ] The applicability of the null-hypothesis testing to the publication of observational (as contrasted to experimental) studies is doubtful. bukan metode. kritik di sini adalah aplikasi. In other contexts. Ada sedikit kritik. After review. [ 23 ] Serangan dan pertahanan dari hipotesis signifikansi uji-null dikumpulkan Harlow et al. Tujuan asli dari formulasi Fisher. Bayesian di alam. but adopted enhanced publication guidelines which implicitly reduced the relative importance of such testing. atau penafsiran. . rather than of the method. [ citation needed ] Para Komite Internasional Medical Journal Editor mengakui kewajiban untuk menerbitkan negatif (tidak signifikan secara statistik) studi di bawah beberapa keadaan [. Bayesian in nature. keluhan fokus pada interpretasi cacat hasil dan over-dependence/emphasis pada satu tes. as a tool for the experimenter. There is little criticism. adalah untuk merencanakan percobaan dan dengan mudah menilai isi informasi dari sampel kecil. Sejumlah serangan di formulasi telah gagal untuk menggantikan sebagai kriteria untuk diterbitkan dalam jurnal ilmiah. Setelah diperiksa. Attacks and defenses of the nullhypothesis significance test are collected in Harlow et al. or of the interpretation.

There is widespread and fundamental disagreement on the interpretation of test results. he violently opposed its inclusion by Neyman and Pearson. Satu adalah probabilitas. Pengujian langsung bertanya apakah sampel dapat menerangi hipotesis penelitian. is almost always false in the real world. Siswa berharap pengujian hipotesis menjadi alat statistik untuk penerangan dari hipotesis penelitian dengan sampel. "makna" sering memiliki dua makna yang berbeda dalam kalimat yang sama. their terminologies have been blended. A single counterexample results in the rejection of a conjecture. The blend is not seamless or standardized.. ia keras menentang dimasukkannya dengan Neyman dan .." [24] Students find it difficult to understand the formulation of statistical null-hypothesis testing. Campuran tidak mulus atau standar. Makna (arti) dari (statistik) signifikansi adalah signifikan (penting). bahkan menyebutkan Neyman dan Pearson terminologi (Tipe error II dan hipotesis alternatif). Sementara artikel ini mengajarkan suatu formulasi Fisher murni.. Dalam retorika. taken literally (and that's the only way you can take it in formal hypothesis testing). examples often support an argument. bukan satu empiris". tetapi bukti matematis "adalah sebuah argumen logis. yang lainnya adalah-materi pengukuran subjek (seperti mata uang). Students expect hypothesis testing to be a statistical tool for illumination of the research hypothesis by the sample. tidak. even it mentions Neyman and Pearson terminology (Type II error and the alternative hypothesis). Pearson " [25] Dalam membahas hasil tes. it must be the case that a large . Null-hypothesis testing shares the mathematical and scientific perspective rather than the more familiar rhetorical one. Pengantar khas statistik teks kurang konsisten. The significance (meaning) of (statistical) significance is significant (important). While Fisher disagreed with Neyman and Pearson about the theory of testing. saya sulit membayangkan mendalam berarti kurang dari transit dari data ke kesimpulan. Pengujian hipotesis null-saham perspektif matematika dan ilmiah daripada satu retoris lebih akrab. One is a probability. it is not. tidak ada hipotesis alternatif dalam skema Fisher: Sesungguhnya.. contoh sering mendukung argumen. If it is false. "significance" often has two distinct meanings in the same sentence.." [ 25 ] In discussing test results. The typical introductory statistics text is less consistent. the other is a subject-matter measurement (such as currency). While this article teaches a pure Fisher formulation. Karl Popper defined science by its vulnerability to disproof by data.. Single -balik hasil dalam penolakan terhadap sebuah dugaan. [2] ". [ 2 ] ". yang sebut-pengujian hipotesis null. terminologi mereka telah dicampur. Sedangkan Fisher tidak setuju dengan Neyman dan Pearson tentang teori pengujian.there is no alternate hypothesis in Fisher's scheme: Indeed. Siswa juga menemukan membingungkan terminologi. even to a tiny degree. The Sage Dictionary of Statistics would not agree with the title of this article. not an empirical one". Ada pendapat luas dan mendasar pada interpretasi hasil tes. Students also find the terminology confusing. Karl Popper didefinisikan ilmu pengetahuan dengan kerentanan terhadap pembantahan oleh data.. but a mathematical proof "is a logical argument."Meskipun cengkraman yang pengujian hipotesis telah di psikologi eksperimental. In rhetoric. Kamus Sage Statistik tidak akan setuju dengan judul artikel ini. "A little thought reveals a fact widely understood among statisticians: The null hypothesis. Siswa kesulitan untuk memahami formulasi pengujian hipotesis null-statistik. The test asks indirectly whether the sample can illuminate the research hypothesis. which it would call null-hypothesis testing.

"Statistical significance does not necessarily imply practical significance!" [ 26 ] "Signifikansi statistik tidak selalu berarti signifikansi praktis!" [26] [ edit ] Practical criticism [ sunting ] kritik Praktis Practical criticism of hypothesis testing includes the sobering observation that published test results are often contradicted. kritik praktis pengujian hipotesis meliputi pengamatan serius bahwa hasil tes dipublikasikan sering bertentangan." [ 2 ] Null-pengujian hipotesis hanya menjawab pertanyaan "seberapa baik temuan sesuai dengan kemungkinan bahwa faktor kebetulan semata mungkin bertanggung jawab. itu harus terjadi bahwa sampel yang cukup besar akan menghasilkan hasil yang signifikan dan menyebabkan penolakan. what's the big deal about rejecting it?" [ 25 ] (The above criticism only applies to point hypothesis tests.) "How has the virtually barren technique of hypothesis testing come to assume such importance in the process by which we arrive at our conclusions from our data?" [ 24 ] "Bagaimana memiliki hampir tandus teknik pengujian hipotesis datang untuk menganggap penting tersebut dalam proses dimana kita sampai pada kesimpulan kami dari data kami?" [24] Null-hypothesis testing just answers the question of "how well the findings fit the possibility that chance factors alone might be responsible. Ini menentukan apakah keyakinan dalam klaim yang hanya didasarkan pada perkiraan sampel berbasis melebihi ambang batas. Nullpengujian hipotesis signifikansi tidak menentukan kebenaran atau kepalsuan klaim.. Jadi jika hipotesis nol selalu salah. misalnya.enough sample will produce a significant result and lead to its rejection. It determines whether confidence in a claim based solely on a sample-based estimate exceeds a threshold. bahkan untuk tingkat kecil. Hal ini seragam sepakat bahwa signifikansi statistik tidak hanya pertimbangan dalam menilai pentingnya hasil penelitian. hampir selalu salah di dunia nyata . secara harfiah (dan bahwa satu-satunya cara yang dapat Anda ambil dalam pengujian hipotesis formal). whether a parameter is greater than zero. It is uniformly agreed that statistical significance is not the only consideration in assessing the importance of research results. banyak digunakan sebagai salah satu persyaratan untuk publikasi penelitian eksperimental dengan hasil statistik. So if the null hypothesis is always false. for example. Jika false .. widely used as one requirement for publication of experimental research with statistical results. If one were testing. Rejecting the null hypothesis is not a sufficient condition for publication. It is a research quality assurance test.) "Sebuah pikiran kecil mengungkapkan fakta secara luas dipahami oleh kalangan ahli statistik: Hipotesis null. [ 27 ] [ 28 ] Model Matematis mendukung dugaan bahwa penelitian medis mempublikasikan hasil tes kebanyakan . Mathematical models support the conjecture that most published medical research test results are flawed." [2] Null-hypothesis significance testing does not determine the truth or falsity of claims. apa masalahnya besar tentang menolaknya "? [25] ( Kritik di atas hanya berlaku untuk titik uji hipotesis Kalau orang pengujian. Menolak hipotesis nol bukan merupakan kondisi yang cukup untuk publikasi. itu tidak akan berlaku. it would not apply. Ini adalah jaminan kualitas penelitian pengujian... apakah parameter lebih besar dari nol. [ citation needed ] Null-hypothesis testing has not achieved the goal of a low error probability in medical journals.

since it violates the Likelihood principle and is thus incoherent and leads to sub-optimal decision-making. Pengujian hipotesis kontroversial ketika hipotesis alternatif diduga menjadi kenyataan pada awal percobaan. karena melanggar prinsip likelihood dan dengan demikian kacau dan mengarah ke suboptimal pengambilan keputusan.05. in other words. rujukan? ] Null-pengujian hipotesis belum mencapai tujuan dari sebuah probabilitas kesalahan rendah dalam jurnal medis. [ rujukan? ] The -Lindley paradoks Jeffreys menggambarkan hal ini. kita dapat menolak null saat itu hampir pasti benar. say 0. dengan kata lain. P (Null | Data) mendekati 1 sementara P (Data sebagai atau lebih ekstrim dari teramati | Null) pendekatan 0. Along with many frequentist statisticians. [27] [28] [ edit ] Straw man [ sunting ] manusia Jerami Hypothesis testing is controversial when the alternative hypothesis is suspected to be true at the outset of the experiment.cacat [. Gerd Gigerenzer telah disebut hipotesis nol uji "statistik mindless" [29] sedangkan Yakub Cohen menggambarkannya sebagai ritual dilakukan untuk meyakinkan diri sendiri bahwa kita memiliki bukti yang diperlukan untuk mengkonfirmasi teori-teori kita. Under traditional null hypothesis testing. we can reject the null when it's virtually certain to be true. the null is rejected when the conditional probability P(Data as or more extreme than observed | Null) is very small. Namun. [ 30 ] Untuk alasan ini dan lainnya. Bayesian statistik menolak hipotesis nol pengujian klasik.05. katakanlah 0. it is put forward as a straw man only to allow the data to contradict it. along . membuat hipotesis nol kebalikan dari apa eksperimen benar-benar percaya. Gerd Gigerenzer has called null hypothesis testing "mindless statistics" [ 29 ] while Jacob Cohen described it as a ritual conducted to convince ourselves that we have the evidence needed to confirm our theories. In some cases [ which? ] . Dalam pengujian hipotesis null tradisional. Many statisticians [ who? ] have pointed out that rejecting the null hypothesis says nothing or very little about the likelihood that the null is true. some [ who? ] say researchers are really interested in the probability P(Null | Data as actually observed) which cannot be inferred from a p-value : some [ who? ] like to present these as inverses of each other but the events "Data as or more extreme than observed" and "Data as actually observed" are very different. null ditolak ketika probabilitas bersyarat P (Data sebagai atau lebih ekstrim dari teramati | Null) yang sangat kecil. P(Null | Data) approaches 1 while P(Data as or more extreme than observed | Null) approaches 0. For this and other reasons. making the null hypothesis the reverse of what the experimenter actually believes. Banyak statistik [ siapa? ] telah menunjukkan bahwa menolak hipotesis nol mengatakan apa-apa atau sangat sedikit tentang kemungkinan bahwa nol itu benar. However. itu adalah diajukan sebagai manusia jerami hanya untuk memungkinkan data yang bertentangan dengannya. [ citation needed ] The Jeffreys–Lindley paradox illustrates this. Dalam beberapa kasus [ yang? ]. [30] [ edit ] Bayesian criticism [ sunting ] kritik Bayesian Bayesian statisticians reject classical null hypothesis testing. Bayesians prefer to provide an estimate. beberapa [ siapa? ] mengatakan para peneliti benarbenar tertarik dengan probabilitas P (Null | Data dengan benar-benar diamati) yang tidak dapat disimpulkan dari nilai-p : beberapa [ siapa? ] ingin menyajikan ini sebagai invers satu sama lain tetapi peristiwa "Data sebagai atau lebih ekstrim dari mengamati" dan "Data dengan benar-benar diamati" sangat berbeda.

ERROR DAN ." (pp. Bayesians lebih memilih untuk memberikan perkiraan. Highly Proved. but the Null hypothesis is extremely likely to be true. whereas that is denied by frequentist statisticians. [ citation needed ] though these are not accepted by all Bayesians [ citation needed ] (notably. it has been clearly argued that whenever the p-value differs from a posterior probability it is the posterior that is problematic--regardless of how it is interpreted. Andrew Gelman ). In this framework. [ citation needed ] [ clarification needed ] sehingga P (Null | Data) dapat mendekati 1 sementara P (Data | Null) mendekati 0 hanya jika P (Null) / P (Data) pendekatan tak terhingga. sedangkan P (Data) pendekatan 0: maka P (Data | Null) yang rendah karena data ini sangat tidak mungkin. bukti sampel dapat digunakan untuk menghasilkan diperbarui distribusi posterior . juga mendekati 1. Given a prior probability distribution for one or more parameters. Menurut 'teorema Bayes . sedangkan yang ditolak oleh ahli statistik frequentist. "Evidence as Passing Severe Tests: highly Probably vs. yaitu (misalnya) ketika apriori probabilitas hipotesis nol. Selain itu.). Some Bayesians (James Berger in particular) have developed Bayesian hypothesis testing methods. chapter 9-12). Achinstein (ed. Moreover. For example. since there is SO much that is flagrantly wrong and biased (against significance tests) I will just give some references: D. Artikel ini membuat klaim palsu banyak dan gagal bahkan mengutip referensi dalam literatur (lebih dari 30 tahun atau lebih) yang mengambil masalah radikal dengan mereka. Mengingat distribusi probabilitas sebelumnya untuk satu atau lebih parameter. (walaupun interval kepercayaan Bayesian berbeda dari yang klasik).terlepas dari bagaimana ditafsirkan. tapi tidak dalam rangka pengujian hipotesis null. bermakna untuk membuat laporan bentuk umum "probabilitas bahwa nilai sebenarnya dari parameter lebih besar dari 0 adalah p". Seiring dengan banyak frequentist statistik. P(Null). tetapi hipotesis Null sangat mungkin untuk menjadi kenyataan [. Beberapa Bayesians (James Berger khususnya) telah mengembangkan metode pengujian hipotesis Bayesian. ia menganggap bahwa apa yang orang inginkan adalah sebuah probabilitas posterior null. is also approaching 1. Sebagai contoh. Mayo ERROR AND THE GROWTH OF EXPERIMENTAL KNOWLEDGE (Chicago 1996. SCIENTIFIC EVIDENCE. while P(Data) approaches 0: then P(Data | Null) is low because the data are extremely unlikely. thus P(Null | Data) may approach 1 while P(Data | Null) approaches 0 only when P(Null)/P(Data) approaches infinity. sample evidence can be used to generate an updated posterior distribution . telah jelas menyatakan bahwa jika p-nilai berbeda dari probabilitas posterior itu adalah posterior yang bermasalah --. but not in the null hypothesis testing framework. Dalam kerangka ini. it assumes that what people really want is a posterior probability in the null. it is meaningful to make statements of the general form "the probability that the true value of the parameter is greater than 0 is p ". bersama dengan interval keyakinan .with a confidence interval . (although Bayesian confidence intervals are different from classical ones). rujukan? ] [ klarifikasi diperlukan ] This article makes numerous false claims and fails to even cite references in the literature (over 30 years or more) that take radical issue with them. 195-127) in P. Andrew Gelman ). P ( Null). Mayo (2005). ie (for instance) when the a priori probability of the null hypothesis. [ rujukan? ] meskipun ini tidak diterima oleh semua [Bayesians kutipan diperlukan ] (terutama. karena ada SO banyak yang terang-terangan salah dan bias (melawan tes signifikansi) Saya hanya akan memberikan beberapa referensi: Mayo D. According to Bayes' theorem .

" [ 31 ] "Jurnal lain dan tinjauan telah menunjukkan bias terhadap artikel yang tidak menolak hipotesis nol. mereka cenderung akhirnya tidak diterbitkan. but it means they couldn't prove it.05). reducing the file drawer problem .. The Journal of Articles in Support of the Null Hypothesis (JASNH) was founded to address a scientific publishing bias against such articles. We plan to change that by offering an outlet for experiments that do not reach the traditional significance levels (p < 0. 195-127) di P. . and reducing the bias in psychological literature. Menurut editor. Even though these papers can often be interesting. in "file drawers. bab 9-12)." Ioannidis [ 28 ] has inventoried factors that should alert readers to the risks of publication bias. Tanpa adanya sumber daya peneliti bisa mereka buangbuang waktu empiris memeriksa pertanyaan yang telah diperiksa. Mayo (2005). Cox and Mayo (2010) in Mayo and Spanos (2010). "(hal. BUKTI ILMIAH." Walaupun makalah ini sering bisa menarik.PERTUMBUHAN EKSPERIMENTAL PENGETAHUAN (Chicago 1996.. This does not mean that the relationship they were looking for did not exist.05). sekelompok psikolog meluncurkan jurnal baru yang didedikasikan untuk studi eksperimental dalam psikologi yang mendukung hipotesis nol. Cox dan Mayo (2010) di Mayo dan Spanos (2010). Pada tahun 2002. tetapi itu berarti mereka tidak bisa membuktikannya. "File masalah Laci" adalah masalah yang ada karena fakta bahwa akademisi cenderung untuk tidak mempublikasikan hasil yang menunjukkan hipotesis nol tidak dapat ditolak.). Achinstein (ed. ERROR dan kesimpulan (CUP) [ edit ] Publication bias [ sunting ] bias Publikasi Main article: Publication bias Artikel utama: Publikasi bias In 2002. ERROR AND INFERENCE (CUP) (John Hopkins). Ini tidak berarti bahwa hubungan mereka cari tidak ada. Without such a resource researchers could be wasting their time examining empirical questions that have already been examined. We collect these articles and provide them to the scientific community free of cost. "other journals and reviewers have exhibited a bias against articles that did not reject the null hypothesis. (john Hopkins). The Journal of Artikel dalam Mendukung Hipotesis Null (JASNH) didirikan untuk mengatasi bias publikasi ilmiah terhadap barang tersebut. Dengan demikian mengurangi laci file masalah . dan mengurangi bias dalam literatur psikologis. Thus. Kami mengumpulkan artikel-artikel dan menyediakan mereka untuk ilmiah komunitas bebas biaya " [31] The "File Drawer problem" is a problem that exists due to the fact that academics tend not to publish results that indicate the null hypothesis could not be rejected. they tend to end up unpublished. Kami berencana untuk perubahan yang dengan menawarkan sebuah jalan keluar untuk eksperimen yang tidak mencapai tingkat signifikansi tradisional (p <0. According to the editors. dalam "laci file. "Bukti sebagai Melewati berat Pengujian: Mungkin sangat vs Sangat Terbukti. Ioannidis [28] memiliki faktor diinventarisasi yang harus waspada pembaca dengan resiko bias publikasi. a group of psychologists launched a new journal dedicated to experimental studies in psychology which support the null hypothesis.

which altered the claimed significance by a factor of 2. yang mengubah makna diklaim oleh faktor 2. Fisher ignored the 8-failure case (equally improbable as the 8-success case) in the example test involving tea. Fisher mengabaikan-kegagalan kasus 8 (sama mustahil sebagai 8-keberhasilan kasus) dalam teh contoh tes yang melibatkan. [ 32 ] They conclude that. Jones dan Tukey menyarankan perbaikan moderat dalam perumusan hipotesis null-asli untuk merumuskan penanganan-tes satu ekor. in the "Lady Tasting Tea" example. [32] Mereka menyimpulkan bahwa. dalam Lady Teh Rasa "contoh".[ edit ] Improvements [ sunting ] Perbaikan Jones and Tukey suggested a modest improvement in the original null-hypothesis formulation to formalize handling of one-tail tests. .

You're Reading a Free Preview

Mengunduh
scribd
/*********** DO NOT ALTER ANYTHING BELOW THIS LINE ! ************/ var s_code=s.t();if(s_code)document.write(s_code)//-->