Anda di halaman 1dari 5

The Use of P-Values for Decision Making in Testing Hypotheses

Penggunaan P-Values untuk Pengambilan Keputusan dalam Menguji Hipotesis

In testing hypotheses in which the test statistic is discrete, the critical region may be chosen
arbitrarily and its size determined. If α is too large, it can be reduced by making an adjustment in the
critical value. It may be necessary to increase the sample size to offset the decrease that occurs
automatically in the power of the test.

Dalam pengujian hipotesis di mana statistik uji diskrit, daerah kritis dapat dipilih secara sewenang-
wenang dan ukurannya ditentukan. Jika terlalu besar, dapat dikurangi dengan melakukan
penyesuaian nilai kritis. Mungkin perlu untuk meningkatkan ukuran sampel untuk mengimbangi
penurunan yang terjadi secara otomatis dalam kekuatan pengujian.

Over a number of generations of statistical analysis, it had become customary to choose an


α of 0.05 or 0.01 and select the critical region accordingly. Then, of course, strict rejection or
nonrejection of H0 would depend on that critical region. For example, if the test is two tailed and α
is set at the 0.05 level of significance and the test statistic involves, say, the standard normal
distribution, then a z-value is observed from the data and the critical region is

Selama beberapa generasi analisis statistik, sudah menjadi kebiasaan untuk memilih dari 0,05 atau
0,01 dan memilih daerah kritis yang sesuai. Kemudian, tentu saja, penolakan atau penolakan tegas
terhadap H0 akan tergantung pada daerah kritis itu. Sebagai contoh, jika pengujian adalah dua sisi
dan ditetapkan pada tingkat signifikansi 0,05 dan statistik uji melibatkan, katakanlah, distribusi
normal standar, maka nilai-z diamati dari data dan daerah kritisnya adalah

z > 1.96 or z < −1.96,

where the value 1.96 is found as z0.025 in Table A.3. A value of z in the critical region
prompts the statement “The value of the test statistic is significant,” which we can then translate
into the user’s language. For example, if the hypothesis is given by

dimana nilai 1,96 ditemukan sebagai z0,025 pada Tabel A.3. Nilai z di wilayah kritis memunculkan
pernyataan “Nilai statistik uji signifikan”, yang kemudian dapat kami terjemahkan ke dalam bahasa
pengguna. Misalnya, jika hipotesis diberikan oleh

H0: μ = 10,

H1: μ = 10,

one might say, “The mean differs significantly from the value 10.”

orang mungkin berkata, "Rata-rata berbeda secara signifikan dari nilai 10."

Preselection of a Significance Level

Praseleksi Tingkat Signifikansi

This preselection of a significance level α has its roots in the philosophy that the maximum
risk of making a type I error should be controlled. However, this approach does not account for
values of test statistics that are “close” to the critical region. Suppose, for example, in the illustration
with H0 : μ = 10 versus H1: μ = 10, a value of z = 1.87 is observed; strictly speaking, with α = 0.05, the
value is not significant. But the risk of committing a type I error if one rejects H0 in this case could
hardly be considered severe. In fact, in a two-tailed scenario, one can quantify this risk as

Pemilihan awal tingkat signifikansi ini berakar pada filosofi bahwa risiko maksimum membuat
kesalahan tipe I harus dikendalikan. Namun, pendekatan ini tidak memperhitungkan nilai statistik uji
yang "dekat" dengan wilayah kritis. Misalkan, misalnya, dalam ilustrasi dengan H0 : = 10 versus H1: =
10, nilai z = 1,87 diamati; sebenarnya, dengan = 0,05, nilainya tidak signifikan. Tetapi risiko
melakukan kesalahan tipe I jika seseorang menolak H0 dalam kasus ini hampir tidak dapat dianggap
parah. Faktanya, dalam skenario dua sisi, seseorang dapat mengukur risiko ini sebagai

P = 2P(Z > 1.87 when μ = 10) = 2(0.0307) = 0.0614.

As a result, 0.0614 is the probability of obtaining a value of z as large as or larger (in magnitude) than
1.87 when in fact μ = 10. Although this evidence against H0 is not as strong as that which would
result from rejection at an α = 0.05 level, it is important information to the user. Indeed, continued
use of α = 0.05 or 0.01 is only a result of what standards have been passed down through the
generations. The P-value approach has been adopted extensively by users of applied statistics. The
approach is designed to give the user an alternative (in terms of a probability) to a mere “reject” or
“do not reject” conclusion. The P-value computation also gives the user important information when
the z-value falls well into the ordinary critical region. For example, if z is 2.73, it is informative for the
user to observe that

Akibatnya, 0,0614 adalah probabilitas untuk memperoleh nilai z sebesar atau lebih besar (dalam
besaran) dari 1,87 padahal sebenarnya = 10. Meskipun bukti terhadap H0 ini tidak sekuat yang akan
dihasilkan dari penolakan pada suatu = 0,05 tingkat, itu adalah informasi penting bagi pengguna.
Memang, penggunaan = 0,05 atau 0,01 yang berkelanjutan hanyalah hasil dari standar yang telah
diturunkan dari generasi ke generasi. Pendekatan nilai-P telah diadopsi secara luas oleh pengguna
statistik terapan. Pendekatan ini dirancang untuk memberi pengguna alternatif (dalam hal
probabilitas) untuk kesimpulan "tolak" atau "jangan tolak". Perhitungan nilai-P juga memberikan
informasi penting kepada pengguna ketika nilai-z jatuh dengan baik ke daerah kritis biasa. Misalnya,
jika z adalah 2,73, pengguna perlu mengamati bahwa

P = 2(0.0032) = 0.0064,

and thus the z-value is significant at a level considerably less than 0.05. It is important to know that
under the condition of H0, a value of z = 2.73 is an extremely rare event. That is, a value at least that
large in magnitude would only occur 64 times in 10,000 experiments.

dan dengan demikian nilai-z signifikan pada tingkat yang jauh lebih kecil dari 0,05. Penting untuk
diketahui bahwa pada kondisi H0, nilai z = 2,73 adalah kejadian yang sangat jarang. Artinya, nilai
setidaknya sebesar itu hanya akan terjadi 64 kali dalam 10.000 percobaan.

A Graphical Demonstration of a P-Value

Demonstrasi Grafis dari Nilai-P

One very simple way of explaining a P-value graphically is to consider two distinct samples. Suppose
that two materials are being considered for coating a particular type of metal in order to inhibit
corrosion. Specimens are obtained, and one collection is coated with material 1 and one collection
coated with material 2. The sample sizes are n1 = n2 = 10, and corrosion is measured in percent of
surface area affected. The hypothesis is that the samples came from common distributions with
mean μ = 10. Let us assume that the population variance is 1.0. Then we are testing

Salah satu cara yang sangat sederhana untuk menjelaskan nilai-P secara grafis adalah dengan
mempertimbangkan dua sampel yang berbeda. Misalkan dua bahan sedang dipertimbangkan untuk
melapisi jenis logam tertentu untuk menghambat korosi. Spesimen diperoleh, dan satu kumpulan
dilapisi dengan bahan 1 dan satu kumpulan dilapisi dengan bahan 2. Ukuran sampel adalah n1 = n2 =
10, dan korosi diukur dalam persen luas permukaan yang terpengaruh. Hipotesisnya adalah bahwa
sampel berasal dari distribusi umum dengan rata-rata = 10. Mari kita asumsikan bahwa varians
populasi adalah 1,0. Kemudian kami menguji

H0: μ1 = μ2 = 10.

Let Figure 10.8 represent a point plot of the data; the data are placed on the distribution stated by
the null hypothesis. Let us assume that the “×” data refer to material 1 and the “◦” data refer to
material 2. Now it seems clear that the data do refute the null hypothesis. But how can this be
summarized in one number? The P-value can be viewed as simply the probability of obtaining
these data given that both samples come from the same distribution. Clearly, this probability is
quite small, say 0.00000001! Thus, the small P-value clearly refutes H0, and the conclusion is that
the population means are significantly different.

Biarkan Gambar 10.8 mewakili plot titik data; data ditempatkan pada distribusi yang dinyatakan oleh
hipotesis nol. Mari kita asumsikan bahwa data “×” mengacu pada materi 1 dan data “◦” merujuk
pada materi 2. Sekarang tampak jelas bahwa data tersebut menyangkal hipotesis nol. Tapi
bagaimana ini bisa diringkas dalam satu nomor? Nilai-P dapat dilihat sebagai probabilitas
memperoleh data ini karena kedua sampel berasal dari distribusi yang sama. Jelas, probabilitas ini
cukup kecil, katakanlah 0,00000001! Dengan demikian, nilai P yang kecil dengan jelas menyangkal
H0, dan kesimpulannya adalah mean populasi berbeda nyata.

Figure 10.8: Data that are likely generated from populations having two different means.

Gambar 10.8: Data yang kemungkinan dihasilkan dari populasi yang memiliki dua cara berbeda.

Use of the P-value approach as an aid in decision-making is quite natural, and nearly all computer
packages that provide hypothesis-testing computation print out P-values along with values of the
appropriate test statistic. The following is a formal definition of a P-value.

Penggunaan pendekatan nilai-P sebagai bantuan dalam pengambilan keputusan cukup alami, dan
hampir semua paket komputer yang menyediakan komputasi pengujian hipotesis mencetak nilai-P
bersama dengan nilai-nilai statistik uji yang sesuai. Berikut ini adalah definisi formal dari nilai-P.
Note :

A P -value is the lowest level (of significance) at which the observed value of the test statistic is
significant.

Nilai-P adalah tingkat (signifikansi) terendah di mana nilai statistik uji yang diamati adalah signifikan.

How Does the Use of P-Values Differ from Classic Hypothesis Testing?

Bagaimana Penggunaan Nilai-P Berbeda dari Pengujian Hipotesis Klasik?

It is tempting at this point to summarize the procedures associated with testing, say, H0 : θ = θ0.
However, the student who is a novice in this area should understand that there are differences in
approach and philosophy between the classic fixed α approach that is climaxed with either a “reject
H0” or a “do not reject H0” conclusion and the P-value approach. In the latter, no fixed α is
determined and conclusions are drawn on the basis of the size of the P-value in harmony with the
subjective judgment of the engineer or scientist. While modern computer software will output P-
values, nevertheless it is important that readers understand both approaches in order to appreciate
the totality of the concepts. Thus, we offer a brief list of procedural steps for both the classical and
the P-value approach.

Sangat menggoda pada titik ini untuk meringkas prosedur yang terkait dengan pengujian,
katakanlah, H0 : = 0. Namun, mahasiswa yang masih pemula dalam bidang ini harus memahami
bahwa ada perbedaan pendekatan dan filosofi antara pendekatan tetap klasik yang klimaks dengan
kesimpulan “tolak H0” atau “jangan tolak H0” dan kesimpulan P- pendekatan nilai. Dalam yang
terakhir, tidak ada tetap yang ditentukan dan kesimpulan ditarik berdasarkan ukuran nilai-P selaras
dengan penilaian subjektif dari insinyur atau ilmuwan. Sementara perangkat lunak komputer
modern akan menghasilkan nilai-P, namun penting bagi pembaca untuk memahami kedua
pendekatan tersebut untuk menghargai konsep keseluruhan. Dengan demikian, kami menawarkan
daftar singkat langkah-langkah prosedural untuk pendekatan klasik dan nilai-P.

Approach to Hypothesis Testing with Fixed Probability of Type I Error

1. State the null and alternative hypotheses.

2. Choose a fixed significance level α.

3. Choose an appropriate test statistic and establish the critical region based on α.

4. Reject H0 if the computed test statistic is in the critical region. Otherwise, do not reject.

5. Draw scientific or engineering conclusions.

Pendekatan Pengujian Hipotesis dengan Probabilitas Tetap Kesalahan Tipe I

1. Nyatakan hipotesis nol dan hipotesis alternatif.

2. Pilih tingkat signifikansi tetap .

3. Pilih statistik uji yang sesuai dan tentukan daerah kritis berdasarkan .

4. Tolak H0 jika statistik uji yang dihitung berada di daerah kritis. Jika tidak, jangan ditolak.

5. Menarik kesimpulan ilmiah atau rekayasa.


Significance Testing (P-Value Approach)

1. State null and alternative hypotheses.

2. Choose an appropriate test statistic.

3. Compute the P-value based on the computed value of the test statistic.

4. Use judgment based on the P-value and knowledge of the scientific system.

Pengujian Signifikansi (P-Value Approach)

1. Nyatakan hipotesis nol dan hipotesis alternatif.

2. Pilih statistik uji yang sesuai.

3. Hitung nilai-P berdasarkan nilai statistik uji yang dihitung.

4. Gunakan penilaian berdasarkan nilai-P dan pengetahuan sistem ilmiah.

Anda mungkin juga menyukai