MENGAPA 5%?
Penjelasan yang sedikit lebih ilmiah untuk memilih 5% sebagai cut-off adalah bahwa
sekitar 5% (4,5%, lebih tepatnya) dari distribusi normal terdiri dari nilai-nilai outlying atau
“berbeda secara signifikan”, yaitu nilai-nilai yang lebih dari dua simpangan baku jauh dari rata-
rata.
Bayangkan Anda melakukan uji coba terkontrol secara acak (RCT) yang membandingkan
obat antidepresan baru dengan plasebo. Pada titik akhir studi 8 minggu, Anda menemukan
bahwa 60% pasien merespons obat dan 40% merespons plasebo. Uji Chiÿsquare yang Anda
terapkan menghasilkan nilai P sebesar 0,04, nilai yang kurang dari 0,05. Anda menyimpulkan
bahwa secara signifikan lebih banyak pasien menanggapi antidepresan daripada plasebo.
Interpretasi Anda adalah bahwa obat antidepresan baru benar-benar memiliki efek antidepresan.
Kesimpulannya benar tetapi rapuh karena batas 5% dan bahkan konsep signifikansi statistik
sedang ditantang. Interpretasi salah karena nilai P , bahkan yang signifikan secara statistik, tidak
menentukan kebenaran.
Nilai P dan konsep signifikansi statistik telah lama dipertanyakan. kesimpulan ilmiah dan
pengambilan keputusan tidak boleh hanya didasarkan pada apakah nilai P berada di bawah
ambang batas yang sewenang-wenang atau tidak; dan menarik kesimpulan yang tepat
membutuhkan pelaporan dan transparansi yang lengkap. Namun, menghilangkan P dan ambang
batas signifikansi statistik akan sulit. Hal ini karena memperkirakan P dan menyatakan
signifikansi statistik (atau tidak adanya) telah menjadi landasan penelitian empiris.
Menetapkan ambang batas untuk P juga diperlukan untuk estimasi ukuran sampel dan
perhitungan daya.
REKOMENDASI
Nilai P harus ditafsirkan sebagai variabel kontinu dan tidak secara dikotomis. Jadi, kita
tidak boleh menyimpulkan bahwa hanya karena nilai P < 0,05 atau ambang batas lain yang telah
ditentukan, hipotesis penelitian adalah benar. Demikian juga, kita tidak boleh mengatakan bahwa
hanya karena P > 0,05 atau ambang batas lain yang telah ditentukan, hipotesis penelitian salah.
Bagaimanapun, ini adalah cara yang salah dalam interpretasi tentang nilai P.
Meneliti perkiraan tunggal dan nilai P yang terkait tidak cukup. Penting untuk menilai
sebanyak mungkin tentang perkiraan tersebut. Selain nilai absolut, 95% CI harus diperiksa
sebagai interval kompatibilitas, dan ketepatan interval ini harus dipertimbangkan. Semua temuan
harus ditafsirkan dalam konteks desain penelitian, termasuk sifat sampel, ukuran sampel,
reliabilitas dan validitas instrumen yang digunakan, dan ketelitian penelitian yang dilakukan.