com
6
Pengantar Pengujian Hipotesis:
Inferensi Tentang Mean Tunggal
Konsep Kunci
1. Hipotesis nol atau statistik versus hipotesis ilmiah atau penelitian
2. Kesalahan tipe I (α), kesalahan tipe II (β), dan daya (1 - )
3. Hipotesis alternatif dua sisi versus satu sisi
4. Daerah kritis dan nilai kritis
121
122 Pengantar Konsep Statistik
5. zstatistik uji
6. Interval kepercayaan (CI) di sekitar rata-rata
7. Tstatistik uji
8. Tdistribusi, derajat kebebasan, dan tabel distribusi t
Dalam Bab 5, kita mulai masuk ke ranah statistik inferensial. Di sana kami
mempertimbangkan topik umum berikut: probabilitas, pengambilan sampel, dan
estimasi. Dalam bab ini, kita beralih sepenuhnya ke domain statistik inferensial, di mana
konsep yang terlibat dalam probabilitas, pengambilan sampel, dan estimasi dapat
diimplementasikan. Tema keseluruhan dari bab ini adalah penggunaan uji statistik
untuk membuat kesimpulan tentang mean tunggal. Untuk menutupi tes inferensial ini
dengan benar, sejumlah konsep dasar dasar dijelaskan dalam bab ini. Banyak dari
konsep-konsep ini digunakan sepanjang sisa teks ini. Topik yang dijelaskan meliputi:
jenis hipotesis, jenis kesalahan keputusan, tingkat signifikansi (α), gambaran langkah-
langkah dalam proses pengambilan keputusan, kesimpulan tentang ketika diketahui,
Kesalahan tipe II (β) dan kekuatan (1 - ), signifikansi statistik versus signifikansi praktis,
dan inferensi tentang ketika tidak diketahui. Konsep yang akan dibahas meliputi berikut
ini: hipotesis nol atau statistik versus hipotesis ilmiah atau penelitian; Kesalahan tipe I
(α), kesalahan tipe II (β), dan daya (1 - ); hipotesis alternatif dua sisi versus satu sisi;
daerah kritis dan nilai kritis; z uji statistik; interval kepercayaan (CI) di sekitar rata-rata;
statistik uji t; dan distribusi t, derajat kebebasan, dan tabel distribusi t. Tujuan kami
adalah bahwa pada akhir bab ini, Anda akan dapat (a) memahami konsep dasar
pengujian hipotesis; (b) menggunakan tabel normal dan t tabel; dan (c) memahami,
menentukan, dan menginterpretasikan hasil dari prosedur uji z, uji t, dan CI. signifikansi
statistik versus praktis, dan kesimpulan tentang ketika tidak diketahui. Konsep yang
akan dibahas meliputi berikut ini: hipotesis nol atau statistik versus hipotesis ilmiah atau
penelitian; Kesalahan tipe I (α), kesalahan tipe II (β), dan daya (1 - ); hipotesis alternatif
dua sisi versus satu sisi; daerah kritis dan nilai kritis; z uji statistik; interval kepercayaan
(CI) di sekitar rata-rata; statistik uji t; dan distribusi t, derajat kebebasan, dan tabel
distribusi t. Tujuan kami adalah bahwa pada akhir bab ini, Anda akan dapat (a)
memahami konsep dasar pengujian hipotesis; (b) menggunakan tabel normal dan t tabel;
dan (c) memahami, menentukan, dan menginterpretasikan hasil dari prosedur uji z, uji t,
dan CI. signifikansi statistik versus praktis, dan kesimpulan tentang ketika tidak
diketahui. Konsep yang akan dibahas meliputi berikut ini: hipotesis nol atau statistik
versus hipotesis ilmiah atau penelitian; Kesalahan tipe I (α), kesalahan tipe II (β), dan
daya (1 - ); hipotesis alternatif dua sisi versus satu sisi; daerah kritis dan nilai kritis; z uji
statistik; interval kepercayaan (CI) di sekitar rata-rata; statistik uji t; dan distribusi t,
derajat kebebasan, dan tabel distribusi t. Tujuan kami adalah bahwa pada akhir bab ini,
Anda akan dapat (a) memahami konsep dasar pengujian hipotesis; (b) menggunakan
tabel normal dan t tabel; dan (c) memahami, menentukan, dan menginterpretasikan hasil
dari prosedur uji z, uji t, dan CI. Konsep yang akan dibahas meliputi berikut ini:
hipotesis nol atau statistik versus hipotesis ilmiah atau penelitian; Kesalahan tipe I (α),
kesalahan tipe II (β), dan daya (1 - ); hipotesis alternatif dua sisi versus satu sisi; daerah
kritis dan nilai kritis; z uji statistik; interval kepercayaan (CI) di sekitar rata-rata; statistik
uji t; dan distribusi t, derajat kebebasan, dan tabel distribusi t. Tujuan kami adalah bahwa
pada akhir bab ini, Anda akan dapat (a) memahami konsep dasar pengujian hipotesis; (b)
menggunakan tabel normal dan t tabel; dan (c) memahami, menentukan, dan
menginterpretasikan hasil dari prosedur uji z, uji t, dan CI. Konsep yang akan dibahas
meliputi berikut ini: hipotesis nol atau statistik versus hipotesis ilmiah atau penelitian;
Kesalahan tipe I (α), kesalahan tipe II (β), dan daya (1 - ); hipotesis alternatif dua sisi
versus satu sisi; daerah kritis dan nilai kritis; z uji statistik; interval kepercayaan (CI) di
sekitar rata-rata; statistik uji t; dan distribusi t, derajat kebebasan, dan tabel distribusi t.
Tujuan kami adalah bahwa pada akhir bab ini, Anda akan dapat (a) memahami konsep
dasar pengujian hipotesis; (b) menggunakan tabel normal dan t tabel; dan (c) memahami,
Pengantar Pengujian Hipotesis: Inferensi Tentang Mean Tunggal 1
menentukan, dan menginterpretasikan hasil dari prosedur uji z, uji t, dan CI. hipotesis
alternatif dua sisi versus satu sisi; daerah kritis dan nilai kritis; z uji statistik; interval
kepercayaan (CI) di sekitar rata-rata; statistik uji t; dan distribusi t, derajat kebebasan,
dan tabel distribusi t. Tujuan kami adalah bahwa pada akhir bab ini, Anda akan dapat (a)
memahami konsep dasar pengujian hipotesis; (b) menggunakan tabel normal dan t tabel;
dan (c) memahami, menentukan, dan menginterpretasikan hasil dari prosedur uji z, uji t,
dan CI. hipotesis alternatif dua sisi versus satu sisi; daerah kritis dan nilai kritis; z uji
statistik; interval kepercayaan (CI) di sekitar rata-rata; statistik uji t; dan distribusi t,
derajat kebebasan, dan tabel distribusi t. Tujuan kami adalah bahwa pada akhir bab ini,
Anda akan dapat (a) memahami konsep dasar pengujian hipotesis; (b) menggunakan
tabel normal dan t tabel; dan (c) memahami, menentukan, dan menginterpretasikan hasil
dari prosedur uji z, uji t, dan CI. (b) menggunakan tabel normal dan t tabel; dan (c)
memahami, menentukan, dan menginterpretasikan hasil dari prosedur uji z, uji t, dan CI.
(b) menggunakan tabel normal dan t tabel; dan (c) memahami, menentukan, dan
menginterpretasikan hasil dari prosedur uji z, uji t, dan CI.
Marie, seorang mahasiswa pascasarjana yang mengejar gelar master dalam penelitian
pendidikan, telah menyelesaikan tugas pertamanya sebagai asisten peneliti —
menentukan sejumlah statistik deskriptif pada data yang diberikan kepadanya oleh
mentor fakultasnya. Anggota fakultas sangat senang dengan analisis deskriptif dan
presentasi hasil yang dibagikan sebelumnya sehingga dia telah meminta Marie untuk
berkonsultasi dengan pelatih hoki lokal, Oscar, yang tertarik untuk memeriksa
kinerja tim skating. Berdasarkan pertanyaan penelitian Oscar: Apakah kecepatan
rata-rata skating tim hoki berbeda dari kecepatan rata-rata liga 12 detik? Marie
menyarankan uji satu sampel sarana sebagai uji inferensi. Tugasnya adalah
membantu Oscar dalam menghasilkan uji inferensi untuk menjawab pertanyaan
penelitiannya.
Pengujian hipotesis adalah proses pengambilan keputusan di mana dua keputusan yang
mungkin ditimbang secara statistik. Di satu sisi, ini sama seperti keputusan lain yang
melibatkan dua kemungkinan, seperti apakah Anda akan membawa payung hari ini atau
tidak. Dalam pengambilan keputusan statistik, dua kemungkinan keputusan yang
dikenal sebagai hipotesis. Data sampel kemudian digunakan untuk membantu kita
memilih salah satu keputusan ini. Dua jenis hipotesis yang bersaing satu sama lain
dikenal sebagai hipotesis nol atau statistik, dilambangkan dengan H0, dan hipotesis
ilmiah, alternatif, atau penelitian, dilambangkan dengan H1.
124 Pengantar Konsep Statistik
Hipotesis nol atau statistik adalah pernyataan tentang nilai parameter populasi yang
tidak diketahui. Mempertimbangkan prosedur yang kita diskusikan dalam bab ini, tes
rata-rata satu sampel, satu contoh H0 mungkin bahwa skor IQ rata-rata populasi adalah
100, yang kita nyatakan sebagai
Secara matematis, kedua persamaan mengatakan hal yang sama. Versi di sebelah kiri
adalah bentuk hipotesis nol yang lebih tradisional yang melibatkan mean tunggal.
Namun, versi di sebelah kanan menjelaskan kepada pembaca mengapa istilah "null"
tepat. Artinya, tidak ada perbedaan atau perbedaan “nol” antara mean populasi dan nilai
mean yang dihipotesiskan dari 100. Secara umum, nilai mean yang dihipotesiskan
dilambangkan dengan 0 (di sini 0 = 100). H0 lain mungkin berarti populasi ujian statistik
sama untuk siswa laki-laki dan perempuan, yang kita nyatakan sebagai
H0: 1 2 100
di mana
1 adalah rata-rata populasi untuk laki-laki
2 adalah rata-rata populasi untuk wanita
Di sini tidak ada perbedaan atau perbedaan “null” antara kedua mean populasi. Uji
perbedaan antara dua rata-rata disajikan dalam Bab 7. Saat kita bergerak melalui bab-bab
berikutnya, kita menjadi akrab dengan hipotesis nol yang melibatkan parameter populasi
lainnya seperti proporsi, varians, dan korelasi.
Hipotesis nol pada dasarnya ditetapkan oleh peneliti dalam upaya untuk menolak
hipotesis nol demi hipotesis ilmiah, alternatif, atau penelitian pribadi kita sendiri.
Dengan kata lain, hipotesis ilmiah adalah apa yang kami yakini sebagai hasil penelitian,
berdasarkan teori dan penelitian sebelumnya. Jadi, kami mencoba untuk menolak
hipotesis nol dan bukti dan bukti yang mendukung hipotesis ilmiah kami. Hipotesis
ilmiah H1 untuk dua contoh kami adalah:
dan
H1: 1 2 100
membuat keputusan yang benar tentang parameter populasi. Karena biasanya tidak,
kami menggunakan statistik inferensial untuk membantu membuat keputusan dari data
sampel dan menyimpulkan hasil tersebut kembali ke populasi. Sifat dari kesalahan
keputusan tersebut dan probabilitas yang dapat kita kaitkan dengannya dijelaskan di
bagian selanjutnya.
Dengan demikian, kami tertarik untuk menguji apakah rata-rata populasi untuk
instrumen kecerdasan sama dengan 100, nilai rata-rata yang kami hipotesiskan, atau tidak
sama dengan 100.
Selanjutnya kita mengambil beberapa sampel acak individu dari populasi dewasa. Kami
menemukan
untuk sampel kami sampel pertama - = 105 (yaitu, menunjukkan mean untuk sampel 1).
k
Memperhatikan informasi-
Untuk sampel 1, rata-rata sampel adalah sepertiga dari standar deviasi di atas nilai yang
dihipotesiskan [yaitu, dengan menghitung skor az dari (105 - 100) / 15 = 0,3333], jadi
kesimpulan kami mungkin akan gagal untuk menolak H0. Dengan kata lain, jika rata-
rata populasi sebenarnya adalah 100, maka kami percaya bahwa seseorang sangat
mungkin untuk mengamati rata-rata sampel 105. Jadi, keputusan kami untuk sampel 1
adalah gagal menolak H0; namun, ada beberapa kemungkinan atau kemungkinan bahwa
keputusan tidak tepat.
Kami mengambil sampel kedua dan Y-nd Y2 = 115 (yaitu, menunjukkan mean untuk sampel
2).
Melihat informasi untuk sampel 2, rata-rata sampel adalah satu standar deviasi di atas
nilai hipotesis [yaitu, z = (115 - 100) / 15 = 1,0000], jadi kesimpulan kami mungkin akan
gagal menolak H0. Dengan kata lain, jika rata-rata populasi sebenarnya adalah 100, maka
kami percaya bahwa kemungkinan besar untuk mengamati rata-rata sampel adalah 115.
Jadi, keputusan kami untuk sampel 2 adalah gagal menolak H0. Namun, ada
kemungkinan atau kemungkinan yang lebih besar bahwa keputusan kami salah
daripada kasus untuk sampel 1; ini karena rata-rata sampel lebih jauh dari nilai yang
dihipotesiskan.
Kami mengambil sampel ketiga dan menemukan - = 190 (yaitu, menunjukkan mean untuk
sampel 3). bola mata k
informasi untuk sampel 3, rata-rata sampel adalah enam standar deviasi di atas nilai
126 Pengantar Konsep Statistik
hipotesis [yaitu, z = (190 - 100) / 15 = 6.0000], jadi kesimpulan kami mungkin adalah
Pengantar Pengujian Hipotesis: Inferensi Tentang Mean Tunggal 1
menolak H0. Dengan kata lain, jika mean populasi sebenarnya adalah 100, maka kami
percaya bahwa sangat tidak mungkin untuk mengamati mean sampel 190. Jadi,
keputusan kami untuk sampel 3 adalah menolak H0; namun, ada beberapa
kemungkinan kecil atau kemungkinan bahwa keputusan kami salah.
TABEL 6.1
Tabel Keputusan
Statistik
Keputus
an
Keadaan Alam (Realitas) Gagal Menolak H0 Tolak H0
(a) Kasus umum
H0 adalahbenarBenar keputusan (1 -) Jenis saya salah (α)
H0adalah falseType kesalahan II () Benar keputusan (1 - ) = kekuatan
(b) Contoh kasus hujan
H0 benar (tidakhujan) Keputusan yang benar (jangan H0 salah(hujan) Kesalahan tipe II
membawa payung (tidak
dan tidak perlu payung)(1 - ) membawa
128 Pengantar Konsep Statistik
payung dan basah kuyup) (β) Kesalahan tipe I (ambil payung dan terlihat
konyol) (α)
kesalahan. Artinya, kita salah gagal menolak H0 palsu. Data sampel kami telah
membawa kami ke kesimpulan yang berbeda dari data populasi. Probabilitas hasil ini
dikenal sebagai (beta). Kedua, jika H0 benar-benar salah dan kita menolak H0, maka kita
telah membuat keputusan yang benar; yaitu, kita telah menolak dengan benar H0 palsu.
Probabilitas hasil kedua ini dikenal sebagai 1 - atau pangkat (akan lebih lengkap dibahas
nanti dalam bab ini). Oleh karena itu, jika H0 sebenarnya salah, maka data sampel kami
membawa kami ke salah satu dari dua kesimpulan, apakah kami salah menolak H0, atau
kami benar menolak H0. Jumlah probabilitas untuk kedua hasil ini ketika H0 salah
adalah sama dengan 1 [yaitu, + (1 - ) = 1].
Sebagai aplikasi dari tabel ini, pertimbangkankasus khusus berikut, seperti yang
ditunjukkan pada bagian (b) dari Tabel 6.1. Kami ingin menguji hipotesis berikut tentang
apakah besok akan hujan atau tidak.
H0: besok tidak hujan
H1: besok hujan
Kami mengumpulkan beberapa data sampel dari tahun-tahun sebelumnya untuk
bulan dan hari yang sama, dan pergi untuk membuat keputusan statistik kami. Dua
kemungkinan keputusan statistik kami adalah (a) kami tidak percaya besok akan hujan
dan oleh karena itu tidak membawa payung, atau (b) kami yakin akan hujan besok dan
karena itu membawa payung.
Sekali lagi ada empat hasil potensial. Pertama, jika H0 benar-benar benar (tidak ada
hujan) dan kita tidak membawa payung, maka kita telah membuat keputusan yang tepat
karena tidak diperlukan payung (probabilitas = 1 - ). Kedua, jika H0 benar-benar benar
(tidak ada hujan) dan kita membawa payung, maka kita telah membuat kesalahan Tipe I
karena kita terlihat konyol membawa payung itu sepanjang hari (probabilitas = ). Ketiga,
jika H0 benar-benar salah (hujan) dan kita tidak membawa payung, maka kita telah
melakukan kesalahan Tipe II dan menjadi basah (probabilitas = ). Keempat, jika H0
benar-benar salah (hujan) dan kita membawa payung, maka kita telah mengambil
keputusan yang benar karena payung membuat kita tetap kering (probabilitas = 1 - ).
Mari kita membuat dua pernyataan penutup tentang tabel keputusan. Pertama,
seseorang tidak akan pernah bisa membuktikan kebenaran atau kesalahan H0 dalam satu
penelitian. Seseorang hanya mengumpulkan bukti yang mendukung atau menentang
hipotesis nol. Sesuatu terbukti dalam penelitian ketika seluruh kumpulan studi atau
bukti mencapai kesimpulan yang sama berulang kali. Bukti c bukti ilmiah sulit dicapai
dalam ilmu sosial dan perilaku, dan kita tidak boleh menggunakan istilah pembuktian
atau pembuktian secara longgar. Sebagai peneliti, kami mengumpulkan banyak bukti
yang pada akhirnya mengarah pada pengembangan satu atau lebih teori. Ketika sebuah
teori terbukti benar (yaitu, dalam semua kasus), maka bukti telah ditetapkan.
Kedua, mari kita pertimbangkan kesalahan keputusan dalam sudut pandang yang
berbeda. Seseorang dapat sepenuhnya menghilangkan kemungkinan kesalahan Tipe I
dengan memutuskan untuk tidak pernah menolak H0. Artinya, jika kita selalu gagal
menolak H0 (jangan pernah membawa payung), maka kita tidak akan pernah bisa
membuat kesalahan Tipe I (terlihat konyol dengan payung yang tidak perlu). Meskipun
strategi ini terdengar seperti itu, itu benar-benar mengambil kekuatan pengambilan
keputusan dari tangan kita. Dengan strategi ini, kami bahkan tidak perlu
mengumpulkan data sampel apa pun, karena kami telah memutuskan untuk tidak
pernah menolak H0.
Seseorang dapat sepenuhnya menghilangkan kemungkinan kesalahan Tipe II dengan
memutuskan untuk selalu menolak H0. Artinya, jika kita selalu menolak H0 (selalu
membawa payung), maka kita tidak akan pernah bisa membuat kesalahan Tipe II (basah
tanpa payung). Meskipun strategi ini juga terdengar seperti itu, itu benar-benar
menghilangkan kekuatan pengambilan keputusan dari tangan kita. Dengan strategi ini,
kami bahkan tidak perlu mengumpulkan data sampel apa pun karena kami telah
memutuskan untuk selalu menolak H0. Secara bersama-sama, seseorang tidak akan
pernah bisa sepenuhnya menghilangkan kemungkinan kesalahan Tipe I dan Tipe II. Apa
130 Pengantar Konsep Statistik
pun keputusan yang kita buat, selalu ada kemungkinan untuk membuat kesalahan Tipe I
dan/atau Tipe II. Oleh karena itu, sebagai peneliti, tugas kita adalah membuat keputusan
secara sadar dalam merancang dan melakukan penelitian kita dan dalam menganalisis
data sehingga kemungkinan kesalahan keputusan diminimalkan.
Pengantar Pengujian Hipotesis: Inferensi Tentang Mean Tunggal 1
Kita memerlukan mekanisme untuk memutuskan seberapa jauh jarak rata-rata sampel
dari nilai rata-rata yang dihipotesiskan 0 = 100 untuk menolak H0. Dengan kata lain,
pada suatu titik atau jarak tertentu dari 100, kita akan memutuskan untuk menolak H0.
Kami menggunakan untuk menentukan titik itu bagi kami, di mana dalam konteks ini,
dikenal sebagai tingkat signifikansi. Gambar 6.1a menunjukkan distribusi sampling
mean di mana nilai hipotesis 0 digambarkan di pusat distribusi. Menuju kedua ekor
distribusi, kita melihat dua daerah yang diarsir yang dikenal sebagai daerah kritis atau
daerah penolakan. Daerah gabungan dari dua daerah yang diarsir sama dengan , dan,
dengan demikian, luas daerah kritis atas atau bawah sama dengan / 2 (yaitu, kita
membagi menjadi dua dengan membagi dua) . Jika sampel berarti
/2 /2
Daerah kritis Daerah kritis
Daerah kritis
Daerah kritis
GAMBAR 6.1
Hipotesis alternatif dan daerah kritis: (a) uji dua sisi; (b) uji satu sisi, uji sisi kanan; (c) uji satu arah, uji arah kiri.
132 Pengantar Konsep Statistik
cukup jauh dari nilai rata-rata yang dihipotesiskan, 0, sehingga jatuh ke salah satu
wilayah kritis, maka keputusan statistik kami adalah menolak H0. Dalam kasus ini,
keputusan kami adalah menolak H0 pada tingkat signifikansi . Namun, jika rata-rata
sampel cukup dekat dengan 0 sehingga masuk ke wilayah yang tidak diarsir (yaitu, tidak
ke salah satu wilayah kritis), maka keputusan statistik kami adalah gagal menolak H0.
Titik-titik tepat pada sumbu X di mana daerah kritis dibagi dari daerah yang tidak
diarsir dikenal sebagai nilai kritis. Menentukan nilai kritis dibahas nanti dalam bab ini.
Catatanbahwa di bawah hipotesis alternatif H1, kami bersedia menolak H0 ketika rata-
rata sampel secara signifikan lebih besar dari atau secara signifikan lebih kecil dari nilai
rata-rata yang dihipotesiskan 0. Hipotesis alternatif khusus ini dikenal sebagai hipotesis
alternatif nondirectional, karena tidak ada arah yang tersirat sehubungan dengan nilai
yang dihipotesiskan. Artinya, kami akan menolak hipotesis nol demi hipotesis alternatif
di kedua arah, baik di atas atau di bawah nilai rata-rata yang dihipotesiskan. Ini juga
menghasilkan apa yang dikenal sebagai uji signifikansi dua sisi di mana kita bersedia
menolak hipotesis nol baik di wilayah ekor atau wilayah kritis.
Dua hipotesis alternatif lain juga dimungkinkan, tergantung pada hipotesis ilmiah
peneliti, yang dikenal sebagai hipotesis alternatif terarah. Salah satu alternatif arah
adalah bahwa rata-rata populasi lebih besar dari nilai rata-rata yang dihipotesiskan, juga
dikenal sebagai uji arah kanan, seperti yang dilambangkan dengan
Secara matematis, kedua persamaan ini mengatakan hal yang sama. Dengan hipotesis
alternatif berekor kanan, seluruh wilayah penolakan terkandung di ekor atas, dengan
luas , yang dikenal sebagai uji signifikansi satu sisi (dan khususnya ekor kanan). Jika
mean sampel secara signifikan lebih besar dari nilai mean yang dihipotesiskan 100, maka
keputusan statistik kami adalah menolak H0. Namun, jika rata-rata sampel jatuh ke
daerah yang tidak diarsir, maka keputusan statistik kami adalah gagal menolak H0.
Situasi ini digambarkan pada Gambar 6.1b.
Alternatif arah kedua adalah bahwa rata-rata populasi kurang dari nilai rata-rata yang
dihipotesiskan, juga dikenal sebagai uji arah kiri, seperti yang dilambangkan dengan
Secara matematis, kedua persamaan ini mengatakan hal yang sama. Dengan hipotesis
alternatif berekor kiri, seluruh wilayah penolakan terkandung di ekor bawah, dengan
luas , juga dikenal sebagai uji signifikansi satu arah (dan khususnya ekor kiri). Jika mean
sampel secara signifikan lebih kecil dari nilai mean yang dihipotesiskan 100, maka
keputusan statistik kita adalah menolak H0. Namun, jika rata-rata sampel jatuh ke
daerah yang tidak diarsir, maka keputusan statistik kami adalah gagal menolak H0.
Situasi ini digambarkan pada Gambar 6.1c. Ada beberapa potensi penyalahgunaan
alternatif yang berbeda, yang kami anggap sebagai masalah etis. Sebagai contoh, seorang
peneliti melakukan uji satu arah dengan daerah kritis bagian atas dan gagal menolak H0.
Namun, peneliti memperhatikan bahwa rata-rata sampel jauh di bawah nilai rata-rata
yang dihipotesiskan dan kemudian memutuskan untuk mengubah hipotesis alternatif
menjadi tes nondirectional atau tes satu sisi di sisi lain. Ini tidak etis, karena peneliti telah
memeriksa data dan mengubah hipotesis alternatif. Moral dari cerita ini adalah: Jika ada
bukti empiris sebelumnya dan konsisten untuk menggunakan hipotesis alternatif terarah
tertentu, maka Anda harus melakukannya. Namun, jika ada bukti empiris minimal atau
tidak konsisten untuk menggunakan alternatif arah tertentu, maka Anda tidak boleh
melakukannya. Sebaliknya, Anda harus menggunakan alternatif nondirectional. Setelah
Anda memutuskan alternatif mana Ini tidak etis, karena peneliti telah memeriksa data
dan mengubah hipotesis alternatif. Moral dari cerita ini adalah: Jika ada bukti empiris
sebelumnya dan konsisten untuk menggunakan hipotesis alternatif terarah tertentu,
maka Anda harus melakukannya. Namun, jika ada bukti empiris minimal atau tidak
Pengantar Pengujian Hipotesis: Inferensi Tentang Mean Tunggal 1
konsisten untuk menggunakan alternatif arah tertentu, maka Anda tidak boleh
melakukannya. Sebaliknya, Anda harus menggunakan alternatif nondirectional. Setelah
Anda memutuskan alternatif mana Ini tidak etis, karena peneliti telah memeriksa data
dan mengubah hipotesis alternatif. Moral dari cerita ini adalah: Jika ada bukti empiris
sebelumnya dan konsisten untuk menggunakan hipotesis alternatif terarah tertentu,
maka Anda harus melakukannya. Namun, jika ada bukti empiris minimal atau tidak
konsisten untuk menggunakan alternatif arah tertentu, maka Anda tidak boleh
melakukannya. Sebaliknya, Anda harus menggunakan alternatif nondirectional. Setelah
Anda memutuskan alternatif mana maka Anda tidak harus. Sebaliknya, Anda harus
menggunakan alternatif nondirectional. Setelah Anda memutuskan alternatif mana maka
Anda tidak harus. Sebaliknya, Anda harus menggunakan alternatif nondirectional.
Setelah Anda memutuskan alternatif mana
134 Pengantar Konsep Statistik
hipotesis untuk pergi dengan, maka Anda harus tetap dengan itu selama keputusan
statistik. Jika Anda menentang dan menemukan bukti yang berlawanan, maka laporkan
karena mungkin merupakan temuan penting, tetapi jangan ubah hipotesis alternatif di
tengah jalan.
Seseorang juga dapat memilih salah satu dari hipotesis alternatif terarah yang dijelaskan
sebelumnya.
Jika kita memilih untuk menulis hipotesis nol kita sebagai H0: = 100, kita ingin menulis
hipotesis penelitian kita secara konsisten, H1: 100 (bukan H1: - 100 0). Dalam publikasi,
banyak peneliti memilih untuk menyajikan hipotesis dalam bentuk naratif (misalnya,
"hipotesis nol menyatakan bahwa rata-rata populasi akan sama dengan 100, dan
hipotesis alternatif menyatakan bahwa rata-rata populasi tidak akan sama dengan 100").
Bagaimana Anda menyajikan hipotesis Anda (secara matematis atau menggunakan
notasi statistik) terserah Anda.
Langkah 2: Langkah kedua dalam proses pengambilan keputusan adalah memilih tingkat
signifikansi . Ada dua pertimbangan yang harus dibuat dalam hal memilih tingkat
signifikansi. Satu pertimbangan adalah biaya yang terkait dengan membuat kesalahan
Tipe I, yang sebenarnya adalah . Ingatlah bahwa alpha adalah probabilitas menolak
hipotesis nol jika dalam kenyataannya hipotesis nol itu benar. Ketika kesalahan Tipe I
dibuat, itu berarti bukti dibangun untuk mendukung hipotesis penelitian (yang
sebenarnya salah). Mari kita ambil contoh obat baru. Untuk menguji kemanjuran obat,
percobaan dilakukan di mana beberapa individu mengambil obat baru sementara yang
lain menerima plasebo. Hipotesis nol, yang dinyatakan tanpa arah, pada dasarnya akan
menunjukkan bahwa efek obat dan plasebo adalah sama. Menolak hipotesis nol akan
berarti bahwa efeknya tidak sama — menunjukkan bahwa mungkin obat baru ini, yang
pada kenyataannya tidak lebih baik daripada plasebo, disebut-sebut sebagai obat yang
efektif. Itu jelas bermasalah dan berpotensi sangat berbahaya.
Jadi, jika ada biaya yang relatif tinggi terkait dengan kesalahan Tipe I — misalnya,
seperti hilangnya nyawa, seperti dalam profesi medis — maka orang akan ingin memilih
tingkat signifikansi yang relatif kecil (mis. atau lebih kecil). Sebuah alpha kecil akan
diterjemahkan ke probabilitas yang sangat kecil untuk menolak nol jika itu benar-benar
benar (yaitu, kemungkinan kecil membuat
Pengantar Pengujian Hipotesis: Inferensi Tentang Mean Tunggal 1
keputusan yang salah). Jika ada relatifbiaya rendah yang terkait dengan kesalahan Tipe I
— misalnya, sehingga anak-anak harus makan permen peringkat kedua daripada yang
pertama — kemudian memilih tingkat signifikansi yang lebih besar mungkin sesuai
(mis., 0,05 atau lebih besar). Namun, biaya tidak selalu diketahui. Pertimbangan kedua
adalah tingkat signifikansi yang biasa digunakan dalam penelitian Anda. Dalam banyak
disiplin, tingkat signifikansi 0,05 telah menjadi standar (walaupun tampaknya tidak ada
yang memiliki alasan yang benar-benar bagus). Ini benar dalam banyak ilmu sosial dan
perilaku. Jadi, sebaiknya Anda berkonsultasi dengan literatur yang diterbitkan di bidang
Anda untuk melihat apakah beberapa standar umum digunakan dan
mempertimbangkannya untuk penelitian Anda sendiri.
Langkah 3: Langkah ketiga dalam proses pengambilan keputusan adalah menghitung statistik
uji. Untuk
-
uji rata-rata satu sampel, kami akan menghitung rata-rata kamudan bandingkan dengan
sampel
nilai hipotesis . Ini memungkinkan kita untuk menentukan ukuran perbedaan antara
- 0
kamudan 0, dan selanjutnya, probabilitas yang terkait dengan perbedaan tersebut. Yang lebih
besar
perbedaannya, semakin besar kemungkinan rata-rata sampel benar-benar berbeda dari
nilai rata-rata yang dihipotesiskan dan semakin besar kemungkinan yang terkait dengan
perbedaan tersebut.
Langkah 4: Langkah keempat dan terakhir dalam proses pengambilan keputusan adalah
membuat keputusan statistik mengenai hipotesis nol H0. Artinya, keputusan dibuat
apakah akan menolak H0 atau gagal menolak H0. Jika perbedaan antara rata-rata sampel
dan nilai yang dihipotesiskan cukup besar relatif terhadap nilai kritis (kita akan
membicarakan nilai kritis secara lebih rinci nanti), maka keputusan kita adalah menolak
H0. Jika perbedaan antara mean sampel dan nilai hipotesis tidak cukup besar relatif
terhadap nilai kritis, maka keputusan kami adalah gagal menolak H0. Ini adalah proses
empat langkah dasar untuk pengujian hipotesis dari setiap tes inferensial. Rincian
spesifik untuk pengujian rata-rata tunggal diberikan dalam bagian berikut.
6.5.1 zUji
Ingat kembali dari Bab 4 definisi skor az sebagai
Yi. .
z. Y
di mana
Yiadalah skor pada variabel Y untuk individu i
adalah mean populasi untuk variabel Y
Y adalah simpangan baku populasi untuk variabel Y
Skor z digunakan untuk memberi tahu kita berapa banyak unit standar deviasi skor
individu dari mean.
Namun, dalam konteks bab ini, kita memperhatikan sejauh mana rata-rata sampel berbeda
136 Pengantar Konsep Statistik
dari beberapa nilai rata-rata yang dihipotesiskan. Kita dapat membuat variasi dari
Pengantar Pengujian Hipotesis: Inferensi Tentang Mean Tunggal 1
skor z untuk menguji hipotesis tentang rata-rata tunggal. Dalam situasi ini, kita prihatin
dengan distribusi sampling rata-rata (diperkenalkan pada Bab 5), sehingga persamaan
harus mencerminkan rata-rata daripada skor mentah. Persamaan skor z kami untuk
menguji hipotesis tentang rata-rata tunggal menjadi
kamu. 0
z.
.kamu
di mana
-
kamuadalah mean sampel untuk variabel Y
0 adalah nilai rata-rata yang dihipotesiskan untuk variabel Y
–adalah kesalahan standar populasi rata-rata untuk variabel Y
k
Dari Bab 5, ingatlah bahwa kesalahan standar populasi rata-rata – dihitung dengan
k
.kamu
. .k Sebuah
di mana
Y adalah simpangan baku populasi untuk variabel Y n
adalah ukuran sampel
Jadi, pembilang persamaan skor z adalah selisih antara rata-rata sampel dan nilai rata-
rata yang dihipotesiskan, dan penyebutnya adalah kesalahan standar rata-rata. Apa yang
sebenarnya kita tentukan di sini adalah berapa banyak standar deviasi (atau kesalahan
standar) rata-rata sampel dari rata-rata yang dihipotesiskan. Untuk selanjutnya, kami
menyebut variasi skor z ini sebagai statistik uji untuk uji rata-rata tunggal, yang juga
dikenal sebagai uji z. Ini adalah yang pertama dari beberapa statistik uji yang kami
jelaskan dalam teks ini; setiap uji inferensial memerlukan beberapa statistik uji untuk
tujuan pengujian hipotesis.
Kita perlu membuat asumsi statistik mengenai situasi pengujian hipotesis ini. Kami
berasumsi bahwa z terdistribusi normal dengan rata-rata 0 dan standar deviasi 1. Ini
ditulis secara statistik sebagai z N (0, 1) mengikuti notasi yang kami kembangkan pada
Bab 4. Jadi, asumsinya adalah bahwa z mengikuti distribusi normal satuan (dengan kata
lain, bentuk distribusi mendekati normal). Pemeriksaan statistik uji kami z
mengungkapkan bahwa hanya rata-rata sampel yang dapat bervariasi dari sampel ke
sampel. Nilai hipotesis dan kesalahan standar rata-rata adalah konstan untuk setiap
sampel berukuran n dari populasi yang sama. Untuk membuat keputusan statistik,
daerah kritis perlu didefinisikan. Karena statistik uji adalah z dan kami mengasumsikan
normalitas, maka distribusi teoritis yang relevan yang kita bandingkan dengan statistik
uji adalah distribusi normal satuan. Kami sebelumnya membahas distribusi ini di Bab 4,
dan tabel nilai diberikan pada Tabel A.1. Jika hipotesis alternatif adalah nondirectional,
maka akan ada dua daerah kritis, satu di ekor atas dan satu di ekor bawah. Di sini kita
akan membagi area wilayah kritis, yang dikenal sebagai , menjadi dua. Jika hipotesis
alternatifnya terarah, maka hanya akan ada satu daerah kritis, baik di dikenal sebagai ,
dalam dua. Jika hipotesis alternatifnya terarah, maka hanya akan ada satu daerah kritis,
baik di dikenal sebagai , dalam dua. Jika hipotesis alternatifnya terarah, maka hanya
akan ada satu daerah kritis, baik di
ekor atas atau ekor bawah, tergantung arah mana yang mau menolak H0.
6.5.2 Contoh
Mari kita ilustrasikan penggunaan uji inferensial ini melalui sebuah contoh. Kami
tertarik untuk menguji apakah populasi mahasiswa program sarjana dari Awesome State
University (ASU) memiliki nilai rata-rata tes kecerdasan yang berbeda dengan nilai rata-
rata yang dihipotesiskan.
138 Pengantar Konsep Statistik
0 = 100 (ingat bahwa nilai rata-rata yang dihipotesiskan tidak berasal dari sampel kami
tetapi dari sumber lain; dalam contoh ini, mari kita katakan bahwa nilai 100 ini adalah
norma nasional seperti yang disajikan dalam manual teknis tes kecerdasan khusus ini).
Ingatlah bahwa langkah pertama kita dalam pengujian hipotesis adalah menyatakan hipotesis.
Sebuah hipotesis alternatif nondirectional menarik karena kita hanya ingin tahu apakah
populasi ini memiliki kecerdasan rata-rata yang berbeda dari nilai yang dihipotesiskan,
baik lebih besar dari atau kurang dari. Dengan demikian, hipotesis nol dan alternatif
dapat ditulis berturut-turut sebagai berikut:
H0: 100 atau
H0: 100 100 0
H1: 100 atau
H1:. . 100 0
Rata-rata sampel - = 103 diamati untuk sampel n = 100 mahasiswa sarjana ASU. Dari
pengembangan tesk inteligensi ini, kita mengetahui bahwa standar deviasi populasi
teoritis adalah Y = 15 (sekali lagi, untuk tujuan ilustrasi, katakanlah standar deviasi
populasi 15 dicatat dalam manual teknis untuk tes ini) .
Langkah kedua kami adalah memilih tingkat signifikansi. Standar tingkat signifikansi dalam
bidang ini adalah tingkat 0,05; dengan demikian, kami melakukan uji signifikansi kami
pada = 0,05.
Langkah ketiga adalah menghitung nilai statistik uji. Untuk menghitung nilai statistik
pengujian kami, pertama-tama kami menghitung kesalahan standar mean (penyebut
rumus statistik pengujian kami) sebagai berikut:
.kamu
. . 15
. . 1.5000
k Sebuah100
Kemudian kita hitung statistik uji z, dimana pembilangnya adalah selisih antara
rata-rata sampel kami(- = 103) dan nilai rata-rata yang = 100), dan pecahan-
k 0
dihipotesiskan (μ
nator adalah kesalahan standar rata-rata:
.kamu 1.5000
Akhirnya, pada langkah terakhir, kami membuat keputusan statistik kami dengan membandingkan
statistik uji z dengan kritisnilai-nilai. Untuk menentukan nilai kritis untuk uji z, kami
menggunakan distribusi normal satuan pada Tabel A.1. Karena = 0,05 dan kita
melakukan pengujian non-arah, kita perlu menemukan nilai kritis untuk ekor atas dan
bawah, di mana luas masing-masing dari dua wilayah kritis sama dengan 0,025 (yaitu,
pemisahan alfa menjadi dua : / 2 atau .05 / 2 = .025). Dari tabel normal satuan, kita
menemukan nilai kritis ini menjadi +1,96 (titik pada sumbu X di mana luas di atas titik
itu sama dengan 0,025) dan 1,96 (titik pada sumbu X di mana luas di bawah titik itu sama
dengan
.025). Seperti yang ditunjukkan pada Gambar 6.2, statistik uji z = 2,00 masuk ke wilayah
kritis ekor atas, hanya sedikit lebih besar dari nilai kritis ekor atas +1,96. Keputusan kami
adalah menolak H0 dan menyimpulkan bahwa populasi ASU dari mana sampel dipilih
memiliki skor kecerdasan rata-rata yang secara statistik signifikan berbeda dari rata-rata
hipotesis 100 pada tingkat signifikansi 0,05.
Cara berpikir yang lebih tepat tentang proses ini adalah dengan menentukan
probabilitas yang tepat untuk mengamati rata-rata sampel yang berbeda dari nilai rata-
rata yang dihipotesiskan. Dari tabel normal satuan, luas di atas z = 2,00 sama dengan
0,0228. Oleh karena itu, luas di bawah z = 2.00 juga sama dengan 0,0228. Jadi, peluang p
untuk mengamati, secara kebetulan, rata-rata sampel 2,00 atau lebih kesalahan standar
(yaitu, z = 2,00) dari nilai rata-rata yang dihipotesiskan 100, di kedua arah, adalah dua
kali tingkat probabilitas yang diamati atau p = ( 2) (.0228) = .0456. Untuk memasukkan ini
Pengantar Pengujian Hipotesis: Inferensi Tentang Mean Tunggal 1
/2 /2
Daerah kritis Daerah kritis
–1.96 +2.00
μ.0Nilai yang +1,96
znilai dihipotesiska znilai zuji nilai statistik
kritis n kritis
GAMBAR 6.2
Daerah kritis misalnya.
konteks nilai-nilai dalam contoh ini, ada yang relatif kecilprobabilitas (kurang dari 5%)
untuk mengamati rata-rata sampel 103 hanya secara kebetulan jika rata-rata populasi
sebenarnya benar-benar 100. Karena probabilitas tepat ini (p = .0456) lebih kecil dari
tingkat signifikansi α = .05, kita tolak H0. Jadi, ada dua pendekatan untuk menangani
probabilitas. Salah satu pendekatan adalah keputusan yang hanya didasarkan pada nilai-
nilai kritis. Kami menolak atau gagal menolak H0 pada tingkat tertentu, tetapi tidak ada
informasi lain yang diberikan. Pendekatan lainnya adalah keputusan berdasarkan
membandingkan probabilitas yang tepat untuk tingkat yang diberikan. Kami menolak
atau gagal menolak H0 pada tingkat tertentu, tetapi kami juga memiliki informasi yang
tersedia tentang kedekatan atau keyakinan dalam keputusan itu.
Untuk contoh ini, perubahan dalam naskah akan dilaporkan berdasarkan
perbandingan nilai p dengan alfa dan dilaporkan sebagai z = 2 (p <.05) atau sebagai z = 2
(p = .0456). (Anda mungkin ingin merujuk ke manual gaya yang relevan dengan disiplin
Anda, seperti Manual Publikasi untuk American Psychological Association (2010), untuk
informasi tentang gaya pelaporan yang direkomendasikan.) Jelas kesimpulannya sama
dengan keduanya. mendekati; itu hanya masalah bagaimana hasilnya dilaporkan.
Sebagian besar program komputer statistik, termasuk SPSS, melaporkan probabilitas
yang tepat sehingga pembaca dapat membuat keputusan berdasarkan tingkat
signifikansi yang mereka pilih sendiri. Program-program ini tidak memberikan nilai
kritis (s), yang hanya ditemukan di lampiran buku teks statistik.
di mana
zcvadalah nilai kritis dari distribusi normal satuan
–adalah kesalahan standar populasi dari mean
k
140 Pengantar Konsep Statistik
CI biasanya dibentuk untuk tes nondirectional atau dua sisi seperti yang ditunjukkan
dalam persamaan. CI akan menghasilkan batas bawah dan batas atas. Jika nilai rata-rata
yang dihipotesiskan berada dalam batas bawah dan batas atas, maka kita akan gagal
menolak H0. Dengan kata lain, jika mean yang dihipotesiskan terkandung dalam (atau
berada di dalam) CI di sekitar mean sampel, maka kita menyimpulkan bahwa mean
sampel dan mean yang dihipotesiskan tidak berbeda secara signifikan dan mean sampel
dapat berasal dari populasi dengan mean yang dihipotesiskan. Jika nilai rata-rata yang
dihipotesiskan berada di luar batas interval, maka kita akan menolak H0. Di sini kita
menyimpulkan bahwa tidak mungkin mean sampel dapat berasal dari populasi dengan
mean yang dihipotesiskan.
Salah satu cara untuk berpikir tentang CI adalah sebagai berikut. Bayangkan kita
mengambil 100 sampel acak dengan ukuran sampel yang sama n, menghitung rata-rata
setiap sampel, dan kemudian membangun setiap 95% CI. Kemudian kita dapat
mengatakan bahwa 95% dari CI ini akan berisi parameter populasi dan 5% tidak.
Singkatnya, 95% dari CI yang dibangun serupa akan berisi parameter populasi. Juga
harus disebutkan bahwa pada tingkat signifikansi tertentu, seseorang akan selalu
memperoleh keputusan statistik yang sama dengan uji hipotesis dan CI. Kedua prosedur
tersebut menggunakan informasi yang sama persis. Uji hipotesis didasarkan pada
estimasi titik; CI didasarkan pada perkiraan interval yang memberikan sedikit lebih
banyak informasi kepada peneliti.
Untuk situasi contoh ASU, 95% CI akan dihitung dengan:
kamu. zcvY 103 1,96 (1,5) 103 2,94 100 (100,06, 105,94)
Dengan demikian, 95% CI berkisar antara 100,06 hingga 105,94. Karena interval tidak
mengandung nilai rata-rata yang dihipotesiskan 100, kami menolak H0 (keputusan yang
sama yang kami dapatkan dengan menjalani langkah-langkah untuk pengujian
hipotesis). Jadi, sangat tidak mungkin rata-rata sampel kami berasal dari distribusi
populasi dengan rata-rata 100.
Contoh Contoh
distribusi kapan distribusi kapan
H"Tidak
0
hujan" H"Tidak
0
hujan"
adalah benar. adalah palsu.
GAMBAR 6.3
Distribusi sampel untuk kasus hujan.
distribusi sampling tanpa hujan di sebelah kiri, ada dua kemungkinan. Pertama, kami
tidak membawa payung dan tidak hujan. Ini adalah bagian yang tidak diarsir di bawah
distribusi pengambilan sampel tanpa hujan di sebelah kiri garis vertikal. Ini adalah
keputusan yang benar, dan probabilitas yang terkait dengan keputusan ini adalah 1 - .
Kedua, kami membawa payung dan tidak hujan. Ini adalah bagian yang diarsir di bawah
distribusi pengambilan sampel tanpa hujan di sebelah kanan garis vertikal. Ini adalah
keputusan yang salah, kesalahan Tipe I, dan probabilitas yang terkait dengan keputusan
ini adalah / 2 baik di bagian atas atau bawah, dan secara kolektif.
Distribusi di sebelah kanan gambar adalah distribusi sampling ketika H0 salah, artinya
pada kenyataannya hujan. Untuk distribusi sampling hujan, ada dua kemungkinan.
Pertama, kami membawa payung dan hujan turun. Ini adalah bagian yang tidak diarsir
di bawah distribusi sampling hujan di sebelah kanan garis vertikal. Ini adalah keputusan
yang benar, dan probabilitas yang terkait dengan keputusan ini adalah 1 - atau pangkat.
Kedua, kami tidak membawa payung dan hujan turun. Ini adalah bagian yang diarsir di
bawah distribusi sampling hujan di sebelah kiri garis vertikal. Ini adalah keputusan yang
salah, kesalahan Tipe II, dan probabilitas yang terkait dengan keputusan ini adalah .
Sebagai ilustrasi kedua, perhatikan kembali contoh situasi tes kecerdasan. Situasi ini-
asi digambarkan pada Gambar 6.4. Distribusi di sisi kiri gambar adalah
distribusi sampling dari - ketika H benar, artinya pada kenyataannya,
-
= 100. Distribusi pada
k 0
sisi kanan gambar adalah distribusi sampling dari Y ketika H1 benar, artinya
pada kenyataannya, = 115 (dan dalam contoh ini, sementara ada dua nilai kritis, hanya
ekor kanan yang penting yang berkaitan dengan distribusi pengambilan sampel H1).
Garis vertikal mewakili nilai kritis untuk memutuskan apakah akan menolak hipotesis
nol atau tidak. Di sebelah kiri garis vertikal kita tidak menolak H0 dan di sebelah kanan
garis vertikal kita menolak H0. Untuk H0 adalah distribusi sampling benar di sebelah
kiri, ada dua kemungkinan. Pertama, kita tidak menolak H0 dan H0 benar-benar benar.
Ini adalah bagian yang tidak diarsir di bawah H0 adalah distribusi sampling yang benar
di sebelah kiri garis vertikal. Ini adalah keputusan yang benar, dan probabilitas yang
terkait dengan keputusan ini adalah 1 - . Kedua, kita tolak H0 dan H0 benar. Ini adalah
bagian yang diarsir di bawah H0 adalah distribusi sampling yang benar di sebelah kanan
garis vertikal.
142 Pengantar Konsep Statistik
Contoh Contoh
distribusi kapan distribusi kapan
H:0 = 100 1
H: = 115
adalah benar. adalah benar
(yaitu,H:
0 = 100 salah).
adalah lebih sedikit kesalahan pengambilan sampel dengan sampel yang lebih besar. Ini
juga akan mengakibatkan garis vertikal dipindahkan ke kiri (sekali lagi dengan demikian
menciptakan daerah kritis yang lebih besar dan dengan demikian memudahkan untuk
menolak hipotesis nol). Faktor ini juga berada di bawah kendali peneliti. Selain itu,
karena sampel yang lebih besar menghasilkan kesalahan standar yang lebih kecil, akan
lebih mudah untuk menolak H0 (semuanya dianggap sama), dan CI yang dihasilkan juga
akan lebih sempit.
Ketiga, daya ditentukan oleh besarnya simpangan baku populasi . Meskipun tidak di
bawah kendali peneliti, saat meningkat, daya berkurang. Jadi, jika meningkat, berarti
variabilitas dalam populasi lebih besar, ini akan menyebabkan kesalahan standar rata-
rata meningkat karena semakin banyak kesalahan pengambilan sampel dengan
variabilitas yang lebih besar. Ini akan mengakibatkan garis vertikal dipindahkan ke
kanan. Jika menurun, berarti variabilitas dalam populasi semakin kecil, hal ini akan
menyebabkan standar error mean menurun karena sampling error semakin kecil dengan
variabilitas yang lebih kecil. Ini akan mengakibatkan garis vertikal dipindahkan ke kiri.
Mengingat, misalnya, uji rata-rata satu sampel, kesalahan standar rata-rata adalah
penyebut dari rumus statistik uji. Ketika istilah kesalahan standar menurun,
Keempat, daya ditentukan oleh perbedaan antara rata-rata populasi sebenarnya dan
nilai rata-rata yang dihipotesiskan 0. Meskipun tidak selalu di bawah kendali peneliti
(hanya dalam eksperimen nyata seperti yang dijelaskan dalam Bab 14), karena perbedaan
antara rata-rata populasi yang sebenarnya dan nilai rata-rata yang dihipotesiskan
meningkat, daya meningkat. Jadi, jika perbedaan antara mean populasi sebenarnya dan
nilai mean yang dihipotesiskan besar, akan lebih mudah untuk menolak H0 dengan
benar. Ini akan menghasilkan pemisahan yang lebih besar antara dua distribusi
sampling. Dengan kata lain, seluruh H1 yang benar distribusi sampling akan digeser ke
kanan. Pertimbangkan, misalnya, uji rata-rata satu sampel. Pembilang adalah selisih
antara rata-rata. Semakin besar pembilangnya (dengan mempertahankan penyebutnya
konstan),
Akhirnya, daya ditentukan oleh arah dan jenis prosedur statistik—apakah kita
melakukan uji satu sisi atau dua sisi serta jenis uji inferensi. Ada kekuatan yang lebih
besar dalam uji satu sisi, seperti ketika > 100, daripada dalam uji dua sisi. Dalam
pengujian satu arah, garis vertikal akan digeser ke kiri, menciptakan daerah penolakan
yang lebih besar. Faktor ini berada di bawah kendali peneliti. Ada juga kekuatan yang
sering lebih besar dalam melakukan parametrik dibandingkan dengan tes inferensi
nonparametrik (kita akan berbicara lebih banyak tentang tes parametrik versus
nonparametrik di bab-bab selanjutnya). Faktor ini berada di bawah kendali peneliti
sampai batas tertentu tergantung pada skala pengukuran variabel dan sejauh mana
asumsi uji parametrik terpenuhi.
Kekuasaan telah menjadi minat dan perhatian yang jauh lebih besar bagi peneliti
terapan dalam beberapa tahun terakhir. Kita mulai dengan membedakan antara
kekuasaan apriori, ketika kekuasaan ditentukan sebagai studi yang sedang direncanakan
atau dirancang (yaitu, sebelum penelitian), dan kekuasaan post hoc, ketika kekuasaan
ditentukan setelah studi telah dilakukan dan data dianalisis.
Untuk kekuatan apriori, jika Anda ingin memastikan sejumlah kekuatan tertentu dalam
sebuah penelitian, maka Anda dapat menentukan ukuran sampel apa yang diperlukan
untuk mencapai tingkat kekuatan seperti itu. Ini membutuhkan input karakteristik seperti , ,
selisih antara dan 0, dan uji satu lawan dua. Atau, seseorang dapat menentukan kekuatan
yang diberikan masing-masing karakteristik tersebut. Inidapat dilakukan baik dengan
menggunakan perangkat lunak statistik [seperti Power and Precision, Ex-Sample, G *
Power (freeware), atau CD yang disediakan dengan teks Murphy, Myors, dan Wolach
(2008)] atau dengan menggunakan tabel [yang paling koleksi itive nitive tabel berada di
Cohen (1988)].
Untuk daya post hoc (juga disebutdaya yang diamati), sebagian besar paket perangkat
lunak statistik (misalnya, SPSS, SAS, STATGRAPHICS) akan menghitung ini sebagai
bagian dari analisis untuk banyak jenis statistik inferensial (misalnya, analisis varians).
144 Pengantar Konsep Statistik
Namun, meskipun kekuatan post hoc adalah
Pengantar Pengujian Hipotesis: Inferensi Tentang Mean Tunggal 1
seperti apa adanya. Di sisi lain, yang lain berpendapat bahwa NHST harus benar-benar
ditinggalkan. Di tengah, namun yang lain berpendapat bahwa NHST harus dilengkapi
dengan ukuran efek. Dalam teks ini, kami telah mengambil jalan tengah dengan
keyakinan bahwa lebih banyak informasi adalah pilihan yang lebih baik.
Mari kita secara resmi memperkenalkan gagasan tentang ukuran efek. Meskipun ada
sejumlah ukuran efek yang berbeda, ukuran yang paling umum digunakan adalah
Cohen's (delta) atau d (1988). Untuk kasus populasi uji rata-rata satu sampel, delta
Cohen dihitung sebagai berikut:
. . 0
. . .
bagian, kami mempertimbangkan berikut: statistik uji untuk kesimpulan tentang mean
ketika standar deviasi populasi tidak diketahui, distribusi t, uji t, dan contoh
menggunakan uji t.
miliknya
Skamu.
Sebuah
Sekarang kita mengestimasi dua parameter populasi: (1) mean populasi, Y, sedang
-
kamu; dan (2) simpangan baku populasi, Y, sedang
diperkirakan
diperkirakan dengan
dengan standar
rata- deviasi sampel, s. Keduanya - dapat
ke bervariasi dari sampel
dan s
kamu kamu kamu
Sampel. Jadi, meskipun kesalahan sampling rata-rata diperhitungkan secara eksplisit dalam
uji z, kita juga perlu memperhitungkan kesalahan pengambilan sampel dari standar
deviasi, yang sama sekali tidak dipertimbangkan oleh uji z. Kami sekarang
mengembangkan tes inferensial baru untuk situasi di mana tidak diketahui. Statistik uji
dikenal sebagai uji t dan dihitung sebagai berikut:
kamu. 0
T.
Skamu
Uji t dikembangkan oleh William Sealy Gossett, juga dikenal dengan nama samaran
Student, yang sebelumnya disebutkan dalam Bab 1. Distribusi normal satuan tidak dapat
digunakan di sini untuk situasi yang tidak diketahui. Distribusi teoritis yang berbeda
harus digunakan untuk menentukan nilai kritis untuk uji t, yang dikenal sebagai
distribusi t.
6.8.2 TDistribusi
Distribusi t adalah distribusi teoritis yang digunakan untuk menentukan nilai kritis dari
uji t. Seperti distribusi normal, distribusi t sebenarnya adalah keluarga distribusi. Ada
distribusi yang berbeda untuk setiap nilai derajat kebebasan. Namun, sebelum kita
melihat lebih dekat pada distribusi t, beberapa diskusi tentang derajat
domkonsepnya adalahdiperlukan.
-
Sebagai contoh, katakanlah kita mengetahui rata-rata sampel Y = 6 untuk ukuran sampel n =
5. Berapa banyak?
dari lima skor yang diamati bebas untuk bervariasi? Jawabannya adalah bahwa empat
skor bebas untuk bervariasi. Jika empat skor yang diketahui adalah 2, 4, 6, dan 8 dan
rata-rata adalah 6, maka skor yang tersisa harus 10. Skor yang tersisa tidak bebas untuk
bervariasi, tetapi sudah ditentukan secara total. Kita melihat ini dalam persamaan
berikut di mana, untuk sampai pada solusi 6, jumlah pembilangnya harus sama dengan
30, dan Y5 harus 10:
Sebuah 5
. Yi .Yi
saya.1 saya.1 2 4 6 8 Y5 6
kamu. Sebuah 5. 5 .
Oleh karena itu, jumlah derajat kebebasan sama dengan 4 dalam kasus khusus ini dan n -
1 secara umum. Untuk uji t yang dipertimbangkan di sini, kami menentukan derajat
kebebasan sebagai
Pengantar Pengujian Hipotesis: Inferensi Tentang Mean Tunggal 1
0.4 1
5
Normal
0,3
Frekuensi relatif
0.2
0.1
0
–404
T
GAMBAR 6.5
Beberapa anggota keluarga distribusi t.
= n - 1 (ν adalah huruf Yunani “nu”). Kami sering menggunakan dalam statistik untuk
menunjukkan beberapa jenis derajat kebebasan.
Cara lain untuk berpikir tentang derajat kebebasan adalah bahwa kita mengetahui
jumlah penyimpangan dari rata-rata harus sama dengan 0 (ingat pembilang tak kuadrat
dari rumus konsep varians). Misalnya, jika n = 10, ada 10 penyimpangan dari mean.
Setelah rata-rata diketahui, hanya sembilan penyimpangan yang bebas untuk bervariasi.
Cara terakhir untuk memikirkan hal ini adalah, secara umum, df = (n - jumlah batasan).
Untuk uji t satu sampel, karena varians populasi tidak diketahui, kita harus
mengestimasinya sehingga menghasilkan satu restriksi. Jadi, df = (n - 1) untuk uji
inferensial khusus ini.
Beberapa anggota keluarga dari distribusi t ditunjukkan pada Gambar 6.5. Distribusi
untuk = 1 memiliki ekor yang lebih tebal dari distribusi normal unit dan puncak yang
lebih pendek. Hal ini menunjukkan bahwa ada kesalahan pengambilan sampel yang
cukup besar dari standar deviasi sampel dengan hanya dua pengamatan (sebagai = 2 - 1 =
1). Untuk = 5, ekornya lebih tipis dan puncaknya lebih tinggi daripada untuk = 1. Dengan
meningkatnya derajat kebebasan, distribusi t menjadi lebih mendekati normal. Untuk =
(yaitu, tak hingga), distribusi t tepat merupakan distribusi normal satuan.
Beberapa karakteristik penting dari distribusi t perlu disebutkan. Pertama, seperti
distribusi normal satuan, mean dari setiap distribusi t adalah 0, dan distribusi t simetris
di sekitar mean dan unimodal. Kedua, tidak seperti distribusi normal satuan yang
memiliki varians 1, varians dari pada distribusi adalah sebagai berikut:
.
2 untuk 2
.
.2
Dengan demikian, varians pada distribusi agak lebih besar dari 1 tetapi mendekati 1 sebagai
meningkat.
Tabel untuk distribusi disajikan pada Tabel A.2, dan gambaran tabel disajikan pada
Gambar 6.6 untuk tujuan ilustrasi. Dalam melihat tabel, setiap header kolom memiliki
dua nilai. Nilai teratas adalah tingkat signifikansi untuk uji satu arah, dilambangkan
dengan 1. Jadi, jika Anda melakukan uji satu sisi pada tingkat signifikansi 0,05, Anda
ingin melihat di kolom angka kedua. Nilai terbawah adalah tingkat signifikansi untuk uji
dua sisi, dilambangkan dengan 2. Jadi, jika Anda melakukan uji dua sisi pada tingkat
signifikansi 0,05, Anda ingin melihat pada kolom angka ketiga. Baris-baris tabel
menunjukkan berbagai derajat kebebasan .
150 Pengantar Konsep Statistik
GAMBAR 6.6
Cuplikan tabel distribusi t.
Jadi, jika = 3, artinya n = 4, Anda ingin mencari di baris ketiga angka. Jika = 3 untuk 1 =
0,05, nilai tabelnya adalah 2,353. Nilai ini mewakili titik persentil ke-95 pada distribusi
dengan tiga derajat kebebasan. Ini karena tabel hanya menyajikan persentil ekor atas.
Karena distribusi t simetris di sekitar 0, persentil ekor bawah adalah nilai yang sama
kecuali untuk perubahan tanda. Persentil kelima untuk tiga derajat kebebasan adalah
2,353. Jadi, untuk hipotesis arah berekor kanan, nilai kritisnya adalah
+2,353, dan untuk hipotesis arah kiri, nilai kritisnya adalah 2,353.
Jika = 120 untuk 1 = 0,05, maka nilai tabelnya adalah 1,658. Jadi, ketika ukuran sampel
dan derajat kebebasan meningkat, nilai t menurun. Ini membuatnya lebih mudah untuk
menolak hipotesis nol ketika ukuran sampel besar.
6.8.3 TUji
Sekarang kita telah membahas distribusi teoretis yang mendasari pengujian rata-rata
tunggal untuk yang tidak diketahui, kita dapat melanjutkan dan melihat pengujian
inferensial. Pertama, hipotesis nol dan alternatif untuk uji t ditulis dengan cara yang
sama seperti untuk uji z yang disajikan sebelumnya. Jadi, untuk uji dua sisi, kami
memiliki notasi yang sama seperti yang disajikan sebelumnya:
H0: 100 atau H0: 100 100 0
H1: 100 atau H1:. . 100 0
Statistik uji t ditulis sebagai berikut:
kamu. 0
T. Skamu
Untuk menggunakan distribusi t teoretis untuk menentukan nilai kritis, kita harus
mengasumsikan bahwa Yi N (μ, 2) dan bahwa pengamatan saling bebas (juga disebut
sebagai "tidak tergantung dan terdistribusi identik" atau IID). Dalam hal distribusi skor
pada Y, dengan kata lain, kita mengasumsikan bahwa populasi skor pada Y berdistribusi
normal dengan beberapa mean populasi dan beberapa varians populasi 2. Asumsi yang
paling penting untuk uji t adalah normalitas populasi. Penelitian konvensional telah
menunjukkan bahwa uji t sangat kuat terhadap nonnormalitas untuk uji dua sisi kecuali
untuk sampel yang sangat kecil (misalnya, n <5). Uji t tidak sekuat nonnormalitas untuk
uji satu arah, bahkan untuk sampel sebesar 40 atau lebih (misalnya, Noreen, 1989;
Wilcox, 1993). Ingat dari Bab 5 tentang teorema limit pusat bahwa ketika ukuran sampel
meningkat, distribusi sampling rata-rata menjadi lebih mendekati normal. Karena bentuk
distribusi populasi mungkin tidak diketahui, secara konservatif seseorang akan lebih
baik melakukan uji dua sisi jika ukuran sampelnya kecil, kecuali jika beberapa bukti
normalitas tersedia.
Pengantar Pengujian Hipotesis: Inferensi Tentang Mean Tunggal 1
Namun, penelitian terbaru (misalnya, Basu & DasGupta, 1995; Wilcox, 1997, 2003)
menunjukkan bahwa penyimpangan kecil dari normalitas dapat mengurangi kesalahan
standar rata-rata (karena standar deviasi lebih besar). Ini dapat mengurangi daya dan
juga memengaruhi kontrol atas kesalahan Tipe I. Dengan demikian, sikap angkuh
tentang mengabaikan nonnormalitas mungkin bukan pendekatan terbaik, dan jika
nonnormalitas menjadi masalah, prosedur lain, seperti uji satu sampel Kolmogorov-
Smirnov nonparametrik, dapat dipertimbangkan. Dalam hal asumsi independensi,
asumsi ini terpenuhi ketika kasus atau unit dalam sampel Anda telah dipilih secara acak
dari populasi. Jadi, sejauh mana asumsi ini terpenuhi tergantung pada desain
pengambilan sampel Anda. Pada kenyataannya,
Nilai kritis untuk distribusi t diperoleh dari tabel t pada Tabel A.2, di mana Anda
memperhitungkan level , apakah pengujiannya satu atau dua sisi, dan derajat kebebasan
= n - 1. Jika statistik uji jatuh ke dalam daerah kritis, seperti yang didefinisikan oleh nilai
kritis, maka kesimpulan kami adalah menolak H0. Jika statistik uji tidak masuk ke dalam
daerah kritis, maka kesimpulan kita adalah gagal menolak H0. Untuk uji t, nilai kritis
bergantung pada ukuran sampel, sedangkan untuk uji z, nilai kritis tidak.
Seperti halnya uji z, untuk uji t, CI untuk 0 dapat dikembangkan. (1 - )% CI terbentuk
dari
kamu. tv skamu
dimana tcv adalah nilai kritis dari tabel t. Jika nilai rata-rata yang dihipotesiskan 0 tidak
terdapat dalam interval tersebut, maka kesimpulan kita adalah menolak H0. Jika nilai
rata-rata yang dihipotesiskan 0 terdapat dalam interval tersebut, maka kesimpulan kita
adalah gagal menolak H0. Prosedur CI untuk uji t kemudian sebanding dengan prosedur
untuk uji z.
6.8.4 Contoh
Mari kita pertimbangkan contoh keseluruhanTproses tes. Seorang pelatih hoki ingin
menentukan apakah kecepatan rata-rata skating timnya berbeda dari kecepatan rata-rata
liga yang dihipotesiskan yaitu 12 detik. Hipotesis dikembangkan sebagai uji dua sisi dan
ditulis sebagai berikut:
Kecepatan skating di sekitar arena ditentukan untuk masing-masing dari 16 pemain (data
diberikan pada Tabel 6.2 dan di situs web sebagai chap6data). Kecepatan rata-rata tim adalah -
= 10 detik dengan standar k
simpangan sY = 1,7889 detik. Kesalahan standar rata-rata kemudian dihitung sebagai berikut:
S 1.7889
ka .16 . 0,4472
m
u
Skamu.
Sebuah
Kami ingin melakukan pengujian pada = 0,05, di mana kami menghitung statistik uji t sebagai
kamu. 0 10 12
T. . . .44.4722
Skamu 0,4472
152 Pengantar Konsep Statistik
TABEL 6.2
Keluaran SPSS untuk Contoh Skating
Data mentah: 8, 12, 9, 7, 8, 10, 9, 11, 13.5, 8.5, 10.5, 9.5, 11.5, 12.5, 9.5, 10.5
Meja berlabel“Statistik 1
Satu Sampel”menyediakan
dasar
SPSS melaporkan kepercayaan
95%
selang selisihyang berarti
Statistik Satu Sampel
bahwa dalam 95% sampel CI,
SEBUAH Berarti Std. Deviasi Std. Kesalahan perbedaan rata-rata populasi
Berarti sebenarnya akan turun antara –
-
Wakt 16 10.000 1.7889 .4472 kamuperbedaan± tCVSkamu -
u –2.00 ± (2.131) (4472)
Interval kepercayaan 95% dari mean (meskipun tidak disediakan oleh SPSS) juga dapat dihitung sebagai:
10 ± 2,131 (0,4472) = 10 ±
dfadalah derajat kebebasan. Tes Satu Sampel (,9530)
Untuk uji t satu sampel,
mereka dihitung sebagai n - - ±ts-=
kamucv Y
Nilai Tes = 12
Interval Keyakinan 95% dari
df
Selisih
Kami beralih ke tabel t pada Tabel A.2 dan menentukan nilai kritis berdasarkan 2 = 0,05
dan = 15 derajat kebebasan. Nilai kritisnya adalah +2.131, yang mendefinisikan wilayah
kritis ekor atas, dan 2.131, yang mendefinisikan wilayah kritis ekor bawah. Karena
statistik uji t (yaitu, 4.4722) jatuh ke wilayah kritis ekor bawah (yaitu, statistik uji kurang
dari nilai kritis ekor bawah), keputusan kami adalah menolak H0 dan menyimpulkan
bahwa kecepatan rata-rata skating tim ini berbeda secara signifikan dari kecepatan rata-
rata liga yang dihipotesiskan pada
0,05 tingkat signifikansi. 95% CI dapat dihitung sebagai berikut:
kamu. tcvsY. 10 2,131 (0,4472) 10 (,9530) (9,0470, 10,9530)
Karena CI tidak mengandung nilai rata-rata yang dihipotesiskan 12, kesimpulan kami
adalah menolak lagi H0. Jadi, ada bukti yang menunjukkan bahwa kecepatan rata-rata
skating tim berbeda dari kecepatan rata-rata liga yang dihipotesiskan yaitu 12 detik.
6.9 SPSS
Di sini kami mempertimbangkan apa yang ditawarkan SPSS dalam cara menguji
hipotesis tentang mean tunggal. Seperti kebanyakan perangkat lunak statistik, uji t
disertakan sebagai opsi dalam SPSS, tetapi uji z tidak. Petunjuk untuk menentukan uji t
satu sampel menggunakan SPSS disajikan terlebih dahulu. Ini diikuti oleh langkah-
langkah tambahan untuk menguji asumsi normalitas.
SEBUAH
Langkah 1
B C
154 Pengantar Konsep Statistik
Langkah 2:Selanjutnya, dari kotak dialog utama “Uji T Satu Sampel”, klik variabelbunga
dari daftar di sebelah kiri (misalnya, waktu), dan pindahkan ke dalam kotak “Uji
Variabel” dengan mengklik tombol panah. Di kanan bawah layar adalah kotak untuk
"Nilai Uji", di mana Anda menunjukkan nilai yang dihipotesiskan (misalnya, 12).
Langkah 2
Pilih variabel
menarik dari daftar di sebelah kiri dan gunakan panah untuk pindah ke
“Variabel Uji” Mengklik
"Pilihan"akan memungkinkan Anda untuk menentukan persentase interval kepercayaan.
kotak di sebelah kanan.
Standarnya adalah 95% (sesuai dengan alfa 0,05).
Langkah 3 (Opsional):Level alpha default di SPSS adalah .05, dan, dengan demikian,
default cor-merespon CI adalah 95%. Jika Anda ingin menguji hipotesis Anda pada
tingkat alfa selain 0,05 (dan dengan demikian memperoleh CI selain 95%), klik tombol
"Opsi" yang terletak di sudut kanan atas kotak dialog utama. Dari sini, persentase CI
dapat disesuaikan agar sesuai dengan tingkat alfa di mana hipotesis Anda sedang diuji.
(Untuk tujuan contoh ini, pengujian telah dibuat menggunakan tingkat alfa 0,05.)
Langkah 3
Hasil uji t satu sampel untuk contoh skating disajikan pada Tabel 6.2.
telah disajikan dalam bab-bab sebelumnya (misalnya, Bab 4), mereka tidak akan diulangi di
sini. Setelah variabel yang diinginkan dipilih dan dipindahkan ke kotak "Daftar Tergantung"
pada kotak dialog "Jelajahi" utama, klik "Plot" di sudut kanan atas. Beri tanda centang pada
kotak untuk "Plot normal dengan tes" dan juga untuk "Histogram."
Pilih variabel
rik dari daftar di sebelah kiri dan gunakan panah untuk pindah ke“Daftar Tergantung”kotak diBaik. Kemudian klik"Plot."
Membangkitkan normalitas
bukti
Histogram
Rata-rata = 10,0 Std. pengembang = 1.789SEBUAH= 16
3
2
Frekuen
0
8.010.0 12.014.0
Wak
tu
156 Pengantar Konsep Statistik
Ada beberapa statistik lain yang dapat digunakan untuk mengukur normalitas juga.
Dengan menggunakan SPSS, kita dapat memperoleh dua uji statistik normalitas.
Kolmogorov – Smirnov (K – S) (Chakravart, Laha, & Roy, 1967) dengan signifikansi
Lilliefors (Lilliefors, 1967) dan Shapiro-Wilk (S – W) (Saphiro & Wilk, 1965) adalah tes
yang memberikan bukti sejauh mana distribusi sampel kami secara statistik berbeda dari
distribusi normal. Uji K – S cenderung konservatif, sedangkan uji S – W biasanya
dianggap lebih kuat dari keduanya untuk menguji normalitas dan direkomendasikan
untuk digunakan dengan ukuran sampel kecil (n <50). Kedua statistik ini dihasilkan dari
pemilihan "Plot Normalitas dengan pengujian". Output untuk uji K – S dan S – W
disajikan sebagai berikut. Seperti yang telah kita pelajari dalam bab ini, ketika
probabilitas yang diamati (mis. e., nilai p yang dilaporkan dalam SPSS sebagai "Sig.")
kurang dari tingkat alfa yang kami nyatakan, maka kami menolak hipotesis nol. Kami
mengikuti aturan interpretasi yang sama di sini. Terlepas dari tes mana (K – S atau S –
W) yang kami periksa, keduanya memberikan bukti yang sama — distribusi sampel
kami secara statistik tidak berbeda secara signifikan dari apa yang diharapkan dari
distribusi normal.
Tes Normalitas
1
diharapkan
-1
–2
6810 1214
Nilai yang
diamati
Pengantar Pengujian Hipotesis: Inferensi Tentang Mean Tunggal 1
0.4
0,3
0.2
0.1
Dev. dari
0,0
–0.1
–0.2
810
Nilai yang 1214
diamati
6.10 G * Kekuatan
Dalam diskusi kami tentang daya yang disajikan sebelumnya dalam bab ini, kami
menunjukkan bahwa ukuran sampel untuk mencapai tingkat daya yang diinginkan
dapat ditentukan secara apriori (sebelum penelitian dilakukan), dan daya yang diamati
juga dapat ditentukan post hoc (setelah penelitian dilakukan). dilakukan) menggunakan
perangkat lunak statistik atau tabel daya. Salah satu program freeware untuk
menghitung daya adalah G*Power
(http://www.psycho.uni-duesseldorf.de/abteilungen/aap/gpower3/), yang dapat
digunakan untuk menghitung ukuran sampel apriori dan analisis daya post
hoc(antara lain). Dengan menggunakan hasil uji t satu sampel yang baru saja dilakukan,
mari kita gunakan G * Power untuk menentukan terlebih dahulu menentukan ukuran
sampel yang diperlukan dengan berbagai parameter yang diperkirakan dan kemudian
menghitung kekuatan post hoc dari pengujian kami.
Langkah 1
Langkah 2
Pilihan default untuk“Jenis Analisis Daya”adalah"Apriori: Hitung ukuran sampel yang diperlukan – diberika
apa yang dianggap banyak orang sebagai kekuatan yang cukup. Namun, untuk tujuan
contoh ini, kami akan menggunakan kekuatan default 0,95. Setelah parameter
ditentukan, cukup klik "Hitung" untuk menghasilkan statistik daya apriori.
Langkah 3
Langkah 4
Itu“Parameter Keluaran”menyediakan
statistik yang relevan dengan input yang ditentukan.
Dalam hal ini, kami tertarik untuk menentukan ukuran sampel yang diperlukan dengan berbagai parameter. Berdasarkan parameter yang ditentukan, kami membutuhkan ukuran sampel 54 untuk
Jika kita telah mengantisipasi ukuran efek yang lebih kecil, katakanlah 0,20, tetapi
membiarkan semua parameter input lainnya tetap sama, ukuran sampel yang diperlukan
yang diperlukan untuk mencapai kekuatan 0,95 meningkat pesat — menjadi 327.
Jika efek kecil diantisipasi, ukuran sampel yang dibutuhkan meningkat pesat untuk mencapai daya yang diinginkan.
Langkah 2–4
Mungkin bermanfaat untuk mengawali hasil uji t satu sampel dengan informasi yang
kami kumpulkan untuk menguji sejauh mana asumsi normalitas terpenuhi. Ini
membantu pembaca dalam memahami bahwa Anda teliti dalam penyaringan data
sebelum melakukan uji inferensi.
Asumsi tambahan dari uji t satu sampel adalah asumsi independensi. Asumsi ini
terpenuhi ketika kasus dalam sampel kami telah dipilih secara acak dari populasi. Ini
adalah asumsi yang sering diabaikan, tetapi penting, bagi para peneliti ketika
mempresentasikan hasil pengujian mereka. Satu atau dua kalimat biasanya cukup untuk
menunjukkan apakah asumsi ini terpenuhi.
Juga diinginkan untuk memasukkan ukuran ukuran efek. Ingat rumus kita untuk
menghitung ukuran efek, d, yang disajikan sebelumnya dalam bab ini. Memasukkan
nilai untuk contoh skating kami, kami menemukan ukuran efek 1.117, yang ditafsirkan
menurut pedoman Cohen (1988) sebagai efek besar:
kamu. .0 10 12
D. . . 1.117
S 1.7889
Ingatlah bahwa untuk uji mean satu sampel, d menunjukkan berapa banyak standar
deviasi mean sampel dari mean yang dihipotesiskan. Jadi, dengan ukuran efek 1.117, ada
164 Pengantar Konsep Statistik
hampir satu dan seperempat unit standar deviasi antara rata-rata sampel kami dan rata-
rata yang dihipotesiskan. Tanda negatif hanya menunjukkan bahwa mean sampel kami
adalah mean yang lebih kecil (karena ini adalah nilai pertama dalam pembilang rumus).
Dalam contoh khusus ini, efek negatif diinginkan karena menunjukkan waktu skating
rata-rata tim lebih cepat daripada rata-rata liga.
Berikut adalah contoh paragraf gaya APA hasil untuk data skating (ingat bahwa ini
akan diawali dengan paragraf yang melaporkan sejauh mana asumsi tes terpenuhi).
Uji t satu sampel dilakukan pada tingkat alfa 0,05 untuk menjawab
pertanyaan penelitian: Apakah kecepatan skating rata-rata tim hoki
berbeda dari kecepatan rata-rata liga 12 detik? Hipotesis nol
menyatakan bahwa kecepatan rata-rata tim tidak akan berbeda dari
kecepatan rata-rata liga 12. Hipotesis alternatif menyatakan bahwa
kecepatan rata-rata tim akan berbeda dari rata-rata liga. Seperti
yang digambarkan pada Tabel 6.2, berdasarkan sampel acak dari 16
skater, ada waktu rata-rata 10 detik, dan standar deviasi 1,7889
detik. Jika dibandingkan dengan rata-rata hipotesis 12 detik, uji
t satu sampel terbukti signifikan secara statistik (t = 4.472, df
= 15, p <.001). Oleh karena itu, hipotesis nol bahwa waktu rata-
rata tim adalah
12 detik ditolak. Ini memberikan bukti yang menunjukkan bahwa
sampel waktu skating rata-rata untuk tim khusus ini secara
statistik berbeda dari waktu skating rata-rata yang dihipotesiskan
di liga. Selain itu, ukuran efek d adalah 1.117, umumnya
ditafsirkan sebagai efek besar (Cohen, 1988), dan menunjukkan
bahwa ada lebih dari satu perbedaan standar deviasi antara waktu
skating rata-rata tim dan liga. Kekuatan post hoc tes, mengingat
ukuran sampel, uji dua sisi, tingkat alpha, dan ukuran efek yang
diamati, adalah 0,96.
6.12 Ringkasan
Dalam bab ini, kami mempertimbangkan situasi pengujian inferensial pertama kami,
menguji hipotesis tentang mean tunggal. Sejumlah topik dan konsep baru dibahas.
Pertama, kami memperkenalkan jenis hipotesis yang digunakan dalam statistik
inferensial, yaitu hipotesis nol atau statistik versus hipotesis ilmiah atau alternatif atau
penelitian. Kedua, kami beralih ke jenis kesalahan keputusan (yaitu, kesalahan Tipe I dan
Tipe II) seperti yang digambarkan oleh tabel keputusan dan diilustrasikan oleh contoh
hujan. Ketiga, tingkat signifikansi diperkenalkan serta jenis hipotesis alternatif (yaitu,
hipotesis alternatif nondirectional vs directional). Keempat, diberikan gambaran tentang
langkah-langkah dalam proses pengambilan keputusan statistik inferensial. Kelima, kami
menguji uji z, yang merupakan uji inferensial tentang mean tunggal ketika standar
deviasi populasi diketahui. Ini diikuti oleh deskripsi yang lebih formal tentang kesalahan
dan kekuatan Tipe II. Kami kemudian membahas gagasan signifikansi statistik versus
signifikansi praktis. Akhirnya, kami mempertimbangkan uji t, yang merupakan uji
inferensial tentang mean tunggal ketika standar deviasi populasi tidak diketahui, dan
kemudian menyelesaikan bab dengan contoh, informasi SPSS, ilustrasi G * Power, dan
penulisan gaya APA. hasil. Pada titik ini, Anda harus memiliki yang merupakan tes
inferensial tentang rata-rata tunggal ketika standar deviasi populasi tidak diketahui, dan
kemudian menyelesaikan bab dengan contoh, informasi SPSS, ilustrasi G * Power, dan
penulisan hasil gaya APA. Pada titik ini, Anda harus memiliki yang merupakan tes
inferensial tentang rata-rata tunggal ketika standar deviasi populasi tidak diketahui, dan
kemudian menyelesaikan bab dengan contoh, informasi SPSS, ilustrasi G * Power, dan
Pengantar Pengujian Hipotesis: Inferensi Tentang Mean Tunggal 1
penulisan hasil gaya APA. Pada titik ini, Anda harus memiliki
166 Pengantar Konsep Statistik
memenuhi tujuan sebagai berikut: (a) mampu memahami konsep dasar pengujian hipotesis,
(b) dapat menggunakan tabel normal dan t tabel, dan (c) dapat memahami, menentukan,
dan menginterpretasikan hasil dari prosedur uji z, uji t, dan CI. Banyak konsep dalam
bab ini terbawa ke dalam tes inferensial lainnya. Dalam bab berikutnya, kita membahas
uji inferensial yang melibatkan perbedaan antara dua cara. Tes inferensial lainnya akan
dibahas dalam bab-bab berikutnya.
Masalah
Masalah Konseptual
H0: 100
H1: 100
a. Ekor atas
b. Ekor bagian bawah
c. Baik ekor atas dan bawah
d. Tidak dapat ditentukan
6.4 Sebuah pertanyaan penelitian menanyakan, "Apakah usia rata-rata anak yang
masuk prasekolah berbeda dari 48 bulan"? Manakah dari berikut ini yang tersirat?
a. Tes arah kiri
b. Tes arah kanan
c. Tes dua sisi
d. Tidak dapat ditentukan berdasarkan informasi ini
Pengantar Pengujian Hipotesis: Inferensi Tentang Mean Tunggal 1
H1: 295
168 Pengantar Konsep Statistik
6.13 Jika mean sampel melebihi mean yang dihipotesiskan sebesar 200 poin, saya
menegaskan bahwa H0 dapat ditolak. Apakah saya benar?
6.14 Saya menegaskan bahwa H0 dapat ditolak dengan keyakinan 100% jika sampel
terdiri dari seluruh populasi. Apakah saya benar?
6.15 Saya menegaskan bahwa 95% CI memiliki lebar yang lebih besar dari 99% CI untuk
rata-rata populasi menggunakan data yang sama. Apakah saya benar?
6.16 Saya menegaskan bahwa nilai kritis z, untuk pengujian rata-rata tunggal, akan
meningkat seiring dengan bertambahnya ukuran sampel. Apakah saya benar?
6.17 Rata-rata distribusi t meningkat dengan meningkatnya derajat kebebasan? Benar
atau salah?
6.18 Ada kemungkinan bahwa hasil uji t satu sampel dan untuk CI yang sesuai akan
berbeda untuk set data dan tingkat signifikansi yang sama. Benar atau salah?
6.19 Lebar CI 95% tidak bergantung pada rata-rata sampel. Benar atau salah?
6.20 Hipotesis nol adalah pernyataan numerik tentang yang mana dari berikut ini?
a. Parameter yang tidak diketahui
b. Parameter yang diketahui
c. Statistik yang tidak diketahui
d. Statistik yang diketahui
Masalah Komputasi
6.1 Dengan menggunakan data yang sama dan metode analisis yang sama, hipotesis
berikut diuji tentang apakah tinggi rata-rata adalah 72 inci. Peneliti A
menggunakan tingkat signifikansi 0,05, dan Peneliti B menggunakan tingkat
signifikansi 0,01:
H72: 72
H1: 1 72
6.3 Berilah nilai numerik untuk setiap uraian berikut dengan mengacu pada
Tmeja.
a. Peringkat persentil dari t5 = 2.015
b. Peringkat persentil dari t20= 1,325
c. Peringkat persentil dari t30= 2.042
d. Rata-rata distribusi t10
e. Median dari distribusi t10
f. Varians dari distribusi t10
g. Persentil ke-95 dari distribusi t14
6.4 Sampel acak pengeluaran mahasiswa mingguan berikut ini diperoleh dari populasi
mahasiswa sarjana yang terdistribusi normal dengan parameter yang tidak
diketahui:
68 56 76 75 62 8172699184
49 75 69 59 70 5365787187
71 74 69 65 64
H0: 74
H1: 74
23.541.252.53.254.54.252.753.25
1.751.52.753.53.253.752.251.51.253.25
H0: 3.0
H1: 3.0
6.6 Dalam populasi, dihipotesiskan bahwa ags memiliki rata-rata masa pakai 100 hari.
Dua puluh lima ags dimiliki di kota Tuscaloosa dan ditemukan memiliki sampel
rata-rata masa pakai 200 hari dengan standar deviasi 216 hari. Apakah mean
sampel di Tuscaloosa berbeda dengan mean populasi?
a. Lakukan uji t dua sisi pada tingkat signifikansi 0,01.
b. Bangun hingga 99% CI.
Masalah Interpretasi
6.1 Menggunakan item 7 dari dataset survei 1 yang dapat diakses dari situs web,
gunakan SPSS untuk melakukan uji t satu sampel untuk menentukan apakah
jumlah rata-rata compact disk yang dimiliki berbeda secara signifikan dari 25, pada
tingkat signifikansi 0,05. . Uji sejauh mana asumsi normalitas telah terpenuhi.
Hitung ukuran efek serta kekuatan post hoc. Kemudian tulis paragraf bergaya APA
yang melaporkan hasil Anda.
6.2 Menggunakan item 14 dari dataset survei 1 yang dapat diakses dari situs web,
gunakan SPSS untuk melakukan uji t satu sampel untuk menentukan apakah rata-
rata jumlah jam tidur berbeda secara signifikan dari 8, pada tingkat signifikansi
0,05. Uji sejauh mana asumsi normalitas telah terpenuhi. Hitung ukuran efek serta
kekuatan post hoc. Kemudian tulis paragraf bergaya APA yang melaporkan hasil
Anda.
Pengantar Pengujian Hipotesis: Inferensi Tentang Mean Tunggal 1