TUGAS SUMMARY
MATA KULIAH STATISTIKA
Oleh :
RHOMIY HANDICAN
NIM. 22169029
Dosen Pengampu:
Prof. Dr. Ahmad Fauzan, M.Pd., M.Sc
Dr. Syafriadi, M.Si
Link : https://www.youtube.com/watch?v=VK-rnA3-41c
Summary
Bab VI Buku Lomax, R, G. & Hahs-Vaughn, D, L., (2012). An Introduction to
Statistical Concepts Third Edition. Routledge : New York London
Summary
Bab VII Buku Jackson. (2009). Research Method and Statistic (A Critical Thinking
Approach) Third Edition. Jacksonville University : Nelson Education, Ltd
Types of Hypotheses
Pengujian hipotesis adalah proses pengambilan keputusan di mana dua
kemungkinan keputusan ditimbang secara statistik. Di satu sisi, hal ini mirip dengan
keputusan lain yang melibatkan dua kemungkinan, seperti apakah Anda akan
membawa payung hari ini atau tidak. Dalam Pengambilan Keputusan statistik, dua
kemungkinan keputusan tersebut dikenal sebagai hipotesis. Data sampel kemudian
digunakan untuk membantu kita memilih salah satu dari keputusan tersebut. Dua jenis
hipotesis yang saling bersaing satu sama lain dikenal sebagai hipotesis nol atau
hipotesis statistik, dilambangkan dengan H0, dan hipotesis ilmiah, alternatif, atau
hipotesis penelitian, dilambangkan dengan H1.
Hipotesis nol atau hipotesis statistik adalah pernyataan tentang nilai parameter
populasi yang tidak diketahui. Mempertimbangkan prosedur yang kita bahas dalam
bab ini, uji rata-rata satu sampel, salah satu contohnya H0 mungkin adalah bahwa
skor IQ rata-rata populasi adalah 100, yang kita nyatakan sebagai;
Secara matematis, kedua persamaan tersebut menyatakan hal yang sama. Versi
di sebelah kiri adalah bentuk yang lebih tradisional dari hipotesis nol yang melibatkan
satu rata-rata. Namun, versi di sebelah kanan menjelaskan kepada pembaca mengapa
istilah "nol" adalah tepat. Artinya, tidak ada perbedaan atau perbedaan "nol" antara
rata-rata populasi dan nilai rata-rata yang dihipotesiskan sebesar 100. Secara umum,
nilai rata-rata yang dihipotesiskan dilambangkan dengan μ0 (di sini μ0 = 100). H0
lainnya mungkin adalah nilai rata-rata populasi ujian statistika sama untuk siswa laki-
laki dan perempuan, yang kita nyatakan sebagai;
di mana
μ1 adalah rata-rata populasi untuk laki-laki
μ2 adalah rata-rata populasi untuk perempuan
Di sini tidak ada perbedaan atau perbedaan "nol" antara dua rata-rata populasi.
Ketika kita melanjutkan ke bab-bab berikutnya, kita akan mengenal hipotesis nol yang
melibatkan parameter populasi lainnya seperti proporsi, varians, dan korelasi.
Hipotesis nol pada dasarnya dibuat oleh peneliti dalam upaya untuk menolak hipotesis
nol dan mendukung hipotesis ilmiah, alternatif, atau hipotesis penelitian kita sendiri.
Dengan kata lain, hipotesis ilmiah adalah apa yang kita yakini sebagai hasil penelitian,
berdasarkan teori dan penelitian sebelumnya. Dengan demikian, kita mencoba
menolak hipotesis nol dan menemukan bukti yang mendukung hipotesis ilmiah kita.
Hipotesis ilmiah H1 untuk kedua contoh kita adalah;
Oleh karena itu, kami tertarik untuk menguji apakah rata-rata populasi untuk
instrumen kecerdasan sama dengan 100, nilai rata-rata yang kami hipotesiskan, atau
tidak sama dengan 100.
Selanjutnya kita mengambil beberapa sampel acak individu dari populasi
orang dewasa. Kita temukan untuk sampel pertama kita Y1 = 105 (yaitu,
menunjukkan rata-rata untuk sampel 1). Melihat informasi untuk sampel 1, rata-rata
sampel adalah sepertiga dari standar deviasi di atas nilai yang dihipotesiskan [yaitu,
dengan menghitung nilai z sebesar (105 - 100)/15 = .3333], sehingga kesimpulan kita
mungkin akan gagal menolak H0. Dengan kata lain, jika rata-rata populasi sebenarnya
adalah 100, maka kita percaya bahwa kita sangat mungkin mengamati rata-rata
sampel 105. Dengan demikian, keputusan kita untuk sampel 1 adalah gagal menolak
H0; namun, ada kemungkinan atau probabilitas bahwa keputusan kita salah. Kita
mengambil sampel kedua dan menemukan Y2 = 115 (yaitu, menunjukkan rata-rata
sampel 2).
Melihat informasi untuk sampel 2, rata-rata sampel adalah satu standar deviasi
di atas nilai yang dihipotesiskan [yaitu, z = (115 - 100)/15 = 1,0000], sehingga
kesimpulan kita mungkin akan gagal menolak H0. Dengan kata lain, jika rata-rata
populasi sebenarnya adalah 100, maka kita percaya bahwa kemungkinan besar kita
akan melihat rata-rata sampel sebesar 115. Dengan demikian, keputusan kita untuk
sampel 2 adalah gagal menolak H0. Namun, ada kemungkinan yang lebih besar lagi
bahwa keputusan kita salah dibandingkan dengan sampel 1; hal ini dikarenakan rata-
rata sampel lebih jauh dari nilai yang dihipotesiskan.
Kita mengambil sampel ketiga dan menemukan Y3 = 190 (yaitu,
menunjukkan rata-rata sampel 3). Melihat informasi untuk sampel 3, rata-rata sampel
adalah enam standar deviasi di atas nilai yang dihipotesiskan [yaitu, z = (190-100) /
15 = 6,0000], sehingga kesimpulannya adalah tolak H0.
Dengan kata lain, jika rata-rata populasi sebenarnya adalah 100, maka kami
percaya bahwa sangat tidak mungkin untuk mengamati rata-rata sampel sebesar 190.
Dengan demikian, keputusan kita untuk sampel 3 adalah menolak H0; namun, ada
beberapa kemungkinan atau probabilitas kecil bahwa keputusan kita salah.
2. Decision-Making Table
Mari kita pertimbangkan Tabel 6.1 sebagai mekanisme untuk memilah-milah
hasil yang mungkin terjadi dalam proses pengambilan keputusan statistik. Tabel
tersebut terdiri dari kasus umum dan kasus khusus. Pertama, pada bagian (a) dari tabel
tersebut, kita memiliki hasil yang mungkin untuk kasus umum. Untuk keadaan alam
atau kenyataan (yaitu, bagaimana keadaan sebenarnya dalam populasi), ada dua
kemungkinan yang berbeda seperti yang digambarkan oleh baris-baris tabel. Entah H0
memang benar atau H0 memang salah. Dengan kata lain, menurut kondisi dunia nyata
dalam populasi, H0 benar atau H0 salah. Harus diakui, kita biasanya tidak tahu apa
kondisi alam yang sebenarnya; namun, kondisi alam itu ada dalam data populasi.
Keadaan alam inilah yang kita coba perkirakan dengan sebaik-baiknya ketika
membuat keputusan statistik berdasarkan data sampel.
Untuk keputusan statistik kita, ada dua kemungkinan yang berbeda seperti
yang digambarkan oleh kolom-kolom pada tabel. Kita gagal menolak H0 atau kita
menolak H0. Dengan kata lain, berdasarkan data sampel kita, kita gagal menolak H0
atau menolak H0. Karena tujuan kita biasanya untuk menolak H0 yang mendukung
hipotesis penelitian kita, kita lebih memilih istilah gagal tolak daripada menerima.
Menerima menyiratkan bahwa Anda bersedia membuang hipotesis penelitian Anda
dan mengakui kekalahan berdasarkan satu sampel. Gagal tolak menyiratkan bahwa
Anda masih memiliki harapan untuk hipotesis penelitian Anda, meskipun bukti dari
satu sampel menunjukkan sebaliknya.
Jika kita melihat ke dalam tabel, kita akan melihat empat hasil yang berbeda
berdasarkan kombinasi keputusan statistik dan keadaan alam. Perhatikan baris
pertama dari tabel di mana H0 pada kenyataannya benar. Pertama, jika H0 benar dan
kita gagal menolak H0, maka kita telah membuat keputusan yang benar; yaitu, kita
telah gagal menolak H0 yang benar. Probabilitas dari hasil pertama ini dikenal
sebagai 1 - α (di mana α mewakili alpha). Kedua, jika H0 benar dan kita menolak H0,
maka kita telah membuat kesalahan keputusan yang dikenal sebagai kesalahan Tipe I.
Artinya, kita telah salah menolak H0 yang benar. Data sampel kita telah membawa
kita pada kesimpulan yang berbeda dari data populasi. Probabilitas dari hasil kedua
ini dikenal sebagai α. Oleh karena itu, jika H0 sebenarnya benar, maka data sampel
kita akan membawa kita pada salah satu dari dua kesimpulan, yaitu kita dengan benar
gagal menolak H0, atau kita salah menolak H0. Jumlah dari probabilitas untuk kedua
hasil ini ketika H0 benar adalah sama dengan 1 [yaitu, (1 - α) + α = 1]. Sekarang
perhatikan baris kedua dari tabel di mana H0 sebenarnya salah. Pertama, jika H0
benar-benar salah dan kita gagal menolak H0, maka kita telah membuat kesalahan
keputusan yang dikenal sebagai kesalahan keputusan Tipe II.
Artinya, kita telah gagal menolak H0 yang salah. Data sampel kita telah
membawa kita pada kesimpulan yang berbeda dari data populasi. Probabilitas dari
hasil ini dikenal sebagai β (beta). Kedua, jika H0 benar-benar salah dan kita menolak
H0, maka kita telah membuat keputusan yang benar; yaitu, kita telah menolak H0
yang salah dengan benar. Probabilitas dari hasil kedua ini dikenal sebagai 1 - β atau
pangkat (akan dibahas lebih lanjut dalam bab ini). Oleh karena itu, jika H0
sebenarnya salah, maka data sampel kita akan membawa kita pada salah satu dari dua
kesimpulan, kita salah menolak H0, atau kita menolak H0 dengan benar. Jumlah dari
probabilitas untuk kedua hasil ini ketika H0 salah adalah sama dengan 1 [yaitu, β + (1
- β) = 1].
Sebagai aplikasi dari tabel ini, pertimbangkan kasus spesifik berikut, seperti
yang ditunjukkan pada bagian (b) dari Tabel 6.1. Kita ingin menguji hipotesis berikut
ini tentang apakah besok akan berlatih atau tidak.
H0: tidak ada hujan besok
H1: hujan besok
Taraf signifikansi atau sering juga disebut dengan tingkat kesalahan erat
kaitannya dengan pengambilan keputusan dalam pengujian hipotesis baik pengujian
hipotesis satu arah (one-tailed) ataupun dua arah (two-tailed). Taraf signifikansi ini
muncul pada penelitian kuantitatif, tapi tidak selamanya penelitian kuantitatif
menggunakannya, tergantung dengan jenis penelitiannya juga ya.
Signifikansi dalam statistik berarti kemungkinan atau berpeluang betul-betul
benar. benar berbeda atau nyata. Dalam penelitian, Taraf signifikansi (α) merupakan
angka yang menunjukkan probabilitas atau peluang kesalahan yang ditetapkan
peneliti dalam mengambil keputusan untuk menolak atau mendukung hipotesis nol,
atau dapat diartikan juga sebagai tingkat kesalahan atau tingkat kekeliruan yang dapat
ditolerir/ ditoleransi oleh peneliti, yang sebabkan kemungkinan adanya kesalahan
dalam pengambilan sampel (sampling error).
Taraf signifikansi dinyatakan dalam bentuk persen dan dilambangkan dengan
α (alpha). Pada umumnya dalam penelitian nilai tingkat kesalahan yang digunakan
adalah 1%, 5% ataupun 10%. Semakin kecil nilainya, maka semakin besar tingkat
kepercayaan pengambilan keputusan. Pada penelitian pendidikan atau sosial ekonomi
sering digunakan 5%, namun dalam ekonomipun sering juga digunakan 10%,
sedangkan 1% digunakan untuk penelitian kesehatan karna pada penelitian kesehatan
atau penelitian yang berkaitan dengan keselamatan dengan keberlangsungan makhluk
hidup sehingga diperlukan tingkat kesalahan sekecil mungkin.
Sebagai contoh misalkan kita menggunakan tingkat kesalahan 5%, maka jika
dari 100 sampel penelitian, maka kesalahan pengambilan sampel yang masih bisa
diterima yaitu 5 sampel (5% dari 100), atau jika dikaitkan dengan pengujian hipotesis,
tingkat kesalahan 5% atau 0,05 artinya kita mengambil resiko salah dalam mengambil
keputusan untuk menolak hipotesis yang benar maksimal 5% dan benar dalam
mengambil keputusan sedikitnya 95% (tingkat kepercayaan).
Kita juga dapat memilih salah satu dari hipotesis alternatif terarah yang telah
dijelaskan sebelumnya.
Jika kita memilih untuk menulis hipotesis nol kita sebagai H0: μ = 100, kita
ingin menulis hipotesis penelitian kita dengan cara yang konsisten, H1: μ ≠ 100
(daripada H1: μ - 100 ≠ 0). Dalam publikasi, banyak peneliti memilih untuk
menyajikan hipotesis dalam bentuk naratif (misalnya, "hipotesis nol menyatakan
bahwa rata-rata populasi akan sama dengan 100, dan hipotesis alternatif menyatakan
bahwa rata-rata populasi tidak akan sama dengan 100"). Bagaimana Anda menyajikan
hipotesis Anda (secara matematis atau menggunakan notasi statistik) terserah Anda.
Langkah 2: Langkah kedua dalam proses pengambilan keputusan adalah
memilih tingkat signifikansi α. Ada dua pertimbangan yang harus dilakukan dalam
memilih tingkat signifikansi. Salah satu pertimbangannya adalah biaya yang terkait
dengan membuat kesalahan Tipe I, yang sebenarnya adalah α. Ingatlah bahwa alpha
adalah probabilitas untuk menolak hipotesis nol jika pada kenyataannya hipotesis nol
itu benar. Ketika kesalahan Tipe I terjadi, itu berarti bukti-bukti yang ada mendukung
hipotesis penelitian (yang sebenarnya salah). Mari kita ambil contoh sebuah obat baru.
Untuk menguji keampuhan obat tersebut, sebuah eksperimen dilakukan di mana
beberapa orang mengonsumsi obat baru tersebut sementara yang lain menerima
plasebo. Hipotesis nol, yang dinyatakan secara tidak langsung, pada dasarnya akan
menunjukkan bahwa efek obat dan plasebo adalah sama. Menolak hipotesis nol
tersebut berarti bahwa efeknya tidak sama-menunjukkan bahwa mungkin obat baru ini,
yang pada kenyataannya tidak lebih baik dari plasebo, disebut-sebut sebagai obat
yang efektif. Hal ini jelas bermasalah dan berpotensi sangat berbahaya. Jadi, jika ada
biaya yang relatif tinggi yang terkait dengan kesalahan Tipe I-misalnya, seperti nyawa
melayang, seperti dalam profesi medis-maka kita akan memilih tingkat signifikansi
yang relatif kecil (misalnya, 0,01 atau lebih kecil). Alfa yang kecil akan menghasilkan
probabilitas yang sangat kecil untuk menolak null jika memang benar (yaitu,
probabilitas yang kecil untuk membuat keputusan yang salah). Jika ada biaya yang
relatif rendah yang terkait dengan kesalahan Tipe I-misalnya, sehingga anak-anak
harus memakan permen dengan nilai kedua daripada yang pertama-maka memilih
tingkat signifikansi yang lebih besar mungkin tepat (misalnya, 0,05 atau lebih besar).
Akan tetapi, biaya tidak selalu diketahui. Pertimbangan kedua adalah tingkat
signifikansi yang biasa digunakan dalam bidang studi Anda. Dalam banyak disiplin
ilmu, tingkat signifikansi 0,05 telah menjadi standar (meskipun tampaknya tidak ada
yang memiliki alasan yang benar-benar baik). Hal ini berlaku dalam banyak ilmu
sosial dan perilaku. Oleh karena itu, sebaiknya Anda membaca literatur yang
dipublikasikan di bidang Anda untuk mengetahui apakah ada standar yang umum
digunakan dan mempertimbangkannya untuk penelitian Anda sendiri.
Langkah 3: Langkah ketiga dalam proses pengambilan keputusan adalah
menghitung statistik uji. Untuk uji rata-rata satu sampel, kita akan menghitung rata-
rata sampel Y- dan membandingkannya dengan nilai yang dihipotesiskan μ0. Hal ini
memungkinkan kita untuk menentukan ukuran perbedaan antara Y dan μ0, dan
selanjutnya, probabilitas yang terkait dengan perbedaan tersebut. Semakin besar
perbedaannya, semakin besar kemungkinan bahwa rata-rata sampel benar-benar
berbeda dari nilai rata-rata yang dihipotesiskan dan semakin besar probabilitas yang
terkait dengan perbedaan tersebut.
Langkah 4: Langkah keempat dan terakhir dalam proses pengambilan
keputusan adalah membuat keputusan statistik mengenai hipotesis nol H0. Artinya,
keputusan dibuat apakah akan menolak H0 atau gagal menolak H0. Jika perbedaan
antara rata-rata sampel dan nilai yang dihipotesiskan cukup besar relatif terhadap nilai
kritis (kita akan membahas tentang nilai kritis secara lebih rinci nanti), maka
keputusan kita adalah menolak H0. Jika perbedaan antara rata-rata sampel dan nilai
yang dihipotesiskan tidak cukup besar relatif terhadap nilai kritis, maka keputusan
kita adalah gagal menolak H0. Ini adalah proses empat langkah dasar untuk pengujian
hipotesis dari setiap uji inferensial. Rincian spesifik untuk pengujian rata-rata tunggal
diberikan di bagian berikut.
di mana
Yi adalah skor pada variabel Y untuk individu ke-I
μ adalah rata-rata populasi untuk variabel Y
σY adalah deviasi standar populasi untuk variabel Y
Nilai z digunakan untuk memberi tahu kita berapa unit standar deviasi skor
individu dari nilai rata-rata.
Namun, dalam konteks bab ini, kita akan membahas sejauh mana rata-rata
sampel berbeda dari nilai rata-rata yang dihipotesiskan. Kita dapat membuat variasi
dari skor z untuk menguji hipotesis tentang rata-rata tunggal. Dalam situasi ini, kita
peduli dengan distribusi sampling dari mean (diperkenalkan di Bab 5), sehingga
persamaan harus mencerminkan nilai rata-rata dan bukan nilai mentah. Persamaan
nilai z kita untuk menguji hipotesis tentang mean tunggal menjadi;
di mana
Dimana:
Y- adalah rata-rata sampel untuk variabel Y
μ0 adalah nilai rata-rata yang dihipotesiskan untuk variabel Y
σY- adalah kesalahan standar populasi dari rata-rata untuk variabel Y
ingat bahwa galat standar populasi dari rata-rata σY- dihitung dengan;
di mana
σY adalah deviasi standar populasi untuk variabel Y
n adalah ukuran sampel
2) Example
Menguji apakah populasi mahasiswa S1 dari Awesome State University (ASU)
memiliki nilai rata-rata tes inteligensi yang berbeda dengan nilai rata-rata yang
dihipotesiskan, yaitu μ0 = 100 (ingatlah bahwa nilai rata-rata yang dihipotesiskan
bukan berasal dari sampel kita, melainkan dari sumber lain; pada contoh ini,
katakanlah nilai 100 ini adalah norma nasional seperti yang disajikan pada buku
panduan teknis tes inteligensi ini). Ingatlah bahwa langkah pertama kita dalam
pengujian hipotesis adalah menyatakan hipotesis. Hipotesis alternatif nondireksional
menjadi menarik karena kita hanya ingin mengetahui apakah populasi ini memiliki
rata-rata kecerdasan yang berbeda dari nilai yang dihipotesiskan, lebih besar atau
lebih kecil dari. Dengan demikian, hipotesis nol dan hipotesis alternatif dapat
dituliskan sebagai berikut:
di mana
zcv adalah nilai kritis dari distribusi normal satuan
σY- adalah kesalahan standar populasi dari rata-rata
CI biasanya dibentuk untuk uji satu arah atau uji dua ekor seperti yang
ditunjukkan dalam persamaan. CI akan menghasilkan batas bawah dan batas atas. Jika
nilai rata-rata yang dihipotesiskan berada di dalam batas bawah dan batas atas, maka
kita akan gagal menolak H0. Dengan kata lain, jika nilai rata-rata yang dihipotesiskan
berada di dalam (atau berada di dalam) CI di sekitar nilai rata-rata sampel, maka kita
menyimpulkan bahwa nilai rata-rata sampel dan nilai rata-rata yang dihipotesiskan
tidak berbeda secara signifikan dan nilai rata-rata sampel dapat berasal dari populasi
yang memiliki nilai rata-rata yang dihipotesiskan. Jika nilai rata-rata yang
dihipotesiskan berada di luar batas interval, maka kita akan menolak H0. Di sini kita
menyimpulkan bahwa kecil kemungkinan rata-rata sampel berasal dari populasi
dengan rata-rata yang dihipotesiskan.
Salah satu cara untuk berpikir tentang CI adalah sebagai berikut. Bayangkan
kita mengambil 100 sampel acak dengan ukuran sampel n yang sama, menghitung
setiap rata-rata sampel, dan kemudian membuat masing-masing 95% CI. Kemudian
kita dapat mengatakan bahwa 95% dari CI ini akan mengandung parameter populasi
dan 5% tidak. Singkatnya, 95% dari CI yang dibangun dengan cara yang sama akan
mengandung parameter populasi. Perlu juga disebutkan bahwa pada tingkat
signifikansi tertentu, seseorang akan selalu mendapatkan keputusan statistik yang
sama dengan uji hipotesis dan CI. Kedua prosedur tersebut menggunakan informasi
yang sama persis. Uji hipotesis didasarkan pada estimasi titik; CI didasarkan pada
estimasi interval yang memberikan informasi lebih banyak kepada peneliti. Untuk
contoh situasi ASU, 95% CI akan dihitung dengan ;
2) Power Determinants
Kekuatan ditentukan oleh lima faktor yang berbeda: (1) tingkat signifikansi, (2)
ukuran sampel, (3) deviasi standar populasi, (4) perbedaan antara rata-rata populasi
yang sebenarnya μ dan nilai rata-rata yang dihipotesiskan μ0, dan (5) arah pengujian
(yaitu, uji satu atau dua ekor). Mari kita bahas masing-masing faktor ini secara lebih
rinci.
Pertama, kekuatan ditentukan oleh tingkat signifikansi α. Ketika α meningkat,
kekuatan meningkat. Dengan demikian, jika α meningkat dari 0,05 menjadi 0,10,
maka power akan meningkat. Hal ini akan terjadi pada Gambar 6.4 jika garis vertikal
digeser ke kiri (sehingga menciptakan daerah kritis yang lebih besar dan dengan
demikian membuatnya lebih mudah untuk menolak hipotesis nol). Hal ini akan
meningkatkan tingkat α dan juga meningkatkan daya. Faktor ini berada di bawah
kendali peneliti.
Kedua, power ditentukan oleh ukuran sampel. Ketika ukuran sampel n
meningkat, power juga meningkat. Dengan demikian, jika ukuran sampel meningkat,
yang berarti kita memiliki sampel yang terdiri dari proporsi yang lebih besar dari
populasi, hal ini akan menyebabkan kesalahan standar dari rata-rata menurun, karena
ada lebih sedikit kesalahan pengambilan sampel dengan sampel yang lebih besar. Hal
ini juga akan menyebabkan garis vertikal bergeser ke kiri (sekali lagi sehingga
menciptakan daerah kritis yang lebih besar dan dengan demikian membuatnya lebih
mudah untuk menolak hipotesis nol). Faktor ini juga berada di bawah kendali peneliti.
Selain itu, karena sampel yang lebih besar menghasilkan kesalahan standar yang lebih
kecil, maka akan lebih mudah untuk menolak H0 (semua hal lain dianggap sama), dan
CI yang dihasilkan juga akan lebih sempit.
Ketiga, power ditentukan oleh ukuran deviasi standar populasi σ. Meskipun
tidak berada di bawah kendali peneliti, ketika σ meningkat, power menurun. Dengan
demikian, jika σ meningkat, yang berarti variabilitas dalam populasi lebih besar, hal
ini akan menyebabkan kesalahan standar rata-rata meningkat karena ada lebih banyak
kesalahan pengambilan sampel dengan variabilitas yang lebih besar. Hal ini akan
menyebabkan garis vertikal bergeser ke kanan. Jika σ menurun, yang berarti
variabilitas dalam populasi lebih kecil, hal ini akan menyebabkan kesalahan standar
rata-rata menurun karena ada lebih sedikit kesalahan pengambilan sampel dengan
variabilitas yang lebih kecil. Hal ini akan menyebabkan garis vertikal bergeser ke kiri.
Sebagai contoh, pada uji rata-rata satu sampel, kesalahan standar dari rata-rata adalah
penyebut dari rumus statistik uji. Ketika standar error term menurun, penyebutnya
menjadi lebih kecil dan dengan demikian nilai statistik uji menjadi lebih besar (dan
dengan demikian lebih mudah untuk menolak hipotesis nol).
Keempat, daya ditentukan oleh perbedaan antara rata-rata populasi yang
sebenarnya μ dan nilai rata-rata yang dihipotesiskan μ0. Meskipun tidak selalu berada
di bawah kendali peneliti (hanya dalam eksperimen yang sebenarnya seperti yang
dijelaskan dalam Bab 14), ketika perbedaan antara rata-rata populasi yang sebenarnya
dan nilai rata-rata yang dihipotesiskan meningkat, daya meningkat. Dengan demikian,
jika perbedaan antara rata-rata populasi yang sebenarnya dan nilai rata-rata yang
dihipotesiskan besar, maka akan lebih mudah untuk menolak H0 dengan benar. Hal
ini akan menghasilkan pemisahan yang lebih besar antara dua distribusi sampling.
Dengan kata lain, seluruh distribusi sampling H1 yang benar akan bergeser ke kanan.
Sebagai contoh, pertimbangkan uji rata-rata satu sampel. Pembilangnya adalah selisih
antara rata-rata. Semakin besar pembilangnya (dengan menjaga penyebutnya tetap
konstan), semakin besar kemungkinan untuk menolak hipotesis nol.
Terakhir, kekuatan ditentukan oleh arah dan jenis prosedur statistik - apakah
kita melakukan uji satu atau dua sisi, serta jenis uji kesimpulan. Ada kekuatan yang
lebih besar dalam uji satu sisi, seperti ketika μ > 100, dibandingkan dengan uji dua
sisi. Pada uji satu sisi, garis vertikal akan bergeser ke kiri, sehingga menciptakan
wilayah penolakan yang lebih besar. Faktor ini berada di bawah kendali peneliti.
Sering kali terdapat kekuatan yang lebih besar dalam melakukan uji parametrik
dibandingkan dengan uji nonparametrik untuk menyimpulkan (kita akan membahas
lebih lanjut mengenai uji parametrik versus nonparametrik di bab-bab selanjutnya).
Faktor ini berada di bawah kendali peneliti sampai batas tertentu tergantung pada
skala pengukuran variabel dan sejauh mana asumsi uji parametrik terpenuhi.
Kekuasaan telah menjadi minat dan perhatian yang jauh lebih besar bagi
peneliti terapan dalam beberapa tahun terakhir. Kita mulai dengan membedakan
antara kekuatan apriori, ketika kekuatan ditentukan saat penelitian sedang
direncanakan atau dirancang (yaitu, sebelum penelitian), dan kekuatan post hoc,
ketika kekuatan ditentukan setelah penelitian dilakukan dan data dianalisis. Untuk
kekuatan a priori, jika Anda ingin memastikan jumlah kekuatan tertentu dalam sebuah
penelitian, maka Anda dapat menentukan ukuran sampel yang diperlukan untuk
mencapai tingkat kekuatan tersebut. Hal ini membutuhkan input karakteristik seperti α,
σ, perbedaan antara μ dan μ0, dan uji satu versus dua ekor. Sebagai alternatif,
seseorang dapat menentukan kekuatan yang diberikan masing-masing karakteristik
tersebut. Hal ini dapat dilakukan dengan menggunakan perangkat lunak statistik
[seperti Power and Precision, Ex-Sample, G*Power (freeware), atau CD yang
disertakan dengan teks Murphy, Myors, dan Wolach (2008)] atau dengan
menggunakan tabel [kumpulan tabel yang paling pasti ada di Cohen (1988)]. Untuk
kekuatan post hoc (juga disebut kekuatan yang diamati), sebagian besar paket
perangkat lunak statistik (misalnya, SPSS, SAS, STATGRAPHICS) akan
menghitungnya sebagai bagian dari analisis untuk berbagai jenis statistik inferensial
(misalnya, analisis varians). Namun, meskipun kekuatan post hoc secara rutin
dilaporkan dalam beberapa jurnal, hal ini telah ditemukan memiliki beberapa
kekurangan. Sebagai contoh, Hoenig dan Heisey (2001) menyimpulkan bahwa hal ini
tidak boleh digunakan untuk membantu dalam menafsirkan hasil yang tidak signifikan.
Mereka menemukan bahwa kekuatan yang rendah dapat mengindikasikan efek yang
kecil (misalnya, perbedaan rata-rata yang kecil) daripada studi yang kurang kuat.
Dengan demikian, meningkatkan ukuran sampel mungkin tidak membuat banyak
perbedaan. Yuan dan Maxwell (2005) menemukan bahwa daya yang diamati hampir
selalu bias (terlalu tinggi atau terlalu rendah), kecuali jika daya yang sebenarnya
adalah 0,50. Oleh karena itu, kami tidak merekomendasikan penggunaan post hoc
power untuk menentukan ukuran sampel pada penelitian berikutnya; namun kami
merekomendasikan penggunaan CI sebagai tambahan dari post hoc power. (Contoh
yang disajikan kemudian dalam bab ini akan menggunakan G*Power untuk
mengilustrasikan persyaratan ukuran sampel apriori yang diberikan dengan kekuatan
yang diinginkan dan analisis post hoc power).
Untuk uji rata-rata satu sampel, d menunjukkan berapa banyak deviasi standar
dari rata-rata sampel dari rata-rata yang dihipotesiskan. Dengan demikian, jika d = 1.0,
rata-rata sampel adalah satu standar deviasi dari rata-rata yang dihipotesiskan. Cohen
telah mengusulkan standar subjektif berikut untuk ilmu sosial dan perilaku sebagai
konvensi untuk menginterpretasikan d: ukuran efek kecil, d = .2; ukuran efek sedang,
d = .5; ukuran efek besar, d = .8. Interpretasi ukuran efek harus selalu dibuat terlebih
dahulu berdasarkan perbandingan dengan penelitian serupa; apa yang dianggap
sebagai efek "kecil" menggunakan aturan praktis Cohen mungkin sebenarnya cukup
besar jika dibandingkan dengan penelitian terkait lainnya yang telah dilakukan.
Sebagai pengganti perbandingan dengan penelitian lain, seperti dalam kasus-kasus di
mana tidak ada atau sedikit penelitian terkait, maka standar subyektif Cohen mungkin
sesuai.
Menghitung CI untuk ukuran efek juga bermanfaat. Manfaat dalam membuat
CI untuk nilai ukuran efek serupa dengan membuat CI untuk estimasi parameter-CI
untuk ukuran efek memberikan ukuran presisi tambahan yang tidak diperoleh dari
pengetahuan tentang ukuran efek saja. Namun, menghitung CI untuk indeks ukuran
efek tidak semudah memasukkan nilai yang diketahui ke dalam rumus. Hal ini karena
d merupakan fungsi dari rata-rata populasi dan standar deviasi populasi (Finch &
Cumming, 2009). Oleh karena itu, perangkat lunak khusus harus digunakan untuk
menghitung CI untuk ukuran efek, dan pembaca yang tertarik dirujuk ke sumber yang
sesuai (misalnya, Algina & Keselman, 2003; Algina, Keselman, & Penfield, 2005;
Cumming & Finch, 2001).
Uji t dikembangkan oleh William Sealy Gossett, yang juga dikenal dengan
nama samaran Student, yang telah disebutkan sebelumnya di Bab 1. Distribusi normal
satuan tidak dapat digunakan di sini untuk situasi σ yang tidak diketahui. Distribusi
teoritis yang berbeda harus digunakan untuk menentukan nilai kritis untuk uji t, yang
dikenal sebagai distribusi t.
2) Distribution t
Distribusi t adalah distribusi teoritis yang digunakan untuk menentukan nilai
kritis dari uji t. Seperti distribusi normal, distribusi t sebenarnya adalah sebuah
keluarga distribusi. Terdapat distribusi t yang berbeda untuk setiap nilai derajat
kebebasan. Namun, sebelum kita melihat lebih dekat pada distribusi t, beberapa
diskusi tentang konsep derajat kebebasan diperlukan. Sebagai contoh, katakanlah kita
mengetahui rata-rata sampel Y- = 6 untuk ukuran sampel n = 5. Berapa banyak dari
lima skor yang diamati yang bebas bervariasi? Jawabannya adalah empat skor bebas
bervariasi. Jika empat skor yang diketahui adalah 2, 4, 6, dan 8 dan rata-ratanya
adalah 6, maka skor yang tersisa haruslah 10. Skor yang tersisa tidak bebas bervariasi,
tetapi sudah ditentukan sepenuhnya. Kita dapat melihat hal ini pada persamaan
berikut di mana, untuk mendapatkan solusi 6, jumlah pada pembilang harus sama
dengan 30, dan Y5 harus 10:
Oleh karena itu, jumlah derajat kebebasan sama dengan 4 dalam kasus khusus
ini dan n - 1 secara umum. Untuk uji t yang dipertimbangkan di sini, kami
menetapkan derajat kebebasan sebagai ν = n - 1 (ν adalah huruf Yunani "nu"). Kita
sering menggunakan ν dalam statistik untuk menunjukkan beberapa jenis derajat
kebebasan.
Cara lain untuk berpikir tentang derajat kebebasan adalah bahwa kita tahu
jumlah penyimpangan dari rata-rata harus sama dengan 0 (ingat pembilang yang tidak
dikuadratkan dari rumus konseptual varians). Sebagai contoh, jika n = 10, ada 10
penyimpangan dari rata-rata. Setelah nilai rata-rata diketahui, hanya sembilan deviasi
yang bebas bervariasi. Cara terakhir untuk memikirkan hal ini adalah, secara umum,
df = (n - jumlah batasan). Untuk uji t satu sampel, karena varians populasi tidak
diketahui, kita harus mengestimasinya dengan satu batasan. Dengan demikian, df = (n
- 1) untuk uji inferensial khusus ini. Beberapa anggota keluarga distribusi t
ditunjukkan pada Gambar 6.5. Distribusi untuk ν = 1 memiliki ekor yang lebih tebal
daripada distribusi normal satuan dan puncak yang lebih pendek. Hal ini
mengindikasikan bahwa terdapat kesalahan pengambilan sampel yang cukup besar
dari deviasi standar sampel dengan hanya dua pengamatan (karena ν = 2 - 1 = 1).
Untuk ν = 5, ekornya lebih tipis dan puncaknya lebih tinggi dibandingkan dengan ν =
1. Dengan meningkatnya derajat kebebasan, distribusi t menjadi lebih mendekati
normal. Untuk ν = ∞ (yaitu, tak terhingga), distribusi t justru merupakan distribusi
normal satuan.
Dengan demikian, varians dari distribusi t agak lebih besar dari 1 tetapi
mendekati 1 ketika ν meningkat. Tabel untuk distribusi t diberikan pada Tabel A.2,
dan cuplikan dari tabel tersebut disajikan pada Gambar 6.6 untuk tujuan ilustrasi.
Dalam melihat tabel tersebut, setiap judul kolom memiliki dua nilai. Nilai paling atas
adalah tingkat signifikansi untuk uji satu sisi, dilambangkan dengan α1. Dengan
demikian, jika Anda melakukan uji satu sisi pada tingkat signifikansi 0,05, Anda
dapat melihat pada kolom angka kedua. Nilai paling bawah adalah tingkat signifikansi
untuk uji dua sisi, dilambangkan dengan α2. Jadi, jika Anda melakukan uji dua sisi
pada tingkat signifikansi .05, Anda harus melihat pada kolom angka ketiga. Baris-
baris pada tabel menunjukkan berbagai derajat kebebasan ν.
Tabel distribusi t
Jadi, jika ν = 3, yang berarti n = 4, Anda ingin melihat pada baris ketiga dari
angka-angka tersebut. Jika ν = 3 untuk α1 = .05, nilai yang ditabelkan adalah 2,353.
Nilai ini mewakili titik persentil ke-95 dalam distribusi t dengan tiga derajat
kebebasan. Hal ini karena tabel hanya menyajikan persentil ekor atas. Karena
distribusi t simetris di sekitar 0, persentil ekor bawah memiliki nilai yang sama
kecuali untuk perubahan tanda. Persentil kelima untuk tiga derajat kebebasan adalah -
2,353. Dengan demikian, untuk hipotesis berekor kanan, nilai kritisnya adalah +2.353,
dan untuk hipotesis berekor kiri, nilai kritisnya adalah -2.353. Jika ν = 120 untuk α1
= .05, maka nilai yang ditabelkan adalah 1.658. Dengan demikian, ketika ukuran
sampel dan derajat kebebasan meningkat, nilai t menurun. Hal ini membuat lebih
mudah untuk menolak hipotesis nol ketika ukuran sampel besar.
3) t Test
Sekarang kita telah membahas distribusi teoritis yang mendasari pengujian
rata-rata tunggal untuk σ yang tidak diketahui, kita dapat melanjutkan dan melihat uji
inferensial. Pertama, hipotesis nol dan alternatif untuk uji t ditulis dengan cara yang
sama seperti uji z yang disajikan sebelumnya. Dengan demikian, untuk uji dua sisi,
kita memiliki notasi yang sama seperti yang disajikan sebelumnya:
Summary
Bab VII Buku Jackson. (2009). Research Method and Statistic (A Critical Thinking
Approach) Third Edition. Jacksonville University : Nelson Education, Ltd
Uji Hipotesis
Penelitian biasanya dirancang untuk menjawab pertanyaan spesifik-misalnya-
apakah siswa jurusan sains mendapat nilai lebih tinggi dalam tes kecerdasan
dibandingkan siswa pada populasi umum? Proses untuk menentukan apakah
pernyataan ini didukung oleh hasil proyek penelitian disebut sebagai hipotesis
Pengujian
Dengan kata lain, jika hipotesis alternatif untuk uji satu sisi adalah μ0 > μ1 ,
maka hipotesis nolnya adalah μ0 ≤ μ1 , dan untuk menolak H0 , anak-anak yang
mengikuti program akademik setelah sekolah harus memiliki nilai tes kecerdasan
yang lebih tinggi daripada populasi umum. Alternatif dari uji satu sisi atau uji satu
arah adalah hipotesis dua sisi, atau hipotesis tidak satu arah-hipotesis alternatif di
mana peneliti berharap untuk menemukan perbedaan di antara kedua kelompok,
namun tidak yakin apa perbedaannya. Dalam contoh kita, peneliti akan memprediksi
perbedaan skor IQ antara anak-anak yang mengikuti program akademis setelah
sekolah dan mereka yang berada di populasi umum, tetapi arah perbedaannya tidak
dapat diprediksi. Mereka yang mengikuti program akademis diharapkan memiliki IQ
yang lebih tinggi atau lebih rendah, namun tidak memiliki IQ yang sama dengan
populasi anak-anak pada umumnya. Notasi statistik untuk uji dua sisi adalah;
Dalam contoh kita, hipotesis dua sisi tidak masuk akal. Asumsikan bahwa
peneliti telah memilih sampel acak anak-anak dari program akademik setelah sekolah
untuk membandingkan IQ mereka dengan IQ anak-anak dalam populasi umum
(seperti yang telah disebutkan sebelumnya, kita tahu bahwa rata-rata IQ untuk
populasi adalah 100). Jika kita mengumpulkan data dan menemukan bahwa tingkat
kecerdasan rata-rata anak-anak dalam program akademik setelah sekolah "secara
signifikan" (istilah yang akan segera dibahas) lebih tinggi daripada tingkat
kecerdasan rata-rata untuk populasi, kita dapat menolak hipotesis nol. Ingatlah
bahwa hipotesis nol menyatakan bahwa tidak ada perbedaan antara sampel dan
populasi. Dengan demikian, peneliti menyimpulkan bahwa hipotesis nol-bahwa tidak
ada perbedaan-tidak didukung.
Ketika hipotesis nol ditolak, hipotesis alternatif-bahwa mereka yang
mengikuti program akademik memiliki skor IQ yang lebih tinggi daripada mereka
yang berada di populasi umum-didukung. Kita dapat mengatakan bahwa bukti-bukti
tersebut menunjukkan bahwa sampel anak-anak yang mengikuti program akademis
setelah sekolah mewakili populasi tertentu yang memiliki nilai lebih tinggi pada tes
IQ daripada populasi umum.
Sebaliknya, jika nilai rata-rata IQ anak-anak yang mengikuti program bimbel
tidak berbeda secara signifikan dengan nilai rata-rata populasi, maka peneliti gagal
menolak hipotesis nol dan, secara default, gagal mendukung hipotesis alternatif.
Dalam kasus ini, hipotesis alternatif-bahwa anak-anak dalam program akademik
memiliki IQ yang lebih tinggi daripada populasi umum-tidak didukung.
Keadaan Sebenarnya
Keputusan
Hipotesis Benar Hipotesis Salah
Terima hipotesis Tidak membuat kesalahan Kesalahan tipe II ( )
Tolak hipotesis Kesalahan tipe I ( ) Tidak membuat kesalahan
Jika kita menolak hipotesis nol (bahwa tidak ada perbedaan IQ antar
kelompok), keputusan kita mungkin benar, atau mungkin juga salah. Jika keputusan
kita untuk menolak H0 benar, itu berarti memang ada perbedaan IQ antara anak-anak
yang mengikuti program akademik setelah sekolah dan populasi anak-anak pada
umumnya. Akan tetapi, keputusan kita bisa saja salah. Hasilnya mungkin disebabkan
oleh faktor kebetulan. Meskipun kami mengamati perbedaan yang signifikan dalam
IQ antara anak-anak dalam penelitian kami dan populasi umum, hasilnya mungkin
saja kebetulan-mungkin anak-anak dalam sampel kami kebetulan menebak dengan
benar pada banyak pertanyaan. Dalam kasus ini, kita telah membuat apa yang
dikenal sebagai kesalahan Tipe I-kita menolak H0, padahal pada kenyataannya, kita
seharusnya gagal menolaknya (memang benar tidak ada perbedaan IQ antara sampel
dan populasi). Kesalahan Tipe I dapat dianggap sebagai alarm palsu-kita mengatakan
bahwa ada perbedaan, namun pada kenyataannya, tidak ada perbedaan.
Bagaimana jika keputusan kita adalah untuk tidak menolak H0, yang berarti
kita menyimpulkan bahwa tidak ada perbedaan dalam IQ antara anak-anak dalam
program sekolah tambahan akademis dan anak-anak dalam populasi umum?
Keputusan ini bisa jadi benar, artinya pada kenyataannya tidak ada perbedaan IQ
antara sampel dan populasi. Akan tetapi, keputusan ini juga bisa saja salah. Dalam
kasus ini, kita akan membuat kesalahan Tipe II-mengatakan bahwa tidak ada
perbedaan di antara kelompok-kelompok, padahal pada kenyataannya ada perbedaan.
Entah bagaimana, kita telah melewatkan perbedaan yang benar-benar ada dan gagal
menolak hipotesis nol ketika hipotesis tersebut salah. Kemungkinan-kemungkinan
ini dirangkum dalam Tabel 7.1.
Signifikansi dan Kesalahan Statistik
Misalkan kita benar-benar melakukan penelitian tentang tingkat IQ dan
program akademik setelah sekolah. Selain itu, misalkan kita menemukan bahwa ada
perbedaan antara tingkat IQ anak-anak dalam program akademik setelah sekolah dan
anak-anak dalam populasi umum (mereka yang mengikuti program akademik
memiliki nilai yang lebih tinggi). Terakhir, anggaplah perbedaan ini signifikan secara
statistik pada tingkat 0,05 (atau 5%) (juga dikenal sebagai tingkat alfa 0,05). Untuk
mengatakan bahwa suatu hasil memiliki signifikansi statistik pada tingkat .05 berarti
bahwa perbedaan sebesar atau lebih besar dari apa yang kita amati antara sampel dan
populasi dapat terjadi secara kebetulan hanya 5 kali atau kurang dari 100. Dengan
kata lain, kemungkinan bahwa hasil ini disebabkan oleh kebetulan adalah kecil. Jika
hasilnya bukan karena kebetulan, maka kemungkinan besar hal tersebut disebabkan
oleh perbedaan yang benar atau nyata di antara kedua kelompok. Jika hasil kami
signifikan secara statistik, kami dapat menolak hipotesis nol dan menyimpulkan
bahwa kami telah mengamati perbedaan yang signifikan dalam skor IQ antara
sampel dan populasi.
Namun, ingatlah bahwa ketika kita menolak hipotesis nol, bisa jadi keputusan
kita benar, atau bisa jadi kita membuat kesalahan Tipe I. Mungkin hipotesis nol
benar, dan ini adalah salah satu dari 5 atau kurang dari 100 kali ketika perbedaan
yang diamati antara sampel dan populasi terjadi secara kebetulan. Ini berarti bahwa
ketika kita menggunakan tingkat signifikansi 0,05 (tingkat alfa 0,05), sebanyak 5 kali
dari 100 kali, kita dapat membuat kesalahan Tipe I. Maka, tingkat .05 adalah
probabilitas untuk membuat kesalahan Tipe I (untuk alasan ini, ini juga disebut
sebagai nilai p, yang berarti nilai probabilitas-kemungkinan kesalahan Tipe I). Dalam
ilmu sosial dan perilaku, alpha biasanya ditetapkan pada 0,05 (bukan 0,01, 0,08, atau
yang lainnya). Ini berarti bahwa para peneliti di bidang-bidang ini bersedia menerima
risiko hingga 5% untuk melakukan kesalahan Tipe I.
Bagaimana jika Anda ingin mengurangi risiko membuat kesalahan Tipe I dan
memutuskan untuk menggunakan tingkat alpha .01-mengurangi risiko kesalahan
Tipe I menjadi 1 dari 100 kali? Hal ini tampaknya cukup sederhana: Cukup kurangi
alpha menjadi .01, dan Anda telah mengurangi peluang Anda untuk membuat
kesalahan Tipe I. Namun, dengan melakukan hal ini, Anda sekarang telah
meningkatkan peluang Anda untuk membuat kesalahan Tipe II. Apakah Anda
mengerti mengapa? Jika saya mengurangi risiko membuat alarm palsu-menganggap
ada perbedaan padahal sebenarnya tidak ada-saya meningkatkan risiko kehilangan
perbedaan yang sebenarnya ada. Ketika kita mengurangi tingkat alfa, kita bersikeras
pada kondisi yang lebih ketat untuk menerima hipotesis penelitian kita, sehingga
lebih besar kemungkinannya bahwa kita dapat melewatkan perbedaan yang
signifikan ketika perbedaan itu ada. Kita akan kembali ke kesalahan Tipe I dan II di
bagian akhir bab ini saat kita membahas kekuatan statistik dan mendiskusikan cara-
cara alternatif untuk mengatasi masalah ini.
Menurut Anda, tipe kesalahan mana, Tipe I atau Tipe II, yang dianggap lebih
serius oleh para peneliti? Sebagian besar peneliti menganggap kesalahan Tipe I lebih
serius. Mereka lebih suka melewatkan sebuah hasil (kesalahan Tipe II) daripada
menyimpulkan bahwa ada perbedaan yang berarti padahal sebenarnya tidak ada
(kesalahan Tipe I). Bagaimana dengan di arena lain, misalnya, di ruang sidang?
Seorang juri dapat membuat keputusan yang benar dalam sebuah kasus (memutuskan
bersalah ketika benar-benar bersalah atau memutuskan tidak bersalah ketika benar-
benar tidak bersalah). Mereka juga dapat membuat kesalahan Tipe I (menyatakan
bersalah padahal tidak bersalah) atau kesalahan Tipe II (menyatakan tidak bersalah
padahal bersalah). Mana yang lebih serius di sini? Kebanyakan orang percaya bahwa
kesalahan Tipe I lebih buruk dalam situasi ini. Bagaimana dengan profesi medis?
Bayangkan seorang dokter yang mencoba menentukan apakah seorang pasien
menderita kanker atau tidak. Di sini, sekali lagi, dokter dapat membuat salah satu
dari dua keputusan yang benar atau salah satu dari dua jenis kesalahan. Apa yang
dimaksud dengan kesalahan Tipe I? Ini berarti dokter mengatakan bahwa ada kanker,
padahal sebenarnya tidak. Bagaimana dengan kesalahan Tipe II? Ini berarti
mengatakan bahwa tidak ada kanker, padahal sebenarnya ada. Dalam situasi ini,
kebanyakan orang akan menganggap kesalahan Tipe II lebih serius.