Anda di halaman 1dari 11

441

Wujudnya pada dasarnya sama dengan (17.13), kecuali komponen α akan diperlakukan berbeda; yaitu,
efek acak model adalah bentuk10

Dalam model ini, Ai dapat dilihat menggantikan sampel acak dari variabel acak yang memiliki distribusi
sama—yang mewakili seluruh populasi efek yang mungkin (dalam contoh kita, lingkungan).
Untuk melakukan analisis yang tepat, kita harus menganggap distribusi A i normal dengan nilai
tengah nol:

dimana σA2 mewakili varian Ai. Kita harus juga menganggap Ai independen Eij dan satu sama lain.
k
Syarat nilai tengah nol dalam (17.16) mirip dalam filosofi dengan ∑a I = 0 untuk model efek
i=1
tetap. Ketika model acak (17.15) diterapkan, kita menganggap rata-rata (nilai tengah) efek lingkungan 0
atas seluruh populasi lingkungan; yaitu, kita anggap µ Ai = 0, i = 1, 2, 3, 4.
Bagaimana kita menyatakan hipotesis nol kita? Karena kita menentukan rata-rata efek
lingkungan sekitar 0 untuk seluruh populasi efek yang mungkin, cara satu-satunya menentukan apakah
ada efek lingkungan signifikan termasuk mempertimbangkan σ A2. Jika tidak ada varibilitas (σ A2 = 0),
semua efek lingkungan harus 0. Jika ada variabilitas (σ A2 > 0), beberapa efek tidak nol harus ada dalam
populasi efek lingkungan.
Maka, hipotesis nol kita tentang tidak ada efek lingkungan harus dituliskan sebagai berikut:

Hipotesis ini seanalogi dengan hipootesis nol (17.1) yang digunakan dalam kasus efek tetap, meskipun
disebutkan dalam varian populasi daripada dalam nilai tengah populasi.
Kita masih harus menjelaskan tes F (17.2) digunakan dalam kasus efek tetap persis sama dengan
yang digunakan model efek acak. Penjelasan semacam itu sebaiknya dibuat dengan mempertimbangkan
nilai tengah kuadrat MST dan MSE. Di bagian 17-3-2, dalam hubungan dengan model efek tetap, kita
melihat statistik F, MST/MSE, dapat dianggap perkiraan kasar rasio nilai tengah dari kuadrat nilai tengah
ini,

10
Konvensi biasa kita adalah dengan memakai huruf Latin (X, Y, Z, dan lainnya) untuk melambangkan
variabel acak dan menggunakan huruf Yunani (β, μ, σ, dan lainnya) sebagai ukuran.
11
Sejak variabel acak Ai yang sama diartikan (17.16) muncul dalam (17.15) dari setiap pengamatan dari
populasi i, diikuti (Yij, Yij’) = σA2/( σA2 + σ2), yang disebut korelasi intra kelas (atau populasi). Oleh karena
itu, dibandingkan dengan bentuk efek tetap ANOVA satu arah, bentuk efek acak ANOVA satu arah
memperkenalkan keterikatan antara kumpulan pengamatan dari populasi yang sama.
442

12
Lagi, ujian F merupakan persamaan komputerisasi hanya untuk bentuk tetap dan acak ANOVA satu
arah. Ketika menghadapi dengan ANOVA 2 atau lebih arah, pengujiannya menjadi berbeda
443

Parameter µMST dan µMSE sering disebut kuadat nilai tengah harapan.
Argumen sejenis dapat dibuat dengan memperhatikan statistik F untuk model efek acak.
Terkhusus, untuk model efek acak dan model efek tetap, denominator MSE memperkirakan σ 2;
yaitu,
Terlebih lagi, agar model efek acak diterapkan dalam contoh kita (k = 4, n i = 25), dapat dilihat
kalau MST memperkirakan
Maka, untuk model efek acak, F memperkirakan rasio

Sejak hipotesis nol dalam hal ini adalah H0: σ2A = 0, rasio (17.19) menyederhanakan menjadi
σ2 / σ2 = 1 ketika H0 benar. Oleh karena itu, statistik F dalam H0 terdiri dari rasio dua perkiraan dari
variasi σ2 yang sama. Terlebih lagi, karena σ2A> 0 ketika H0 tidak benar, semakin besar
keberagaman antar efek lingkungan, yang lebih besar seharusnya adalah nilai dari observasi F.

Secara umum, bentuk efek acak bagi ANOVA satu arah adalah

dimana Ai dan Eij merupakan variabel bebas yang memenuhi A i ͡ N(0, σ2A) dan Eij ͡ N(0, σ2A). 13

Untuk bentuk ini, perkiraan F dari perbandingan rata-rata pengkuadratan:

dimana

fungsi suatu rata-rata pengamatan ni dipilih dari setiap populasi. 14Statistik F dalam bentuk
efek acak.
444

17-7 Prosedur Perbandingan Ganda untuk Efek


Tetap Satu Arah ANOVA
Ketika kita menemukan sebuah tes F ANOVA untuk membandingkan beberapa nilai tengah
populasi sekaligus signifikan secara statistik, langkah selanjutnya adalah menentukan perbedaan spesifik
mana yang ada diantara nilai tengah populasi. Sebagai contoh, jika kita membandingkan empat nilai
tengah (kasus efek tetap) dan hipotesis nol H 0: µ1 = µ2 = µ3 = µ4 ditolak, kita kemudian mencoba
menentukan sub-kelompok nilai tengah mana yang berbeda, dengan mempertimbangkan hipotesis yang
lebih spesifik seperti H01: µ1 = µ2, H02: µ2 = µ3, H03: µ3 = µ4, atau bahkan H04 (µ1 + µ2)/2 = (µ3 + µ4)/2, yang
membandingkan rata-rata efek populasi 1 dan 2 dengan rata-rata efek populasi 3 dan 4. Perbandingan
spesifik seperti ini mungkin menarik bagi kita sebelum (priori) data dikumpulkan, atau mereka mungkin
muncul dalam studi hanya mengenai penjelajahan setelah (posteriori) data diperiksa. Yang manapun,
pendekatan pertama yang tampaknya masuk akal untuk menarik inferensi mengenai perbedaan antar
nilai tengah populasi adalah melakukan beberapa tes t dan memfokuskan semua tes yang signifikan.
Sebagai contoh, jika semua perbandingan berpasangan diantara nilai tengah, maka 4C2 = 6 tes semacam
itu harus dilakukan dengan mempertimbangkan 4 nilai tengah (secara umum, tes kC2 = k(k – 1)/2 dengan
mempertimbangkan k nilai tengah). Maka, dalam mencoba H 0: µi = µj pada level kepentingan α, kita
dapat menolak H0 ketika

dimana

dan dimana n adalah jumlah pengamatan; k adalah bilangan nilai tengah yang dipertimbangkan; n i dan nj
adalah ukuran sampel terpilih dari populasi ke-i dan ke-j, berturut; Y i dan Yj adalah nilai tengah
koresponden sampel; dan MSE adalah syarat mean-square-error dengan n – k derajat kebebasan, yang
memperkirakan variasi (homoscedatic) σ2. MSE digunakan sebagai ganti perkiraan dua sampel
sederhana σ2 berdasar sepenuhnya pada data dari grup i dan j; ini karena MSE adalah perkiraan yang σ2
lebih baik (dalam hal derajat kebebasan) dalam asumsi variasi homogen di seluruh populasi k.
Setaranya, H0 dapat ditolak jika 100(1 – α)% interval confidence

tidak mengandung 0.
Sayangnya, melakukan beberapa tes t semacam itu memiliki kekurangan serius: semakin banyak
hipotesis nol yang dites, semakin mungkin satu dari mereka ditolak bahkan jika semua hipotesis nol
benar. Dengan kata lain, jika beberapa tes semacam itu dilakukan, setiap di level α, kemungkinan salah
menolak setidaknya satu H0 lebih besar daripada α dan terus meningkat dengan setiap tes yang dibuat.
Lebih lanjut, jika dalam studi penjelajahan peneliti memutuskan membandingkan hanya sampel nilai
tengah yang paling jauh (terbesar dan terkecil), prosedur pengetesan menjadi condong menolak H 0
karena hanya perbandingannya yang paling mungkin dibuat signifikan. Kecondongan ini tercermin pada
fakta kemungkinan nyata salah menolak sebuah hipotesis nol melampaui level α yang ditujukan untuk
tes.

17-7-1 Pendekatan LSD


445

Cara perkiraan untuk menghindari masalah distorted significance levels ketika membuat
beberapa tes termasuk mengurangi level significance yang digunakan untuk tiap tes individual cukup
untuk memperbaiki level significance keseluruhan (kemungkinan salah menolak setidaknya satu
hipotesis nol yang dites) pada nilai yang diinginkan (misal α). Jika kita membuat l tes semacam itu, nilai
maksimum yang mungkin untuk level significance keseluruhan adalah lα. Maka, satu jalan sederhana
untuk memastikan nilai significance keseluruhan paling tinggi α adalah dengan α/l sebagai level
significance untuk tiap tes terpisah. Pendekatan ini, yang sering disebut metode least-significance-
difference (LSD), adalah penerapan koreksi Bonferroni untuk pencobaan ganda. Sebagai contoh, jika
semua perbandingan ganda l = kC2 = k(k – 1)/2 untuk nilai tengah populasi k dibuat, tiap tes dapat
dilakukan pada level significance α/kC2 untuk memastikan level significance keseluruhan tidak
melampaui α.
Satu kelemahan metode LSD adalah level significance keseluruhan yang sebenarnya mungkin
jauh dibawah nilai α menyebabkan tidak ada tes individual yang mungkin ditolak (kekuatan keseluruhan
metode rendah). Akibatnya, beberapa prosedur yang lebih kuat diciptakan untuk memperoleh level
significance keseluruhan α. Semua prosedur ini dikelompokkan dalam “prosedur perbandingan ganda”.
Kita akan fokus pada dua—satu karena Turkey, dan yang lain karena Scheffe. Pembicaran mengenai
metode perbandingan ini dan yang lain dapat dilihat pada Miller (1966), Guenther (1964), Lindman
(1974), dan Neter dan Wasserman (1974).
Contoh Pertimbangkan set data yang diberikan Tabel 17-7, yang diambil dari eksperimen untuk
membandingkan kekuatan relative empat zat kardiak. Dalam eksperimen, larutan dalah satu zat yang
sesuai dimasukkan perlahan kedalam kelinci percobaan yang dibius, dan dosis yang membunuh tiap
kelinci dicatat. Sepuluh kelinci percobaan digunakan untuk tiap zat, dan lingkungan laboratorium dan
prosedur pengukuran diasumsikan sama untuk tiap kelinci percobaan. Tujuan utama riset adalah
Tabel 17-7 Kekuatan (dosis mematikan) empat zat kardiak.
Ukuran Sampel Dosis Kematian Sampel Nilai Sampel
Zat (ni) (Yij) Total Tengah (Yi) Varian (Si2)
1 10 29, 28, 23,26,26 259 25.9 9.4333
19, 25, 29, 26, 28
2 10 17, 25, 24, 19, 28 222 22.2 12.1778
21, 20, 25, 19, 24
3 10 17, 16, 21, 22, 23 200 20.0 8.6667
18, 20, 17, 25, 21
4 10 18, 20, 25, 24, 16 196 19.6 8.7111
20, 20, 17, 19, 17

menentukan apakah ada perbedaan pada kekuatan keempat zat dan, jika ada, menguantitaskan
perbedaan itu. Table ANOVA keseluruhan untuk membandingkan nilai tengah kekuatan keempat zat
kardiak terdapat pada Tabel 17-8.
Tes global F sangat menolak hipotesis nol kesetaraan (P < .001) pada nilai tengah keempat
populasi. Maka dari itu, muncul pertanyaan perbandingan ganda: Apa cara terbaik menghitung
perbedaan yang muncul? Sebagai langkah kasar awal, kita dapat memeriksa sifat perbedaan dengan
bantuan skema diagram nilai tengah berurutan (Figur 17-1). Dalam diagram, sebuah overbar telah
dibuat untuk zat 3 dan 4, menunjukkan zat 1 dan 2 berbeda satu sama lain dan dengan zat 3 dan 4.
446

Kuantifikasi perbedaan antar nilai tengah populasi semacam ini diinginkan dari analisis
perbandingan ganda. Meskipun begitu, pendekatan deskriptif murni yang diambil tidak memasukkan
sampling variability yang terhubung dengan perkiraan perbandingan apapun yang berhubungan.
Hasilnya, dua nilai tengah sampel yang sepertinya berbeda mungkin faktanya tidak berbeda secara
statistik. Karena metode perbandingan ganda yang kita bahas selama ini adalah metode LSD, mari kita
pertimbangkan bagaimana menerapkan metode ini pada data Tabel 17-7, menggunakan level
significance keseluruhan α = .05 untuk semua perbandingan berpasangan nilai tengah kekuatan
keempat zat kardiak.
Tabel 17-8 Tabel ANOVA untuk data Tabel 17-7.

Figur 17-7 Pendamping kasar sampel nilai tengah data kekuatan.

Pendekatan ini membutuhkan penghitungan interval confidence 4C2 = 6, dihubungkan masing-masing


dengan level significance α/6 = .05/6 = .0083, menggunakan formula

Sisi kanan tampilan ini dihitung


Maka, interval confidence berpasangan yang muncul

Dalam contoh ini, istilah perbedaan paling tidak signifikan mengacu pada fakta nilai tengah dua sampel
dianggap berbeda signifikan jika perbedaan absolutnya melampaui 3.895. (Pernyataan semacam itu
mustahil jika ni tidak setara.)
Interval yang mendahului menunjukkan hanya dua perbandingan signifikan (yang berbintang)
dan diterjemahkan dalam diagram peringkat keseluruhan terlihat dalam Figur 17-2. Hasil-hasil ini
ambigu karena “set kesamaan” yang tumpang tindih, yang menunjukkan substansi 2, 3, dan 4 memiliki
kekuatan yang pada dasarnya sama; dimana 1 dan 2 memiliki kekuatan sama; tapi juga 1 berbeda dari 3
dan 4. Dengan kata lain, satu penyelesaian yang mungkin adalah 2, 3, dan 4 dalam satu kelompok dan 1
dan 2 dalam satu kelompok lain—yang sulit diselesaikan karena zat 2 ada dalam kedua kelompok.
Keharusan menghadapi ketidakpastian ini dianggap beruntung dari sudut pedagogi, karena hasil tidak
pasti semacam itu tidak jarang ditemui dalam hubungan dengan prosedur perbandingan ganda. Dalam
kasus kita hasil menunjukkan bahwa prosedur tidak cukup sensitif untuk melakukan evaluasi yang cukup
pada zat 2. Mengulangi analisis dengan set data yang lebih besar akan membantu menghilangkan
ketidakpastian. Alternatifnya, karena pendekatan LSD cenderung konservatif (interval confidence
cenderung lebih lebar dari yang diperlukan untuk mencapai level significance keseluruhan yang
diinginkan), metode perbandingan ganda lain—seperti Turkey atau Scheffe—mungkin memberikan hasil
yang lebih akurat (interval confidence yang lebih sempit) dan mungkin mengurangi atau menghilangkan
ketidakpastian.
Figur 17-2 Perbandingan LSD nilai tengah sampel untuk data kekuatan.
447

Pendekatan LSD dapat juga diterapkan dengan prosedur GLM SAS. Meskipun SAS tidak
menunjukkan interval confidence, dia tetap menampilkan grafik yang menunjukkan pasangan nilai
tengah mana yang berbeda signifikan. Output pendamping SAS menunjukkan grafik ini; nilai tengah yang
mirip (tidak berbeda signifikan) pada α = 0.05 dilabeli huruf yang sama.
Prosedur GLM SAS tidak mengendalikan jumlah perbandingan berpasangan ketika menggunakan
pendekatan LSD; gantinya, nilai α = .05 yang digunakanuntuk tiap perbandingan berpasangan. Hasilnya,
output SAS yang ditampilkan dibawah menunjukkan LSD 2.8317 daripada 3.798, karena SAS
menggunakan nilai kritis t = 2.03, 36, 0.95. Seperti yang disebutkan sebelumnya, diharapkan
mengendalikan jumlah perbandingan.
Output SAS untuk Data Tabel 17-7

17-7-2 Metode Turkey


Metode Turkey dapat diterapkan jika dua kondisi dipenuhi:
1. Ukuran sampel yang dipilih dari tiap populasi setara; artinya, n i ≡ n*, misal, untuk semua i = 1, 2,
…, k, dimana k mewakili jumlah nilai tengah yang dibandingkan.
2. Perbandingan berpasangan nilai tengah adalah kepentingan utama, artinya,hipotessis nol dalam
bentuk H0: µi = µj dipertimbangkan.
Versi umum prosedur Turkey tersedia untuk mempertimbangkan perbandingan yang lebih kompleks
daripada perbedaan berpasangan sederhana antara nilai tengah. Tapi, karena prosedur ini yang paling
kuat untuk membandingkan perbedaan sederhana antara nilai tengah dan bukan untuk membuat
perbandingan yang lebih kompleks, metode Turkey sebaiknya umumnya digunakan hanya untuk situasi
pertama; yang kedua lebih baik ditangani metode Scheffe (didiskusikan dalam bagian 17-7-3).
Untuk menggunakan metode Turkey, kita menghitung interval confidence berikut untuk
perbandingan berpasangan populasi nilai tengah µi dan µj:

dimana

dan dimana qk, n – k, 1 – α adalah 100(1 – α)% titik distribusi jangkauan studentized range dengan k dan n – k
derajat kebebasan (lihat Tabel A-6 di Appendix A); n* adalah ukuran sampel umum (ni ≡ n*); k adalah
jumlah populasi atau kelompok dan n( = kn*) adalah jumlah total pengamatan.
Distribusi studentized range dengan k da r derajat kebebasan adalah distribusi statistik bentuk
R/S, dimana R = {maxi (Yi) – mini (Yi)} adalah jangkauan set k pengamatan independen Y 1, Y2,…, Yk dari
distribusi normal dengan nilai tengah µ dan varian σ2, dan dimana S2 adalah perkiraan σ2 berdasarkan (n
– k) derajat kebebasan (yang independen Y). Khususnya, ketika nilai tengah k dibandingkan dalam efek
tetap satu arah ANOVA, statistik {max i (Yi) – mini (Yi)}/√ MSE /n* memiliki distribusi studentized range
dengan k dan n – k derajat kebebasan dibawah H 0: µ1 = µ2 = … = µk, dimana ni = n* untuk setiap I dan
dimana n = kn*.
Alternatif prosedur Turkey, disebut metode Student-Newman-Keuls (SNK), menggunakan
distribusi studentized range tapi dengan bilangan numerator derajat kebebasan yang dimodifikasi.
Prosedur SNK mengganti k pertama dalam q k, n – k, 1 – α dengan k* = jumlah nilai tengah dalam jangkauan
nilai tengah yang diuji. Maka, kita mendapat k* = 3 ketika membandingkan kedua terbesar dengan yang
terkecil dari empat nilai tengah, dimana kita akan mendapat k* = 2 ketika membandingkan kedua
terbesar dengan ketiga terbesar.
448

Untuk ukuran sampel tidak setara, Steele dan Torrie (1960) merekomendasikan sedikit
modifikasi pada prosedur Turkey. Untuk tiap perbandingan mengenai ukuran sampel tidak sama,
mereka mengganti T√ MSE dalam (17.21) dengan qk, n – k, 1 – α√ ❑, dimana ni dan nj adalah ukuran sampel
yang dihubungkan dengan kelompok ke-i dan ke-j, berturut.
Dalam set semua kC2 interval confidence berpasangan Turkey dalam bentuk (17.21),
kemungkinan semua interval ini sekaligus mengandung perbedaan nilai tengah populasi yang
diperkirakan adalah 1 – α; artinya 1 – α adalah koefisien confidence keseluruhan untuk semua
perbandingan berpasangan yang berlangsung. Terkhusus, jika setiap interval confidence digunakan
untuk menguji hipotesis berpasangan bentuk umum H 0: µi = µj yang tepat dengan menentukan apakah
nilai 0 terkandung dalam interval yang dihitung, kemungkinan salah menolak hipotesis nol untuk
setidaknya satu tes kC2 setara α.
Prosedur mengaplikasikan metode Turkey pada set data biasanya dilakukan berdasarkan
langkah:
1. Urutkan nilai tengah sampel Y i dari terbesar hingga terkecil (dalam contoh kita, urutannya
adalah Y1 > Y2 > Y3 > Y4).
2. Bandingkan nilai tengah sampel terbesar dengan sampel terkecil, menggunakan (17.21); lalu
bandingkan yang terbesar dengan yang terkecil berikutnya; dan begitu terus, sampai antara
yang terbesar dibandingkan dengan yang terbesar kedua atau hasil tidak signifikan diperoleh,
yang mana yang muncul duluan (dalam contoh kita, kita pertama melihat 1 dan 4, lalu 1 dan 3,
dan akhirnya 1 dan 2).
3. Lanjutkan dengan membandingakan nilai tengah kedua tebesar dengan yang terkecil, kedua
terbesar dengan terkecil berikut, dan selanjutnya, tapi jangan buat perbandingan kedua
terbesar jika sudah mendapat hasil tidak signifikan.
4. Terus buat perbandingan semacam itu melibatkan nilai tengah terbesar ketiga, dan terbesar
keempat, dan seterysnya. Pada tiap tingkat, begitu perbandingan tidak signifikan didapat,
simpulkan bahwa tidak ada perbedaan antar nilai tengah yang tertutup oleh pasangan tidak
signifikan pertama.
5. Wakilkan penyelesaian keseluruhan mengenai kemiripan dan perbedaan antar nilai tengah
populasi dengan menggunakan skema diagram nilai tengah sampel terurut, menarik overbar
untuk menghubungkan nilai tengah yang tidak berbeda signifikan.
Mari kita mengilustrasikan menggunakan metode Turkey dengan level significance keseluruhan
α = .05 untuk data kekuatan Tabel 17-7. Pengurutan nilai tengah sampel dari terbesar hingga terkecil
menunjukkan urutan perbandingan berpasangan berikut harus dibuat:
1 vs. 4, 1 vs. 3, 1 vs. 2, 2 vs. 4, 2 vs. 3, 3 vs. 4
Karena nilai T√ MSE dalam (17.21) diperlukan untuk perbandingan semacam itu, kita pertama
menghitung, sebagai berikut: untuk n* = 10, k = 4, n = 40, dan MSE = 9.747,

(Nilai q4, 36, 0.95 = 3.81 diperoleh dari Tabel A-6 oleh interpolation.) Maka dari itu,

Sekarang, menggunakan (17.21), kita membandingkan 1 dan 4 seperti ini:

atau

Karena interval confidence ini tidak mengaandung nilai 0, kiita dapat menyimpulkan (berdasar level
significance keseluruhan α = .05) bahwa µ1 ≠ µ4.
Berikutnya, kita melihat 1 melawan 3, sebagai berikut:

atau
449

Karena interval confidence ini juga tidak mengandung nilai 0, kita dapat menyimpulkan (pada level
significance keseluruhan α = .05) bahwa µ1 ≠ µ3.
Berikutnya, kita bandingkan 1 dan 2, menghasilkan
atau

yang mengandung nilai 0. Kita lalu menyimpulkan bahwa tidak cukup bukti untuk membolehkan kita
menolak H0: µ1 = µ2 dan juga semua perbandingan yang tersisa, yang melibatkan nilai tengah perbedaan
beerpasangan yang lebih kecil (dalam nilai mutlak), tidak signifikan. Kesimpulan ini mendukung hipotesis
µ2 = µ3 = µ4. Kita mungkin dapat secara skema mewakilkan hasil berdasar pengaplikasian metode Turkey
seperti ditunjukkan di Figur 17-3.
Secara umum, perbedaan berpasangan antara, misal, nilai tengah terbesar dan terbesar kedua
mungkin tidak signifikan, meskipun perbedaan berpasangan lain (misal, antara nilai tengah terbesar
ketiga dan keempat) signifikan. Maka, secara umum, jangan berhenti membuat semua perbandingan
yang tersisa ketika perbedaan berpasangan nonsignifikan pertama ditemui kecuali semua perbedaan
berpasangan yang tersisa lebih kecil daripada yang terlibat dengan pasangan nonsignifikan pertama.
Sebagai contoh, jika kita menemukan Y 1 = 100, Y2 = 99, Y3 = 80, dan Y4 = 20, maka Y 1 – Y2 = 1 akan cukup
kecil (dan mungkin nonsignifikan) sementara Y3 – Y4 = 60 akan besar.
Seperti metode LSD, metode Turkey meninggalkan beberapa ketidakpastian sebagaimana hasil:
zat 2 sekali lagi dihubungkan dengan zat 1 dan juga dengan zat 3 dan 4. Ketidakpastian tidaklah jarang.
Dalam contoh ini, dia menunjukkan jumlah data yang dikumpulkan tidak cukup untuk memperbolehkan
pengkategorian jelas zat 2.
Pendekatan Turkey juga dapat diterapkan dengan prosedur GLM SAS. Sekali lagi SAS tidak
menunjukkan interval confidence, tapi menampilkan grafik yang menunjukkan pasangan nilai tengah
mana yang berbeda signifikan. Output pendamping SAS menampilkan grafik ini; nilai tengah yang mirip
(tidak berbeda signifikan) pada level keseluruhan α = .05 dilabeli huruf sama.
Output SAS untuk data Tabel 17-7

Figur 17-3 Perbandingan nilai tengah sampel Turkey untuk data kekuatan.

17-7-3 Metode Scheffe


Metode Scheffe umumnya disarankan ketika salah satu dari kedua syarat dipenuhi:

1. Ukuran sampel terpilih dari populasi berbeda tidak semuanya setara


2. Perbandingan selain dari perbandingan berpasangan antara dua nilai tengah adalah
kepentingan. (Tipe perbandingan yang lebih umum ini disebut sebagai kontras.)
Untuk menggambarkan arti kontras, misalnya peneliti yang mengumpulkan data kekuatan Tabel
17-7 mencurigai zat 1 dan 3 memiliki kekuatan mirip, zat 2 dan 4 memiliki kekuatan sama, dan kekuatan
1 dan 3, rata-rata, berbeda signifikan dari 2 dan 4. Lalu dia akan menjadi kepentingan untuk
membandingkan hasil rata-rata dari 1 dan 3 dengan hasil rata-rata 2 dan 4, untuk menentukan apakah
(µ1 + µ3)/2 memang berbeda dari (µ2 + µ4)/2. Dengan kata lain, kita dapat mempertimbangkan kontras

yang akan 0 jika hipotesis nol H0: (µ1 + µ3)/2 = (µ2 + µ4)/2 benar. Kita dapat menulis ulang L, menjadi:

or
450

1 −1 1 −1
maka L adalah fungsi linear nilai tengah populasi dengan c 11 = , c 12 = , c13 = , dan c14 = . Lebih
2 2 2 2
jauh lagi,

Secara umum, kontras didefinisikan sebagai fungsi linear nilai tengah populasi, misal,

seperti

Hipotesis nol yang dihubungkan adalah

dan hipotesis alternatif two-tailed adalah

Data di Tabel 17-7 menunjukkan nilai tengah kekuatan zat 1 jelas lebih tinggi daripada nilai
tengah kekuatan tiga zat lainnya. Pengamatan ini mengundang perbandingan nilai tengah kekuatan zat
dengan kekuatan rata-rata zat 2, 3, dan 4. Dalam hal ini, kontras yang tepat untuk dipertimbangkan

atau

4
−1
dimana c21 = 1, c22 = c23 = c24 = . (Lagi, ∑ c 21 = 0.)
3 i=1
Kemungkinan kontras kepentingan ketiga menyangkut perbandingan hasil rata-rata zat 1 dan 2
dengan 3 dan 4. Kontras di sini adalah

1 −1
dimana c31 = c32 = dan c33 = c34 = .
2 2
Terakhir, perbandingan berpasangan apapun juga kontras. Sebagai contoh, perbandingan 1
dengan 4 berbentuk

Dimana c41 = 1, c42 = c43 = 0, dan c44 = – 1.


Metode Scheffe memberikan sekelompok interval confidence untuk mengevaluasi semua
kontras yang mungkin yang dapat didefinisikan, melihat jumlah tetap nilai tengah k populasi,
menyebabkan koefisien confidence keseluruhan berhubungan dengan seluruh kelompok adalah 1 – α,
dimana α ditetapkan peneliti. Dengan kata lain, kemungkinannya 1 – α, interval confidence ini sekaligus
mengandung nilai sesungguhnya semua kontras yang dipertimbangkan. Level significance keseluruhan
k
adalah α untuk mencoba hipotesis bentuk umum H 0: L = ∑ c µ = 0 menyangkut semua kontras yang
i i
i=1
mungkin; yaitu, kemungkinan α setidaknya satu hipotesis nol salah ditolak.
k
Bentuk umum interval confidence tipe Scheffe sebagai berikut. Misal L = ∑ c µ adalah kontras
i i
i=1
kepentingan. Maka interval confidence yang tepat mengenai L diberikan oleh

k k
dimana L = ∑ c Y adalah pengira titik unbiased L, dan S
i i
2
= (k – 1)Fk – 1, n – k, 1 – α dengan n = ∑ n. I
i=1 i=1
451

Sebagai kasus khusus, ketika hanya perbandingan berpasangan adalah kepentingan, formula ini
menyederhana menjadi

Ketika inferensi mengenai µi = µj dipertimbangkan.

Anda mungkin juga menyukai