Jika peneliti tertarik hanya pada perbandingan berpasangan, metode Scheffe menggunakan
(17.23) tidak disarankan; dalam kasus semacam itu, metode Turkey akan selalu memberikan interval
confidence yang lebih sempit (akan memberi perkiraan yang lebih akurat tentang perbedaan
berpasangan yang benar). Tetapi, jika ukuran sampel tidak sama dan/atau jika kontras yang dibicarakan
selain dari perbandingan berpasangan, sebaiknya menggunakan metode Scheffe. Terlebih lagi, metode
Scheffe memiliki karakteristik lain yang diharapkan: kapanpun tes keseluruhan F dari hipotesa nol that
all k population means adalah setara ditolak, setidaknya satu kontras akan kedapatan berbeda
signifikan dari 0. Sebaliknya, metode Tukey mungkin tidak akan menghasilkan perbandingan
berpasangan yang signifikan, bahkan ketika statistik keseluruhan F signifikan.
Untuk mengilustrasikan metode Scheffe, kita harus mempertimbangkan semua perbandingan
berpasangan dari data Tabel 17-7 dan mengikuti prosedur yang sama dengan metode Turkey; yaitu, kita
harus mempertimbangkan, dalam urutan, 1 melawan 4, 1 melawan 3, 1 melawan 2, 2 melawan 4, 2
melawan 3, dan 3 melawan 4. Kita mulai pertama dengan memasukkan jumlah
yang kemudian memiliki nilai yang sama dengan semua perbandingan berpasangan, karena ukuran
semua sampel sama dengan 10. Jadi
atau
Karena interval ini tidak memiliki nilai 0 (begitu juga hasilnya dengan metode Turkey), kami mendukung
pertentangan µ1 ≠ µ4. MAka kami melanjutkan ke perbandingan 1 dan 3:
atau
454
Sekali lagi, seperti interval yang didapat dengan metode Turkey, interval ini tidak memilili nilai 0, yang
mendukung penolakan H0: µ1 = µ3.
yang mengandung nilai 0. Maka, kita tidak dapat menolak H0: µ1 = µ2; dan mengamati perbandingan
berpasangan yang lain tidaklah signifikan, kami menyimpulkan bahwa µ 2 = µ3 = µ4 dan µ1 = µ2.Maka,
ketika dimasukkan pada perbandingan untuk set data ini, metode Turkey dan Scheffe menghasilkan
kesimpulan yang sama tenteng kekuatan relative keempat substansi, termasuk ketidakpastian substansi
2. Akan tetapi, jika interval yang didapat (Tabel 17-9) dilihat lebih lanjut, kita melihat bahwa interval
Turkey lebih sempit yang berarti mendukung acuan yang lebih tepat.
Mari kita menggunakan metode Scheffe untuk membuat acuan mengenai dua contrast of
interest. Terutama, mari kita mempertimbangkan
455
Tabel 17-9 Perbandingan beberapa interval confidence Turkey dan Scheffe untuk data kekuatan Tabel
17-7.
Dengan nilai S = √ ❑ yang sebelumnya kita hitung, kita menghitung dari (17.29) seperti berikut:
atau
Karena interval ini tidak mengandung nilai 0, kita mendapat bukti bahwa kekuatan substansi 1 berbeda
dari rata-rata kekuatan zat 2, 3, dan 4.
atau
456
Figur 17-4 Penyelesaian mengenai sampel nilai tengah untuk data kekuatan.
Karena interval ini juga tidak mengandung nilai 0, kita menyimpulkan rata-rata kekuatan zat 1 dan 2
berbeda dari rata-rata kekuatan zat 3 dan 4.
Jika ada perbandingan tidak berpasangan yang dipertimbangkan, harus dipilih antara
perbandingan yang direncanakan (priori) dan yang tidak direncanakan. Metode Bonferroni sebaiknya
digunakan untuk perbandingan terencana; perbandingan tak terencana sebaiknya dievaluasi dengan
metode Scheffe.
Meskipun kita baru membicarakan hanya metode Bonferroni (LSD), Turkey, Scheffe, banyak
teknik perbandingan ganda lain yang disarankan dalam bacaan statistic. Miller (1981) memberikan
ulasan paling menyeluruh tentang prosedur-prosedur ini. Metodeny berbeda sesuai target set of
contrast (berpasangan dan tidak berpasangan), ukuran sampel cell-specific, dan elemen lain. Para
pencipta metode-metode ini berupaya meminimalisir tingkat error Tipe II (untuk memaksimalkan
kekuatan; lihat Chapter 3) untuk sebuah set perbandingan selagi mengontrol tingkat error Tipe I.
Alasan mempertimbangkan metode perbandingan ganda lain adalah untuk meningkatkan
kekuatan dan mencapai ketahanan. Sebuahprosedur perbandingan ganda dinyatakan tahan apabila
pelanggaran asumsi terselubungnya, seperti ketidaksamaan variasi, tidak mempengaruhi validitas
anasilisnya secara serius. Jika prosedur yang tahan digunakan, bahkan bila beberapa asumsi dilanggar,
tingkat error Tipe I dan II dari tes statistik tidak mungkin berubah. Baik metode Bonferroni maupun
Scheffe cenderung tahan; metode Turkey tidak begitu. Metode Scheffe selalu yang paling lemah, karena
mempertimbangkan semua perbandingan yang mungkin. Metode LSD umumnya dianggap tidak sensitif
(memiliki kekuatan rendah), tapi asumsi ini bisa diabaikan jika set perbandingan direncanakan denga
baik.
Meskipun banyak metode perbandingan ganda yang tersedia, kebanyakan terbatas pada
jangkauan terapan yang yang sempit (metode Turkey memerlukan ukuran sampel cell-specific yang
sama). Baik prosedur Bonferroni maupun Scheffe murni metode umum—yang sebelum untuk
perbandingan ganda terencana (priori) dan yang sesudah untuk tidak terencana (posteriori). Tugas
menutupi semua metode perbandingan ganda berada jauh diluar cakupan buku ini.
Dalam kasus khusus dimana ni sama, persamaan (17.24) mengurangi kepada kondisi
dimana c31 = c32 = dan c33 = c34 = . Karena ni = 10 untuk semua i, kita hanya perlu memastikan bahwa
kondisi (17.25) dapat mendemonstrasikan kertogonalan. Terutama, untuk L 1 dan L2, kita memiliki
Maka, kita menyimpulkan bahwa L1 dan L3 ortogonal terhadap satu sama lain tetapi tidak ada yang
ortogonal dengan L2.
Keortogonalan adalah sifat yang diinginkan untuk beberapa alasan. Bila SST melambangkan
perlakuan jumlah kuadrat dengan k – 1 derajat kebebasan untuk efek tetap satu arah ANOVA, dan bila
L1, L2, …, Lt adalah set t(≤ k – 1 ) mutually orthogonal contrasts nilai tengah sampel k (mutually
orthogonal artinya dua kontras terpilih dari set kontras t orthogonal dengan satu sama lain). Lalu SST
dapat dipecah menjadi t + 1 yang merupakan jumlah kuadrat berdiri sendiri secara statistik, dengan t
dari jumlah ini memiliki masing-masing 1 derajat kebebasan dan dikaitkan dengan kontras ortogonal t,
dan dengan sisa jumlah kuadrat memiliki derajat kebebasan k – 1 – t dan dihubungkan dengan sisa
setelah jumlah kuadrat kontras orthogonal t telah dihitung. Dengan kata lain, kita dapat menghitung
dimana SS(L) adalah notasi dari jumlah kuadrat (dengan 1 derajat kebebasan) dihubungkan dengan
kontras L. Terutama, dapat dilihat bahwa
459
dan
k
dibawah H0: L = ∑ c iµi = 0; dan, secara umum, bahwa
i=1
dibawah H0: L1 = L2 = … = Lt = 0 ketika L1, L2, …, Lt sama-sama ortogonal. Maka, dengan memecah SST
seperti yang dijelaskan, kita dapat mencoba hipotesis mengenai set kontras ortogonal yang memiliki
kepentingan lebih spesifik daripada hipotesis global H 0: µ1 = µ2 = … = µk.
Sebagai contoh, untuk mencoba H0: L2 = µ1 – (µ2 + µ3 + µ4) = 0 untuk kekuatan data Tabel 17 – 7, kita
pertama menggunakan (17.26) untuk menghitung
yang sangat signifikan (P < .001 berdasarkan penyebaran F 1, 36). Memodifikasi Tabel 17 – 8 untuk
merefeksikan hasil pemecahan SST (jumlah kuadrat “substansi”) menghasilkan
seperti ini:
460
Terakhir, karena L1 danL3 ortogonal , kita dapat mewakilkan kontribusi independen kedua kontras ini ke
SST dalam satu table ANOVA:
Disini,
Tidaklah valid untuk menunjukkan table ANOVA yang terpecah sekaligus pemecahan karena L 2 dan L1
atau L3 atau kedua. Ini karena L 2 tidak ortogonal dengan kontras-kontras ini menjadikan jumlah
kuadratnya tidak mewakili kontribusi terpisah atau independen untuk SST; ini dapat dipastikan dengan
mudah dengan mengamati table prediksi yang
Contoh akhir menggunakan perbandingan ortogonal termasuk keperluan menilai apakah nilai
tengah sampel menampilkan semacam tren; keperluan ini sering muncul ketika perlakuan (populasi)
yang dipelajari mewakili, contohnya, level berbeda pada faktor yang sama (konsentrasi berbeda pada
material yang sama, atau temperatur berbeda, atau pengaturan tekanan). Dalam situasi semacam itu
penting untuk menghitung bagaimana nilai tengah sampel berbeda dengan perubahan pada level faktor
—yaitu, untuk memperjelas apakah perubahan pada respon nilai tengah linear, kuadratik, atau jalan lain
sementara level faktor meningkat atau menurun.
Langkah kualitatif pertama dalam menilai tren semacam ini adalah merencanakan cara perlakuan
yang diamati sebagai fungsi dalam level faktor. Ini mungkin menghasilkan ide umum tentang pola yang
ada (jika ada). Teknik kemunduran standard dapat digunakan untuk menghitung tren apapun yang
diusulkan rencana itu, tapi tujuan kita disini bukan membuat model kemunduran; tapi untuk
mengevaluasi tren umum dalam nilai tengah statistik yang mungkin, daripada membuat opini berdasar
pemeriksaan rencana nilai tengah
Dalam pendekatan kemunduran standard, variable independen (“perlakuan”) akan dianggap
sebagai variabel interval, dan nilai sebenarnya variabel dalam setiap aturan perlakuan variabel akan
461
digunakan. Maka dari itu, untuk menguji tren linear dengan kemunduran, kita akan menggunakan
model, dimana X melambangkan (interval) variabel perlakuan. Dengan model ini, pengujian untuk tren
linear adalah tes untuk zero slope yang biasa. Secara umum, tes ini tidak setara dengan tes tren linear
dalam respon nilai tengah dengan polinominal ortogonal yang dijelaskan di bagian ini, kecuali ketika
error murni nilai tengah kuadrat digunakan di tempat residu nilai tengah kuadrat dalam denominator
statistik F kepada tes untuk zero slope; ini karena kemunduran error murni nilai kuadrat dan one-way
ANOVA error means square identik. Tes biasa untuk kekurangan kecocokan model kemunduran straight-
line setara dengan tes untuk tren nonlinear dalam respon nilai tengah yang didiskusikan dalam bagian
ini. (Lihat Masalah 10 di akhir bab ini untuk informasi lebih lanjut)
Analisis tren statistik dapat dilakukan dengan menentukan seberapa banyak jumlah kuadrat karena
perlakuan (SST) dihubungkan dengan setiap syarat (linear, kuadrat, kubik, dll) dalam kemunduran
polinominal. Jika beragam level perlakuan atau faktor yang dipelajari berjarak sama, penentuan ini
sebaiknya dilaksanakan dengan metode polinominal ortogonal. (Untuk pendalaman, lihat Armitage
(1971) dan Bab 13.)
Untuk mengilustrasikan penggunaan polinominal ortogonal, mari kita kembali pada kekuatan data
Tabel 17-7. Lebih lanjut, misalkan ada empat substansi yang sebenarnya mewakili empat konsentrasi zat
beracun berjarak sama, dimana zat 1 yang paling encer dan zat 4 yang paling pekat. Misalnya, zat 1
melambangkan larutan zat beracun 10%, zat 2 20%, zat 3 30%, dan zat 4 40%. Dalam hal ini, plot dari
nilai tengah empat sampel melawan konsentrasi muncul dalam wujud Figur 17-6. Plot ini menunjukkan
setidaknya sebuah hubungan linear dan kemungkinan hubungan kuadrat antara konsentrasi dan respon,
dan pandangan umum ini dapat dikuantifikasi dengan polinominal orthogonal. Terkhusus, mengingat k =
4 nilai tengah sampel, mungkin saja dimuat hingga polinominal tingkat ketiga (k – 1 = 3) ke nilai-nilai
tengah ini; model kubik (dengan empat syarat) akan melewati keempat titik di grafik Figur 17-6,
menjelaskan semua variasi dalam keempat nilai tengah sampel (atau setara, dalam SST). Karena
konsentrasi berjarak sama, dengan polinominal ortogonal mungkin ditetapkan tiga kontras ortogonal
dari empat nilai tengah sampel—satu (misal, L 1) mengukur kekuatan komponen linear derajat ketiga
polinom, satu (misal, L2) mengukur komponen kuadrat, dan satu (misal, L 3) mengukur efek komponen
kubik. Jumlah
462
kuadrat yang dihubungkan dengan tiga kontras ortogonal ini memiliki masing-masing 1 derajat
kebebasan,independen secara statistik, dan memuaskan hubungan
Dapat ditunjukkan bahwa ketiga kontras ortogonal ini mengikuti koefisien berikut:
Kondisi (17.25) jelas berlaku untuk ketiga set koefisien ini, yang cukup untuk menetapkan
kesamaan ortogonalitas, karena ni semuanya setara. Koefisien-koefisien ini diambil dari Tabel A-7 di
Appendix A. Tabel ini hanya dapat dipakai pada nilai perlakuan berjarak sama, dan ukuran sampel cell-
specific sama. Kirk (1969) merumuskan algoritma untuk kasus umum yang tidak memerlukan kedua
pembatas ini. Lebih mudah lagi, software computer dapat digunakan untuk mendapat koefisien kontras
ortogonal.
Sekarang, dari (17.26), jumlah kuadrat untuk ketiga kontras ini adalah
Perhatikan bahwa
Akhirnya, untuk menilai kepentingan jumlah kuadrat ini, kita membentuk table ANOVA terpecah
berikut:
463
Dari tes F sebelumnya jelas bahwa hubungan kekuatan (diukur dari jumlah material yang dimasukkan
untuk menyebabkan kematian) dan konsentrasi sangat linear, dengan tidak ada bukti efek tingkat tinggi.