Anda di halaman 1dari 25

Bab 10

Model Tak Seimbang Dengan Pengaruh Tetap


Suatu set data yang terdiri dari nilai-nilai beberapa respon, Y, dikatakan seimbang jika
jumlah pengamatan-pengamatan dalam subkelas-subkelas data adalah semuanya sama. Jika
tidak, maka dikatakan tidak seimbang. Dengan demikian, kita mungkin memiliki jumlah
yang tidak sama dari pengamatan pada sub kelas dari data, beberapa subkelas mungkin tidak
mengandung pengamatan sama sekali. Dalam kasus terakhir, kita mengatakan bahwa kita
memiliki subkelas kosong atau sel kosong. Misalnya, pada Tabel 9.1 yang memberikan
harga dari berbagai jenis makanan yang dijual di supermarket besar (lihat Contoh 9.1 pada
Bab 9), total terdiri dari 48 sel masing-masing berisi tiga pengamatan (harga direkam untuk
total tiga bulan). Jika, misalnya, untuk supermarket 2 di daerah 1, harga makanan item 2
tercatat hanya dua kali, maka kita berakhir dengan kumpulan data yang melanggar kondisi
dinyatakan sebelumnya. Hal ini juga mungkin bahwa tidak ada informasi sama sekali
tercatat mengenai harga item tersebut dalam supermarket itu. Dalam hal ini, sel (1, 2, 2)
sesuai dengan area 1, supermarket 2, dan item makanan 2 akan kosong.
Berbeda dengan data yang seimbang, analisis data tidak seimbang jauh lebih sukar.
Kesulitan utama berasal dari kenyataan bahwa dalam kasus data tidak seimbang, partisi dari
total jumlah kuadrat dapat dibuat dalam berbagai cara; maka tidak ada cara unik untuk
menulis tabel ANOVA seperti halnya dengan data yang seimbang. Selain itu, sifat baik yang
kita lihat sebelumnya untuk data yang seimbang tidak lagi berlaku untuk data yang tidak
seimbang. Hal ini membuat sangat sulit untuk mengembangkan pendekatan terpadu untuk
perlakuan data tidak seimbang. Oleh karena itu tidak mengherankan bahwa data tersebut
kadang-kadang diberi label sebagai messy atau berantakan. Model linear mewakili data
yang tidak seimbang disebut sebagai model tidak seimbang.
Dalam bab ini, kita mempertimbangkan analisis dari beberapa model pengaruh tetap
tidak seimbang, yaitu, model yang hanya memiliki pengaruh tetap kecuali untuk error atau
galat. Metodologi yang dijelaskan di sini tergantung pada notasi tertentu yang disebut RNotasi, yang akan didefinisikan pada bagian berikutnya.

10.1 Notasi R
Pertimbangkan model :
(10.1)
di mana
X adalah matriks berukuran n p
adalah vektor dari parameter tetap tidak diketahui
adalah vektor galat percobaan diasumsikan memiliki mean nol dan matriks varianskovarians
Misalkan X dipartisi sebagai
masing n p1 dan n p2. Vektor

], di mana

dipartisi sesuai sebagai

dan

berukuran masing-

. Model (10.1)

kemudian dapat ditulis sebagai


(10.2)
Jumlah kuadrat regresi untuk model penuh, yaitu, model (10.1) adalah

. Kita lambangkan jumlah kuadrat ini dengan

, atau,

Dengan demikian kita memiliki


(
)
Mari kita mempertimbangkan model berkurang,

(10.3)
(10.4)

Maka jumlah kuadrat regresi yang juga dilambangkan dengan (

) diberikan oleh

( )
(10.5)
Perbedaan antara jumlah kuadrat regresi dalam (10.3) dan (10.5) dinotasikan dengan
(

). Dengan demikian kita memiliki,


(

)
(10,6)

Catat bahwa

penambahan
untuk , atau

) merupakan peningkatan jumlah kuadrat regresi yang dihasilkan dari


untuk model yang hanya berisi . Dalam hal ini,
dikatakan disesuaikan
telah ditambahkan setelah . Dengan demikian, kesetaraan,
(

(10.7)

menyediakan partisi dari jumlah kuadrat regresi untuk model lengkap ke dalam (
(

) dan

).

Formula (10.7) dapat dengan mudah digeneralisasikan setiap kali


k subvector , , ...,
sehingga :
(

dipartisi menjadi
)

di mana untuk i = 3, 4, ..., k, yang ith R-expression di sisi kanan merupakan kenaikan
jumlah kuadrat regresi yang dihasilkan dari penambahan
, ...,
.

kedalam model yang mencakup

Sebagai contoh, untuk model :


jumlah kuadrat regresi untuk model penuh, dilambangkan dengan
sebagai

, dapat dipartisi

dimana

adalah jumlah kuadrat regresi untuk model yang hanya berisi ,


, dengan
menjadi jumlah kuadrat regresi untuk model yang hanya
berisi dan , dan
.
Teorema berikut dapat dengan mudah dibuktikan atas dasar prinsip-prinsip umum
yang diuraikan dalam Bab 5 (lihat Latihan 10.1).
Teorema 10.1 Pertimbangkan Model (10.2)
bahwa
). Misalkan
dan
(

(a)

, yang diasumsikan
. Maka,

) berdistribusi noncentral chi-squared dengan derajat bebas rr1 dan

parameter noncentral yaitu

[
(b)

),

), dan

(residual) untuk model (10.2).

saling bebas, di mana

]
adalah jumlah kuadrat galat

* (

(c)

)+

, di mana

adalah parameter noncentral pada

poin (a).
Berdasarkan Teorema 10.1, dapat diperhatikan bahwa statistik F,
(

(10.8)

Dengan derajat bebas r-r1 dan n-r, dapat digunakan untuk menguji hipotesis nol :
[
]
(10.9)
Secara khusus, jika X adalah pangkat kolom penuh, maka hipotesis nol ini direduksi menjadi
.
Terdapat ekspresi R khusus yang digunakan dalam pengujian hipotesis tertentu untuk
model (10.1). Ekspresi ini merupakan jumlah kuadrat yang dikenal sebagai Jumlah Kuadrat
Tipe I, Tipe II, dan Type III.
Definition 10.1 Jumlah kuadrat Tipe I (JK Tipe I) untuk sebuah pengaruh, u, dalam model
adalah
, dimana
mewakili semua pengaruh sebelum u dalam model. JK Tipe I
diperoleh dengan menambahkan satu pengaruh pada satu waktu ke dalam model sampai
semua pengaruh telah ditambahkan. Untuk alasan ini, jumlah kuadrat tersebut disebut sebagai
sekuensial.
Sebagai

contoh,

JK

Tipe

untuk

pengaruh

dan

i = 1, 2, ...a; j = 1, 2, ..., b adalah masing-masing


dan
model
yang
sama
ditulis
, maka jumlah kuadrat tipe I untuk dan
masing
pengaruh

dan
dalam model.

(
bahwa

,
, dan
untuk model.

dalam

model,

. Namun, jika
sebagai
adalah masing-

. Dengan demikian, JK Tipe I bergantung pada urutan dari


Perhatikan bahwa JK Tipe I untuk
adalah
, yang biasanya disebut sebagai faktor koreksi. Dicatat juga
, menjelaskan partisi dari jumlah kuadrat regresi,

Definition 10.2 JK Tipe II untuk sebuah pengaruh, u, dalam model disesuaikan untuk
semua pengaruh lainnya dalam model, kecuali bagi yang mengandung u (yaitu, tidak
disesuaikan untuk interaksi yang melibatkan u, atau pengaruh bersarang dalam u).
Tipe ini digunakan jika ingin menguji masing-masing pengaruh utama setelah pengaruh
utama lainnya. Dengan catatan bahwa diasumsikan tidak terdapat interaksi yang signifikan
(dengan kata lain, diharuskan menguji interaksi terlebih dahulu dan hanya jika interaksi
tersebut tidak signifikan, maka dapat dilanjutkan untuk menganalisis pengaruh utama).
Sebagai contoh, untuk model,
dan

adalah masing-masing adalah

JK tipe II untuk pengaruh

dan
. Juga, untuk model,
(i = 1, 2, ..., a; j = 1, 2, ..., b; k = 1, 2, ..., nij),

JK Tipe II untuk pengaruh


, dan interaksi
adalah, masing-masing
,
, dan
. Perhatikan bahwa JK Tipe II tidak perlu menambahkan
hingga total JK Regresi untuk model, tetapi invarian dalam mengurutkan pengaruh dalam
model.

Definisi 10.3 JK Tipe III untuk pengaruh, u, pada prinsipnya, diperoleh dengan
menyesuaikan u untuk semua pengauh lainnya dalam model.
JK Tipe III ini pada prinsipnya sama dengan Tipe II, selain menguji pengaruh utama setelah
pengaruh utama lainnya, tetapi juga setelah interaksi keduanya (dalam hal ini interaksi yang
terjadi signifikan, jika tidak JK Tipe II lebih baik untuk digunakan).
Definisi ini masuk akal ketika model dalam (10.1) adalah pangkat penuh (seperti dalam
model regresi). Namun, untuk model yang pangkat kurang penuh dan tanpa adanya kendala
pada parameter model, definisi ini dapat menghasilkan nilai sama dengan nol untuk beberapa
pengaruh dalam model, seperti yang akan terlihat nanti dalam bagian 10.3. JK Tipe III
disebut juga jumlah kuadrat parsial.
Sebagai contoh, untuk model,

(i = 1, 2, ..., a; j =

1, 2, ..., b; k = 1, 2, ..., nij), JK Tipe III untuk pengaruh


dan
.

dan

, adalah, masing-masing

10.2 Model Dua Arah tanpa Interaksi


Pertimbangkan model dua arah tanpa interaksi,
, i = 1, 2,..., a; j = 1, 2,..., b; k = 0, 1, ..., nij, (10.10)
di mana

, dan

adalah parameter yang tidak diketahui dimana dua terakhir

mewakili pengaruh dari level kedua faktor, dilambangkan masing-masing dengan A dan B,
dan unsur-unsur
saling bebas dan berdistribusi
). Dengan asumsi bahwa
n..>a+b-1, di mana n.. adalah jumlah total pengamatan. Perhatikan bahwa nij, bisa saja nol
untuk beberapa (i,j) yang menunjukkan kemungkinan bahwa beberapa sel kosong (atau
hilang). Model ini dapat ditulis dalam bentuk vektor seperti pada (10.1). Dalam hal ini,
matriks X berukuran n..(a+b+1) dengan bentuk, X=[1n..:H1:H2], dimana
[

],

dan

Perhatikan

bahwa X adalah pangkat dari a+b-1. Ini hasil dari fakta bahwa sebanyak a kolom X
berhubungan dengan

yang dimasukkan sesuai dengan kolom pertama dari X, yang

merupakan kolom sebelumnya. Hal yang sama berlaku untuk b kolom X berhubungan
dengan
. Selain itu, vector dalam (10.1) terdiri dari ,
, dan
dalam model
(10.10).

10.2.1 Fungsi Linear yang dapat Diestimasi untuk Model (10.10)


Misalkan
kosong, maka

menjadi rata-rata dari sel ke (i, j). Jika sel (i,j) tidak
dapat diduga. Selama pangkat X adalah a+b-1, jumlah fungsi linear yang

dapat diduga dan saling bebas dari vektor parameter dalam model harus sama dengan a+b-1.
Selain itu, jika untuk j,
dapat diduga untuk beberapa i
i, kemudian
( )

dapat diduga. Demikian juga, jika untuk i,

j, maka

( )

dapat diduga untuk beberapa j

juga dapat diduga.

Lemma 10.1 Misalkan pola data dua arah adalah sedemikian rupa sehingga

( )

dan

( )

i dan j

yang dapat diduga untuk semua i

j untuk model (10.10). Jika (i0,

j0) adalah sel kosong, maka


(a) Semua sel rataan,
, dalam model yang dapat diduga
(b)

( ),

dan

( ),

i dan j

untuk semua i

j, membentuk

sebuah basis ruang dari semua fungsi linear yang dapat diduga dari parameterparameter dalam model.
Secara umum, jika A adalah fungsi linear yang dapat diduga dari vektor parameter
, di mana A adalah matriks berukuran s p dan berpangkat s (s a + b - 1 dan p = a + b +
1), kemudian oleh Teorema Gauss-Markov (Teorema 7.6), penduga linear takbias terbaik
(BLUE) diberikan oleh , di mana
dan
adalah vektor dari n..
pengamatan dari model (10.10). Dapat dipahami bahwa di bawah kondisi pendugaan dari
Lemma 10.1, BLUE dari
adalah

di mana, ,
Selanjutnya,

(i = 1, 2, ..., a) dan

dan

(10.11)

(j = 1, 2, .. ., b) adalah elemen 1 + a + b dari .

adalah BLUE dari masing-masing

Secara khusus, fungsi linear yang dapat diduga adalah:

(10,13)

dan penduga BLUE mereka adalah masing-masing


definisi,

dengan LSM(
LSM(

(10.12)

dan

. Menurut

adalah least-square mean untuk baris i (i = 1, 2, ..., a), dinotasikan


), dan

adalah least-square mean untuk kolom j, dinotasikan

). Rataan ini juga disebut Rataan Marginal populasi.


LSM seharusnya tidak dibingungkan dengan rataan tertimbang dari sel rataan dalam

baris i dan kolom j, yaitu, masing-masing

dan

, di mana

. Jika set data seimbang, maka LSM sama

dengan rataan tertimbang yang bersesuaian.

10.2.2

Hipotesis-hipotesis Yang Dapat Diuji untuk Model (10.10)

Secara umum, jika


adalah fungsi linear diduga dari , di mana, seperti
sebelumnya, A adalah matriks yang berukuran s p dan pangkat s ( a + b - 1), maka
hipotesis,
(10.14)
dapat diuji (lihat Definisi 7.2), di mana m adalah vektor konstan yang diketahui.
Menggunakan metodologi dalam Bagian 7.4.2 dan di bawah asumsi bahwa dalam model
(10.1) didistribusikan sebagai N(0,2In..), uji statistik untuk H0 diberikan oleh F-ratio
(

) [ (

(10.15)

di mana MSE = SSE / (n.. - a - b + 1) adalah kuadrat tengah galat (residual). Di bawah H0, F
memiliki F-Distribusi dengan s dan n..- a - b + 1 derajat kebebasan, dan H0 ditolak pada level jika F F, s, n.. -a-b+1.
Mari kita mempertimbangkan model (10.10) dengan asumsi bahwa
ij (k) secara
independen didistribusikan sebagai N(0,2). Jika kondisi estimability dinyatakan dalam
Lema 10.1 berlaku untuk satu set data yang diberikan, maka semua sel rataan, yaitu ij untuk
i = 1, 2, ..., a; j = 1, 2, ..., b, dapat diduga. Ada dua jenis hipotesis yang dapat diuji
mengenai tingkat faktor A dan B. Pengembangan hipotesis ini didasarkan pada lemmas
berikut.
Lema 10.2

, dan

saling bebas satu sama lain dan bebas terhadap

, KTG untuk model (10.10). Selanjutnya,

dan

berdistribusi chi-squared dengan masing-masing derajat bebas, a-1 dan b-1,


dan

Lema 10.3 Parameter noncentrality dari


hanya jika nilai-nilai

adalah sama dengan nol jika dan

(10.16)

adalah sama untuk semua i


Lema 10.4 Parameter noncentrality dari
hanya jika
.

adalah sama dengan nol jika dan

10.2.2.1 Pengujian Hipotesis Tipe I


Pengujian Hipotesis Tipe I untuk model (10.10) adalah hipotesis yang diuji oleh Frasio yang menggunakan JK Tipe I dalam pembilangnya. Jika model ini ditulis sehingga
muncul pertama diikuti oleh
, maka JK Tipe I untuk faktor A dan B adalah masingmasing

dan

. Rasio F yang bersangkutan, yaitu :


(10,23)
(10,24)

Sedangkan, jika model tersebut ditulis dengan

muncul pertama diikuti oleh

Tipe I untuk faktor B dan A masing-masing adalah


dan
terlihat dalam Bagian 10.1, dan Rasio F yang bersangkutan, yaitu :

, maka

JK

, seperti yang
(10,25)
(10,26)

Sekarang,
dan
menguji hipotesis bahwa sesuai dengan parameter
noncentral sama dengan nol. Atas dasar lemma 10.2 dan 10.3, hipotesis diuji dengan
adalah

(10.27)

Demikian pula, hipotesis yang diuji dengan

adalah

(10,28)

menggunakan sel rataan, ij, (10,27) dan (10,28) dapat ditulis sebagai

(10,29)

(10.30)

Hipotesis dalam (10.29) menunjukkan kesetaraan rataan tertimbang dari sel rataan di baris 1,
2, .. .,,a dan satu di (10,30) menunjukkan kesetaraan rataan tertimbang dari sel rataan di
kolom 1, 2, ..., b. Hipotesis yang tidak diinginkan untuk menguji pengaruh dari faktor A dan
B karena mereka merupakan data dependen (mereka bergantung pada frekuensi sel). Sebuah
hipotesis seharusnya dapat diatur sebelum mengumpulkan data dalam situasi eksperimental
yang diberikan. Dengan demikian, rasio-F,
dan
, tidak dianjurkan untuk
menguji pengaruh dari A dan B. Karena itu dapat dipertimbangkan dua rasio-F lainnya, yaitu
dan
, dimana hipotesis tersebut dijelaskan di bagian selanjutnya.
10.2.2.2 Pengujian Hipotesis Tipe II
Pengujian hipotesis Tipe II untuk faktor A dan B merupakan hipotesis uji dengan
rasio-F yang ditampilkan dalam formula (10,26) dan (10,24). Mengingat bahwa uji rasio ini
dimana parameter noncentrality yang berkesesuaian adalah sama dengan nol, kami
menyimpulkan, atas dasar lemma 10.2 dan 10.4, bahwa hipotesis ini adalah dalam bentuk
(10.31)
(10.32)
Menggunakan sel rataan, ij, (10,31) dan (10,32) dapat ditulis sebagai

(10.33)
(10.34)

Dari Bagian 10.2.1 yang ekspresikan pada (10,33) dan (10,34) adalah masing-masing
LSM untuk baris i dan kolom j, (i = 1, 2, ..., a; j = 1, 2, ..., b). Dengan demikian, Rasio F,
dan
, masing-masing adalah uji kesetaraan dari
dan
, , atau
secara ekuivalen, kesetaraan dari masing-masing LSM untuk baris a dan kolom b. Hipotesis
ini tidak bergantung pada data dan, tidak seperti hipotesis tipe I, yang invarian untuk
pengurutan pengaruh dalam model (10.10). Selanjutnya, hipotesis tersebut merupakan
bentuk yang sama seperti yang diuji dalam situasi data yang seimbang. Akibatnya, rasio F
pada (10,26) dan (10,24) adalah statistik uji yang direkomendasikan untuk menguji pengaruh
dari faktor A dan B. Hipotesis dalam (10.33) ditolak pada level
jika
. Demikian pula, hipotesis dalam (10.34) ditolak pada level
jika
.
Perhatikan bahwa pengaruh terakhir hipotesis tipe I dalam model, identik dengan
hipotesis tipe II nya, dan rasio F yang bersangkutan juga identik. Secara khusus, jika set data
seimbang, maka Hipotesis Tipe I dan Tipe II dan Rasio F- adalah sama
Hal ini juga harus dicatat bahwa, sebagai tindak lanjut Uji tipe II, jika uji F tertentu
signifikan, maka setiap perbandingan ganda antara level-level faktor yang bersangkutan harus
dibuat dengan menggunakan LSM faktor-faktor tersebut. Dengan demikian, beberapa
perbandingan melaui rataan tertimbang dari sel rataan (untuk baris a dan kolom b) seharusnya
tidak dianggap karena sejumlah pengujian menggunakan Rasio F,
dan
, tidak
diinginkan. Misalnya, untuk membandingkan LSM untuk baris i dan i (i
i ), kita dapat
mempertimbangkan hipotesis nol,
, dimana
dan
adalah vektor konstan
diketahui sehingga
dan
( ) . Uji statistik yang sesuai adalah

(10.35)
*(

di mana
. Dibawah Ho, statistik ini berdistribusi t dengan derajat bebas n..a - b + 1. Dua LSM dianggap berbeda secara signifikan pada level jika | t | t/2, n.. -a-b+1.
Uji t yang sama dapat digunakan untuk membandingkan LSM bagi kolom j dan j (j j).

Contoh Kasus 10.1


Penelitian dilakukan untuk mempelajari pengaruh dari tiga lemak yang berbeda (faktor A) dan
tiga zat aditif yang berbeda (faktor B) pada sejumlah volume roti. Data yang dihasilkan
diberikan dalam Tabel 10.1. Catat bahwa kita memiliki dua sel kosong, tapi kondisi
estimability dari Lemma 10.1 jelas terpenuhi. Jadi semua ada sembilan sel rataan yang dapat
diduga. Diketahui MSE = 0,7459 dengan derajat bebas n..-a-b+1=17-3-3+1=12. Tabel 10.2
dan 10.3 memberikan hasil analisis Tipe I dan Tipe II.
Mungkin dapat diingat kembali bahwa untuk menguji signifikansi pengaruh faktor A dan B
seharusnya dibuat berdasarkan analisis Tipe II. Dari Tabel 10.3, kita menemukan bahwa rasio
F faktor A dan B adalah
= 2,09 (nilai-p =0,1665) dan
= 14,73 (nilaip=0,0006). Dengan demikian, pengaruh dari faktor B adalah signifikan, tetapi untuk A tidak.
Ini berarti bahwa kita memiliki perbedaan yang signifikan antara LSM untuk tiga zat aditif,
tetapi tidak ada perbedaan yang signifikan yang dapat dideteksi antara LSM untuk tiga jenis
lemak. Nilai-nilai dalam Tabel 10.2 dan 10.3 diperoleh menggunakan dengan software SAS
(SAS, 2000, PROC GLM) (lihat Bagian 10.4 dan 10.5).

Perhatikan bahwa dari Tabel 10.2, Rasio F tipe I untuk A dan B sesuai dengan model
(10.10) adalah
=0,32 dan
=14,73. Tabel 10.2 tidak memberikan nilai
, yang sebenarnya sama dengan 12,95. Untuk mendapatkan nilai ini, model SAS harus
ditulis ulang dengan pengaruh B muncul pertama diikuti oleh salah satu dari A. Dalam kasus
apapun,
dan
tidak seharusnya digunakan untuk menguji pengaruh dari B dan
A, seperti yang disebutkan sebelumnya.

Penduga linear takbias terbaik (BLUE) bagi LSM untuk level-level faktor A dan B
diberikan oleh [lihat juga formula (10.12) dan (10.13)] :

Di mana ,

(i = 1, 2, 3), dan

(j = 1, 2, 3) adalah unsur-unsur

. Dari Tabel 10.1, nilai yang sebenarnya dari

dan

ditunjukkan

pada Tabel 10.4. Jika pengujian untuk faktor B adalah signifikan, hal itu akan menarik untuk
membandingkan kedua LSM tersebut menggunakan uji t yang dijelaskan dalam bagian
10.2.2.2. Tabel 10.5 memberikan nilai-nilai t untuk perbandingan berpasangan antara tiga
tingkat B beserta nilai-nilai p.

10.3 Model Dua Arah dengan Interaksi


Pertimbangkan model dua arah lengkap,
,

(10,36)

i = 1, 2, ..., a; j = 1, 2, ..., b; k = 1, 2, ..., nij. Perhatikan bahwa nij>0 untuk semua i, j


menunjukkan bahwa kumpulan data tidak mengandung sel kosong. Ini merupakan perluasan
model (10.10) dengan penambahan pengaruh interaksi,
, i = 1, 2, ..., a; j = 1, 2, ..., b.
Dengan demikian semua sel rataan, ij, dapat diduga untuk semua i, j. Seperti sebelumnya,
diasumsikan berdistribusi secara independen sebagai N(0,2).
Untuk model ini, matriks X pada (10.1) adalah berukuran n..(1+a+b+ab) dalam
bentuk :
[

],

(10,37)

di mana H1 dan H2 adalah sama seperti dalam bagian 10.2 dan


. Kita
catat bahwa pangkat dari X sama dengan ab, yang merupakan pangkat dari H3. Dengan
asumsi bahwa n..> ab. Vektor, , parameter yang tidak diketahui dalam (10.1) dalam hal ini
terdiri dari ,
(i = 1, 2, .a), dan
(j = 1, 2, ..b) dan ()(ij).
Selama ij dapat diduga untuk semua i dan j, semua fungsi linear dari
adalah

diduga. Penduga linear takbias terbaik (BLUE) bagi

(i

. Hal ini berdasarkan fakta bahwa


menghasilkan

= 1, 2, .a),
(j = 1, 2, ..b) dan
. Secara khusus, berikut fungsi-fungsi linear yang dapat diduga:

juga dapat

(10,38)

(10,39)

(10,40)
(

(10,41)

(10,42)

Di sini, LSM(

) dan LSM(

) adalah LSM untuk baris i dan kolom j, masing-masing (i =

1, 2, ..., a; j = 1, 2, ..., b),


kemudian dalam bagian 10.3.1 (

merupakan kontras interaksi yang akan ditentukan


,

); sedangkan

) dan

) adalah

rata-rata tertimbang dari sel rataan pada baris i dan kolom j, (i = 1, 2, ..., a; j = 1, 2, ..., b).

10.3.1

Pengujian Hipotesis

Analisis model (10,36) sehubungan dengan pengujian pengaruh utama dari A dan B
dapat dilakukan dengan menggunakan metode rataan kuadrat tertimbang (Weighted Square
of Means-WSM), yang diperkenalkan oleh Yates (1934). Berikut ini adalah deskripsi dari
metode ini.

Misalkan
. MVWM didasarkan pada penggunaan Xij dalam
menyusun jumlah kuadrat untuk A dan B:

(10.43)

di mana

Dengan demikian, bobot,

( )

dan (10,44) sama dengan

(10,44)

N (0,

) ,

. Perhatikan bahwa :

yang digunakan dalam jumlah kuadrat pada (10.43)

( ). Selanjutnya,

dan

adalah rata-rata tertimbang dari dan , diboboti dengan

Teorema 10.2 Jika

) ,

( )

dan

) ,

, dan

dan

dan

.
~

dalam model (10,36) saling bebas satu sama lain sehingga

), maka :

(a)
(b)
(c) jumlah kuadrat error untuk model (10,36), yaitu,

adalah saling bebas terhadap

dan

( 10.45)

(d)
di mana

dan

adalah parameter noncentrality terkait dengan faktor A dan B.

Lema 10.5
(a) Rasio

menguji suatu hipotesis :


H0: LSM(

di bawah H0,

(b) Rasio

) sama untuk semua i = 1, 2, ..., a

(10.50)

berdistribusi F dengan derajat bebas a-1 dan n..-ab.

menguji suatu hipotesis :


H0: LSM(

) sama untuk semua j = 1, 2, ..., b

di bawah H0, FB berdistribusi F dengan derajat bebas b-1 dan n..-ab.

(10.51)

10.3.1.1 Pengujian Pengaruh Interaksi


Pertimbangkan rasio berikut :

(10,52)
dimana,
(10.53)
adalah peningkatan jumlah kuadrat regresi yang dihasilkan dari penambahan ()( ij) ke dalam
model (10.10) sehingga muncul Model (10,36). Menurut definisi 10.3,
adalah
jumlah kuadrat tipe III untuk pengaruh interaksi.
Dengan menerapkan Teorema 10.1 dengan X1 =[1n ..: H1: H2], X2 = H3, r = ab, r1 =a + b 1, kita temukan bahwa :

dimana,

dan
[
]. Selanjutnya,
jumlah kuadrat error dalam (10,45). Oleh karena itu,

(10,54)

bebas dari SSE,


berdistribusi F

noncentral dengan derajat bebas (a - 1)(b - 1) dan n.. - ab serta parameter noncentral
Dengan (10,9),

= 0 jika dan hanya jika

(10,55)

Mari kita pertimbangkan lemma berikut :


Lema 10,6 parameter noncentrality,
hanya jika

pada (10,54) adalah sama dengan nol jika dan


, (10,56)

di mana

10.3.2

dan

adalah konstanta.

Analisis Tipe III di SAS

Kami telah membahas pengujian hipotesis tanpa interaksi dalam (10.62) yang telah
dilakukan dengan menggunakan Rasio F tipe III,
, yang dapat diperoleh
dengan mudah dengan menerapkan PROC GLM di SAS. Selain rasio ini, SAS juga
menyediakan Rasio F tipe III untuk faktor A dan B. Rasio terakhir, bagaimanapun, yang
berasal setelah menerapkan pembatasan tertentu pada parameter model (10,36), yaitu,

(10,63)
Kebutuhan pembatasan tersebut berasal dari kenyataan bahwa jumlah kuadrat tipe III untuk
faktor A dan B dalam model (10,36) sebenarnya identik sama dengan nol. Model ini
dikatakan overparameterized karena jumlah dari parameter yang tidak diketahui, yaitu 1 + a
+ b + ab, melebihi pangkat dari X dalam (10,37), yang sama dengan ab. Untuk model
seperti itu, jumlah kuadrat tipe III untuk A, menurut definisi,
tapi,

(10.64)
selama ruang kolom X direntang sepanjang kolom

Selanjutnya,
(10,65)

di mana X=[1n..:H2:H3] diperoleh dari X dengan menghapus a kolom yang berkesesuaian


dengan

dalam model. Selama ruang kolom dari X juga direntang oleh kolom H3, maka
(10,66)

Dari (10.64) - (10,66) kita menyimpulkan bahwa


(10,67)
Demikian pula, dapat ditunjukkan bahwa
.

(10.68)

Sekarang, mari kita reparameterisasi model (10,36) menggunakan pembatasan dalam


(10,63). Selama jumlah persamaan bebas linear pada (10,63) adalah sama dengan 1 +a + b,
maka jumlah parameter bebas linear dalam model (10,36) di bawah pembatasan ini adalah
ab, sama dengan pangkat dari X. Model (10,36) kemudian dapat direparameterisasi dan
dinyatakan dalam istilah ab parameter bebas linear untuk mendapatkan model,
(10,69)
di mana unsur-unsur

terdiri dari ab parameter bebas linear dan X* adalah matriks

berukuran n.. ab dan berpangkat ab. Dengan demikian, X* adalah berpangkat kolom
penuh dan oleh karena itu (10,69) adalah model full-rank. Menggunakan model ini, jumlah
kuadrat tipe III untuk A dan B dinyatakan sebagai
dan
, dan jelas tidak identik sama dengan nol. Ekspresi R ini merupakan JK
tipe III yang diberikan oleh SAS untuk A dan B.
Hal ini dapat menunjukkan bahwa
dan
adalah sama seperti
dan
, yaitu jumlah kuadrat untuk A dan B pada (10,43) dan
(10,44), yang diturunkan menggunakan metode rataan kuadrat tertimbang (WSM) (lihat,
misalnya, Speed dan Hocking, 1976, hal 32;. Searle, Speed, dan Henderson, 1981, Bagian
5.2; Searle, 1994, Bagian 3.1). Oleh karena itu kita dapat menyimpulkan bahwa atas dasar
model reparameterized pada (10,69), rasio-F tipe III untuk A dan B, yaitu

,
,
yang identik dengan Rasio F, FA dan FB, yang telah diberikan dalam Lemma 10,5. Hipotesis
yang bersangkutan adalah yang telah diuraikan dalam (10.50) dan (10.51) yang menyamakan
LSM untuk A dan B.
Jadi, dalam kesimpulan, analisis Tipe III yang diberikan dalam SAS dapat digunakan
untuk menguji signifikansi dari faktor A, B, dan interaksi A*B. Perhatikan bahwa F-ratio
tipe III untuk A*B, yang didasarkan pada model overparameterized (10.36), identik dengan
yang diperoleh di bawah model reparameterized (10,69), yaitu,
(
|
). Hal ini benar karena
(
|

) (10,36).

10,4 Model Tingkat Tinggi


Analisis model pengaruh tetap dalam kasus umum tidak seimbang, dengan tidak ada data
yang hilang dalam subkelas, dapat dilakukan dengan terlebih dahulu mengidentifikasi
hipotesis respon tertentu mengenai parameter model. Setiap hipotesis ini kemudian diuji
menggunakan rasio-F yang sesuai seperti pada (10.15) (asumsi klasik seperti normalitas,
bebas, dan persamaan ragam error dianggap valid). Sebuah cara yang lebih mudah untuk
melakukannya adalah dengan melakukan analisis mengandalkan PROC GLM di SAS.
Berikut ini adalah gambaran singkat dari apa yang bisa dipetik dari output SAS yang
mungkin membantu dalam analisis model.
(a) Opsi E
Opsi E dalam pernyataan model PROC GLM memberikan bentuk umum dari semua
fungsi linear yang dapat diduga dari untuk model umum seperti yang ditunjukkan pada
(10.1). Lebih khusus, jika L menunjukkan setiap vector konstanta, maka fungsi linear,
dapat diduga. Kenyataannya, hal ini mudah untuk menunjukkan
bahwa fungsi linear dari dapat diduga jika dan hanya jika dapat dinyatakan sebagai
untuk beberapa vektor L. Unsur-unsur
diberikan
dalam output SAS sebagai hasil dari mengaplikasikan opsi E. Sangat menarik untuk
dicatat di sini bahwa jumlah elemen-elemen L yang muncul pada

sebenarnya sama dengan pangkat X. Selanjutnya koefisien dari elemen-elemen L dalam


kombinasi linear ini

TABLE 10,6
Umum Bentuk Fungsi Diestimasi
Efek
Koefisien
L1
L2
L3
L1 - L2 - L3
L5
L6
L1 - L5 L6

semua dapat diduga dan membentuk basis ruang dari semua fungsi linear yang dapat
diduga dari .
Sebagai contoh, pertimbangkan model (10.10) :
hubungkan dengan kumpulan data pada Contoh 10.1. Dalam hal ini,
,
. Informasi yang
dihasilkan dari penggunaan opsi E dalam pernyataan SAS, MODEL Y = A B/E, yang
ditampilkan pada Tabel 10.6.
Atas dasar Tabel 10.6, kita mendapatkan fungsi linear,

)
(

)
)

)
(10.80)

yang diperoleh dengan mengalikan masukan dibawah "koefisien" oleh pengaruh yang
berkesesuaian dan kemudian menambahkannya terhadap hasil. Catat bahwa jumlah Li
pada (10,80) sebanyak 5, sama dengan pangkat X sebagaimana mestinya (dalam hal
ini, pangkat X : a+ b - 1 = 5). Li ini adalah konstanta sembarang dan karena itu
dapat diberikan nilai-nilai apapun. Oleh karena itu, koefisien dari Li pada (10,80),
yaitu,
,
,
,
,
semuanya dapat diduga dan seharusnya membentuk sebuah basis untuk ruang dari
semua fungsi linear yang dapat diduga dari menurut Lema 10.1 (b).
(b) Opsi E1, E2, dan E3
Opsi ini juga tersedia dalam pernyataan model PROC GLM. Pada opsi ini dihasilkan
fungsi-fungsi yang dapat diduga Tipe I, Tipe II, dan Tipe III, yang juga memunculkan
hipotesis - hipotesis Tipe I, Tipe II, dan Tipe III, untuk setiap pengaruh dalam model.
Selain itu, SAS juga menyediakan JK dan Rasio-F yang berkesesuaian pada Tipe I,
Tipe II, dan Tipe III. Misalnya, dengan menggunakan model (10.10) menggunakan
data pada Contoh 10.1, fungsi-fungsi yang dapat diduga Tipe I, II, dan III untuk A dan
B, masing-masing dapat diturunkan dari Tabel 10.7 hingga 10.9.

Dengan menggunakan Tabel 10.7, Tipe I fungsi-fungsi yang dapat diduga untuk A
dan B diperoleh dengan mengalikan entrian di bawah A dan B dengan pengaruh yang
bersangkutan dan kemudian menambahkannya terhadap hasil. Jadi, untuk faktor A,
fungsi yang dapat diduga Tipe I adalah dalam bentuk :

)
(

Perhatikan bahwa jumlah Li dalam kombinasi ini sebanyak 2, yang seharusnya sama
dengan jumlah derajat bebas bagi A. Hipotesis tipe I untuk A diperoleh dengan
menyamakan koefisien L2 dan L3 ke nol sebagai berikut:
(10.81)
(10,82)
Perhatikan bahwa (10,81) dan (10,82) dapat ditulis sebagai

) (10,83)

) (10,84)

Kita akui bahwa (10,83) dan (10,84) sebagai pembentuk hipotesis Tipe I untuk A yang
diberikan pada (10.27) yang memiliki nilai statistik uji yaitu
(lihat
Tabel 10.2).
Sedangkan fungsi yang dapat diduga Tipe I untuk B dari Tabel 10.7 adalah

, yang

menghasilkan hipotesis

Hipotesis ini sama dengan Hipotesis TIpe II untuk B pada (10,32) yang memiliki nilai
statistik uji yaitu
(lihat Tabel 10.2 atau Tabel 10.3). Perhatikan
bahwa selama model SAS disini ditulis sebagai Y = AB dengan A muncul pertama dan
B kedua, hipotesis Tipe I dan Tipe II dan Rasio-F untuk B adalah identik. Dalam
rangka untuk mendapatkan hipotesis Tipe I untuk B seperti pada (10,28) dan Rasio-F
yang bersangkutan,
, model kedua SAS harus ditambahkan kedalam kode SAS
di mana B muncul pertama dan A kedua. Dalam melakukannya, kita mendapatkan
.

Demikian pula, menggunakan Tabel 10,8 dengan cara yang sama, setelah menyusun
fungsi yang dapat diduga Tipe II dan menyamakan koefisien Li ke nol, hipotesis Tipe
II ditampilkan pada (10.31) dan (10,32). Nilai statistik uji yang bersangkutan adalah
dan
(lihat Tabel 10.3). Tabel 10.9
memberikan informasi yang sama seperti tabel 10,8 selama untuk model dua arah
tanpa interaksi, hipotesis dan Rasio-F Tipe II dan Tipe III adalah identik.
Seperti yang telah dijelaskan sebelumnya dalam Bagian 10.3.3, Analisis Tipe III lebih
disukai secara umum untuk menguji hipotesis mengenai semua pengaruh dalam
model. Hal ini didasarkan pada asumsi bahwa data diatur berdasarkan pertimbangan
tidak mengandung sel kosong.

10.5 Contoh Numerik


Suatu percobaan dilakukan pada tikus laboratorium untuk mempelajari pengaruh obat
pengurang rasa lapar (faktor A) dan lamanya waktu (faktor B), antara pemberian obat dan
makan, pada jumlah makanan yang tertelan oleh tikus. Dua tingkat dosis yang diterapkan,
yaitu, 0,3 dan 0,7 mg/kg, dan tiga tingkat waktu yang dipilih, yaitu, 1, 5, dan 9 jam.
Sebanyak 18 tikus berukuran dan usia yang seragam pada awalnya dipilih untuk percobaan,
dimana setiap kombinasi perlakuan AxB (6 kombinasi perlakuan) digunakan masing-masing
3 tikus. Pada permulaan percobaan, tikus diberi makan untuk jangka waktu tertentu. Masingmasing tikus kemudian diinokulasi dengan obat level dosis tertentu dan setelah jangka waktu
tertentu, diberi makan. Berat (dalam gram) makanan yang dicerna oleh tikus diukur. Namun,
selama percobaan, beberapa tikus menjadi sakit dan kemudian dieliminasi dari percobaan.
Hal ini mengakibatkan data tidak seimbang seperti dalam Tabel 10.10 berikut :

Plot titik data ditunjukkan pada Gambar 10.1 berikut :

Model yang dipertimbangkan adalah sebagaimana pada (10,36) :


.
Kuadrat tengah galat/error untuk data set ini MSE = 0,1904 dengan derajat bebas 7. Tabel
10.11 memberikan analisis Tipe III untuk A, B, dan A * B.

Hipotesis yang sesuai untuk A, B, dan A * B adalah yang tercantum dalam (10.50), (10,51),
dan (10,62). Catat bahwa ketiga uji sangat signifikan.
Dengan menerapkan rumus (10,43) dan (10,44) untuk mendapatkan jumlah kuadrat untuk A
dan B menggunakan metode kuadrat rataan tertimbang (MWMS). Kita temukan bahwa SSA
= 90,6558, SSB = 115,4312, yang identik dengan JK tipe III untuk A dan B, pada Tabel
10.11, seperti yang seharusnya.
Karena interaksi signifikan, menjadi hal yang menarik untuk melakukan beberapa analisis
lebih lanjut dengan menguji setiap faktor pada level-level tetap dari faktor lainnya. Seperti
yang direkomendasikan dalam Bagian 10.3.1, karena kedua faktor kuantitatif, kita dapat
mempertimbangkan menguji pengaruh polinomial masing-masing faktor pada level-level
tetap dari faktor lainnya. Pertimbangkan bahwa faktor A memiliki dua level dan faktor B
memiliki tiga level, pengaruh polinomial dari A terdiri dari hanya pengaruh linear, dan dari B
terdiri dari pengaruh linear dan kuadratik.
Secara umum, pengujian efek polinomial dapat mudah dilakukan dengan menggunakan
PROC GLM di SAS. Misalnya, untuk mendapatkan jumlah kuadrat untuk pengaruh linear
dan kuadrat dari B pada level tetap ith dari A (i = 1, 2), yang dilambangkan dengan BL(i),
BQ(i), kita dapat menggunakan pernyataan SAS berikut:
PROC GLM; CLASS
AB;
MODEL Y = ABA * B;
PROC SORT;
BY A;

PROC GLM,
BY A;
MODEL Y = BB * B;
RUN;
Prosedur SORT mengurutkan pengamatan dalam kumpulan data pada Tabel 10.10
berdasarkan level A. Pernyataan model pertama memberikan informasi untuk menyiapkan
Tabel 10.11. Pernyataan model kedua diperlukan dalam rangka untuk mendapatkan jumlah
kuadrat untuk BL(i) dan BQ(i) (i = 1, 2). Untuk tujuan ini, kita hanya perlu
mempertimbangkan JK Tipe I untuk B dan B * B dalam pernyataan model kedua yang
sesuai dengan BL(i) dan BQ(i). JK ini bersifat aditif, dan karena itu saling bebas secara
statistik. JK ini menghitung kontribusi kontras orthogonal yang mewakili pengaruh tersebut
(lihat, misalnya, Christensen, 1996, Bagian 7.12). Perlu dicatat di sini bahwa pernyataan
model kedua tidak didahului oleh pernyataan "CLASS". Alasannya adalah bahwa dengan
tidak adanya pernyataan CLASS, SAS memperlakukan model sebagai model regresi,
daripada model ANOVA, dimana model variabel independen (B dan B * B dalam hal ini)
diperlakukan sebagai variabel regresi kontinyu dengan satu derajat bebas masing-masing. JK
tipe yang relevan diberikan dalam Tabel 10.12 bersama dengan nilai F yang bersangkutan.

Perhatikan bahwa nilai F ini diperoleh dengan membagi masing-masing JK dengan MSE =
0,1904 untuk model dua arah penuh (nilai F diperoleh dari menggunakan PROC SORT yang
tidak seharusnya dianggap karena MSE yang digunakan dalam penyebutnya tidak
didasarkan pada seluruh himpunan data, dan karena itu berbeda dari 0,1904).
Demikian pula, untuk menguji pengaruh linear dari A pada level tetap B ke-j, yang
dilambangkan dengan AL(j)(j = 1, 2, 3), kita dapat menggunakan pernyataan SAS berikut:
PROC SORT; BY B;
PROC GLM; BY B;
MODEL Y = A;
RUN;
Dalam hal ini, karena faktor A memiliki satu derajat bebas, A dalam model pernyataan di
atas merupakan pengaruh linear dari A, yang merupakan satu-satunya pengaruh polinomial
untuk A, pada level tetap B. Hasil diberikan dalam Tabel 10.13.

Seperti pada Tabel 10.12, MSE = 0,1904, digunakan untuk menghasilkan nilai F pada Tabel
10.13. Dari Tabel 10.12 kita dapat melihat bahwa pengaruh linear dan kuadrat dari B
signifikan untuk level A 0,3. Namun, hanya pengaruh linear dari B yang signifikan untuk
level A 0,7. Hal ini dapat dengan jelas dilihat dari pemeriksaan Gambar 10.2 yang diperoleh
dengan memplot sel rataan yang diduga (nilai ) terhadap tiga level B.

Poin dengan level yang A yang sama dihubungkan. Gambar 10.2 menggambarkan pengaruh
interaksi dan karena itu dianggap plot interaksi. Gambar tersebut menunjukkan tren kuadrat
dalam rataan di bawah B untuk dosis rendah (0,3), tetapi hanya tren linear untuk dosis tinggi,
0,7. Di sisi lain, dari Tabel 10.13 bahwa semua pengaruh linear dari A yang signifikan untuk
setiap level B. Ini sama dengan mengatakan bahwa sel rataan A secara signifikan berbeda
untuk setiap level tetap B.
Secara umum, jika salah satu faktor kualitatif, misalnya, faktor B, dan jika interaksi
signifikan, perbandingan antara sel rataan dari B dapat dibuat dengan menggunakan Uji
Peringkat Tukeys Studentized pada level tetap dari A, seperti yang telah disebutkan dalam
Bagian 10.3.1. Atau, kita dapat mempertimbangkan menggunakan PROC GLM untuk
mendapatkan rasio F untuk menguji B untuk level tetap A. Hal ini dapat dicapai dengan
menggunakan pernyataan SAS berikut:
PROC GLM; CLASS AB;
MODEL Y = ABA * B;LSMEANS A *
B/ SLICE = A;
RUN:
Penggunaan opsi "SLICE = A" dalam pernyataan LSMEANS menjumlahkan partisi data
sesuai dengan level A. Untuk masing-masing agian-bagian partisi dari data, F-ratio diperoleh
dengan menguji kesetaraan LSM B untuk level tetap A. Penyebut F-ratio ini yaitu MSE untuk
model dua arah penuh. Output SAS dari menerapkan pernyataan di atas terhadap data Tabel
10.10 ditunjukkan pada Tabel 10.14.

Catat bahwa semua uji signifikan, yang menunjukkan bahwa ada perbedaan antara LSM B
untuk setiap level A. Tentu saja, dalam kasus kami, B adalah kuantitatif dan akan lebih
informatif untuk menggunakan Tabel 10.12 untuk menguji pengaruh polinomial untuk setiap
level A.

10.6 Metode Unweighted Mean


Salah satu alternatif metode kuadrat rataan tertimbang adalah metode cara tak tertimbang
(MUM), yang juga diperkenalkan oleh Yates (1934). Metode menyediakan perkiraan, tetapi
secara komputasi metode analisisnya sederhana. MUM mendefinisikan jumlah kuadrat yang
analog terhadap yang diperoleh dari situasi data seimbang dengan satu observasi per
kombinasi perlakuan, yaitu, rataan sampel dari sel yang bersangkutan. Kita seharusnya
menunjukkan metode ini dalam kasus model dua arah dengan interaksi seperti pada (10,36).
Seperti sebelumnya, kita asumsikan bahwa istilah galat dalam model secara bebas
berdistribusi sebagai N(0,2). Selain itu, nij>0 untuk semua i dan j, yaitu, data tidak
mengandung sel kosong.

Menggunakan notasi yang sama seperti dalam Bagian 10.3.1, misakan


.Misalkan juga

. Jumlah

kuadrat tak tertimbang yang berkaitan dengan faktor A, B, dan interaksi mereka, A * B,
adalah

(10,86)

(10,87)

(10,85)

dimana adalah rata-rata harmonik dari frekuensi sel yang diberikan oleh

(10,88)

Dasar pemikiran untuk penggunaan dalam JK di atas adalah sebagai berikut: Ragam dari
adalah

. Rata-rata ragam tersebut diatas semua sel ab adalah

Dengan demikian,

bertindak seperti n, frekuensi sel umum, jika set data seimbang.

Sekarang, misalkan

. Kemudian,
()

di mana

(10,89)

. Jika set data seimbang, maka

semua i, j dan

untuk

Lemma berikut memberikan justifikasi tambahan untuk

..

penggunaan rata-rata harmonik.


Lema 10,7 Perkiraan terbaik dari K dalam (10,89) dengan matriks diagonal dari bentuk
diperolah ketika
Perkiraan K dengan

.
dihitung untuk menggantikan sel frekuensi oleh rata-rata

harmonik mereka. Jadi, jika kita menganggap bahwa adalah bilangan bulat positif, dan
jika dalam sel ke (i, j) kita memiliki pengamatan, semuany sama dengan
, maka
,
, dan

dalam (10,85), (10,86), dan (10,87) akan mewakili jumlah kuadrat untuk A,

B, dan A * B, berdasarkan kumpulan data yang seimbang buatan ini.

10.6.1

Distribusi

, dan

Jumlah kuadrat dalam (10,85), (10,86), dan (10,87) dapat ditulis sebagai

(10,92)

(10,93)

)
(10,94)

di mana, jika kita ingat,


. Dengan asumsi kenormalan, saling
bebas, dan kesamaan ragam error, dapat dilihat bahwa
,di mana
dan K adalah matriks diagonal yang digunakan dalam (10,89).
Tidak seperti kasus data seimbang, tak satu pun dari jumlah kuadrat dalam (10,92),
(10,93), dan (10,94) memiliki distribusi chi-kuadrat terskala. Sebagai contoh, jika kita

, akan ditemukan bahwa matriks,

pertimbangkan

(10,95)

tidak idempoten, yang menyiratkan bahwa

tidak berdistribusi chi-kuadrat (lihat

Teorema 5.4). Selanjutnya,


,
, dan
dan
tidak independen karena

tidak saling independen. Sebagi contoh,

(lihat Teorema 5.5). Namun, ketiga jumlah kuadrat independen terhadap jumlah kuadrat
galat,

, pada

(10,45) selama

) independen

dari

Mari kita terapkan Lemma 5.1 terhadap


mengekspresikan

(lihat Contoh 5.5).


Dengan demikian, kita dapat

sebagai kombinasi linear dari peubah chi-squared saling bebas

dalam bentuk

di mana
(10,95),

(10,96)

menunjukkan jumlah nilai eigen tak nol yang berbeda dari matriks dalam
adalah nilai eigen ke I dengan pengali
, dan
adalah parameter noncentral

(i = 1, 2, ...,

).

Demikian pula, untuk

, diperoleh

(10,97)

di mana

, dan

(j = 2, 3) adalah jumlah sebanding dengan

(10,96) dan diperoleh dengan mengganti matriks


matriks bentuk kuadrat lainnya pada (10,93) dan (10,94).
Lema 10.8
(a)

(b)

(10,98)
,

, dan

dengan dua

(c)
di mana

10.6.2

Perkiraan Distribusi

, dan

Mari pertimbangkan kembali formula (10,96), (10,97 ), dan (10,98). Nilai-nilai eigen tak-nol,
(i = 1, 2, ..., k1),

(i = 1, 2, ..., k2), dan

(i = 1 , 2, ..., k3), semua positif. Hal ini

benar karena, misalnya, nilai eigen taknol dari matriks dalam (10,95) adalah sama dengan

yang semi definite positif. Jika nij dekat satu sama lain, maka

dan

sama dengan satu (i = 1, 2, ..., kj; j = 1, 2, 3) .Dalam hal ini,


(10,100)
di mana

(lihat bukti pada bagian kecukupan Teorema 5.4). Demikian pula, kita memiliki
(10,101)
(10,102)
dimana

kira-kira

dan

Konsekuensinya, Rasio-F

menguji hipotesis bahwa

(10,103)

, yaitu,

sama dengan hipotesis dalam (10,50), yang menyamakan LSM untuk faktor A. Di bawah H0,

memiliki kira-kira distribusi F dengan derajat bebas a - 1 dan n.. - ab. Demikian pula,
Rasio F :

(10,104)

(10,105)

uji hipotesis untuk B dan A * B identik dengan yang telah dijelaskan dalam Bagian
10.3.1.
Ingat kembali bahwa kecukupan pendekatan chi-squared pada (10,100), (10,101), dan
(10,102) tergantung pada kedekatan nilai eigen,

terhadap nilai 1 (i = 1, 2, ..., k j, j = 1,

2, 3), yaitu ketika nij dekat satu sama lain, seperti yang disebutkan sebelumnya. Ini setara
dengan mensyaratkan bahwa nilai-nilai

(10,106)

(10,107)

(10,108)

menjadi masing-masing dekat dengan satu (lihat Teorema 9.3). Perhatikan bahwa, secara
umum,

1,

1,

1. Dengan demikian, penggunaan metode rataan tak

tertimbang (MUM) di bawah perkiraan ini mungkin tidak pantas jika set data sangat tidak
seimbang. Snedecor dan Cochran (1980) menyatakan bahwa MUM adalah sangat tepat
hanya jika rasio nij terbesar ke yang terkecil kurang dari dua.
Gosslee dan Lucas (1965) menyarankan sebuah perbaikan pada perkiraan chi-squared
dengan mengubah derajat bebas untuk pembilang kuadrat rata-rata dalam (10,103), (10,104),

dan (10,105) (lihat juga Searle, 1971, hlm 365-367; Rankin, 1974). Dalam kasus khusus dari
percobaan faktorial dengan dua level untuk setiap faktor dan jumlah pengamatan tidak sama
di berbagai sel, Speed dan Monlezun (1979) menunjukkan bahwa semua jumlah kuadrat
yang dihasilkan oleh MUM untuk A, B, dan interaksi A*B didistribusikan persis seperti
. Oleh karena itu, dalam hal ini, Rasio-F MUM ini mengikuti tepat distribusi F dan
hipotesis yang diuji adalah sama sebagaimana pada data dengan kondisi seimbang.
Contoh. 10.2 Pertimbangkan kembali set data yang sama pada tabel 10.10. Dengan
menerapkan formula JK taktertimbang dalam (10.85), (10.86), dan (10.87), kita peroleh
nilai-nilai yang tercantum pada Tabel 10.15 beserta rasio-F dan perkiraan nilai-p. Rasio F ini
dihitung dalam basis formula (10.103), (10,104), dan (10,105).

Catat bahwa seluruh uji signifikan. Perbedaannya disini bahwa uji F dan nilai-p yang
bersangkutan mendekati.