Anda di halaman 1dari 24

HANNA DEWI MARINA HUTABARAT, S. Si.

ELONINTA KRISTIANI
NAHLIRA ANGGI NASUTION
TSUWAIBATUL ASLAMIYA
WAFIQ AZIZAH Br. SINAGA

ANALISIS
REGRESI DAN VARIAN
ANALISIS
REGRESI DAN VARIAN
ANALISIS
REGRESI DAN VARIAN

HANNA DEWI MARINA HUTABARAT, S. Si.


ELONINTA KRISTIANI
NAHLIRA ANGGI NASUTION
TSUWAIBATUL ASLAMIYA
WAFIQ AZIZAH Br. SINAGA
KATA PENGANTAR

Puji syukur kami panjatkan ke hadirat Tuhan Yang Maha Esa, yang telah
melimpahkan rahmat,nikmat, dan kesehatan kepada kami sehingga dapat menyelesaikan
tugas Projek ini dengan baik. Terima kasih kami ucapkan kepada Ibu Hanna Dewi Marina
Hutabarat, S. Si. selaku dosen pengampu mata kuliah Analisis Regresi dan Analisis Varians,
yang telah memberikan tugas ini kepada kami, serta terima kasih juga kepada pihak-pihak
yang membantu kami dalam mengerjakan tugas ini.
Terlepas dari semua itu, kami menyadari sepenuhnya bahwa masih ada kekurangan
baik dari segi susunan kalimat maupun tata bahasanya dalam pembuatan tugas Projek ini.
Oleh karena itu kami menerima segala saran dan kritik agar dapat memperbaiki tugas ini
agar lebih baik lagi.Akhir kata kami mengucapkan permohonan maaf apabila terdapat
kesalahan dalam penulisan maupun tata bahasa yang terdapat pada tugas ini dan semoga
tugas Projek ini dapat bermanfaat.

Medan, November 2021

Kelompok 3

ANALISIS REGRESI DAN VARIAN i


DAFTAR ISI

KATA PENGANTAR...........................................................................................................i
DAFTAR ISI..........................................................................................................................ii
BAB 1 TABEL ANOVA.......................................................................................................1
A. TABEL ONE WAY ANOVA...................................................................................1
B. TABEL TWO WAY ANOVA...................................................................................2
BAB 2 PENJELASAN TABEL ANOVA.............................................................................4
A. ANOVA SATU ARAH MENGGUNAKAN DATA VOLE 5................................5
B. CARA MEMBACA TABEL ANOVA 6.................................................................6
C. SETIAP BARIS DALAM TABEL MENGUJI HIPOTESIS NOL...........................7
ANALISIS REGRESI DAN VARIAN
D. APA YANG HARUS DILAKUKAN SETELAH ANOVA?.................................8 i

E. CARA MEMBACA HASIL ANOVA DALAM TEKS..........................................12


F. PRAKTIK YANG BAIK PERKIRAAN DAN KETIDAKPASTIANNYA..........12
G. DESAIN YANG TIDAK SEIMBANG....................................................................13
H. APA YANG TERJADI DI ANOVA YANG TIDAK SEIMBANG?.....................15
I. BEKERJA DI R........................................................................................................17
J. LATIHAN.................................................................................................................18
DAFTAR PUSTAKA............................................................................................................19

ANALISIS REGRESI DAN VARIAN ii


BAB 1
TABEL ANOVA

ANALISIS REGRESI DAN VARIAN ii


A. TABEL ONE WAY ANOVA
Rumus yang digunakan untuk melakukan uji ANOVA disajikan dalam bentuk
tabel sebagai berikut:
Tabel ANOVA Klasifikasi Satu Arah dengan Ulangan Sama
ANALISIS REGRESI DAN VARIANJumlah ii
Sumber
Derajat Bebas Kuadrat Tengah F hitung
Keragaman Kuadrat
JKK
Nilai tengah kolom JKK k −1 KTK =
k −1 KTK
Galat JKG KTG
JKG k (n−1) KTG=
(Error) k ( n−1 )

Total JKT nk −1

Di mana:
k ni k 2
T T¿ T
JKK =∑ ∑ x − ¿∗¿ ¿ JKK =∑ − ¿∗¿ ¿
2 2
i
2

ij
i=1 j=1 N i=i ni N
JKG=JKT −JKK JKK
KTK =
dbk
JKG KTK
KTG= F ❑hit =
dbg KTG
F ❑tabel =F(α ,dbk ,dbg) Jika F hit ≤ Ftabel , maka H 0 diterima

Keterangan:
JKT : Jumlah Kuadrat Total
JKG: Julah Kuadrat Galat
JKK: Jumlah Kuadrat Kelompok
KTG: Kuadrta Tengah Galat
KTK: Kuadrat Tengah Kelompok
Jika hasil ANOVA tolak Ho, maka dilakukan uji lanjut untuk mengetahui
pasangan perlakuan yang berbeda nyata. Ada banyak uji lanjut ANOVA antara lain uji
Beda Nyata Jujur (Tukey) dan Uji ScheFe.
B. TABEL TWO WAY ANOVA

ANALISIS REGRESI DAN VARIAN 1


ANOVA dua arah/ jalur adalah teknik statistik inferensial parametris yang
digunakan untuk menguji hipotesis komparatif lebih dari dua sampel (k sampel) secara
serempak bila setiap sampel terdiri dari dua kategori atau lebih.
Langkah-langkah dalam penggunaan Anova dua jalur adalah sebagai berikut:
a. Menghitung JK Total;
b. Menghitung Jumlah Kuadrat Kolom (JKK), yaitu kolom arah ke bawah;
c. Menghitung Jumlah Kuadrat Baris (JKB) Baris arah ke kanan;
d. Menghitung Jumlah Kuadrat Interaksi (JKI);
e. Menghitung Jumlah Kuadrat Galat (JKG);
f. Menghitung dk untuk:
g. dk kolom.
h. dk baris.
i. dk interaksi
j. dk galat.
k. dk total;
l. Menghitung Kuadrat Tengah (KT) yaitu membagi masing-masing JK dengan dk-
nya;
m. Menghitung harga fhit untuk kolom, baris dan interaksi dengan cara membagi
dengan Kuadrat Tengah Galat (KTG);
n. Menentukan nilai ftabel ; dan
o. Membandingkan nilai fhit dan ftabel serta membuat kesimpulan
Dengan:
a b nij 2 a b 2 2
y y ij y …
J K T =∑ ∑ ∑ y − … 2
ijk J K ¿Total =∑ ∑ −
i=1 j=1 k=1 n… i=1 j=1 nij n …
a 2
y i .. y …
2
J K AB=J K ¿Total−J K A −J K B
J K A =∑ −
i=1 ni n
b 2
y. j . y…
2
J K G=J K T −J K AB−J K A −J K B
J K B =∑ −
i=1 n. j n ..
F Tabel Baris=(α ,d b B , d b G)
F Tabel kolom =( α ,d b K , d bG )
F Tabel Interaksi =(α , d bI , d bG )
Tabel Anova Klasifikasi Dua Arah
Sumber db JK KT F Hit F Tab

ANALISIS REGRESI DAN VARIAN 2


Keragaman
J KB K TB
Baris (B) b−1 J KB K T B= FB
d bB KTG
J KK KTK
Kolom (K) k −1 J KK K T K= FK
d bK K TG
J KI K TI
Interaksi (I) (b−1)(k−1) J KI K T AB = FI
d bI KTG
Galat bk (n−1) J KG K TG
Total bk (n−1) J KT

Kesimpulan:
Setelah dilakukan pengujian, apabila nilai F Hitung > FTabel maka H 0 ditolak

ANALISIS REGRESI DAN VARIAN 3


BAB 2
PENJELASAN TABEL ANOVA

Mesin di bawah ANOVA modern adalah model linier. Jika model memiliki faktor
kategoris tunggal, ANOVA adalah satu arah. Jika model memiliki dua faktor kategoris itu
adalah ANOVA dua arah. Jika model memiliki faktor kategoris tunggal dan satu faktor
kontinu itu adalah ANCOVA, kependekan dari analisis kovarians (bab berikutnya). Desain
eksperimental yang lebih kompleks yang dianalisis secara klasik dengan ANOVA
bersarang, split-plot, latin-square, dan banyak lainnya.
Jika Anda memilih untuk melaporkan ANOVA, juga melaporkan efek dan
ketidakpastian mereka dalam beberapa cara, baik koefisien model atau kontras.
1. ANOVA menghasilkan tabel dengan satu baris untuk setiap istilah dalam model
linier. Istilah adalah faktor atau kovariat atau interaksi. Untuk ANOVA faktorial dua
arah, istilah-istilah ini adalah dua efek utama dan efek interaksi.
2. ANOVA menghasilkan F dan Nilai-p untuk seluruh model dan untuk setiap istilah
dalam tabel ANOVA.
3. Nilai-p dari istilah interaksi sering digunakan sebagai aturan keputusan untuk
menafsirkan efek utama. Kalau  p ≤0.05 p ≤ 0,05 maka jangan menafsirkan efek utama
tetapi sebaliknya memeriksa efek kondisi ("sederhana). Kalau  p>0.05 p>0,05
Kemudian menafsirkan efek utamanya. Terlepas dari itu, aturan keputusan semacam
ini sendiri kontroversial, dan untuk alasan yang bagus.
4. Jika efek utama harus ditafsirkan, beberapa ahli statistik menganjurkan pemasangan
kembali model tanpa efek interaksi, yang lain menganjurkan menafsirkan efek utama
dengan istilah interaksi dalam model. Ini hanya penting jika desain tidak seimbang
(lihat di bawah).
5. Terlepas dari keputusan apa pun, selalu plot data menggunakan plot Harrell atau plot
interaksi untuk memahami dan mengkomunikasikan besarnya dan pola interaksi.
6. Untuk faktor-faktor dengan lebih dari dua tingkat, Nilai-p sering digunakan sebagai
aturan keputusan untuk membedah faktor dengan tes pasca-hoc, seperti Tukey HSD.
7. Desain seimbang jika semua sel memiliki jumlah replikasi yang sama. Desain tidak
seimbang jika satu atau lebih sel memiliki jumlah replikasi yang berbeda. Desain
yang tidak seimbang membuatnya perlu untuk membuat keputusan, tidak ada yang
sempurna, dan semuanya kontroversial. Beberapa ahli statistik bahkan menganjurkan

ANALISIS REGRESI DAN VARIAN 4


secara acak mengecualikan data sampai desain kembali seimbang. Jangan lakukan
ini.
8. Ada beberapa cara untuk menguraikan jumlah kotak. Saya menyoroti tiga utama:
Tipe I (berurutan), Tipe II (sekuensial parsial), dan Tipe III. Sebagian besar
perangkat lunak statistik dan buku statistik pengantar default ke Tipe III dan,
akibatnya, banyak peneliti tidak menyadari bahwa Tipe I dan II ada. Default R adalah
Tipe I, dan ini dapat membuat perbedaan jika desainnya tidak seimbang.
Ini bukan kesalahan langka dalam publikasi.
9. Karena R default ke Tipe I jumlah kuadrat, Nilai-p suatu faktor tergantung pada
urutan faktor-faktor dalam model jika desain tidak seimbang. Ini adalah fitur, bukan
bug.
10. ANOVA berdasarkan jumlah tipe II kuadrat tidak tergantung pada urutan faktor jika
desain tidak seimbang, tetapi mengasumsikan bahwa interaksi adalah nol.
11. ANOVA berdasarkan jumlah tipe III kuadrat tidak tergantung pada urutan jika desain
tidak seimbang dan tidak menganggap interaksi adalah nol.
12. Jika desain seimbang, Tipe I, II, dan III jumlah kotak menghasilkan tabel ANOVA
yang sama. Dan tabel ANOVA hanya efek utama sama dengan tabel ANOVA yang
mencakup istilah interaksi. Semua ini tidak benar ketika desain tidak seimbang,
Namun, keputusan untuk menggunakan tipe II atau tipe III sangat kontroversial.

A. ANOVA SATU ARAH MENGGUNAKAN DATA VOLE


Data vole memiliki satu faktor ("pengobatan") dengan tiga tingkat ("kontrol",
"vitamin_E", "vitamin_C"). Dalam buku teks statistik yang menekankan pengujian
hipotesis, diagram alur "Tes mana yang harus saya gunakan" akan memandu
seorang peneliti mengingat desain ini ke klasifikasi tunggal, atau ANOVA satu
arah, karena tes t hanya dapat membandingkan dua tingkat tetapi ANOVA dapat
membandingkan lebih dari dua tingkat. Ada cara yang lebih baik untuk memikirkan
apa yang dilakukan ANOVA, tapi oke.
Berikut adalah tabel ANOVA dari data vole:

Df Jumlah Sq Berarti Sq Nilai F Pr(>F)

Pengobatan 2 248446 124223.0 2.95 0.057

Sisa 93 3912751 42072.6


Nilai-p memberikan probabilitas yang diamati F atau lebih besar F Jika null
itu benar. Hipotesis nol memodelkan data seolah-olah mereka diambil sampelnya
dari DAN
ANALISIS REGRESI distribusi tunggal dan normal dan secara acak ditugaskan ke kelompok yang
VARIAN 5
berbeda. Dengan demikian H 0 mencakup kesetaraan sarana di antara tingkat faktor.
Dalam data vole, faktor pengobatan tunggal memiliki tiga tingkat dan sedikit. nilai-
p dapat terjadi karena perbedaan sarana antara vitamin_E pengobatan dan kontrol,
atau antara vitamin_C pengobatan dan kontrol, atau antara dua perawatan vitamin.  
Tabel nilai-p atau ANOVA tidak menunjukkan apa yang berbeda, hanya
saja yang diamati F Secara tak terduga besar jika nol itu benar. Akibatnya, para
peneliti biasanya menafsirkan Nilai-p dalam tabel ANOVA sebagai bukti "efek"
dari istilah tetapi harus menggunakan alat tambahan untuk membedah efek ini. Alat
tambahan yang khas adalah perbandingan yang direncanakan,yang kontras di antara
subset dari tingkat pengobatan yang diidentifikasi apriori (atau kelompok tingkat)
atau perbandingan yang tidak direncanakan (tes "pasca-hoc") di antara semua
pasangan tingkat.

B. CARA MEMBACA TABEL ANOVA


Tabel ANOVA memiliki baris untuk setiap istilah dalam model linier yang
mendasarinya - masing-masing menambahkan komponen varians ke total, dan baris
untuk varians residual (baris varians residual ini sering dikecualikan dari tabel yang
diterbitkan). Model landak memiliki tiga istilah (satu tingkat TempTemp, satu
tingkat CO2 dan satu interaksi). Statistik untuk setiap istilah adalah
a) Derajat Kebebasan (df)
Jika istilah tersebut merupakan faktor, df akan sama dengan jumlah level (k)
untuk faktor minus 1. Anggap saja seperti ini: kontribusi varians karena faktor
adalah fungsi dari variabilitas k Level berarti sekitar grand mean. Berapa
banyak derajat variasi independen yang dimiliki level ini, mengingat bahwa kita
tahu arti besarnya? Jawabannya adalah k −1  setelah nilai-nilai dari k −1 berarti
tingkat ditulis ke bawah, k berarti tidak memiliki kebebasan untuk bervariasi;
nilainya harus 
k−1
k Y −∑ Y i
i
Untuk istilah interaksi, df adalah produk dari df dari masing-masing faktor
dalam interaksi.
b) Jumlah Kotak
Jumlah perbedaan kuadrat antara nilai yang dimodelkan dan rata-rata besar.
ANALISIS REGRESI Selain
DAN VARIAN
jumlah kuadrat untuk setiap istilah, kuadrat rata-rata residual dihitung 6
sebagai jumlah perbedaan kuadrat antara nilai yang diukur dan dimodelkan.
c) Mean Square 
Jumlah kotak dibagi dengan df (ini adalah "berarti" dengan df bertindak sebagai
jumlah hal yang disimpulkan).
d) F-ratio – Mean Square dari istilah yang dived oleh sisa mean square.
e) p-value – nilai-p untuk rasio F. F dibandingkan dengan distribusi-F, yang
merupakan distribusi rasio-F di bawah nol.

C. SETIAP BARIS DALAM TABEL MENGUJI HIPOTESIS NOL


Baris untuk setiap istilah dalam tabel ANOVA menguji hipotesis nol. Untuk
memahami hipotesis nol, terlebih dahulu perlu mendefenisikan beberapa istilah lagi.
Untuk tabel ANOVA di atas, yang menggunakan jumlah kuadrat tipe 3, peluangnya
adalah :
A. Suhu
p= prob { F ≥ F 0|CO 2 , Temp :CO 2 }. Nol tidak ada perbedaan dalam cara
bersyarat pada tingkat CO2 dan Temp: CO2. Ini setara dengan tidak ada
perbedaan antara rata-rata besar dan rata-rata marjinal Suhu+, atau
´
b 1= Resp−E ¿
B. CO2
p= prob { F ≥ F 0|Temp , Temp :CO 2 }. Nol tidak ada perbedaan berarti bersyarat
pada tingkat Temp dan Temp: CO2. Ini setara dengan tidak ada perbedaan
antara rata-rata besar dan rata-rata marjinal CO2 +, atau
´
b 2= Resp−E ¿
C. Temp: CO2
p= prob { F ≥ F 0|Temp , CO 2 } . Nol tidak ada perbedaan berarti bersyarat pada
tingkat Temp dan CO2. Ini setara dengan perbedaan antara rata-rata bersyarat
Temp+ / CO2+ dan rata-rata bersyarat yang diharapkan dari Temp+ / CO2+ jika
tidak ada interaksi.
b 2=E ¿

Sebagaimana dicatat dalam persamaan, ketiga perbedaan ini adalah


koefisien model linier di belakang ANOVA. Berikut adalah tabel koefisiennya
Estimasi Std. Error Nilai t Pr(¿|t |)
ANALISIS REGRESI DAN VARIAN 7
(Intercept) 9.66 0.36 26.6 0.00000
Temp1 -1.58 0.36 -4.4 0.00030
CO21 0.83 0.36 2.3 0.03325
Temp1:CO21 -0.67 0.36 -1.9 0.07910
Dalam ANOVA dengan tipe 3 jumlah kotak, variabel dummy dikodekan
menggunakan efek coding, yang berbeda dari pengkodean boneka diperkenalkan di
bab xxx. Konsekuensinya adalah bahwa rata-rata besar (rata-rata dari Resp di
semua nilai) sekarang menjadi nilai "referensi". Intersep dalam tabel ini, kemudian,
adalah berarti besar. Koefisien adalah perbedaan dari rata-rata besar,seperti yang
dijelaskan di atas.
Gunakan tabel efek bersyarat dan marjinal di atas untuk memeriksa bahwa
koefisien sama dengan perbedaan dalam persamaan di atas. Juga bukan berarti
bahwa pnilai untuk efek dalam tabel koefisien sama dengan nilai-p dalam tabel
ANOVA.
Penting untuk dicatat bahwa tabel ini berbeda dari tabel koefisien dengan
pengkodean boneka karena referensi itu adalah rata-rata Temp-/CO2- dan bukan
grand mean.

Estimasi Std. Error Nilai t Pr(¿|t |)


(Intercept) 8.23 0.73 11.3 0.00000
TempTemp+ 4.51 1.03 4.4 0.00028
CO2CO2+ -0.32 1.03 -0.3 0.76081
TempTemp+ CO2CO2+ -2.68 1.45 -1.9 0.07910

D. APA YANG HARUS DILAKUKAN SETELAH ANOVA?


Berikut adalah tiga strategi untuk menafsirkan tabel ANOVA faktorial yang
menggunakan jumlah kotak Tipe III. Semua strategi menggunakan nilai-p untuk
membuat serangkaian aturan keputusan. Dalam strategi pertama, yang merupakan
ANALISIS REGRESI DAN VARIAN 8

jenis penyederhanaan model atau pemilihan model, seorang peneliti memulai


dengan interaksi di bagian bawah tabel ANOVA dan bekerja, menghilangkan
persyaratan dengan p>0,05 dan memasang kembali model yang dikurangi sebelum
menafsirkan efek utama. Dalam strategi kedua, peneliti menggunakan tabel
ANOVA asli yang mencakup semua istilah untuk menafsirkan efek utama.
Strategi 1
1) Apakah interaksi p < 0,05?
a. Jika ya, maka jangan menguji efek utama. Tampilkan grafik untuk
menunjukkan pola efek bersyarat. Uji efek bersyarat jika ini menarik.
b. Jika tidak, maka reparasi model tanpa interaksi dan uji efek utama - Ini
sekarang setara dengan ANOVA menggunakan jumlah kotak Tipe II.
2) Apakah efek utama p < 0,05 $?
a. Jika ya, maka tetap dalam model
b. Jika tidak, maka reparasi model tanpa efek utama itu
Strategi 2
2. Apakah interaksi p < 0,05?
a. Jika ya, maka jangan menguji efek utama. Tampilkan grafik untuk
menunjukkan pola efek bersyarat. Uji efek bersyarat jika ini menarik.
b. Jika tidak, maka gunakan tabel yang sama dengan tes efek utama. Ini
menafsirkan efek utama dengan istilah interaksi dalam model. Ini adalah
logika anova menggunakan tipe iii jumlah kotak.
Strategi 3
3. Apakah interaksi p < 0,05?
a. Jika ya, maka lihat plot interaksi untuk menentukan apakah itu masuk akal
menguji efek utama. Misalnya, jika CO2+ jelas lebih rendah respresp pada
kedua tingkat temptemp, bahkan jika seseorang jauh lebih rendah (yaitu
interactaction), maka beberapa orang akan mengatakan bahwa tes efek
utama sangat berarti. Uji efek bersyarat jika ini menarik.
b. Jika tidak, maka gunakan tabel yang sama dengan tes efek utama

Secara umum, ahli statistik menyarankan terhadap strategi 3 (menafsirkan


efek utama di hadapan interaksi) - itu tidak salah, hanya saja efek utama memiliki
interpretasi canggung jika ada interaksi. Tentu saja ini benar jika ada istilah
interaksi dalam model, bukan hanya istilah yang signifikan secara statistik.
ANALISIS REGRESI DAN VARIAN 9

Kontroversinya lebih, jika interaksi p tidak signifikan, maka apakah kita


menerapkan strategi 1 (model refit tidak termasuk interaksi untuk menguji efek
utama) atau strategi 2 (gunakan tabel anova faktorial penuh untuk menguji efek
utama).
Df Jumlah Sq Rata-rata Sq Nilai F Pr(¿ F )
Temp 1 45.2 45.2 14.5 0.0011
CO21 1 4.1 4.1 1.3 0.2630
Temp:CO2 1 14.8 14.8 4.8 0.0413
maka seseorang tidak boleh melaporkan hasil ANOVA menggunakan sesuatu
seperti "Suhu memiliki efek signifikan pada metabolism F 1.20=14.5 , p=0.001.
Tidak ada efek CO2 pada metabolisme F 1.20=4.1 , p=0.26 ”. Ada efek interaksi
yang signifikan antara suhu dan CO2 pada metabolisme F 1.20=14.8 , p=0.04 ". Jika
seseorang menerima bahwa interaksi kecil pnilai adalah bukti efek interaksi maka
interpretasi faktor utama ini tidak masuk akal, karena dua hasil pertama
menyiratkan bahwa efek interaksi adalah nol (atau, bahwa ada efek konstan
dari Temp atau CO2 di kedua tingkat faktor lainnya), yang kemudian bertentangan
dengan hasil ketiga.
Lebih khusus lagi, jika seseorang menggunakan nilai-p untuk memandu
pengambilan keputusan, maka interaksi yang signifikan p Menunjukkan bahwa
tidak ada efek "utama" tunggal dari suatu faktor. Sebaliknya, efek
dari Temp bersifat bersyarat pada tingkat CO2, dan efek dari CO2 bersifat bersyarat
pada tingkat Temp. Hal ini mudah terlihat dalam plot interaksi, di mana efek
dari Temp besar ketika CO2 tinggi tetapi jauh lebih kecil ketika CO2 rendah.
Sesungguhnya efek dari Temp Pada CO2 rendah adalah 0,16.
Alih-alih menafsirkan faktor-faktor sebagai efek konstan, strategi yang lebih
baik adalah membandingkan efek bersyarat, yaitu efek dari Temp dalam setiap
tingkat CO2 dan efek dari CO2 dalam setiap tingkat Temp (efek bersyarat kadang-
kadang disebut "efek sederhana").
Kontroversi muncul dalam apa yang harus dilakukan setelah ANOVA jika
efek interaksi memiliki non-signifikan. Nilai-p. Pada titik ini, saya menyepak alih-
alih menjelaskan dasar kontroversi, karena pada akhirnya saya pikir masalah utama
dengan kedua strategi adalah penggunaan pengujian signifikansi hipotesis nol
untuk membuat keputusan analisis.
Bahkan, seluruh alasan mengapa saya menggunakan data landak sebagai
contoh untuk ANOVA faktorial adalah karena dengan indah menggambarkan
absurditas interaksi. Nilai-p aturan keputusan. Mengapa kita harus menafsirkan
hasil ANOVA ketika interaksi p adalah 0,079 berbeda dari ketika
interaksi p Apakah 0,04? Ingat, nilai-p adalah statistik "sampel" (dalam arti bahwa
itu sepenuhnya merupakan fungsi dari data sampel) dan dalam kondisi daya rendah
(yang mungkin, tetapi tidak harus, benar untuk data landak yang diberikan n = 6),
ANALISIS REGRESI DAN VARIAN 10
sebuah nilai-p sangat bervariasi.
Ada beberapa masalah dengan pendekatan ini. 1) Nilai-p bukanlah bukti
"tidak ada efek", 2) kekuatan untuk menguji efek interaksi relatif kecil terhadap
efek utama (ini adalah aturan umum, bukan sesuatu yang spesifik untuk data ini), 3)
interaksi SS menyumbang sekitar 7,2% dari total SS, yang tampaknya tidak
penting, dan 4) interaksi nilai-p cukup kecil untuk menaikkan bendera merah, dan,
yang paling penting, interval kepercayaan dari efek interaksi menunjukkan bahwa
nilai negatif yang besar dari interaksi sama konsistennya dengan data seperti nilai
sepele kecil (atau nilai nol). Tetapi CI tidak ada dalam tabel ANOVA dan banyak
peneliti gagal melaporkannya. Kelima poin ini menunjukkan bahwa percobaan ini
direplikasi, dengan ukuran sampel yang lebih besar, untuk mendapatkan perkiraan
yang lebih baik dari efek interaksi. Masalahnya tentu saja adalah bahwa eksperimen
jarang direplikasi, kecuali dalam penelitian biomedis.
Absurditas dari p Strategi aturan keputusan nilai untuk interpretasi efek
setelah ANOVA disorot dengan membandingkan plot hutan koefisien model dari
data landak nyata dan palsu. Tidak masuk akal untuk menggunakan tabel ANOVA
untuk menafsirkan pola-pola ini sebagai sangat berbeda (satu tanpa interaksi dan
efek utama yang konstan, yang lain dengan efek interaksi dan kondisional).
ANALISIS REGRESI DAN VARIAN 11

Gambar 16.1: Plot hutan (bagian atas plot Harrell) dari data landak yang sebenarnya
dan palsu. A) Data landak nyata. Efek interaksi tidak signifikan ( p = 0.079). B) Data
landak palsu. Efek interaksinya signifikan (p=0.04).

E. CARA MEMBACA HASIL ANOVA DALAM TEKS


Hasil ANOVA sering dilaporkan dalam teks bagian hasil, menggunakan
sesuatu seperti "Suhu memiliki efek signifikan pada metabolism
F 1.20=14.5 , p=0.001. Tidak ada efek CO2 pada metabolisme F 1.20=4.1 , p=0.26 ”.
Subskrip dari F statistik adalah tingkat pembilang dan penyebut kebebasan (df)
dari F-value ( ini adalah kolom dalam tabel ANOVA. Denomintor df mungkin
tidak muncul dalam tabel jika itu adalah df residual dan baris untuk istilah residual
tidak dilaporkan). Kadang-kadang saya menemukan df yang dilaporkan tidak
konsisten dengan deskripsi desain dan analisis, yang berarti data tidak dianalisis
seperti yang dinyatakan.

F. PRAKTIK YANGBAIK PERKIRAAN DAN KETIDAKPASTIANNYA


Keputusan untuk memasukkan atau mengecualikan efek interaksi dalam
model tidak boleh didasarkan pada nilai tetapi pada tujuan model.
1. Jika tujuannya adalah interaksi (karena model ilmiah memprediksi satu, atau
karena ini adalah biologi dan semuanya bersyarat), maka perkirakan efek

ANALISIS REGRESI DAN VARIAN 12


interaksi (sebagai koefisien model) p-nilai. Tidak ada kontroversi tentang
bagaimana memperkirakan efek ini dan ketidakpastiannya. Koefisien akan
berbeda antara model dummy dan efek berkode tetapi ini tidak apa-apa karena
mereka memiliki interpretasi spesifik yang berbeda tetapi interpretasi umum
yang sama.
2. Jika tujuannya adalah untuk memperkirakan efek utama konstan, maka
mengecualikan efek interaksi dari model dan melaporkan efek utama (sekali
lagi, sebagai koefisien dari model atau kontras jika efek pasangan lain yang
diinginkan) dengan ketidakpastian mereka. Gunakan plot interaksi (atau bagian
bawah plot harrell) untuk membenarkan memaksa interaksi ke nol (misalnya
efek interaksi menambahkan sedikit ke jumlah total kuadrat atau interpretasi
efek utama tunggal atau dua (atau lebih) efek bersyarat akan sama.
3. Dan jika seorang peneliti tertarik pada efek dari faktor-faktor tetapi ada bukti
kuat untuk interaksi non-sepele, kemudian melaporkan efek bersyarat (sebagai
kontras) dengan ketidakpastian mereka. Gunakan plot Harrel yang mencakup
istilah interaksi untuk menunjukkan efek bersyarat dan ketidakpastian ini. Jika
ada interaksi yang jelas, mungkin tidak masuk akal untuk menafsirkan efek
utama, bertentangan dengan apa yang beberapa orang berpendapat. Jika ada
efek positif dari faktor A di semua tingkat faktor B, kita tidak benar-benar
membutuhkan pNilai untuk menguji bahwa rata-rata efek positif ini signifikan.
Ini tidak menambah nilai pada plot dan efek bersyarat apa pun yang dilaporkan

G. DESAIN YANG TIDAK SEIMBANG


Jika desain tidak seimbang, urutan faktor penting dalam fungsi R anova
default . Desain yang tidak seimbang adalah desain di mana jumlah replikasi
berbeda di antara sel. Data seimbang karena ada enam replikasi di setiap sel. Jika
respirometer pecah sebelum mengambil langkah-langkah pernapasan tangki akhir,
desainnya tidak seimbang, salah satu sel hanya akan memiliki lima replikasi.
Dengan menghapus tiga replikasi acak (ini mungkin baik dalam satu sel atau
menyebar di seluruh sel. Pertama, berikut adalah jumlah replikasi di setiap sel:

Jumlah Berarti
Df Nilai F Pr(>F)
Sq Sq

Temp 1 60.20 60.20 19.06 0.00030

ANALISIS REGRESI DAN VARIAN 13


Jumlah Berarti
Df Nilai F Pr(>F)
Sq Sq

CO2 1 16.52 16.52 5.23 0.03325

Temp:CO2 1 10.81 10.81 3.42 0.07910

Dan berikut adalah dua tabel dengan urutan Temp dan CO2 terbalik dalam model

Df Jumlah Sq Berarti Sq Nilai F Pr(>F)

CO2 1 17.59 17.59 5.21 0.03561

Temp 1 66.14 66.14 19.59 0.00037

CO2:Temp 1 6.38 6.38 1.89 0.18720

Beberapa pengamatan sangat penting.


1. Statistik untuk baris terakhir, yang merupakan interaksi, tidak berubah.
2. Jika data ini dianalisis dalam paket perangkat lunak JMP, atau SAS, atau SSPS
maka pesanan tidak masalah. Berikut adalah apa tabel akan terlihat seperti

Jumlah Sq Df Nilai F Pr(>F)

Temp 58.77 1 17.41 0.00064

CO2 19.93 1 5.90 0.02648

Temp:CO2 6.38 1 1.89 0.18720

Jumlah Sq Df Nilai F Pr(>F)

CO2 19.93 1 5.90 0.02648

Temp 58.77 1 17.41 0.00064

CO2:Temp 6.38 1 1.89 0.18720

Kira Std. Kesalahan nilai t Pr(>|t|)

(Intercept) 9.50 0.407 23.367 0.0000


ANALISIS REGRESI DAN VARIAN 14
Temp1 -1.70 0.407 -4.172 0.0006

CO21 0.99 0.407 2.430 0.0265

Temp1:CO21 -0.56 0.407 -1.374 0.1872

3. Pesanan tidak mengubah statistik dalam tabel koefisien, bahkan untuk data yang
tidak seimbang:

Kira Std. Kesalahan nilai t Pr(>|t|)

(Intercept) 9.50 0.407 23.367 0.0000

CO21 0.99 0.407 2.430 0.0265

Temp1 -1.70 0.407 -4.172 0.0006

CO21:Temp1 -0.56 0.407 -1.374 0.1872

H. APA YANG TERJADI DI ANOVA YANG TIDAK SEIMBANG?


Tipe I, II, III jumlah kuadrat
Ketik I jumlah kotak. Berikut adalah tabel ANOVA (default)
menggunakan jumlah kotak Tipe I untuk data landak dengan tiga baris yang hilang.

Df Jumlah Sq Berarti Sq Nilai F Pr(>F)

Temp 1 62.248 62.248 18.4 0.0005

CO2 1 21.488 21.488 6.4 0.0219

Temp:CO
1 6.377 6.377 1.9 0.1872
2

Sisa 17 57.399 3.376

Pengkodean default variabel dummy dalam fungsi R adalah pengkodean


dummy, yang merupakan pengkodean yang digunakan untuk Tipe I atau  Jumlah
Kotak Sekuensial. Hipotesis yang diuji oleh setiap baris dalam tabel ANOVA
menggunakan jumlah kotak Tipe I adalah efek dari istilah baris itu bersyarat pada

ANALISIS REGRESI DAN VARIAN 15


semua istilah sebelum dalam model (atau di atasnya dalam tabel) dan mengabaikan
semua istilah .
Tipe II jumlah kotak. Berikut adalah tabel ANOVA menggunakan jumlah
kotak Tipe II untuk data landak dengan nilai yang hilang. Istilah interaksi
dikecualikan dari model linier, karena jumlah kotak tipe II digunakan untuk
memperkirakan efek utama mengabaikan interaksi (jadi ini akan masuk akal hanya
jika plot efek menyarankan interaksi kecil relatif terhadap efek utama). Jumlah
kuadrat untuk efek utama akan sama jika interaksi dimasukkan tetapi df residual,
dan dengan demikian nilai F dan P akan berbeda.

Df Jumlah Sq Berarti Sq Nilai F Pr(>F)

Temp 1 66.145 66.145 18.7 0.0004

CO2 1 21.488 21.488 6.1 0.0241

Sisa 18 63.776 3.543

Hipotesis yang diuji oleh setiap baris dalam tabel ANOVA menggunakan
jumlah kotak Tipe II adalah efek dari istilah baris itu bersyarat pada semua
istilah pada tingkat yang sama atau di bawahnya tetapi mengabaikan semua istilah
pada tingkat yang lebih tinggi dalam model (atau di bawahnya dalam tabel).
Misalnya, tes hipotesis untuk suatu faktor dikondisikan pada faktor-faktor lain
tetapi mengabaikan istilah interaksi di antara faktor-faktor. Akibatnya, hipotesis
yang diuji ini
Tipe III jumlah kuadrat. Berikut adalah tabel ANOVA menggunakan
jumlah kotak Tipe III untuk data landak untuk data yang hilang. Istilah interaksi
dikecualikan dari model linier, dan pendukung menggunakan jumlah Tipe III
kuadrat secara eksplisit menginginkan ini dalam model.

Jumlah Sq Df Nilai F Pr(>F)

Temp 58.770 1 17.406 0.0006

CO2 19.935 1 5.904 0.0265

Temp:CO2 6.377 1 1.889 0.1872

ANALISIS REGRESI DAN VARIAN 16


Jumlah Sq Df Nilai F Pr(>F)

Sisa 57.399 17

Hipotesis yang diuji oleh setiap baris dalam tabel ANOVA menggunakan
jumlah kotak Tipe III adalah efek dari istilah baris itu bersyarat pada semua istilah
dalam model.
1. Hipotesis yang diuji oleh p-nilai untuk TempTemp bersifat bersyarat pada CO2
dan Temp: CO2.
2. Hipotesis yang diuji oleh p-nilai untuk CO2 bersifat bersyarat
pada Temp dan Temp: CO2.
3. Hipotesis yang diuji oleh p-nilai untuk Temp:CO2 bersifat bersyarat pada Temp
dan CO2. Ini sama untuk jumlah kotak Tipe I (dan Tipe II, jika istilah interaksi
disertakan)

I. BEKERJA DI R
a. Jumlah kotak Tipe I di R
Fungsi basis R menghitung tabel ANOVA menggunakan jumlah kotak Tipe
I untuk objek model yang sesuai, seperti yang dikembalikan oleh . Berikut adalah
skrip untuk data landak. Pertama-tama saya membuat data yang tidak seimbang
dengan menghapus baris pertama yang merupakan baris kontrol.anova
b. Tipe II dan III Jumlah Kuadrat
Tipe II jumlah kuadrat dapat dihitung secara manual hanya dengan pas
model dua kali, sekali dengan faktor-faktor yang dipesan satu arah dan kemudian
dengan faktor-faktor yang dipesan sebaliknya. Paket mobil memiliki fungsi yang
secara khusus menghasilkan tabel ANOVA Tipe II dan Tipe III Anova.
Tipe II jumlah kuadrat dapat sesuai dengan interaksi dalam model, dan ini
menghasilkan jumlah Tipe II kuadrat untuk istilah utama tetapi sisanya salah
untuk Rasio-F karena merupakan sisa dari model penuh dan Tipe II
mengasumsikan efek interaksi adalah nol. Jadi, jika seseorang menginginkan meja
ANOVA dengan F dan p yang mencerminkan hal ini, maka interaksi harus
dijatuhkan dari model.
ANALISIS REGRESI DAN VARIAN 17
J. LATIHAN
1. Suatu penelitian dilakukan untuk mengetahui apakah terdapat pengaruh perbedaan
kartu kredit terhadap penggunaannya. Data di bawah ini adalah jumlah uang yang
dibelanjakan ibu rumah tangga menggunakan kartu kredit (dalam $). Empat jenis
kartu kredit dibandingkan :
JUMLAH YANG DIBELANJAKAN ($)
ASTRA BCA CITI AMEX
8 12 19 13
7 11 20 12
10 16 15 14
19 10 18 15
11 12 19
Ujilah dengan α =0.05 , apakah terdapat pengaruh kartu kredit pada
penggunaannya?

2. Seorang analis mempelajari premi untuk asuransi mobil yang dibebankan oleh
sebuah perusahaan asuransi di enam kota. Enam kota dipilih untuk mewakili
ukuran yang berbeda (Faktor A: kecil, sedang, besar) dan daerah yang berbeda di
negara bagian (Faktor B: timur, barat, selatan). Hanya ada satu kota untuk setiap
kombinasi ukuran dan wilayah. Jumlah premi yang dibebankan untuk jenis
pertanggungan tertentu dalam kategori risiko tertentu untuk masing-masing dari
enam kota diberikan dalam tabel berikut.
Faktor B
Faktor A
Timur Barat Selatan
Kecil 135 175 180
Sedang 150 180 160
Besar 155 195 165

ANALISIS REGRESI DAN VARIAN 18


DAFTAR PUSTAKA

Christensen, R. 1996. Analysis of variance, design, and regression: aplied statistical


methods. USA: CRC Press.

Rinaldi, A., Novalia, S. P., & Syazali, M. 2020. Statistika Inferensial untuk Ilmu Sosial dan
Pendidikan. Bogor: PT Penerbit IPB Press.

ANALISIS REGRESI DAN VARIAN 18

ANALISIS REGRESI DAN VARIAN 19

Anda mungkin juga menyukai