Anda di halaman 1dari 21

Inferensi untuk Dua atau

Lebih means
Pendahuluan

Meskipun metode untuk membandingkan dua populasi memiliki


banyak penerapan. Metode-metode tersebut ketika sampel diambil secara
independen; yaitu menggeneralisasi uji t sampel independen
Uji t gabungan untuk membandingkan dua rata-rata tidak dapat
diterapkan langsung dengan perbandingan lebih dari dua rata-rata. Sebaliknya,
analisis yang paling sering digunakan untuk tujuan ini didasarkan pada
perbandingan varians, dan oleh karena itu disebut analisis varian, sering
disebut dengan singkatan ANOVA atau AOV.
Analisis Varians

Analisis of variance atau ANOVA merupakan salah satu teknik analisis


multivariate yang berfungsi untuk membedakan rerata lebih dari dua
kelompok data dengan cara membandingkan variansinya. Analisis varian
termasuk dalam kategori statistik parametrik. Metode statistik untuk
membandingkan rata-rata disebut analisis varians.
Konsep Varian

Tabel 6.2, masing-masing memiliki lima nilai sampel untuk masing-


masing dari tiga populasi. Melihat hanya pada means (rata-rata) terlihat
identik di kedua set. Dengan menggunakan means (rata-rata) tidak ada
perbedaan antara dua set.
Namun, ketika melihat plot kotak dari dua set, seperti yang ditunjukkan pada Gambar. 6.1,
perbedaan antara rata-rata di Set 1 dan rata-rata di Set 2. Itu karena plot kotak
menunjukkan bahwa pengamatan didalamnya sampel lebih rapat di Set 1 daripada di Set 2,

sampel berarti dari populasi dengan varian yang lebih kecil juga akan lebih sedikit
variabelnya. Jadi, meskipun varians di antara rata-rata untuk dua set identik, varians
diantara pengamatan dalam sampel individu lebih kecil untuk Set 1 dan lebih kecil. alasan
bukti yang tampaknya lebih kuat dari cara yang berbeda. Pengamatan ini adalah dasar
untuk menggunakan analisis varians untuk membuat kesimpulan tentang perbedaan
One way Anova

Tujuan dilakukannya uji anova satu arah adalah untuk membandingkan


dua rata-rata atau lebih yang akan digunakan untuk menguji kemampuan
generalisasi. Jika hasil pengujian ditemukan kedua sampel tersebut
berbeda, maka bisa digeneralisasikan.

Anova satu arah berfungsi menganalisis data yang hanya memiliki satu
variabel bebas atau karena satu faktor.
Asumsi Anova

1. Independen variabelnya berskala nominal atau katagorikal


2. Independen variabel ini sering disebut juga sebagai faktor
3. Dependen variabelnya berskala numerik (rasio atau interval)
4. Data berdistribusi normal
Asumsi Anova

Membandingkan means sampel T populasi, (T ≥ 2), berdasarkan sampel


acak yang diambil secara independen dari populasi. sampel dengan
ukuran ni diambil dari populasi I, i = 1,2, ... ,T. Pengamatan dari
sekumpulan data tersebut dilambangkan dengan

Yij, i = 1, ... ,T dan j = 1, ... , ni.


Rumus Anova

Sb 2
F 
Sw 2

Sw 
2 n1  1S1  n2  1S 2  ...  nk  1S k
2 2 2

N k
n x  X   n2 x2  X   ...  nk xk  X 
2 2 2

Sb 2  1 1
k 1
n  x1  n2  x2  ...  nk  xk
X  1
N
df between  k  1 (numerator )
df within  N  k (denominat or)
CONTOH KASUS

Terdapat 3 cara dalam memeriksa kadar Hb, setiap


metode digunakan untuk memeriksa 5 orang, hasilnya
(gr/100ml) adalah:

metode 1 : 10 11 13 14,4 15
metode 2 : 9,8 11,2 13,4 14,2 15
metode 3 : 11 12,2 13,6 14,2 14,4
Apakah ada perbedaan kadar Hb dari tiga metode tsb,
dengan  5%

Hipotesis :
Ho : 1=2=3 tidak ada perbedaan mean tiga metode
Ha : 1 ≠ 2 ≠ 3 ada perbedaan mean tiga metode
SOLUSI

Metode 1 Metode 2 Metode 3


10 9.8 11
11 11.2 12.2
13 13.4 13.6
14.4 14.2 14.2
15 15 14.4
Rata-rata 12.68 12.72 13.08
Varian (S2) 4,61 4.67 2.54
SOLUSI
5 *12.68  5 *12.72  5 *13.08 63,4  63.6  65.4
X    12.82
15 15
Sw 2 
5  1* 4.61  5  1* 4.67  (5  1) * 2.54  18.44  18.68  10.16  3.94
15  3 12
512.68  12.82   512.72  12.82   513.08  12.82 
2 2 2
0.098  0,05  0.8
Sb 
2
  0.474
3 1 2
Sb 2 0.474
F   0,12
Sw 2 3.94
df between  k  1 (numerator )  3 - 1  2
df within  N  k (denominat or)  15 - 3  12
Fhit  0,12 Ftab  3.89
Fhit  Ftab  ho gagal ditolak
p  nilai   ho gagal ditolak

•Dengan demikian dengan  5 % dapat disimpulkan bahwa secara statistik tidak


ada perbedaan rata rata kadar Hb pada ketiga kelompok data tersebut (p>0,05).
Pembenaran Heuristik untuk Analisis Varians

Pada bagian ini, kami menyajikan pembenaran heuristik untuk analisis prosedur
varians untuk kasus seimbang (semua ni = n).
Untuk analisis varian
hipotesis nol adalah rata-rata populasi yang diteliti adalah sama
hipotesis alternatifnya adalah bahwa ada beberapa ketidaksetaraan di antara means tersebut.

Distribusi sampel rata-rata ditentukan bahwa rata-rata sampel dihitung dari sampel acak ukuran n
dari populasi dengan rata-rata μ dan varians σ2 adalah variabel acak dengan rata-rata μ dan varians
σ2∕n.
T populasi yang mungkin memiliki rata-rata μi yang berbeda tetapi memiliki varian yang sama σ2.
Jika nol hipotesis benar, yaitu, masing-masing μi memiliki nilai yang sama, katakanlah μ, maka
distribusi masing-masing sampel T berarti, yi: , akan memiliki mean μ dan varians σ2∕n. menghitung
varians menggunakan rata-rata sampel sebagai pengamatan
/(T-1),
maka kuantitas ini adalah perkiraan σ2∕n. Oleh karena itu ns2 berarti adalah perkiraan σ2. Estimasi ini
memiliki (T - 1) derajat kebebasan, dan juga dapat ditunjukkan bahwa estimasi ini adalah independen
dari estimasi gabungan σ2 yang disajikan sebelumnya.
Jumlah Kuadrat antara Rata-Rata

rasio F dihitung dari dua perkiraan varians, yang masing-masing adalah jumlah kuadrat
dibagi dengan derajat kebebasan. untuk menghitung jumlah kuadrat; adalah,
Jumlah Kuadrat dalam Grup

Jumlah kuadrat untuk menghitung varian yang dikumpulkan,


sering disebut "di dalam". kelompok" atau "jumlah kesalahan
kuadrat," hanyalah jumlah dari jumlah kuadrat untuk masing-
masing sampel, yaitu
Model Linear

1. Model Linier untuk Populasi Tunggal


2. Model Linier untuk Beberapa Populasi
Model Linier untuk Populasi Tunggal

Konsep model linier dengan mempertimbangkan data dari populasi tunggal


yang terdistribusi secara normal dengan rata-rata μ dan varian σ2. Model
linier mengungkapkan nilai-nilai yang diamati dari variabel acak Y sebagai
persamaan atau model berikut:

Ruas kiri persamaan adalah yi, yang merupakan nilai pengamatan ke-i dari
variabel respon Y. Variabel respon juga disebut sebagai variabel dependen. Ruas
kanan persamaan terdiri dari dua suku: Bagian fungsional atau deterministik,
terdiri dari fungsi parameter. Dalam kasus populasi tunggal, bagian deterministik
hanyalah μ, rata-rata dari populasi tunggal yang diteliti.

Porsi acak, biasanya terdiri dari satu suku, εi, mengukur perbedaan dalam variabel
respon dan bagian fungsional dari model. Varians dari istilah kesalahan ini disebut
sebagai varians kesalahan
Model Linier untuk Beberapa Populasi

Kami sekarang beralih ke model linier yang menggambarkan sampel


dari populasi T ≥ 2 yang memiliki rata-rata μ1; μ2; ... ; μT , dan
varian umum σ2. Model linier menggambarkan variabel respon adalah
Asumsi dan Deteksi Pelanggaran

Asumsi dalam analisis varians biasanya dinyatakan dalam kesalahan ran-


dom, εij

1. Model yang ditentukan, , cukup mewakili perilaku data.


Karena model ini tidak memaksakan pola apa pun pada sarana grup, itu cukup fleksibel.
Pelanggaran yang paling umum adalah istilah kesalahan beroperasi sebagai perkalian faktor:
Dalam data, ini akan muncul sebagai pelanggaran asumsi varian yang sama (lihat Asumsi 3, di
bawah). Ini mudah ditangani dengan menganalisis logaritma dari variabel respon.

2. εij berdistribusi normal dengan rata-rata 0.


Persyaratan rata-rata menjadi 0 hanya terpenuhi, karena jika tidak kelompok berarti dapat
disesuaikan. Kondisi yang lebih ketat adalah bahwa dari distribusi normal. Penyimpangan kecil
dari normalitas bukanlah masalah, tetapi ekstrim kecondongan atau outlier ekstrim akan
melemahkan validitas analisis.
Asumsi dan Deteksi Pelanggaran

3. Pada setiap kelompok, εij memiliki variansi populasi yang sama, σ2:
Kasus varian yang sama kadang-kadang disebut sebagai
homoskedastisitas, dan varian yang tidak sama sebagai
heteroskedastisitas. Asalkan ada pengamatan yang cukup di setiap
kelompok, memplot residu berdasarkan kelompok harus
menunjukkan dispersi yang serupa.

4. εij independen dalam arti probabilitas: perilaku satu εij tidak


dipengaruhi oleh perilaku orang lain.
Biasanya, persyaratan bahwa pengamatan diperoleh secara acak cara
akan menjamin asumsi ini. Kesulitan yang paling umum adalah ketika
data dikumpulkan selama beberapa koordinat waktu atau ruang
sehingga pengukuran yang berdekatan cenderung terkait.
TERIMA KASIH

Anda mungkin juga menyukai