Anda di halaman 1dari 24

Dalam melakukan analisis meta, setelah menghitung effect size, yang perlu

dilakukan adalah menghitung effect size agregasi yang juga disebut dengan
summary effect. Pada penghitungan agregasi, ada dua model yang dapat dipilih,
yaitu model tetap dan model acak. Langkah terakhir sebelum dilaporkan adalah
membuat forest plot, untuk kemudian diinterpretasikan. Pada bab ini, ketiga langkah
tersebut dibahas lebih detail

Setelah effect size, variansi, dan standar error dari effect size sudah
diperoleh, maka prosedur analisis dilanjutkan dengan menghitung summary effect.
Summary effect dihitung untuk mengetahui rangkuman atau gambaran umum
mengenai effect size yang akan diamati. Untuk menghitung summary effect size
tentu tidak dapat langsung merata-rata effect size dari semua studi yang dianalisis.
Hal tersebut karena studi-studi yang dianalisis memiliki keragaman khususnya jika
ditinjau ukuran dan karakteristik sampel. Keragaman tersebut perlu diperhitungkan
dalam membuat summary effect.

Dalam meta-analisis kita menghitung effect size berdasarkan informasi atau


hasil amatan yang dilaporkan dari sejumlah studi yang dianalisis. Karena informasi
yang diperoleh berasal dari sampel (bukan populasi) maka effect size ( D, d, r, dsb)
yang dihasilkan merupakan effect size yang teramati dari sampel (observed effect).
Akan tetapi effect size yang sebenarnya pada level populasi (true effect) tidak
diketahui nilainya. Bagaimana kondisi true effect inilah yang membedakan antara
model efek tetap (Fixed Effect [FE]) dengan model efek acak (Random Effect [RE]).

FIXED AND RANDOM-EFFECTS MODEL

a. True Effect pada Model Fix Effect (FE) vs Random Effect (RE)
Untuk memudahkan dalam pengumpulan data, suatu studi biasanya
menggunakan teknik sampling untuk mendapatkan informasi mengenai sesuatu
yang sedang diteliti. Semakin besar sampel yang digunakan dalam suatu studi,
maka data yang terobservasi akan mendekati data asli. Oleh karena sampel
dalam suatu studi biasanya terbatas maka data yang terobservasi memuat error
yang berasal dari kesalahan sampling.
Seperti yang telah disinggung di atas, bahwa perbedaan mendasar antara
model FE dan RE adalah asumsi mengenai true effect. Model Fixed effect
menggunakan asumsi bahwa seluruh studi-studi yang dianalisis mempunyai
true effect yang sama. Model FE mengasumsikan bahwa keberagaman
observed effect (pada studi-studi yang dianalisis) hanya diakibatkan oleh
sampling error. Dengan kata lain, observed effect (Yi ) merupakan akumulasi
true effect (θ) dan sampling error (ε i ). Secara sistematis dituliskan sebagai
berikut .
Y = θ+ε i
Sementara model Random Effect (RE) menggunakan asumsi bahwa studi-
studi yang dianalisis memiliki true effect yang tidak sama atau bervariasi.
Dalam model RE true Effect Size diasumsikan berdistribusi normal. Oleh
karena itu, keberagaman pada observed effect (Yi ) pada model RE tidak hanya
dipengaruhi oleh sampling error (ε i ). Seperti pada model FE, Tetpi juga
dipengaruhi oleh keberagaman true Effect Size (ζ i) itu sendiri. Secara matematis
dapat di tuliskan sebagai berikut.
Yi =μ + ζ i + ε i ; (μ : mean true effect)
Perbandingan asumsi mengenai true effect pada model FE dan RE dapat
dilihat pada Gambar 3. 1.

Kapan model Fixed Effect digunakan? Model Fixed Effect (FE) digunakan
ketika populasi studi yang dianalisis memenuhi dua kondisi. Pertama kita
meyakini bahwa semua studi yang dianalisis identik (setara) secara fungsional.
Kedua, tujuan analisis adalah untuk membuat kesimpulan Effect Size hanya
berdasarkan populasi yang teridentifikasi dan tidak melakukan generalisasi
dalam skala yang lebih luas (Borenstein et al., 2009).
Kapan menggunakan model Random Effect? Model Random Effect (RE)
digunakan ketika populasi studi yang dianalisis berbeda secara fungsional yang
disebabkan karena treatment yang dilakukan oleh beberapa orang (Borenstein
et al., 2009). Perbedaan tersebut bisa diakibatkan perbedaan karakteristik
sampel/partisipan yang diamati, dan bagaimana treatment diterapkan kepada
sampel.
Gambar 3. 1. Asumsi true effect model FE dan RE (Borenstein et al., 2009)
Keterangan simbol:
● : True Effect
■ : Observed Effect
▼: Summary/mean Effect

b. Menghitung Summary Effect Size dengan Fixed-Effect Model


Langkah-langkah menghitung Summary Effect Size pada model FE sebagai
berikut:
Menghitung rerata effect terbobot (M) menggunakan rumus:

Keterangan:

Yi : Effect Size studi ke-i, dan

VYi : variasi Effecr size studi ke-i

Menghitung variansi dari summary effect (VM) menggunakan rumus:


Menghitung variansi dari summary effect (SEM) menggunakan rumus:

Menghitung Batas bawah (LLM) dan batas atas (ULM) menggunakan rumus:

Menghitung nilai Z untuk menguji hipotesis nol (H0 : True effect θ=0) ,
menggunakan rumus:

dimana Φ (|Z|) tandar normal distribusi kumulatif (standard normal cumulative


distribution). Φ (|Z|) dapat dihitung dengan MS. Excel dengan fungsi
“=NORMSDIST(Z)”.

c. Menghitung Summary Effect Size dengan Random-Effect Model


Seperti yang disebutkan di atas bahwa model RE mengasumsikan adanya
keragaman true effect pada masing-masing studi. Oleh karena itu, sebelum
menghitung nilai M dan terlebih dahulu dilakukan perhitungan untuk
mengestimasi variansi dari true Effect Size dari semua studi (disimbolkan
dengan τ 2 ). τ 2 disini diestimasi karena kita tidak memiliki informasi mengenai
true effect size pada studi-studi yang dianalisis. Artinya, jika kita mengetahui
true effect size dari setiap studi maka kita dapat langsung menghitung variansi
nya.
Berikut ini langkah-langkah menghitung summary effect pada model RE:
1. Mengestimasi Tau Square (τ 2):
Mengestimasi nilai τ 2 apat dilakukan dengan memanfaatkan informasi
yang ada pada observed Effect Size (disimbolkan dengan T2)
menggunakan metode DerSimonian and Laird sebagai berikut.

Dimana Q adalah WSS (weighted sum square) atau Jumlah Kuadrat


Terbobot
(JK terbobot),

Dimana k adalah banyaknya studi yang dianalisis, dan

Perlu diingat bahwa nilai variansi dari true effect (τ 2) tidak mungkin
bernilai kurang dari nol. Pada perhitungan statistik deskriptif, kita tahu
bahwa
rumus varians (s) adalah:

Oleh karenanya, meskipun x1 ¿x, nilai s akan selalu bernilai positif. Oleh
karena itu, apabila diperoleh hasil estimasi (T 2) ¿ 0, maka hal itu
disebabkan oleh sampling error, atau berarti nilai Q ¿ df. Pada kasus ini
kita menyimpulkan bahwa (T2) =0 ((Borenstein et al., 2009). Dengan
kata lain, hasil estimasi (T2) yang digunakan adalah
T2 ≥ 0
Setelah diperoleh nilai T2, kemudian dilanjutkan dengan menghitung nila
M dengan prosedur yang hampir sama seperti pada model FE.
Perbedaannya terletak pada variansi. Pada model RE variansi tidak
hanya berasal dari sampling error, tetapi juga berasal dari variansi true
effect (τ 2) tadi. Oleh karena itu, variansi dari masing-masing studi
dijumlahkan lagi dengan variansi true effect (τ 2) yang telah diestimasi
sebelumnya (V*y1=Vyi+T2).

Menghitung Rerata Effect terbobot (M*) menggunakan rumus:

Dimana

Dan

Menghitung variansi dari summary effect (vm*) menggunakan rumus:

Menghitung Standar Error dari summary effect (SE m*):

d. Meta-Analisis Group Contrasts


Group Contrasts merupakan jenis penelitian yang melibatkan satu
atau lebih variabel yang diukur pada dua atau lebih kelompok responden dan
kemudian dibandingkan. Jenis penelitian ini melaporkan hasil temuannya
dalam bentuk statistik deskriptif, seperti nilai tendensi sentral (Mean, SD,
dan proporsi). Nilai tendensi sentral tersebut kemudian digunakan untuk
membandingkan antara kelompok satu dengan kelompok yang lainnya.
Perbandingan antara dua atau lebih kelompok biasanya menggunakan uji
beda rata-rata (t-test) dan uji-F. Pengujian perbedaan rata-rata antar kelompok
biasa dikenal dengan analysis contrasts (Zhang & Heyse, 2012). Ada
dua bentuk penelitian group contrasts yang sering digunakan dan menarik
perhatian para peneliti, yakni penelitian experimental dan group differences.
Penelitian experimental merupakan jenis penelitian yang membandingkan
kelompok responden berdasarkan kondisi eksperimen yang diterimanya
(kelompok perlakuan dan kelompok kontrol). Perbedaan atau kontras antara
kelompok eksperimen dan kelompok kontrol terhadap variabel yang diukur
diinterpretasikan sebagai efek perlakuan (treatment effect) (Lipsey &
Wilson, 2001). Misalnya, penelitian dalam bidang pendidikan yang
membandingkan kelompok siswa yang diajar menggunakan media
pembelajaran berbasis komputer dengan kelompok siswa yang diajar tanpa
menggunakan media pembelajaran berbasis komputer (menggunakan media
pembelajaran tradisional) ditinjau dari prestasi belajarnya. Disisi lain, ada
penelitian group differences yang juga membandingkan kelompok responden,
namun kelompok yang dibandingkan bukan hanya berdasarkan kondisi
eksperimen yang diterimanya, akan tetapi berdasarkan hal lain. Hal lain yang
dimaksud bisa berdasarkan jenis kelamin, status demografi, dan lain-lain.
Misalnya, penelitian tentang perbedaan prestasi belajar siswa ditinjau dari jenis
kelaminnya
Hasil penelitian dari beberapa peneliti yang menggunakan jenis
penelitian group contrasts (penelitian experimental dan group differences)
tidak jarang ditemukan berbeda satu sama lain dalam menarik kesimpulan.
Dasar penarikan kesimpulan yang digunakan dalam jenis penelitian ini
berdasarkan uji hipotesis null (misalnya; uji-t). Misalnya, ada tiga penelitian
yang membandingkan dua kelompok (laki-laki vs perempuan, kelompok
perlakuan vs kelompok kontrol, dan lain-lain) ditinjau dari prestasi belajar
pada rentang waktu yang berbeda. Penelitian pertama menunjukkan bahwa
dari 10 responden (5 responden kelompok 1 dan 5 responden kelompok 2)
diperoleh rata-rata dan standar deviasi untuk kelompok 1 sebesar 3,0 dan 1,0,
sedangkan untuk kelompok 2 sebesar 5,0 dan 1,0. Berdasarkan uji beda
ratarata (t-test) diperoleh nilai t8 = 3,16 dengan p-value = 0,016. Penelitian
pertama kemudian menyimpulkan bahwa prestasi belajar kelompok 2 secara
signifikan lebih tinggi dari kelompok 1. Penelitian kedua mereplikasi
penelitian pertama dengan ukuran sampel yang lebih kecil (3 responden
kelompok 1 dan 3 responden kelompok 2). Hasilnya menunjukkan bahwa
rata-rata dan standar deviasi untuk kelompok 1 sebesar 3,0 dan 1,0,
sedangkan untuk kelompok 2 sebesar 5,0 dan 1,0. Berdasarkan uji beda
ratarata (t-test) diperoleh nilai t4 = 2,45 dengan p-value = 0,071. Penelitian
kedua kemudian menyimpulkan bahwa kedua kelompok tidak berbeda secara
signifikan. Penelitian ketiga tertarik untuk menjawab perbedaan hasil
temuan pada penelitian pertama dan kedua dengan mereplikasi penelitian
yang sama menggunakan ukuran sampel yang lebih besar (10 responden
kelompok 1 dan 10 responden kelompok 2). Hasilnya menunjukkan bahwa
rata-rata dan standar deviasi untuk kelompok 1 sebesar 3,0 dan 1,0,
sedangkan untuk kelompok 2 sebesar 5,0 dan 1,0. Berdasarkan uji beda
ratarata (t-test) diperoleh nilai t18 = 4,74 dengan p-value = 0,00016. Penelitian
ketiga kemudian menyimpulkan bahwa bukan hanya kelompoknya yang
berbeda, tapi perbedaannya lebih jelas dari penelitian sebelumnya.
Contoh kasus pada paragraf 2 menggambarkan kelemahan menggunakan uji
hipotesis null dalam membandingkan hasil di seluruh penelitian
(khususnya jenis penelitian contrasts group). Penelitian hipotesis yang
mengandalkan tes signifikansi (significance test) dapat membawa kita pada
kesimpulan yang tidak tepat (Card, 2012). Misalnya, hasil temuan pada
penelitian kedua yang mereplikasi penelitian pertama menjadi tidak akurat
karena tidak mempertimbangkan inadequacy of statistical power. Begitu juga
dengan penelitian ketiga yang salah menginterpretasikan nilai p-value
yang rendah sebagai besarnya efek. Untuk menjawab persoalan ini, maka
dalam bab ini akan difokuskan membahas effect size dan summary effect
pada jenis penelitian experimental dan difference group untuk mengurangi
kebingungan akibat temuan hasil penelitian yang berbeda-beda berdasarkan
uji signifikansi (misalnya, uji-t). Ada 4 jenis effect size yang akan dibahas
dalam bab ini sesuai dengan jenis penelitian experimental dan difference
group, yakni unstandardized mean difference, standardized mean difference,
proportion, dan odds ratio. Untuk summary effect, ada dua model
yang akan dibahas, yakni fixed-effect model dan random-effect model.
Dalam penafsirannya, Lipsey & Wilson (2001) membuat suatu kriteria
terkait besaran effect size, yakni jika effect size ≤ 0,20 maka besaran
(magnitude) dari effect size tersebut tergolong kecil (small), jika effect size =
0,50 maka besaran (magnitude) dari effect size tersebut tergolong sedang
(medium), dan jika effect size ≥ 0,80 maka besaran (magnitude) dari effect
size tersebut tergolong besar (large).

e. Menghitung Effect Size dari Group Contrasts

Unstandardized Mean Difference


Effect size jenis ini mempersyaratkan bahwa variabel yang diukur
(variabel dependen) dari semua penelitian yang akan digunakan sebagai
sampel dalam meta-analisis harus berada dalam skala yang sama (Cheung,
2015). Jika syaratnya terpenuhi, maka effect size dapat diperoleh langsung
dari selisih rata-rata skor mentah (unstandardized mean difference). Misalnya
dalam penelitian experimental dan group difference, jika variabel dependennya
adalah rata-rata IPK (skala 1-4) atau rata-rata prestasi belajar siswa
berdasarkan hasil UN (skala 0-100), maka effect size dapat diperoleh langsung
dari selisih rata-rata IPK atau prestasi belajar antar kelompok. Jika kita
misalkan 1 dan 2 sebagai rata-rata populasi kelompok 1 dan kelompok
2, maka selisih rata-rata populasinya didefinisikan sebagai:

Sehingga dapat diestimasi selisih rata-rata sampelnya ( D) menggunakan


persamaan dibawah ini.

Adalah rata-rata sampel untuk kelompok 1 dan kelompok 2. D


akan bernilai positif atau negatif. Jika bernilai positif, maka
dapat diartikan bahwa rata-rata kelompok 1 lebih tinggi dari kelompok 2,
begitupun sebaliknya. Selanjutnya, jika kita berasumsi
bahwa varians populasi dari kedua kelompok sama (asumsi
homogenitas varians), kita dapat menggabungkan varians kelompok 1 dan
kelompok 2 menjadi varians gabungan (S2pooled).
Dimana S1 dan S2 adalah varians sampel pada kelompok 1 dan kelompok 2, dan
n1 dan n2 adalah ukuran sampel pada kelompok 1 dan kelompok 2. Dengan
menerapkan teorema limit sentral (central limit theorem), maka dapat diestimasi
varians sampel pada kelompok 1 dan kelompok 2.

Karena X1 dan X2 independen, maka varians sampel dari D (VD) hanyalah jumlah
dari varians sampel kelompok 1(VX1) dan Kelompok 2 (VX2).

Jika varians populasi kedua kelompok diasumsikan tidak sama σ 12 ≠ σ 22, maka
persamaan estimasi varians sampel dari kelompok 1 dan kelompok 2 menjadi:

Dengan varians sampel dari D(VD):

Tampaknya antara pers. (6.9) lebih menarik dari pers. (6.6) karena tidak
memerlukan asumsi homogenitas varians. Namun, varians sampel dari D (V D)
menjadi kurang akurat dari pada varians sampel dari D(V D) bila asumsi
homogenitas varians sesuai. Ukuran sampel yang lebih besar mungkin
diperlukan untuk memperbaiki VD. Oleh karena itu, meta-analisis yang paling
banyak dipublikasikan didasarkan pada homogenitas varians dalam menghitung
varians sampel. Jika varians sampel dari D di kuadradkan. Maka akan diperoleh
standaerd error dari D.

f. MENGHITUNG SUMMARY EFFECT DARI GROUP CONTRASTS


Tahap terakhir dalam meta-analisis setelah menghitung effect size dari
masing-masing penelitian adalah menghitung summary effect. Summary effect
merupakan ringkasan efek atau efek rata-rata dari berbagai penelitian. Seperti
yang telah dijelaskan sebelumnya pada Bab 3, bahwa untuk menghitung
summary effect didasarkan pada satu dari dua model statistik, yakni fixed-effect
model dan random-effect model. Untuk jenis effect size seperti D, g, PD, dan
OR dan LogOR yang digunakan dalam penelitian experimental dimisalkan
dengan Y untuk mempermudah dalam perhitungan summary effect.
Contoh Kasus 5: Untuk contoh kasus ini, akan dihitung summary effect
dari contoh kasus 2 dengan menggunakan fixed-effect model dan random-effect
model. Data terkait rangkuman hasil perhitungan contoh kasus 2 disajikan pada
Tabel 6. 9.
1. FIXED-EFFECT MODEL
Adapun langkah-langkah dalam menghitung summary effect berdasarkan
fixed-effect model adalah sebagai berikut:
A. Menghitung weight (W).
Untuk menghitung weight digunakan pers. (3.4). weight dari penelitian
Yang Seok Yoo (W1).:

Sehingga, weight dari effect size penelitian lainnya. Berdasarkan

11
perhitungan, diperoleh total weight dari sebelas penelitian (∑ W iYi )
i=1

11
sebesar 169,968 total weight dari effect size sebelas penelitian (∑ W iYi ¿
i=1

sebsar 13,430. Hasil perhitungan disajikan pada Tabel 6. 10.

B. Menghitung summary effect (M)


Untuk menghitung summary effect (M) digunakan pers. (3.3).
C. Menghitung varians dari summary effect (VM).
Untuk menghitung varians summary effect (VM) digunakan pers. (3.5)

D. Menghitung standart error dari summary effect (SEM)


Untuk menghitung standart error dari summary effect digunakan pers
(3.6)

E. Menghitung batas bawah (LLM) dan batas atas (ULM)


Untuk menghitung batas bawah (LLM) dan batas atas (ULM) dari
summary effect digunakan pers. (3.7) dan pers. (3.8):

F. Menghitung nilai Z dan pengujian hipotesis.


Untuk menghitung nilai Z dan summary effect digunakan pers (3.9)
Untuk pengujian hipotesis:
H0 : M = 0
Ha : M ≠ 0
Maka dapat digunakan pers 3.10 dan pers 3.11

G. Menginterpretasikan Summary Effect berdasarkan fixed-effect model


Berdasarkan hasil perhitungan dengan fexed-effect model
diperoleh summary effect dari contoh kasus 2 (M) Sebesar 0,079 dengan
interval kepercayaan (confidence interval) 95% mulai dari-0,072 sampai
0,230. Karena interval kepercayaan (confidence interval) mengandung 0
(nol), maka ada bukti yang kuat bahwa perlakuan (treatment) yang
diberikan kepada kelompok siswa berupa model PBM tidak berbeda
dengan dengan kelompok siswa yang diajar dengan model PTBM dalam
hal meningkatkan prestasi belajar matematika siswa. Hal ini juga
diperkuat dengan hasil pengujian hipotesis null (H0 = 0) dimana kita harus
menerima hipotesis tersebut dikarenakan nilai Z dari summary
effect sebesar 1,026 dengan p-value one-tailed test (0,152) lebih besar
dari nilai α (0,05) dan p-value two-tailed test (0,304) juga lebih besar dari
nilai α (0,05). Jika diperhatikan nilai summary effect atau efek gabungan (
M=0,079) memang menunjukan besaran efek ( effect magnitude) yang
tergolong kecil (M ≤ 0,20).
Kesimpulan yang dpaat ditarik berdasarkan fixed- effect model
adalah tidak ada perbedaan keefektifan antara model pembelajaran
berbasis malasalah dan model pembelajaran tidak berbasis masalah
dalam meningkatkan prestasi belajar matematika siswa. Namun,
kesimpulan yang ditarik berdasarkan fixed-effect model ini akan menjadi
tepat atau akurat jika terbukti bahwa semua penelitian (kesebelas
penelitian) menghasilkan “true” effect size yang sama pada populasi
homogen (Yi = θ+ ε i). Oleh karena itu, sangat disarankan untuk selalu
menafsirkan ukuran heterogenitas sebelum memutuskan untuk menarik
kesimpulan berdasarkan fixed-effect model.

H. Forest Plot berdasarkan Fixed-Effect Model

Pada Gambar 6.1, summary effect ditunjukkan dengan label FE


Model. Summary effect sebesar 0,79 atau 0,08 dapat diartikan bahwa
prestasi belajar matematika meningkat 7,9% atau 8% lebih tinggi untuk
siswa yang diajar dengan model PBM daripada siswa yang diajar dengan
model PTBM. Perlu diketahui, jika summary effect bernilai 0 maka dapat
diartikan tidak ada perbedaan keefektifan pada kedua kelompok dalam
meningkatkan prestasi belajar matematika siswa, jika summary effect
bernilai lebih besar dari 0 maka dapat diartikan bahwa model PBM lebih
efektif daripada model PTBM dalam meningkatkan prestasi belajar
matematika siswa, dan jika summary effect bernilai lebih kecil dari 0 maka
dapat diartikan bahwa model PBM tidak lebih efektif daripada model
PTBM dalam meningkatkan prestasi belajar matematika siswa. Jika
diperhatikan forest plot pada Gambar 6.1, posisi summary effect hampir
mendekati garis 0 yang berarti tidak ada perbedaan kefektifan antara
kedua kelompok dalam meningkatkan prestasi belajar matematika siswa.
Hal ini sejalan dengan hasi pengujian hipotesis sebelumnya dimana harus
menerima hipotesis null (H0).
Informasi lain yang dapat diperoleh dari forest plot pada Gambar
6.1 adalah mengenai konsistensi effect size dari sebelas penelitian dan
penyebab summary effect menjadi tidak signifikan. berdasarkan forest
plot pada Gambar 6.1 diperoleh informasi bahwa dari sebelas penelitian
hanya ada tiga penelitian yang memiliki effect size yang jatuh pada
interval 0,50 sampai 0,90, yakni penelitian yang dilakukan oleh Farhan
dan Husnul. Interval kepercayaan (confidence interval) yang membatasi
setiap effect size menunjukkan ketepatan suatu penelitian. Jika interval
kepercayaan tidak termasuk 0, maka penelitian tersebut signifikan secara
statistik. Hal ini mengindikasikan bahwa sebagian besar effect size tidak
begitu konsisten antara penelitian yang satu dengan penelitian yang
lainnya dan hanya ada empat penelitian yang signifikan secara statistik
(tujuh penelitian lainnya tidak signifikan secara statistik). Selain itu, dari
sebelas penelitian diperoleh relative weight tertinggi sebesar 10,14% dari
relative weight total, yakni penelitian yang dilakukan oleh Wulansari.
Penelitian Wulansari memiliki pengaruh yang cukup besar terhadap
summary effect dibandingkan penelitian lainnya, sehingga menarik
summary effect ke arah yang mendekati garis 0 (ke arah yang tidak
signifikan).

2. RANDOM EFFECT MODEL


Adapun langkah-langkah dalam menghitung summary effect
berdasarkan random-effect model adalah sebagai berikut:
A. Menghitung weight (W*)
Dan sseterusnya untuk sepuluh penelitian lainnya. Berdasarkan

11
perhitungan, diperoleh total weight dari sebelas penelitian (∑ W 1*) sebesar
i=1

11
32,649 dan total weight (W*) dari effect size kesebelasan penelitian (∑ W
i=1

*
1Y1) sebesar 2,576. Hasil perhitungan disajikan pada Tabel 6.11.

B. Menghitung summery effect (M*)

C. Menghitung varians dari summary effect (VM*)

D. Menghitung standard error dari summary effect (SEM*)


E. Menghitung batas bawah (LLM*) dan batas atas (ULM*)

F. Menghitung nilai Z* dan pengujian hipotesis


G. Menginterpretasikan Summary Effect berdasarkan random-effect model
Berdasarkan hasil perhitungan dengan random-effect model diperoleh
summary effect dari contoh kasus 2 ( M*) sebesar 0,079 dengan interval
kepercayaan (confidence interval) 95% mulai dari -0,266 sampai 0,424.
Karena interval kepercayaan (confidence interval) mengandung 0 (nol),
maka ada bukti yang kuat bahwa perlakuan (treatment) yang diberikan
kepada kelompok siswa berupa model PBM tidak berbeda dengan dengan
kelompok siswa yang diajar dengan model PTBM dalam hal meningkatkan
prestasi belajar matematika siswa. Hal ini juga diperkuat dengan hasil
pengujian hipotesis null (H0 = 0) dimana kita harus menerima hipotesis
tersebut dikarenakan nilai Z dari summary effect sebesar 0,449 dengan p-
value one-tailed test (0,327) lebih besar dari nilai α (0,05) dan p-value two-
tailed test (0,653) juga lebih besar dari nilai α (0,05). Jika diperhatikan nilai
summary effect atau efek gabungan (M=0,079) memang menunjukkan
besaran efek (effect magnitude) yang tergolong kecil ( M ≤ 0,20).
Kesimpulan yang dpaat ditarik berdasarkan random-effect model adalah
tidak ada perbedaan keefektifan antara model PBM dan model PTBM
dalam meningkatkan prestasi belajar matematika siswa.

H. Forrest Plot berdasarkan Random-Effect Model


Pada Gambar 6. 2, summary effect ditunjukkan dengan label FE
Model. Summary effect sebesar 0,079 atau 0,08 dapat diartikan bahwa
prestasi belajar matematika meningkat 7,9% atau 8% lebih tinggi untuk
siswa yang diajar dengan model PBM dari pada siswa yang diajar dengan
model PTBM. Sama halnya dengan penafsiran pada fixed-effect
model, jika summary effect bernilai 0 maka dapat diartikan tidak ada
perbedaan keefektifan pada kedua kelompok dalam meningkatkan
prestasi belajar matematika siswa, jika summary effect bernilai lebih besar
dari 0 maka dapat diartikan bahwa model PBM lebih efektif daripada
model PTBM dalam meningkatkan prestasi belajar matematika siswa, dan
jika summary effect bernilai lebih kecil dari 0 maka dapat diartikan bahwa
model PBM tidak lebih efektif daripada model PTBM dalam meningkatkan
prestasi belajar matematika siswa. Jika diperhatikan forest plot pada
Gambar 6. 2, posisi summary effect hampir mendekati garis 0 yang berarti
tidak ada perbedaan kefektifan antara kedua kelompok dalam
meningkatkan prestasi belajar matematika siswa. Hal ini sejalan dengan
hasi pengujian hipotesis sebelumnya dimana harus menerima hipotesis
null (H0).

Informasi lain yang dapat diperoleh dari forest plot pada Gambar 6.2
adalah mengenai konsistensi effect size dari sebelas penelitian dan
penyebab summary effect menjadi tidak signifikan. berdasarkan forest plot
pada Gambar 6.2 diperoleh informasi bahwa dari sebelas penelitian hanya
ada tiga penelitian yang memiliki effect size yang jatuh pada interval 0,50
sampai 0,90, yakni penelitian yang dilakukan oleh Farhan dan Husnul.
Interval kepercayaan (confidence interval) yang membatasi setiap effect
size menunjukkan ketepatan suatu penelitian. Jika interval kepercayaan
tidak termasuk 0, maka penelitian tersebut signifikan secara statistik. Hal
ini mengindikasikan bahwa sebagian besar effect size tidak begitu
konsisten antara penelitian yang satu dengan penelitian yang lainnya dan
hanya ada empat penelitian yang signifikan secara statistik (tujuh
penelitian lainnya tidak signifikan secara statistik). Selain itu, dari sebelas
penelitian diperoleh relative weight tertinggi sebesar 9,28% dari relative
weight total, yakni penelitian yang dilakukan oleh Wulansari. Penelitian
Wulansari memiliki pengaruh yang cukup besar terhadap summary effect
dibandingkan penelitian lainnya, sehingga menarik summary effect ke arah
yang mendekati garis 0 (ke arah yang tidak signifikan).
3. HETEROGENITAS
Seperti yang telah dijelaskan sebelumnya bahwa summary effect
dengan fixed-effect model dapat menjadi informasi yang akurat jika semua
penelitian (kesebelas penelitian) menghasilkan “true” effect size yang sama
pada populasi homogen. Namun, jika diperhatikan forest plot pada Gambar 1
terlihat ada berbagai effect size yang berbeda dalam berbagai jenis populasi.
Dengan kata lain, domain penelitian yang dianalisis dalam metaanalisis
harus dilihat heterogen. Hal ini yang kemudian menjadi landasan atau dasar
untuk dilakukannya uji homogenitas. Pada Bab sebelumnya telah dijelaskan
bahwa ada tiga jenis informasi heterogenitas, yakni Q-statistic (pvalue),
A. Menghitung Q-Statistic

Q-Statistic sebesar 52,006 hanyalah ukuran variansi disekitar


summary effect, bukan ukuran heterogenitas. Namun, beberapa ahli
membandingkan Q-statistic dengan derajat kebebsannya (df = k-1) untuk
mengestimasi heterogenitas. Jika Q < df maka T2= 0 atau dapat dikatakan
bahwa variabilitas yang terjadi pada semua penelitian hanya disebabkan
oleh sampling error (syarat yang dipenuhi untuk menggunakan fixedeffect
model). Sebaliknya, jika Q≥ df maka asumsi homogenitas perlu ditolak dan
menerima asumsi heterogenitas. Artinya variabilitas yang terjadi pada
semua penelitian lebih besar dari yang diharpkan (variabilitas yang terjadi
bukan lagi karena sampling error). Selain itu, dapat juga digunakan nilai p-
value dari Q-Statistic yang dibandingkan dengan α = 0,05. Jika P-value ˂
α maka asumsi homogenitas perlu ditolak dan menerima asumsi
heterogenitas. Untuk menghitung p-value digunakan bantuan fungsi
Microsoft Excell, yakni =CHIDIST(Q, df).
Berdasarkan perhitungan di atas, diperoleh nilai Q ≥ df (52,006 > 10)
dengan nilai p-value < α (0,00000011382 < 0,05), maka asumsi
homogenitas perlu ditolak dan menerima asumsi heterogenitas. Artinya,
variabilitas yang terjadi pada kesebelas penelitian tidak hanya disebabkan
oleh sampling error atau dengan kata lain“true” effect size pada kesebelas
penelitian tidak sama (Yi = μ+ζi+ εi). Dengan demikian menarik kesimpulan
berdasarkan informasi dari fixed-effect model tidak disarankan atau tidak
tepat. Oleh karena itu, perlu digunakan random-effect model untuk
menarik kesimpulan yang tepat. Untuk menggunakan random-effect
model perlu diestimasi variabilitas populasi atau varians dari “true” effet
size (T2).

B. Menghitung I2
Selain menggunakan Q-statistic untuk mengetahui ukuran variansi di
sekitar summary effect, ada I2 yang juga menggambarkan proporsi dari
ukuran variansi di sekitar summary effect dalam skala 0 sampai 100
persen. Untuk menghitung I2 digunakan persamaan berikut:

Jika I2 rendah (katakanlah ukuran rendah kurang dari atau sama dengan
25%), maka tidak ada heterogenitas atau dengan kata lain “true” effect
size pada semua penelitian sama, sehingga dengan menafsirkan hasil
summry effect dengan fixed-effect model saja sudah cukup. Jika I 2 tinggi
(katakanlah ukuran tinggi lebih besar dari 25%), maka ada heterogenitas
yang tidak hanya disebabkan oleh sampling error atau dengan kata lain
“true” effect size pada semua penelitian tidak sama, sehingga untuk
menafsirkan summary effect dengan fixed-effect model menjadi tidak tepat
atau tidak akurat, melainkan menggunakan random-effect model sama (Yi
= μ+ζi+ εi) karena mempertimbangkan dua faktor yang menyebabkan
ketidaktepatan dalam estimasi effect size, yakni variabilitas populasi (ζi ¿
atau variasi dari “ true” effect size (T2).

C. Menghitung T2

Varians dari “true” effet size ( T2) ini artinya nanti digunakan untuk
menghitung weight dari effect size yang baru pada Random-effect model
(Wi*).

g. BAGAN META ANALISIS KORELASI

Anda mungkin juga menyukai