Anda di halaman 1dari 31

BAB 13

Penelitian Eksperimental
Penelitian eksperimental adalah salah satu metodologi penelitian paling kuat yang dapat
digunakan para peneliti. Dari banyak jenis penelitian yang mungkin digunakan, percobaan
adalah cara terbaik untuk membangun hubungan sebab-akibat antar variabel. Namun
eksperimen tidak selalu mudah dilakukan. Dalam bab ini, kami akan menunjukkan Anda
berdua kekuatan, dan masalah yang terlibat dalam, melakukan eksperimen.

Keunikan Penelitian Eksperimental


Dari semua metodologi penelitian yang dijelaskan dalam ini buku, penelitian eksperimental
adalah unik dalam dua hal hal-hal penting: Ini adalah satu-satunya jenis penelitian yang
secara langsung mencoba mempengaruhi variabel tertentu, dan ketika diterapkan dengan
tepat, itu adalah tipe terbaik untuk menguji hipotesis tentang hubungan sebab-akibat. Dalam
sebuah studi eksperimental, para peneliti melihat efek (s) setidaknya satu variabel independen
pada satu atau variabel yang lebih tergantung. Variabel independen dalam pengalaman
penelitian mental juga sering disebut sebagai variabel eksperimental, atau pengobatan,. Itu
variabel dependen, juga dikenal sebagai kriteria, atau hasil, variabel, mengacu pada hasil atau
hasil penelitian. Karakteristik utama dari penelitian eksperimental yang membedakannya dari
semua jenis penelitian lainnya adalah bahwa peneliti memanipulasi variabel independen.
Mereka memutuskan sifat perawatan (yaitu, apa itu akan terjadi pada subyek penelitian),
kepada siapa itu harus diterapkan, dan sejauh mana. Variabel independen sering dimanipulasi
dalam penelitian pendidikan termasuk metode pengajaran, jenis penugasan, bahan belajar,
hadiah yang diberikan kepada siswa, dan tipe pertanyaan yang diajukan oleh guru. Variabel
dependen yang sering dipelajari antara lain prestasi, minat dalam subjek, rentang perhatian,
motivasi, dan sikap menuju sekolah.
Setelah perawatan telah diberikan untuk lamanya waktu yang tepat, para peneliti mengamati
atau mengukur kelompok yang menerima perlakuan berbeda (berdasarkan berarti semacam
posttest) untuk melihat apakah mereka berbeda. Cara lain untuk mengatakan ini adalah yang
diinginkan para peneliti untuk melihat apakah perawatan membuat perbedaan. Jika skor rata-
rata kelompok pada postes berbeda dan para peneliti tidak dapat menemukan alternatif yang
masuk akal penjelasan untuk perbedaan ini, mereka dapat menyimpulkan itu pengobatan
memang memiliki efek dan kemungkinan penyebabnya perbedaannya. Penelitian
eksperimental, oleh karena itu, memungkinkan para peneliti melampaui deskripsi dan
prediksi, melampaui identifikasi hubungan, untuk setidaknya sebagian penentuan apa yang
menyebabkannya. Studi korelasional dapat menunjukkan hubungan yang kuat antara tingkat
sosial ekonomi dan prestasi akademik, misalnya, tetapi mereka tidak dapat menunjukkan
bahwa meningkatkan tingkat sosial ekonomi tentu akan meningkatkan pencapaian. Hanya
penelitian eksperimental yang memiliki kemampuan ini. Beberapa contoh aktual dari jenis
studi eksperimental yang telah dilakukan oleh peneliti pendidikan adalah sebagai berikut:
 Efek kelas kecil pada instruksi.
 Pengaruh instruksi membaca dini pada pertumbuhan tingkat TK berisiko.
 Penggunaan pendampingan intensif untuk membantu memulai guru mengembangkan
pengajaran yang seimbang.
 Efek lotere pada tingkat respons survei Web.
 Pengantar kursus tentang intimidasi ke dalam pelayanan kurikulum pelatihan guru
 Menggunakan cerita sosial untuk meningkatkan konflik antarpribadi keterampilan
resolusi anak-anak dengan ketidakmampuan belajar.
 Meningkatkan konsep diri siswa melalui Penggunaan hipnosis.

Karakteristik Esensial Penelitian Eksperimental


Kata eksperimen memiliki sejarah panjang dan termasyhur dalam catatan penelitian. Ini
sering dipuji sebagai metode paling kuat yang ada untuk mempelajari penyebab dan efek.
Asal-usulnya kembali ke awal sejarah ketika, misalnya, manusia purba pertama kali
bereksperimen dengan cara untuk menghasilkan api. Orang bisa membayangkan upaya coba-
coba yang tak terhitung jumlahnya di pihak mereka sebelumnya mencapai kesuksesan dengan
memicu batu atau dengan memutar gelendong kayu di daun kering. Banyak keberhasilan
sains modern adalah karena eksperimen yang dirancang dengan cermat dan
diimplementasikan dengan cermat. Ide dasar yang mendasari semua penelitian eksperimental
sangat sederhana: Cobalah sesuatu dan secara sistematis amati apa yang terjadi. Eksperimen
formal terdiri dari dua kondisi dasar. Pertama, setidaknya dua (tetapi sering lebih banyak)
kondisi atau metode dibandingkan untuk menilai efek dari kondisi atau "perawatan" tertentu
(variabel independen). Kedua, independen variabel dimanipulasi secara langsung oleh
peneliti. Perubahan direncanakan untuk dan sengaja dimanipulasi untuk mempelajari efeknya
pada satu atau lebih hasil (variabel dependen). Mari kita bahas beberapa karakteristik penting
dari penelitian eksperimental sedikit lebih detail.
1. Membandingkan kelompok : melibatkan 2 kelompok subjek yaitu kelompok
eksperimen dan kontrol atau kelompok pembanding.
2. Memanipulasi variabel bebas : memanipulasi variabel bebas yang berarti bahwa
peneliti sengaja dan langsung menentukan bentuk variabel bebas apa yang akan
diambil dan kemudian diterapkan pada kelompok mana.
3. Randomisasi : randomisasi subjek atau kelompok, meskipun ada pula penelitian
eksperimental yang tidak munkin untuk dilakukan randomisasi.

PERBANDINGAN KELOMPOK
Eksperimen biasanya melibatkan dua kelompok subjek, kelompok eksperimen dan kontrol
atau perbandingan kelompok, meskipun dimungkinkan untuk melakukan percobaan dengan
hanya satu kelompok (dengan menyediakan semua perawatan untuk subyek yang sama) atau
dengan tiga atau lebih kelompok. Itu kelompok eksperimen menerima semacam perlakuan
(seperti buku teks baru atau metode pengajaran yang berbeda), sedangkan kelompok kontrol
tidak menerima perlakuan (atau kelompok pembanding menerima perlakuan berbeda).
Kontrol atau kelompok pembanding sangat penting dalam semua penelitian eksperimental,
karena memungkinkan Peneliti untuk menentukan apakah perawatan telah dilakukan efek
atau apakah satu perawatan lebih efektif dari yang lain. Secara historis, kelompok kontrol
murni adalah kelompok yang tidak menerima perawatan sama sekali. Meskipun ini sering
terjadi dalam penelitian medis atau psikologis, jarang benar dalam penelitian pendidikan.
Kelompok kontrol hampir selalu menerima perlakuan berbeda. Beberapa peneliti pendidikan,
oleh karena itu, merujuk pada kelompok pembanding daripada mengontrol kelompok.
Pertimbangkan sebuah contoh. Misalkan seorang peneliti berharap untuk mempelajari
keefektifan metode pengajaran baru ilmu. Dia akan memiliki siswa dalam kelompok
eksperimen yang diajarkan oleh metode baru, tetapi siswa dalam kelompok pembanding akan
terus diajar oleh metode biasa guru mereka. Peneliti tidak mau kelola metode baru ke grup
eksperimen dan minta kelompok kontrol tidak melakukan apa pun. Metode apa pun dari
instruksi akan lebih efektif daripada tidak metode sama sekali!

MANIPULASI INDEPENDEN VARIABEL


Karakteristik penting kedua dari semua percobaan adalah bahwa peneliti secara aktif
memanipulasi independen variabel. Apa artinya ini? Sederhananya, artinya bahwa peneliti
sengaja dan langsung menentukan apa bentuk variabel independen yang akan diambil dan
kemudian kelompok mana yang akan mendapatkan formulir yang mana. Misalnya, jika
variabel independen dalam penelitian adalah jumlah antusiasme yang ditampilkan oleh
instruktur, seorang peneliti dapat melatih dua guru untuk menampilkan jumlah antusiasme
yang berbeda sebagai mereka mengajar kelas mereka. Meskipun banyak variabel independen
dalam pendidikan dapat dimanipulasi, banyak lainnya tidak bisa. Contoh dari variabel
independen yang dapat dimanipulasi termasuk metode pengajaran, jenis konseling, kegiatan
belajar, tugas yang diberikan, dan bahan yang digunakan; contoh variabel independen yang
tidak dapat dimanipulasi termasuk jenis kelamin, etnis, usia, dan preferensi agama. Peneliti
dapat memanipulasi jenis kegiatan pembelajaran dimana siswa terpapar di ruang kelas, tetapi
mereka tidak dapat memanipulasi, katakanlah, preferensi agama — yaitu, siswa tidak dapat
"dibuat menjadi" Protestan, Katolik, Orang Yahudi, atau Muslim, misalnya, untuk melayani
tujuan sebuah studi. Untuk memanipulasi suatu variabel, peneliti harus memutuskan siapa
yang akan mendapatkan sesuatu dan kapan, di mana, dan bagaimana mereka akan
mendapatkannya. Variabel independen dalam penelitian eksperimental dapat dibentuk
dengan beberapa cara — baik (1) satu bentuk variabel versus yang lain; (2) ada tidaknya
bentuk tertentu; atau (3) berbagai derajat dari bentuk yang sama. Contoh (1) akan menjadi
studi membandingkan metode inkuiri dengan metode ceramah instruksi dalam pengajaran
kimia. Contoh dari (2) akan menjadi studi yang membandingkan penggunaan PowerPoint
slide versus tidak ada slide PowerPoint dalam pengajaran statistik. Contoh (3) akan menjadi
studi yang membandingkan efek dari jumlah yang berbeda dari antusiasme guru pada sikap
siswa terhadap matematika. Di keduanya (1) dan (2), variabel (metode) jelas kategorikal.
Dalam (3), variabel yang dalam kenyataannya adalah kuantitatif (derajat antusiasme)
diperlakukan sebagai kategori (efek dari hanya jumlah antusiasme tertentu yang akan
dipelajari) agar peneliti memanipulasi (yaitu, mengendalikan) jumlah antusiasme.

RANDOMISASI
Aspek penting dari banyak eksperimen adalah acak tugas mata pelajaran ke grup. Meskipun
ada beberapa jenis eksperimen di mana penugasan acak tidak memungkinkan, peneliti
mencoba menggunakan pengacakan kapan pun memungkinkan. Ini merupakan unsur penting
dalam jenis eksperimen terbaik. Tugas acak serupa, tetapi tidak identik, dengan konsep
pemilihan acak kita bahas dalam Bab 6. Cara penugasan acak bahwa setiap individu yang
berpartisipasi dalam percobaan memiliki kesempatan yang sama untuk ditugaskan ke salah
satu kondisi eksperimental atau kontrol dibandingkan. Pemilihan acak, di sisi lain, berarti
setiap anggota populasi memiliki peluang yang sama untuk menjadi dipilih untuk menjadi
anggota sampel. Di bawah acak tugas, setiap anggota sampel diberi nomor (sewenang-
wenang), dan tabel angka acak (lihat Bab 6) kemudian digunakan untuk memilih anggota
kelompok eksperimen dan kontrol. Tiga hal harus dicatat tentang penugasan acak subyek ke
kelompok. Pertama, ini terjadi sebelum percobaan dimulai. Kedua, ini adalah proses
menugaskan atau mendistribusikan individu ke grup, bukan a hasil distribusi tersebut. Ini
artinya Anda tidak bisa lihat dua kelompok yang sudah terbentuk dan dapat mengetahui,
hanya dengan melihat, apakah mereka benar atau tidak terbentuk secara acak. Ketiga,
penggunaan tugas acak memungkinkan peneliti untuk membentuk kelompok itu, tepat di
permulaan penelitian adalah setara — artinya, mereka hanya berbeda secara kebetulan dalam
variabel minat apa pun. Di lain kata, tugas acak dimaksudkan untuk menghilangkan ancaman
variabel asing, atau tambahan — tidak hanya yang peneliti sadari tetapi juga yang tidak
mereka sadari — yang mungkin memengaruhi hasil penelitian. Inilah keindahan dan
keindahannya kekuatan penugasan acak. Itu salah satu alasannya mengapa eksperimen,
secara umum, lebih efektif daripada jenis penelitian lain untuk menilai sebab-akibat
hubungan. Pernyataan terakhir ini ditempa, tentu saja oleh kesadaran bahwa kelompok-
kelompok yang dibentuk melalui penugasan acak mungkin masih agak berbeda. Tugas acak
memastikan hanya bahwa grup tersebut setara (atau setidaknya sama dengan setara dengan
manusia yang dapat membuatnya) pada awal percobaan. Selain itu, tugas acak tidak ada
jaminan kelompok yang sederajat kecuali kedua kelompok tersebut memadai besar. Tidak
ada yang akan mengharapkan penugasan acak untuk menghasilkan kesetaraan jika hanya
lima mata pelajaran yang ditugaskan ke setiap grup, misalnya. Tidak ada aturan untuk
menentukan bagaimana kelompok besar harus, tetapi kebanyakan peneliti tidak nyaman
mengandalkan tugas acak dengan kurang dari 40 mata pelajaran di setiap kelompok.

Kontrol Ekstran Variabel


Para peneliti dalam studi eksperimental memiliki kesempatan untuk melakukan kontrol yang
jauh lebih banyak daripada di kebanyakan lainnya bentuk penelitian. Mereka menentukan
perawatan (atau perawatan), pilih sampel, tetapkan individu untuk kelompok, tentukan
kelompok mana yang akan mendapatkan perawatan, cobalah untuk mengendalikan faktor lain
selain perawatan yang mungkin memengaruhi hasil penelitian, dan kemudian (akhirnya)
mengamati atau mengukur efek perawatan pada kelompok ketika pengobatan selesai. Dalam
Bab 9, kami memperkenalkan gagasan tentang validitas internal dan membahas beberapa
jenis ancaman terhadap internal keabsahan. Ini sangat penting bagi peneliti yang melakukan
sebuah studi eksperimental untuk melakukan yang terbaik untuk mengendalikan— yaitu,
untuk menghilangkan atau meminimalkan efek yang mungkin dari — ancaman ini. Jika
peneliti tidak yakin apakah variabel lain mungkin menjadi penyebab hasil yang diamati
sebuah studi, mereka tidak dapat memastikan apa penyebabnya sebenarnya. Untuk Sebagai
contoh, jika seorang peneliti mencoba untuk membandingkan efek dari dua metode
pengajaran yang berbeda pada siswa sikap terhadap sejarah tetapi tidak memastikan bahwa
kelompok yang terlibat setara dalam kemampuan, kemudian kemampuan mungkin penjelasan
alternatif yang mungkin (bukan perbedaan dalam metode) untuk setiap perbedaan dalam
sikap kelompok yang ditemukan pada posttest. Secara khusus, peneliti yang melakukan
eksperimen studi mencoba yang terbaik untuk mengontrol setiap dan semua karakteristik
subjek yang dapat mempengaruhi hasil penelitian. Mereka melakukan ini dengan memastikan
bahwa kedua kelompok sama. Setara mungkin pada semua variabel selain satu atau yang
sedang dipelajari (yaitu, variabel independen). Bagaimana peneliti meminimalkan atau
menghilangkan ancaman karena karakteristik subjek? Ada banyak cara. Sini adalah beberapa
yang paling umum.
Pengacakan: Seperti yang kami sebutkan sebelumnya, jika subjek dapat secara acak
ditugaskan ke berbagai kelompok yang terlibat dalam studi eksperimental, peneliti dapat
mengasumsikan bahwa kelompok tersebut setara. Ini adalah cara terbaik untuk memastikan
efeknya satu atau lebih variabel asing yang mungkin miliki telah dikontrol.
Memegang variabel tertentu konstan: Idenya di sini adalah untuk menghilangkan
kemungkinan efek suatu variabel oleh menghapusnya dari ruang kerja. Sebagai contoh, jika
seorang peneliti mencurigai bahwa jenis kelamin dapat mempengaruhi hasil penelitian, dia
bisa mengendalikannya dengan membatasi subyek penelitian untuk perempuan dan dengan
mengecualikan semua laki-laki. Variabel gender, dalam Dengan kata lain, dianggap konstan.
Namun, ada sebuah biaya yang terlibat (karena hampir selalu ada) untuk ini kontrol, sebagai
generalisasi dari hasil studi berkurang.
Membangun variabel ke dalam desain: Solusi ini melibatkan membangun variabel ke
dalam penelitian untuk menilai efeknya. Ini adalah kebalikan dari ide sebelumnya.
Menggunakan contoh sebelumnya, Peneliti akan mencakup perempuan dan laki-laki (sebagai
kelompok yang berbeda) dalam desain penelitian dan kemudian menganalisis dampak gender
dan metode hasil.
Matching: Seringkali pasangan mata pelajaran dapat dicocokkan pada variabel tertentu yang
menarik. Jika seorang peneliti merasakan usia itu, misalnya, dapat mempengaruhi hasil
sebuah studi, dia mungkin berusaha untuk mencocokkan siswa sesuai dengan usia mereka
dan kemudian menugaskan satu anggota dari masing-masing pasangan (secara acak jika
memungkinkan) untuk masing-masing pasangan kelompok pembanding.
Menggunakan subjek sebagai kontrol mereka sendiri: Ketika subjek digunakan sebagai
kontrol mereka sendiri, kinerja mereka di bawah kedua (atau semua) perawatan
dibandingkan. Dengan demikian, siswa yang sama dapat diajarkan aljabar unit pertama
dengan metode penyelidikan dan kemudian dengan metode ceramah. Contoh lain adalah
penilaian perilaku seseorang selama periode waktu tertentu sebelum dan sesudah perawatan
dilakukan untuk melihat apakah perubahan perilaku terjadi.
Menggunakan analisis kovarians: Seperti disebutkan dalam Bab 11, analisis kovarians
dapat digunakan untuk menyamakan kelompok secara statistik berdasarkan pretest atau
lainnya variabel. Skor posttest dari masing-masing subjek grup kemudian disesuaikan.
Kami akan segera menunjukkan kepada Anda sejumlah desain penelitian yang
menggambarkan bagaimana beberapa dari kontrol di atas dapat diimplementasikan dalam
studi eksperimental.
Desain Grup dalam Eksperimental Penelitian
Desain percobaan dapat mengambil berbagai bentuk. Beberapa desain yang kami sajikan di
bagian ini lebih baik dari yang lain. Kenapa "lebih baik"? Karena berbagai ancaman terhadap
validitas internal yang diidentifikasi dalam Bab 9: Desain yang bagus mengendalikan banyak
dari ancaman ini, sementara miskin desain hanya mengendalikan sedikit. Kualitas percobaan
tergantung pada seberapa baik berbagai ancaman terhadap internal validitas dikontrol.

(POOR EXPERIMENTAL DESIGNS )DESAIN EKSPERIMENTAL YANG


BURUK
Desain yang "lemah" tidak memiliki kontrol bawaan untuk ancaman terhadap validitas
internal. Selain variabel independen, ada sejumlah penjelasan masuk akal lainnya untuk
setiap hasil yang terjadi. Akibatnya, apa saja Peneliti yang menggunakan salah satu dari
desain ini memiliki kesulitan menilai efektivitas variabel independen. Studi Kasus Satu
Tembakan. Dalam wadah sekali tembak desain studi, satu kelompok terpapar pengobatan
atau peristiwa dan variabel dependen selanjutnya diamati (diukur) untuk menilai efek dari
pengobatan. Diagram desain ini adalah sebagai berikut:
Desain Studi Kasus One-Shot
X O
Pengobatan Pengamatan
(Variabel tak bebas)
Simbol X mewakili pemaparan grup ke perlakuan yang menarik, sedangkan O mengacu pada
pengamatan (pengukuran) dari variabel dependen. Penempatan simbol dari kiri ke kanan
menunjukkan urutan waktu X dan O. Seperti yang Anda lihat, pengobatan, X,
datang sebelum pengamatan variabel dependen, O. Misalkan seorang peneliti ingin melihat
apakah buku teks baru meningkatkan minat siswa pada sejarah. Dia menggunakan buku teks
(X) selama satu semester dan kemudian mengukur minat siswa (O) dengan skala sikap.
Diagram contoh ini ditunjukkan pada Gambar 13.1. Kelemahan paling jelas dari desain ini
adalah tidak adanya kontrol. Peneliti tidak punya cara mengetahui apakah hasil yang
diperoleh di O (diukur dengan skala sikap) adalah karena perlakuan X (buku teks). Itu desain
tidak menyediakan perbandingan apa pun, sehingga peneliti tidak dapat membandingkan
hasil pengobatan (yang diukur dengan skala sikap) dengan kelompok yang sama sebelum
menggunakan buku teks baru, atau dengan orang-orang dari kelompok lain menggunakan
buku teks yang berbeda. Karena kelompoknya belum telah diuji dengan cara apa pun, peneliti
tidak tahu apa-apa tentang kelompok itu seperti sebelum menggunakan teks.

X O
Buku teks baru Skala sikap
untuk mengukur bunga
(Variabel tak bebas)
Dengan demikian, dia tidak tahu apakah perawatannya sudah ada efek sama sekali. Sangat
mungkin siswa yang menggunakan buku teks baru akan menunjukkan sikap yang sangat baik
terhadap sejarah. Namun pertanyaannya tetap, apakah sikap-sikap ini dihasilkan oleh buku
teks yang baru? Sayangnya, studi kasus sekali pakai tidak membantu kami jawab pertanyaan
ini. Untuk memperbaiki desain ini, perbandingan dapat dibuat dengan kelompok siswa lain
yang memiliki konten kursus yang sama disajikan secara reguler buku pelajaran. (Kami akan
segera menunjukkan desain seperti itu kepada Anda.) Untungnya, desain dalam one-shot
sangat baik diketahui bahwa itu jarang digunakan dalam penelitian pendidikan.
Desain Satu-Grup Pretest-Posttest. Dalam desain satu kelompok pretest-posttest, satu
kelompok diukur atau diamati tidak hanya setelah menjadi terkena semacam perawatan,
tetapi juga sebelumnya. Sebuah diagram desain ini adalah sebagai berikut:
Desain Satu-Grup Pretest-Posttest
O X O
Pretest Pengobatan Posttest
Perhatikan contoh desain ini. Kepala sekolah menginginkan untuk menilai efek dari sesi
konseling mingguan pada sikap siswa "sulit dijangkau" tertentu di sekolahnya. Dia meminta
para penasihat dalam program untuk bertemu sekali a minggu dengan siswa ini selama 10
minggu, selama sesi mana siswa didorong untuk mengekspresikan perasaan dan
kekhawatiran mereka. Dia menggunakan skala 20-item untuk mengukur sikap siswa terhadap
sekolah baik segera sebelum dan setelah periode 10 minggu. Gambar 13.2 menyajikan
diagram desain penelitian. Desain ini lebih baik daripada studi kasus sekali pakai (the peneliti
setidaknya tahu apakah ada perubahan yang terjadi), tapi masih lemah. Sembilan ancaman
tidak terkendali untuk
O X O
Pretest: Pengobatan Posttest:
20-item skala 10 minggu 20-item
Sikap penyuluhan skala sikap
diselesaikan oleh diselesaikan oleh
siswa siswa
(Tergantung (tergantung
variabel) variabel)

Ada validitas internal yang mungkin juga menjelaskan hasil pada posttest. Mereka adalah
sejarah, pematangan, instrumen pembusukan, karakteristik pengumpul data, bias pengumpul
data, pengujian, regresi statistik, sikap subyek, dan penerapan. Salah satu atau semua ini
dapat memengaruhi hasil penelitian. Peneliti tidak akan tahu jika ada perbedaan antara pretest
dan posttest karena perawatan atau satu atau lebih dari ancaman ini. Untuk mengatasinya,
kelompok pembanding, yang tidak menerima perawatan, dapat ditambahkan. Lalu jika ada
perubahan sikap terjadi antara pretest dan posttest, the Peneliti memiliki alasan untuk percaya
bahwa itu disebabkan oleh pengobatan (dilambangkan dengan X).
Desain Perbandingan Kelompok Statis. Di desain perbandingan kelompok statis, dua
kelompok yang sudah ada, atau utuh, digunakan. Ini kadang-kadang disebut sebagai
kelompok statis, karenanya nama untuk desain. Desain ini kadang-kadang disebut kontrol
nonequivalent desain kelompok. Diagram desain ini adalah sebagai berikut:
Desain Perbandingan Kelompok Statis
X.....................O
O
Garis putus-putus menunjukkan bahwa kedua kelompok sedang dibandingkan sudah
terbentuk — yaitu, subjek tidak ditugaskan secara acak ke dua kelompok. X melambangkan
perawatan eksperimental. Ruang kosong dalam desain menunjukkan bahwa grup "kontrol"
tidak menerima pengobatan eksperimental; mungkin menerima yang berbeda perawatan atau
tidak ada perawatan sama sekali. Dua O ditempatkan persis vertikal satu sama lain,
menunjukkan bahwa pengamatan atau pengukuran kedua kelompok terjadi di waktu yang
sama. Perhatikan lagi contoh yang digunakan untuk menggambarkan desain studi kasus
oneshot. Kita bisa menerapkan grup statis desain perbandingan dengan contoh ini. Peneliti
akan (1) menemukan dua kelompok utuh (dua kelas), (2) menugaskan buku teks baru (X) ke
salah satu kelas tetapi memiliki kelas lain menggunakan buku teks biasa, dan kemudian (3)
mengukur tingkat minat semua siswa di kedua kelas pada saat yang sama (misalnya, pada
akhir semester). Gambar 13.3 menyajikan diagram dari contoh ini. Meskipun desain ini
memberikan kontrol yang lebih baik ancaman sejarah, pematangan, pengujian, dan regresi, *
begitulah

X O
Buku teks baru Skala sikap
untuk mengukur bunga
(Variabel tak bebas)
..............................................................................
O
Buku teks biasa Skala sikap
untuk mengukur bunga

lebih rentan tidak hanya terhadap kematian dan lokasi, † tetapi juga, yang lebih penting,
untuk kemungkinan diferensial karakteristik subjek. Desain Pretest-Posttest Kelompok Statis.
Desain static-group pretest-posttest berbeda dari desain perbandingan kelompok statis hanya
dalam pretest itu diberikan kepada kedua kelompok. Diagram untuk desain ini adalah sebagai
berikut:
Desain Pretest-Posttest Kelompok Statis
O.....................X.....................O
O O
Dalam menganalisis data, skor pretest masing-masing individu adalah dikurangi dari skor
posttestnya, sehingga memungkinkan analisis "keuntungan" atau "perubahan." Sementara ini
memberikan yang lebih baik kontrol ancaman karakteristik subjek (karena itu adalah
perubahan pada setiap siswa yang dianalisis), jumlah gain seringkali tergantung pada kinerja
awal; itu adalah kelompok yang mendapat skor lebih tinggi pada pretest kemungkinan akan
meningkat lebih (atau dalam beberapa kasus lebih sedikit), dan dengan demikian karakteristik
subjek masih tetap menjadi ancaman. Selanjutnya, pemberian pretest meningkatkan
kemungkinan ancaman pengujian. Dalam acara pretest digunakan untuk mencocokkan grup,
desain ini menjadi kelompok kontrol pretest-posttest hanya cocok desain (lihat halaman 275),
desain yang jauh lebih efektif.
DESAIN EKSPERIMENTAL YANG BENAR
Bahan penting dari desain eksperimental yang benar adalah bahwa subyek secara acak
ditugaskan untuk pengobatan kelompok. Sebagaimana dibahas sebelumnya, penugasan acak
adalah a teknik yang kuat untuk mengendalikan ancaman karakteristik subjek ke validitas
internal, pertimbangan utama dalam penelitian pendidikan.
Kontrol Acak Hanya Posttest. Desain Grup. Desain kelompok kontrol hanya-posttest acak
melibatkan dua kelompok, yang keduanya dibentuk oleh tugas acak. Satu kelompok
menerima pengobatan eksperimental sedangkan yang lainnya tidak, dan kemudian kedua
kelompok dipostest pada ketergantungan variabel. Diagram desain ini adalah sebagai berikut:
Acak Hanya Posttest Desain Grup Kontrol
Kelompok perlakuan R X O
Kelompok kontrol R C O
Seperti sebelumnya, simbol X mewakili paparan terhadap pengobatan dan O mengacu pada
pengukuran dependen variabel. R mewakili tugas acak individu ke grup. C sekarang
mewakili kelompok kontrol. Dalam desain ini, kontrol ancaman tertentu sangat baik. Melalui
penggunaan tugas acak, ancaman karakteristik subjek, pematangan, dan regresi statistik
dikontrol dengan baik untuk. Karena tidak ada Subjek dalam penelitian diukur dua kali,
pengujian bukan sebuah kemungkinan ancaman. Ini mungkin yang terbaik dari semua desain
gunakan dalam studi eksperimental, asalkan setidaknya ada 40 subjek dalam setiap
kelompok. Sayangnya, ada beberapa ancaman terhadap validitas internal yang tidak
dikendalikan oleh desain ini. Yang pertama adalah kematian. Karena kedua kelompok itu
serupa, kita mungkin mengharapkan tingkat putus sekolah yang sama dari masing-masing
kelompok. Namun, pajanan terhadap pengobatan dapat menyebabkan lebih banyak orang
dalam grup eksperimen untuk keluar (atau tetap di) daripada dalam kelompok kontrol. Ini
dapat menyebabkan dua kelompok menjadi berbeda dalam hal karakteristik mereka, yang
pada gilirannya dapat mempengaruhi hasil pada posttest. Untuk alasan ini, peneliti harus
selalu melaporkan berapa banyak subyek keluar dari masing-masing kelompok selama
percobaan. Ancaman sikap mungkin terjadi. Selain itu, implementasi, bias pengumpul data,
lokasi, dan ancaman riwayat mungkin ada. Ancaman ini terkadang dapat dikendalikan oleh
modifikasi yang sesuai untuk desain ini. Sebagai contoh desain ini, pertimbangkan studi
hipotetis di mana seorang peneliti menyelidiki efeknya dari serangkaian lokakarya pelatihan
sensitivitas di fakultas moral di distrik sekolah menengah besar. Peneliti secara acak memilih
sampel 100 guru dari semua guru di kabupaten tersebut. Peneliti kemudian (1) secara acak
menugaskan para guru di kabupaten ke dua kelompok; (2) memaparkan satu kelompok, tetapi
tidak yang lain, ke pelatihan; dan kemudian (3) mengukur moral masing-masing kelompok
menggunakan sebuah kuesioner. Gambar 13.4 menyajikan diagram ini percobaan hipotetis.
Sekali lagi kami menekankan bahwa penting untuk tetap membersihkannya perbedaan antara
pemilihan acak dan tugas acak. Keduanya melibatkan proses pengacakan, tetapi untuk tujuan
yang berbeda. Pilihan acak, Anda akan recall, dimaksudkan untuk memberikan sampel yang
representatif. Tapi itu bisa atau tidak bisa disertai secara acak tugas mata pelajaran ke grup.
Tugas acak dimaksudkan untuk menyamakan kelompok, dan seringkali tidak disertai dengan
pemilihan acak.
Kontrol Acak Pretest-Posttest. Desain Grup. Pretest-posttest acak desain kelompok kontrol
berbeda dari yang diacak desain kelompok kontrol hanya posttest hanya dalam penggunaan
sebuah pretest. Dua kelompok subjek digunakan, dengan keduanya kelompok diukur atau
diamati dua kali. Pengukuran pertama berfungsi sebagai pretest, yang kedua sebagai posttest.

Tugas acak digunakan untuk membentuk kelompok. Itu pengukuran atau pengamatan
dikumpulkan secara bersamaan waktu untuk kedua kelompok. Diagram desain ini berikut.
The Pretest-Posttest Acak Desain Grup Kontrol
Kelompok perlakuan R O X O
Kelompok kontrol R O C O
Penggunaan pretest meningkatkan kemungkinan ancaman interaksi perawatan pretest, karena
dapat "mengingatkan" anggota kelompok eksperimen, sehingga menyebabkan mereka
melakukan lebih baik (atau lebih buruk) pada posttest daripada anggota kelompok kontrol.
Sebuah trade-off adalah bahwa hal itu memberikan peneliti sarana untuk memeriksa apakah
kedua kelompok itu benar-benar serupa — yaitu, apakah penugasan acak benar-benar
berhasil membuat kelompok setara. Ini sangat diinginkan jika nomor dalam masing-masing
kelompok kecil (kurang dari 30). Jika pretest menunjukkan bahwa kelompok tidak setara,
peneliti dapat mencari untuk membuatnya dengan menggunakan salah satu desain yang
cocok kami akan segera membahas. Pretest juga diperlukan jika jumlah perubahan dari waktu
ke waktu akan dinilai. Mari kita ilustrasikan desain ini dengan menggunakan desain
sebelumnya contoh yang melibatkan penggunaan lokakarya sensitivitas. Gambar 13.5
menyajikan diagram bagaimana desain ini akan digunakan.
Kelompok Empat Solomon Acak Desain. Solomon secara acak terdiri dari empat kelompok
desain adalah upaya untuk menghilangkan efek yang mungkin terjadi dari pretest. Ini
melibatkan penugasan acak subjek ke empat kelompok, dengan dua kelompok yang dites dan
dua tidak. Salah satu kelompok yang dites dan salah satunya kelompok yang tidak ditafsirkan
terkena pengobatan eksperimental. Keempat kelompok ini kemudian diuji coba. Diagram dari
desain ini adalah sebagai berikut:
Desain Empat Grup Solomon Secara Acak
Kelompok perlakuan R O X O
Kelompok kontrol R O C O
Kelompok perlakuan R X O
Kelompok kontrol R C O
Desain empat kelompok Solomon secara acak menggabungkan kelompok kontrol pretes-
postes dan hanya postes desain kelompok kontrol. Dua kelompok pertama mewakili desain
kelompok kontrol pretest-posttest, sedangkan yang terakhir dua kelompok mewakili
kelompok kontrol hanya posttest Desain. Gambar 13.6 menyajikan contoh desain acak empat
kelompok Solomon. Desain empat kelompok Solomon acak memberikan kontrol terbaik
terhadap ancaman terhadap validitas internal yang telah kita bahas. Namun, kelemahannya
adalah itu itu membutuhkan sampel besar karena subjek harus ditugaskan ke empat
kelompok. Selanjutnya, melakukan penelitian melibatkan empat kelompok pada saat yang
sama membutuhkan energi dan usaha dalam jumlah yang cukup besar peneliti.
Tugas Acak dengan Pencocokan. Di upaya untuk meningkatkan kemungkinan bahwa
kelompok subjek dalam percobaan akan setara, berpasangan individu dapat dicocokkan pada
variabel tertentu.
Pilihan variabel yang akan dicocokkan didasarkan pada penelitian sebelumnya, teori, dan /
atau pengalaman sang peneliti. Anggota dari setiap pasangan yang cocok adalah kemudian
ditugaskan ke kelompok eksperimen dan kontrol sembarangan. Adaptasi ini dapat dilakukan
untuk keduanya desain kelompok kontrol posttest-only dan desain kelompok kontrol
pretestest, meskipun yang terakhir adalah lebih umum. Diagram desain ini disediakan di
bawah ini.
Kontrol Acak Hanya Posttest Desain Grup, Menggunakan Subjek yang Cocok
Kelompok perlakuan Mr X O
Kelompok kontrol Mr C O
Kontrol Acak Pretest-Posttest Desain Grup, Menggunakan Subjek yang Cocok
Kelompok perlakuan Mr O X O
Kelompok kontrol Mr O C O
Simbol Mr mengacu pada fakta bahwa anggota setiap pasangan yang cocok secara acak
ditugaskan ke kelompok eksperimen dan kontrol. Meskipun pretest dari variabel dependen
biasanya digunakan untuk memberikan skor yang cocok, sebuah pengukuran variabel apa pun
yang menunjukkan hubungan substansial dengan variabel dependen sesuai. Sesuai dapat
dilakukan dengan salah satu atau kedua cara: mekanis atau secara statistik. Keduanya
membutuhkan skor untuk setiap mata pelajaran setiap variabel yang akan dicocokkan
subjeknya.

Pencocokan mekanis adalah proses memasangkan dua orang yang nilainya pada variabel
tertentu serupa. Dua gadis, misalnya, yang memiliki nilai bakat matematika dan nilai
kecemasan tes yang serupa mungkin cocok dengan variabel-variabel tersebut. Setelah
pencocokan selesai untuk seluruh sampel, pemeriksaan harus dilakukan (melalui penggunaan
poligon frekuensi) untuk memastikan itu kedua kelompok tersebut memang setara pada setiap
pencocokan variabel. Sayangnya, dua masalah membatasi kegunaan pencocokan mekanik.
Pertama, sangat sulit untuk cocok dengan lebih dari dua atau tiga variabel — orang saja
jangan berpasangan dengan lebih dari beberapa karakteristik, membuat perlu memiliki
sampel awal yang sangat besar untuk menggambar dari. Kedua, untuk mencocokkan, hampir
tidak bisa dihindari bahwa beberapa mata pelajaran harus dihilangkan dari penelitian karena
tidak ada "kecocokan" untuk mereka dapat ditemukan. Sampel maka tidak lagi acak
meskipun mungkin mereka miliki sebelum pencocokan terjadi. Sebagai contoh desain
pencocokan mekanis dengan tugas acak, misalkan seorang peneliti tertarik dalam efek
pembinaan akademik pada titik kelas rata-rata (IPK) siswa berprestasi dalam sains kelas.
Peneliti secara acak memilih sampel 60 siswa dari populasi 125 siswa di Indonesia sebuah
sekolah dasar setempat dan mencocokkannya dengan pasangan pada IPK, menemukan bahwa
ia dapat mencocokkan 40 dari 60. Dia kemudian secara acak menetapkan setiap subjek dalam
hasil 20 pasang untuk eksperimen atau kelompok kontrol. Gambar 13.7 menyajikan contoh
serupa.
Pencocokan statistik, * di sisi lain, tidak tidak mengharuskan hilangnya subjek, juga tidak
membatasi jumlah variabel yang cocok. Setiap mata pelajaran diberikan a Skor "diprediksi"
pada variabel dependen, berdasarkan korelasi antara variabel dependen dan variabel (atau
variabel) di mana subjek sedang cocok. Perbedaan antara skor yang diprediksi dan yang
sebenarnya untuk setiap individu kemudian digunakan untuk membandingkan kelompok
eksperimen dan kontrol. perbedaan antara skor yang diprediksi dan yang sebenarnya adalah
disebut skor gain regressed. Skor ini lebih disukai untuk mendapatkan skor yang lebih mudah
(minus posttest skor pretest untuk setiap individu) terutama karena itu lebih dapat diandalkan.
Kami membahas prosedur serupa di bawah korelasi parsial dalam Bab 15. Jika pencocokan
mekanis digunakan, satu anggota dari setiap pasangan yang cocok secara acak ditugaskan ke
kelompok eksperimen, yang lain ke kelompok kontrol. Jika pencocokan statistik digunakan,
sampel dibagi secara acak di awal, dan penyesuaian statistik dilakukan setelah semua data
telah dikumpulkan. Meskipun beberapa peneliti menganjurkan penggunaan statistik lebih
pencocokan mekanis, pencocokan statistik tidak sempurna. Kelemahan utamanya adalah
asumsi itu hubungan antara variabel dependen dan setiap variabel prediktor dapat dijelaskan
dengan benar oleh a garis lurus daripada garis melengkung. Prosedur apa pun yang
digunakan, peneliti harus (dalam desain ini) mengandalkan pada tugas acak untuk
menyamakan kelompok pada semua lainnya variabel yang terkait dengan variabel dependen.
DESAIN QUASI-EKSPERIMENTAL
Desain semi-eksperimental tidak termasuk penggunaan tugas acak. Peneliti yang
menggunakan ini desain sebaliknya bergantung pada teknik lain untuk mengontrol (atau
setidaknya mengurangi) ancaman terhadap validitas internal. Kami akan menjelaskan
beberapa teknik ini ketika kami membahas beberapa desain kuasi-eksperimental.
Desain Yang Cocok Saja. Hanya yang cocok desain berbeda dari tugas acak dengan
pencocokan hanya pada kenyataan bahwa tugas acak tidak digunakan. Itu Peneliti masih
cocok dengan subjek dalam eksperimen dan kelompok kontrol pada variabel tertentu, tetapi
ia memiliki tidak ada jaminan bahwa mereka setara pada orang lain. Mengapa? Karena
meskipun cocok, subjek sudah masuk kelompok utuh. Ini adalah batasan serius tetapi sering
kali tidak dapat dihindari ketika tugas acak tidak mungkin — itu adalah, ketika kelompok
utuh harus digunakan. Ketika beberapa (katakan, 10 atau lebih) kelompok tersedia untuk
studi metode dan kelompok dapat secara acak ditugaskan untuk berbeda Perawatan, desain
ini menawarkan alternatif untuk acak tugas mata pelajaran. Setelah kelompok secara acak
ditugaskan untuk perawatan yang berbeda, individu yang menerima satu perawatan
dicocokkan dengan individu menerima perawatan lain. Desain ditunjukkan pada Namun,
Gambar 13.7 masih lebih disukai.
Harus ditekankan bahwa pencocokan (apakah mekanis atau statistik) tidak pernah menjadi
pengganti acak tugas. Selanjutnya, korelasi antara variabel yang cocok dan variabel dependen
harus cukup substansial. (Kami sarankan setidaknya 0,40.) Sadarilah juga bahwa kecuali
digunakan bersamaan dengan acak tugas, kontrol pencocokan hanya untuk variabel
dicocokkan. Diagram masing-masing hanya cocok desain kelompok kontrol mengikuti.
Yang Cocok-Hanya Posttest-Saja Desain Grup Kontrol
Kelompok perlakuan M X O
Kelompok kontrol M C O
The Pretest-Only Pretest-Posttest Desain Grup Kontrol
Kelompok perlakuan M O X O
Kelompok kontrol M O C O
M dalam desain ini berarti bahwa subjek dalam masing-masing grup telah dicocokkan (pada
variabel tertentu) tetapi tidak secara acak ditugaskan ke grup.
Desain diimbangi. Diimbangi desain mewakili teknik lain untuk menyamakan kelompok
eksperimen dan pembanding. Dalam desain ini, masing-masing kelompok terkena semua
perawatan, namun ada banyak, tetapi dalam urutan yang berbeda. Sejumlah perawatan
mungkin terlibat. Contoh diagram untuk penyeimbang desain yang melibatkan tiga perawatan
adalah sebagai berikut:
Desain Counterbalanced Tiga-Perawatan
Kelompok I X1 O X2 O X3 O
Kelompok II X2 O X3 O X1 O
Kelompok III X3 O X1 O X2 O
Pengaturan ini melibatkan tiga kelompok. Kelompok I menerima pengobatan 1 dan posttest,
kemudian menerima pengobatan 2 dan posttest, dan yang terakhir menerima pengobatan 3
dan posttested. Kelompok II menerima pengobatan 2 pertama, kemudian pengobatan 3, dan
kemudian pengobatan 1, setelah posttest setiap perawatan. Kelompok III menerima
pengobatan 3 pertama, lalu pengobatan 1, diikuti oleh pengobatan 2, juga posttest setelah
setiap perawatan. Urutan di mana kelompok menerima perawatan harus ditentukan secara
acak. Bagaimana para peneliti menentukan efektivitasnya dari berbagai perawatan? Cukup
dengan membandingkan skor rata-rata untuk semua grup pada posttest untuk masing-masing

pengobatan. Dengan kata lain, skor posttest rata-rata untuk semua kelompok untuk
pengobatan 1 dapat dibandingkan dengan skor posttest rata-rata untuk semua kelompok untuk
perawatan 2, dan seterusnya, untuk banyak perawatan. Desain ini mengontrol dengan baik
ancaman karakteristik subjek terhadap validitas internal tetapi khususnya rentan terhadap
gangguan multi-perawatan — itu adalah, kinerja selama perawatan tertentu mungkin
dipengaruhi oleh satu atau lebih perawatan sebelumnya. Akibatnya, hasil dari setiap
penelitian di mana peneliti telah menggunakan desain yang seimbang harus diperiksa dengan
cermat. Pertimbangkan dua set hipotesis data ditunjukkan pada Gambar 13.8. Interpretasi
dalam studi 1 jelas: Metode X lebih unggul untuk kedua kelompok terlepas dari urutan dan ke
derajat yang sama. Namun, interpretasi dalam studi 2 adalah jauh lebih kompleks. Secara
keseluruhan, metode X muncul unggul, dan dengan jumlah yang sama seperti dalam studi 1.
Dalam kedua studi, rata-rata keseluruhan untuk X adalah 12, sedangkan untuk Y adalah 8.
Dalam studi 2, bagaimanapun, tampak bahwa perbedaan antara X dan Y tergantung pada
paparan sebelumnya ke metode lain. Kelompok I berkinerja jauh lebih buruk pada metode Y
saat itu terpapar setelah X, dan kelompok II dilakukan jauh lebih baik pada X ketika terkena
setelah metode Y. Ketika X atau Y diberikan pertama kali dalam urutan, tidak ada perbedaan
dalam kinerja. Ini tidak jelas bahwa metode X lebih unggul dalam semua kondisi dalam
penelitian 2, sedangkan ini cukup jelas dalam penelitian 1.
Desain Seri Waktu. Desain khas pra dan posttest diperiksa sampai sekarang melibatkan
pengamatan atau pengukuran dilakukan segera sebelum dan sesudah pengobatan. Namun,
desain deret waktu melibatkan pengukuran atau pengamatan berulang selama suatu periode
waktu sebelum dan sesudah perawatan. Ini benar-benar sebuah elaborasi desain satu
kelompok pretest-posttest disajikan pada Gambar 13.2. Jumlah yang luas data dikumpulkan
pada satu kelompok. Jika skor kelompok pada dasarnya sama pada pretest dan kemudian
meningkat pada posttests, peneliti memiliki lebih banyak yakinkan bahwa perawatan tersebut
menyebabkan perbaikan daripada jika hanya satu pretest dan satu posttest diberikan.
Contohnya mungkin seorang guru yang memberi tes mingguan ke kelasnya selama beberapa
minggu sebelum memberikan mereka buku teks baru untuk digunakan, dan kemudian
memantau caranya mereka mendapat skor pada beberapa tes mingguan setelah mereka
melakukannya menggunakan teks. Diagram desain seri waktu dasar adalah sebagai berikut:
Desain Seri-Waktu Dasar
O1 O2 O3 O4 O5 O6 O7 O8 O9 O10
Ancaman terhadap validitas internal yang membahayakan penggunaan desain ini termasuk
sejarah (sesuatu dapat terjadi antara pretest terakhir dan posttest pertama), instrumentasi (jika,
karena alasan tertentu, tes digunakan diubah setiap saat selama penelitian), dan pengujian
(karena efek latihan). Kemungkinan interaksi pretesttreatment juga meningkat dengan
penggunaan beberapa pretest. Efektivitas pengobatan dalam desain seri waktu pada dasarnya
ditentukan dengan menganalisis pola nilai tes yang dihasilkan dari beberapa tes. Gambar 13.9
menggambarkan beberapa kemungkinan pola hasil yang mungkin hasil dari pengenalan
variabel eksperimental (X). Garis vertikal menunjukkan titik di mana pengobatan
eksperimental diperkenalkan. Dalam figur ini, the perubahan antara periode waktu 5 dan 6
memberikan hal yang sama jenis data yang akan diperoleh dengan menggunakan satu
kelompok desain pretest-posttest. Pengumpulan data tambahan Namun, sebelum dan sesudah
diperkenalkannya pengobatan, menunjukkan betapa menyesatkannya desain satu kelompok
pretest-posttest. Dalam (A), peningkatan ditunjukkan ke tidak lebih dari apa yang terjadi dari
satu periode pengumpulan data ke periode lain — apa pun metodenya. Kamu akan melihat
bahwa kinerja memang meningkat dari waktu ke waktu waktu, tetapi tidak ada tren atau
peningkatan keseluruhan terlihat. Dalam (B), keuntungan dari periode 5 hingga 6 tampaknya
menjadi bagian dari tren sudah jelas sebelum pengobatan dimulai (cukup mungkin contoh
pematangan). Di (D) semakin tinggi skor di periode 6 hanya sementara, sebagai kinerja
segera mendekati apa itu sebelum perawatan itu diperkenalkan (menunjukkan suatu peristiwa
transien yang asing dampak). Hanya dalam (C) kita memiliki bukti efek pengobatan yang
konsisten.
Desain time-series adalah desain yang kuat, meskipun demikian rentan terhadap sejarah
(peristiwa asing bisa terjadi setelah periode 5) dan instrumentasi (karena beberapa
administrasi pengujian pada titik waktu yang berbeda). Itu dibutuhkan pengumpulan data
dalam jumlah besar, kemungkinan alasan mengapa desain ini jarang digunakan dalam
penelitian pendidikan. Dalam banyak penelitian, terutama di Indonesia sekolah, itu tidak
layak untuk memberikan instrumen yang sama delapan hingga sepuluh kali. Bahkan ketika
itu mungkin, pertanyaan serius diajukan tentang validitas interpretasi instrumen dengan
begitu banyak administrasi. Pengecualian adalah penggunaan perangkat yang tidak mencolok
yang bisa diterapkan pada banyak kesempatan, sejak interpretasi berdasarkan pada mereka
harus tetap valid.
DESAIN FAKTORIAL
Desain faktorial menambah jumlah hubungan yang dapat diperiksa dalam studi
eksperimental. Mereka pada dasarnya adalah modifikasi dari hanya posttest kelompok
kontrol atau desain kelompok kontrol pretes-postes (dengan atau tanpa penugasan acak), yang
mengizinkan penyelidikan variabel independen tambahan. Nilai lain dari desain faktorial
adalah memungkinkan Peneliti mempelajari interaksi yang independen variabel dengan satu
atau lebih variabel lain, kadang-kadang disebut variabel moderator. Variabel moderator
mungkin baik variabel perlakuan atau karakteristik subjek variabel. Diagram desain faktorial
adalah sebagai berikut:
Desain faktorial
Pengobatan R O X Y1 O
Kontrol R O X Y1 O
Pengobatan R O X Y2 O
Kontrol R O X Y2 O
Desain ini merupakan modifikasi dari pretest-posttest desain kelompok kontrol. Ini
melibatkan satu perawatan dan satu kelompok kontrol, dan variabel moderator memiliki dua
level (Y1 dan Y2). Dalam contoh ini, dua kelompok akan melakukannya menerima
perawatan (X) dan dua tidak mau (C). Itu kelompok yang menerima pengobatan akan
berbeda pada Y, seperti halnya kedua kelompok yang tidak menerima pengobatan. Karena
setiap variabel, atau faktor, memiliki dua tingkatan, desain di atas disebut desain faktorial 2
by 2. Ini desain juga dapat diilustrasikan sebagai berikut:
Ilustrasi Alternatif dari Contoh di Atas

Variasi desain ini menggunakan dua atau lebih berbeda kelompok perlakuan dan tidak ada
kelompok kontrol. Pertimbangkan contoh yang kami gunakan sebelumnya dari seorang
peneliti yang membandingkan keefektifan metode inkuiri dan ceramah instruksi tentang
pencapaian dalam sejarah. Independen variabel dalam hal ini (metode pengajaran) memiliki
dua level — inquiry (X1) dan kuliah (X2). Sekarang bayangkan Peneliti ingin melihat apakah
prestasi belajar juga dipengaruhi oleh ukuran kelas. Dalam hal itu, Y1 mungkin mewakili
kelas kecil dan Y2 mungkin mewakili kelas besar. Seperti yang kami sarankan di atas,
dimungkinkan menggunakan faktorial desain untuk menilai tidak hanya efek terpisah dari
masing-masing variabel independen tetapi juga efek bersama mereka. Di lain kata-kata,
peneliti dapat melihat bagaimana salah satu variabel mungkin memoderasi yang lain
(karenanya alasan untuk memanggil variabel ini variabel moderator).

Mari kita lanjutkan dengan contoh peneliti yang ingin menyelidiki efek metode pengajaran
dan ukuran kelas pada prestasi dalam sejarah. Gambar 13.10 menggambarkan bagaimana
berbagai kombinasi ini variabel dapat dipelajari dalam desain faktorial. Desain faktorial, oleh
karena itu, merupakan cara yang efisien untuk pelajari beberapa hubungan dengan satu set
data. Biarkan kami menekankan lagi, bagaimanapun, bahwa kebajikan terbesar mereka
terletak dalam kenyataan bahwa mereka memungkinkan seorang peneliti untuk mempelajari
interaksi antar variabel.
Gambar 13.11, misalnya, menggambarkan dua hasil yang mungkin untuk desain faktorial 2
oleh 2 ditunjukkan pada Gambar 13.10. Skor untuk setiap kelompok pada posttest (kuis 50
item tentang sejarah Amerika) ditampilkan di kotak (biasanya disebut sel) yang sesuai dengan
setiap kombinasi metode dan ukuran kelas. Dalam studi (a) pada Gambar 13.11, metode
penyelidikan adalah terbukti lebih unggul di kelas kecil dan besar, dan kelas kecil lebih
unggul daripada kelas besar untuk kedua metode. Karenanya tidak ada efek interaksi. Dalam
studi (b), siswa melakukan lebih baik di kelas kecil daripada di kelas besar dengan kedua
metode; Namun, siswa di kelas kecil melakukannya lebih baik ketika mereka diajarkan oleh
metode penyelidikan, tetapi siswa di kelas besar melakukan yang lebih baik ketika mereka
diajarkan dengan metode ceramah. Dengan demikian, meskipun siswa melakukan lebih baik
di kelas kecil daripada di kelas besar pada umumnya, seberapa baik mereka bergantung pada
metode pengajaran. Sebagai akibatnya, peneliti tidak dapat mengatakan metode tersebut
selalu lebih baik; itu tergantung pada ukuran kelas di mana siswa diajar. Ada interaksi,
dengan kata lain, antara ukuran dan metode kelas, dan ini pada gilirannya mempengaruhi
pencapaian. Misalkan desain faktorial tidak digunakan dalam penelitian (b). Jika peneliti
hanya membandingkan efek keduanya metode, tanpa memperhitungkan ukuran kelas, ia akan
menyimpulkan bahwa tidak ada perbedaan dalam pengaruhnya terhadap prestasi (perhatikan
bahwa sarana kedua kelompok 5 40). Penggunaan desain faktorial memungkinkan kita untuk
melihat bahwa efektivitas metode ini, dalam kasus ini, tergantung pada ukuran kelas di mana
itu digunakan. Tampaknya ada interaksi di antara keduanya metode dan ukuran kelas. Desain
faktorial yang melibatkan empat tingkat variabel independen dan menggunakan modifikasi
desain kelompok kontrol posttest-only dipekerjakan oleh Tuckman. 8 Dalam penelitian ini,
variabel independen adalah jenis instruksi, dan moderator adalah jumlah motivasi. Ini adalah
desain faktorial 4 oleh 2 (Gambar 13.12). Banyak variasi tambahan juga dimungkinkan,
seperti 3 oleh 3, 4 oleh 3, dan 3 oleh 2 oleh 3 desain. Desain faktorial dapat digunakan untuk
menyelidiki lebih dari dua variabel, meskipun jarang lebih dari tiga variabel yang diteliti satu
desain.

Kontrol Ancaman ke Internal Validitas: Ringkasan


Tabel 13.1 menyajikan evaluasi kami terhadap efektivitas masing-masing desain sebelumnya
dalam mengendalikan ancaman untuk validitas internal yang kita bahas di Bab 9. Anda harus
ingat bahwa penilaian ini mencerminkan penilaian kami pertimbangan; tidak semua peneliti
tentu setuju. Kami telah menugaskan dua plus (+ +) untuk menunjukkan yang kuat kontrol
(ancaman tidak mungkin terjadi); satu tambah (+) ke menunjukkan beberapa kontrol
(ancaman mungkin terjadi); minus (-) untuk menunjukkan kontrol yang lemah (kemungkinan
ancaman akan terjadi terjadi); dan tanda tanya (?) untuk ancaman yang kemungkinan, karena
sifat penelitian, kita tidak bisa menentukan. Anda akan melihat bahwa desain ini paling
efektif dalam mengendalikan ancaman karakteristik subjek, kematian, riwayat, pematangan,
dan regresi. Catat itu kematian dikendalikan dalam beberapa desain karena ada subjek yang
hilang hilang baik untuk metode eksperimental dan kontrol, sehingga memperkenalkan tidak
ada keuntungan untuk keduanya. Ancaman lokasi adalah masalah kecil dalam rangkaian
waktu desain karena lokasi di mana perawatan diberikan biasanya konstan sepanjang
penelitian; itu Hal yang sama berlaku untuk karakteristik pengumpul data, meskipun
karakteristik seperti itu mungkin menjadi masalah dalam desain lain jika kolektor yang
berbeda digunakan untuk metode yang berbeda. Namun, ini biasanya mudah dikendalikan.
Sayangnya, desain time-series memang menderita kemungkinan kuat peluruhan instrumen
dan bias kolektor data, karena data (oleh alat observasi) harus dikumpulkan melalui banyak
percobaan, dan pengumpul data sulit disimpan dalam kegelapan
tentang maksud dari penelitian ini. Bias tidak sadar pada bagian pengumpul data tidak
dikontrol oleh salah satu dari desain ini, juga tidak ada efek implementasi. Pelaksana atau
pengumpul data dapat, tanpa sengaja, mendistorsi hasil penelitian. Data pengumpul harus
tetap tidak tahu siapa yang menerima perawatan yang mana, apakah ini layak. Itu harus
diverifikasi bahwa perawatan diberikan dan data dikumpulkan seperti yang dimaksudkan
peneliti. Seperti yang Anda lihat pada Tabel 13.1, ancaman pengujian mungkin terjadi hadir
dalam banyak desain, meskipun besarnya tergantung pada sifat dan frekuensi instrumentasi
yang terlibat. Ini dapat terjadi hanya ketika subjek merespons ke instrumen pada lebih dari
satu kesempatan.

Efek sikap (atau demoralisasi) paling baik dikendalikan oleh desain yang seimbang karena
setiap subjek menerima keduanya (atau semua) perawatan khusus. Dalam desain yang tersisa,
dapat dikontrol dengan menyediakan yang lain. Pengalaman "khusus" selama pengobatan
alternatif. Perhatian khusus harus dibuat dari double-blind jenis percobaan. Studi semacam
itu biasa dilakukan dalam bidang kedokteran tetapi sulit diatur dalam pendidikan. Elemen
kunci adalah bahwa baik subjek maupun peneliti tidak tahu identitas mereka yang menerima
setiap perawatan. Ini yang paling mudah dicapai dalam studi medis dengan cara a plasebo
(kadang-kadang pil gula) yang tidak dapat dibedakan dari obat yang sebenarnya. Regresi
tidak akan menjadi masalah kecuali di desain satu kelompok pretest-posttest, karena
seharusnya terjadi sama dalam kondisi eksperimental dan kontrol jika itu terjadi sama sekali.
Namun, hal itu mungkin terjadi dalam desain grup kontrol pretest-posttest staticgroup, jika
ada perbedaan awal yang besar antara kedua kelompok.

Mengevaluasi Kemungkinan dari Ancaman terhadap Validitas Internal dalam


Studi Eksperimental
Pertimbangan penting dalam merencanakan eksperimen belajar atau dalam mengevaluasi
hasil penelitian yang dilaporkan adalah kemungkinan ancaman terhadap validitas internal.
Seperti yang kita miliki ditampilkan, sejumlah kemungkinan ancaman terhadap validitas
internal mungkin ada. Pertanyaan yang harus ditanyakan oleh peneliti adalah: Seberapa besar
kemungkinan ada ancaman khusus dalam hal ini belajar? Untuk membantu dalam menilai
kemungkinan ini, kami menyarankan mengikuti prosedur.
Langkah 1: Tanyakan: Faktor spesifik apa yang diketahui untuk mempengaruhi variabel
dependen atau secara logis diharapkan mempengaruhi variabel ini? (Perhatikan bahwa para
peneliti tidak perlu khawatir dengan faktor-faktor yang tidak terkait dengan apa yang mereka
pelajari.)
Langkah 2: Tanyakan: Apa kemungkinan kelompok pembanding berbeda pada masing-
masing faktor ini? (Sebuah perbedaan antara kelompok tidak dapat dijelaskan pergi oleh
faktor yang sama untuk semua kelompok.)
Langkah 3: Evaluasi ancaman berdasarkan seberapa besar kemungkinannya mereka akan
memiliki efek, dan berencana untuk mengendalikan untuk mereka. Jika ancaman yang
diberikan tidak dapat dikendalikan, akui ini.
Pentingnya langkah 2 diilustrasikan pada Gambar 13.13. Dalam setiap diagram, termometer
menggambarkan kinerja subyek yang menerima metode A dibandingkan dengan yang
menerima metode B. Dalam diagram (a), subyek yang menerima metode A dilakukan lebih
tinggi pada posttest tetapi juga berkinerja lebih tinggi pada pretest; jadi, perbedaan dalam
prestasi pretest akun untuk perbedaan pada posttest. Dalam diagram (b), subjek menerima
metode A dilakukan lebih tinggi pada posttest tetapi tidak tampil lebih tinggi pada pretest;
demikian, hasil posttest tidak dapat dijelaskan oleh, atau dikaitkan untuk, tingkat pencapaian
yang berbeda sebelum menerima metode. Mari kita perhatikan contoh untuk menggambarkan
caranya langkah-langkah yang berbeda ini mungkin digunakan. Misalkan a peneliti ingin
menyelidiki efek dari keduanya metode pengajaran yang berbeda (misalnya, kuliah versus
instruksi inkuiri) pada kemampuan berpikir kritis siswa (yang diukur dengan skor pada kritis
tes berpikir). Peneliti berencana untuk membandingkan dua kelompok siswa kelas sebelas,
satu kelompok diajar oleh seorang instruktur yang menggunakan metode ceramah, yang
lainnya kelompok diajar oleh instruktur yang menggunakan metode inkuiri. Asumsikan
bahwa kelas utuh akan digunakan alih-alih tugas acak ke grup. Beberapa ancaman terhadap
validitas internal yang dibahas dalam Bab 9 dipertimbangkan dan dievaluasi dengan
menggunakan langkah-langkah yang baru saja disajikan. Kami berpendapat bahwa ini adalah
jenis pemikiran yang harus dilibatkan peneliti ketika merencanakan sebuah proyek Penelitian.
Karakteristik Subjek. Meskipun banyak karakteristik subjek yang mungkin memengaruhi
kemampuan berpikir kritis, kami mengidentifikasi hanya dua di sini— (1) kritis awal
kemampuan berpikir dan (2) gender.

1. Kemampuan berpikir kritis. Langkah 1: Posttreatment kemampuan berpikir kritis


siswa dalam dua kelompok hampir pasti terkait dengan pemikiran kritis awal
kemampuan. Langkah 2: Grup mungkin berbeda kecuali ditentukan secara acak atau
cocok. Langkah 3: Kemungkinan memiliki efek kecuali dikendalikan: tinggi.
2. Jenis kelamin. Langkah 1: Kemampuan kritis pasca perawatan mungkin terkait
dengan gender. Langkah 2: Grup mungkin berbeda proporsi masing-masing gender
kecuali dikendalikan oleh sesuai. Langkah 3: Kemungkinan memiliki efek kecuali
dikendalikan: sedang.
Kematian. Langkah 1: Mortalitas kemungkinan akan mempengaruhi skor posttreatment pada
ukuran pemikiran kritis apa pun karena subjek yang keluar atau hilang kemungkinan besar
akan memiliki skor lebih rendah. Langkah 2: Grup mungkin tidak akan berbeda dalam jumlah
yang hilang, tetapi ini seharusnya diverifikasi. Langkah 3: Kemungkinan memiliki efek
kecuali terkendali: sedang.
Lokasi Langkah 1: Jika lokasi implementasi perlakuan dan / atau pengumpulan data berbeda
untuk keduanya kelompok, ini dapat mempengaruhi skor posttreatment pada tes berpikir
kritis. Skor posttreatment akan diharapkan untuk dipengaruhi oleh sumber daya seperti
ukuran kelas, ketersediaan bahan bacaan, film, dan sebagainya. Langkah 2: Ancaman ini
mungkin berbeda untuk kelompok kecuali dikontrol dengan menstandarkan lokasi untuk
implementasi dan data koleksi. Ruang kelas yang menggunakan setiap metode dapat berbeda
secara sistematis kecuali langkah-langkah diambil untuk memastikan hal itu sumber daya
sebanding. Langkah 3: Kemungkinan memiliki efek kecuali terkontrol: sedang hingga tinggi.

Instrumentation
1. Peluruhan instrumen. Langkah 1: Peluruhan instrumen dapat memengaruhi hasil apa
pun. Langkah 2: Kerusakan instrumen dapat berbeda untuk kelompok. Ini seharusnya
tidak menjadi masalah besar, asalkan semua instrumen yang digunakan diperiksa
dengan cermat dan setiap perubahan yang ditemukan diperbaiki. Langkah 3:
Kemungkinan memiliki efek kecuali dikendalikan: rendah.
2. Karakteristik pengumpul data. Langkah 1: Karakteristik pengumpul data dapat
memengaruhi skor pada tes berpikir kritis. Langkah 2: Ancaman ini mungkin berbeda
untuk grup kecuali dikontrol dengan menggunakan data yang sama pengumpul untuk
semua grup. Langkah 3: Kemungkinan memiliki efek kecuali dikendalikan: sedang.
3. Bias kolektor data. Langkah 1: Bias tentu saja dapat memengaruhi skor pada tes
berpikir kritis. Langkah 2: Ancaman ini mungkin berbeda untuk kelompok kecuali
dikontrol oleh pelaksana pelatihan dalam administrasi instrumen dan / atau
membiarkan mereka tidak tahu kelompok pengobatan mana yang sedang diuji.
Langkah 3: Kemungkinan memiliki efek kecuali dikendalikan: tinggi.
Pengujian. Langkah 1: Pretesting, jika digunakan, mungkin mempengaruhi skor posttest
pada tes berpikir kritis. Langkah 2: Mungkin pretest akan mempengaruhi kedua kelompok
secara sama, namun, dan tidak akan mungkin berinteraksi dengan metode, karena instruktur
yang menggunakan setiap metode mengajar kritis kemampuan berpikir. Langkah 3:
Kemungkinan memiliki efek kecuali dikontrol: rendah.
Sejarah. Langkah 1: Peristiwa luar yang mungkin memengaruhi keterampilan berpikir kritis
sulit untuk dugaan, tetapi mereka mungkin memasukkan hal-hal seperti serial TV khusus
berpikir, hadir di lokakarya distrik tentang pemikiran kritis oleh beberapa siswa, atau
partisipasi dalam tertentu kegiatan ekstrakurikuler (mis., debat) yang terjadi selama studi
berlangsung. Langkah 2: Dalam kebanyakan kasus, ini Peristiwa kemungkinan akan
mempengaruhi kedua kelompok secara setara dan karenanya tidak mungkin merupakan
ancaman. Peristiwa semacam itu harus dicatat dan dampaknya terhadap masing-masing
kelompok dinilai sedapat mungkin. Langkah 3: Kemungkinan memiliki efek kecuali
terkendali: rendah.
Pematangan. Langkah 1: Kedewasaan dapat memengaruhi skor hasil karena pemikiran kritis
mungkin terkait dengan pertumbuhan individu. Langkah 2: Menganggap bahwa instruktur
mengajar setiap metode selama periode waktu yang sama, pematangan seharusnya tidak
menjadi ancaman. Langkah 3: Kemungkinan memiliki efek kecuali dikendalikan: rendah.
Sikap Subjek. Langkah 1: Sikap subjek dapat mempengaruhi skor posttest. Langkah 2: Jika
anggota salah satu kelompok merasa bahwa mereka menerima apa pun "Perhatian khusus,"
ini bisa menjadi ancaman. Sejauh mana pengobatan mana pun yang "baru" harus dievaluasi.
Langkah 3: Kemungkinan memiliki efek kecuali dikendalikan: rendah ke sedang.
Regresi. Langkah 1: Regresi tidak mungkin mempengaruhi skor posttest kecuali jika subjek
dipilih pada dasar skor ekstrim. Langkah 2: Ancaman ini tidak mungkin untuk mempengaruhi
kelompok secara berbeda, meskipun bisa melakukannya. Langkah 3: Kemungkinan memiliki
efek kecuali dikendalikan: rendah.
Penerapan. Langkah 1: Karakteristik instruktur cenderung memengaruhi skor posttreatment.
Langkah 2: Karena instruktur yang berbeda mengajarkan metode, mereka mungkin berbeda.
Ini bisa dikontrol dengan memiliki beberapa instruktur untuk setiap metode, dengan memiliki
masing-masing instruktur mengajarkan kedua metode, atau dengan memonitor instruksi.
Langkah 3: Kemungkinan memiliki efek kecuali dikontrol: tinggi.
Triknya, kemudian, untuk mengidentifikasi ancaman terhadap validitas internal
adalah, pertama-tama, untuk memikirkan berbagai variabel (kondisi, karakteristik subjek, dan
sebagainya) yang mungkin mempengaruhi variabel hasil penelitian dan, kedua, untuk
memutuskan, berdasarkan bukti dan / atau pengalaman, apakah ini hal-hal akan
mempengaruhi kelompok pembanding secara berbeda. Jika demikian, pengaruh faktor-faktor
ini dapat memberikan penjelasan alternatif untuk hasilnya. Jika ini sepertinya, ancaman
terhadap validitas internal penelitian memang mungkin hadir dan perlu diminimalkan atau
dihilangkan. Saya kemudian harus dibahas dalam laporan akhir tentang proyek penelitian.

Kontrol Eksperimental Perawatan


Desain yang dibahas dalam bab ini dimaksudkan untuk semua meningkatkan validitas
internal suatu penelitian eksperimental. Seperti yang telah Anda lihat, masing-masing
memiliki kelebihan dan kekurangan, dan masing-masing menyediakan cara untuk menangani
beberapa ancaman tapi tidak yang lain. Masalah lain, bagaimanapun, melintasi semua desain.
Meskipun telah disentuh di bagian sebelumnya, khususnya sehubungan dengan lokasi dan
implementasi ancaman, itu layak mendapat perhatian lebih dari biasanya menerima.
Masalahnya adalah bahwa kendali peneliti atas pengobatan eksperimental. Tentu saja, yang
penting Persyaratan percobaan yang dilakukan dengan baik adalah bahwa para peneliti
memiliki kendali atas perawatan — yaitu, mereka mengontrol apa, siapa, kapan, dan
bagaimana. Contoh yang jelas dari kendali peneliti adalah pengujian obat baru; jelas, obatnya
adalah pengobatan dan peneliti bisa kontrol siapa yang mengaturnya, dalam kondisi apa,
kapan itu diberikan, kepada siapa, dan berapa banyak. Sayangnya, para peneliti jarang
memiliki tingkat kontrol ini dalam penelitian pendidikan. Dalam situasi yang ideal, seorang
peneliti dapat menentukan secara tepat bahan-bahan perawatan; dalam praktik sebenarnya,
banyak perawatan atau metode yang terlalu rumit gambarkan dengan tepat. Pertimbangkan
contoh yang telah kami berikan sebelumnya dari studi yang membandingkan keefektifan
metode pengajaran inkuiri dan ceramah. Apa, tepatnya, individu yang mengimplementasikan
setiap metode melakukan? Para peneliti mungkin sangat berbeda dalam jawaban mereka
untuk pertanyaan ini. Ambiguitas dalam menentukan dengan tepat apa pelaksana pengobatan
adalah melakukan mengarah ke jurusan masalah dalam implementasi. Bagaimana kabar
peneliti melatih para guru untuk mengimplementasikan metode yang terlibat di dalamnya
sebuah studi jika mereka tidak dapat menentukan karakteristik penting dari metode tersebut?
Bahkan seandainya itu memadai spesifikasi dapat dicapai dan metode pelatihan
dikembangkan, bagaimana peneliti dapat yakin metode tersebut diimplementasikan dengan
benar? Masalah-masalah ini harus dihadapi oleh peneliti mana pun menggunakan salah satu
desain yang kita miliki dibahas. Pertimbangan masalah ini sering mengarah pada
pertimbangan (dan penilaian) dari kemungkinan trade-off. Itu kontrol terbesar kemungkinan
akan terjadi ketika peneliti adalah orang yang menerapkan pengobatan; ini, bagaimanapun,
juga memberikan peluang terbesar untuk ancaman implementasi terjadi. Semakin peneliti
menyebar implementasi dengan menambahkan pelaksana lain di kepentingan mengurangi
ancaman, namun, semakin dia atau dia berisiko mengalami distorsi atau pengenceran
perawatan. Itu kasus ekstrem adalah penggunaan kelompok pengobatan yang ada— yaitu,
kelompok-kelompok yang terletak oleh peneliti yang sudah menerima perawatan tertentu.
Sebagian besar penulis merujuk ini sebagai studi kausal-komparatif atau ex post facto (lihat
Bab 16), dan jangan menganggapnya jatuh di bawah kategori penelitian eksperimental.
Sedemikian studi, peneliti harus menemukan kelompok yang menerima perawatan yang
ditentukan dan kemudian menggunakan desain yang cocok saja atau, jika ada waktu yang
memadai sebelumnya implementasi perawatan, desain seri waktu. Kami tidak yakin bahwa
studi tersebut, jika perawatan diidentifikasi dengan cermat, harus kalah dengan sehubungan
dengan kesimpulan sebab-akibat dibandingkan dengan studi di mana perawatan ditugaskan
untuk guru (atau lainnya) oleh peneliti. Keduanya sama-sama terbuka untuk sebagian besar
ancaman yang telah kita bahas. Yang ada kelompok lebih rentan terhadap karakteristik
subjek, lokasi, dan ancaman regresi dari eksperimen yang sebenarnya, tetapi tidak harus lebih
dari eksperimen semu. Seseorang akan mengharapkan lebih sedikit masalah dengan sikap
efeknya, karena praktik yang ada tidak diubah. Lebih besar ancaman sejarah dan pematangan
ada karena peneliti akan memiliki kontrol yang kurang. Implementasinya adalah sulit dinilai.
Guru yang sudah menerapkan metode baru mungkin antusias jika mereka Awalnya memilih
metode, tetapi mereka juga mungkin guru yang lebih baik. Di sisi lain, guru ditugaskan untuk
Metode yang baru bagi mereka mungkin antusias atau sebal. Kami menyimpulkan bahwa
kedua jenis penelitian adalah sah.

Contoh Eksperimental Penelitian


Dalam sisa bab ini, kami menyajikan contoh penelitian eksperimental yang dipublikasikan.
Seiring dengan a cetak ulang dari penelitian itu sendiri, kami mengkritik penelitian tersebut,
kenali kekuatannya, dan diskusikan bidang yang menurut kami bisa ditingkatkan. Kami juga
melakukan ini di akhir Bab 14 ke 17 dan 19 hingga 24, dalam setiap kasus menganalisis jenis
studi yang dibahas dalam bab ini. Dalam memilih studi untuk ditinjau, kami menggunakan
kriteria berikut:
 Studi ini harus mencontohkan metodologi yang khas, tetapi tidak menonjol, dan
memungkinkan kritik yang membangun
 Penelitian harus memiliki nilai minat yang cukup memegang perhatian siswa,
meskipun minat profesional tertentu mungkin tidak secara langsung ditangani.
 Penelitian harus dilaporkan secara ringkas.
Secara total, studi-studi ini mewakili keragaman khusus minat di bidang pendidikan. Dalam
mengkritik setiap studi ini, kami menggunakan seri kategori dan pertanyaan yang seharusnya,
sekarang akrab bagi anda. Mereka:
Tujuan / pembenaran: Apakah logis? Apakah ini meyakinkan? Apakah cukup? Apakah
penulis menunjukkan bagaimana hasilnya studi memiliki implikasi penting bagi teori,
berlatih, atau keduanya? Apakah asumsi dibuat eksplisit?
Definisi: Apakah istilah-istilah utama jelas didefinisikan? Jika tidak, apakah mereka jelas
dalam konteks?
Penelitian sebelumnya: Apakah pekerjaan sebelumnya pada topik telah tercakup secara
memadai? Apakah jelas terhubung ke belajar sekarang?
Hipotesis: Apakah mereka dinyatakan? Tersirat? Sesuai untuk belajar?
Sampel: Apa jenis sampel yang digunakan? Apakah ini acak? Sampel? Jika tidak, apakah
sudah dijelaskan secara memadai? Lakukan penulis merekomendasikan atau menyiratkan
generalisasi ke populasi? Jika demikian, apakah populasi target jelas ditunjukkan? Apakah
mungkin batasan untuk generalisasi dibahas?
Instrumentasi: Apakah dijelaskan secara memadai? Aku s bukti keandalan yang memadai
disajikan? Apakah bukti validitas diberikan? Seberapa persuasifnya bukti atau argumen untuk
validitas kesimpulan terbuat dari instrumen?
Prosedur / validitas internal: Apa itu ancaman jelas? Apakah mereka dikendalikan? Jika
tidak, apakah mereka dibahas?
Analisis data: Apakah data dirangkum dan dilaporkan secara tepat? Apakah deskriptif dan
dapat disimpulkan statistik (jika ada) digunakan dengan tepat? Apakah itu statistik diartikan
dengan benar? Apakah keterbatasan dibahas?
Hasil: Apakah disajikan dengan jelas? Apakah ini tertulis? ringkasan konsisten dengan data
yang dilaporkan?
Diskusi / interpretasi: Apakah tempat penulis studi dalam konteks yang lebih luas? Apakah
mereka mengakui keterbatasan penelitian, terutama yang berkaitan dengan populasi dan
generalisasi ekologis hasil?

Analisis Studi
MAKSUD / TUJUAN
Tujuannya dinyatakan dengan jelas: untuk memeriksa kognitif efek instruksi catur pada siswa
yang berisiko gagal akademis. Tampaknya tidak ada masalah etika kembali kerahasiaan,
risiko, atau penipuan. Pembenaran terdiri dari (a) kebutuhan siswa, khususnya mereka yang
“berisiko”, untuk memperoleh keterampilan kognitif tingkat tinggi dan (b) keefektifan
bermain catur yang mungkin untuk memperoleh keterampilan seperti itu.

PENELITIAN SEBELUMNYA
Studi dikutip untuk mendukung (a) dan (b) di atas. Di hadir, hanya bukti anekdotal yang
dikatakan tersedia tentang instruksi catur dengan siswa yang berisiko.

DEFINISI
"Siswa yang Berisiko" didefinisikan sebagai mereka yang satu tahun atau lebih di bawah usia
mereka atau tingkat kelas dalam matematika atau membaca. Namun, tidak jelas apakah
referensi ke menulis dalam paragraf terakhir di bawah "Instrumen" berlaku untuk penelitian
saat ini — jika demikian, ini menyiratkan perbedaan definisi termasuk kinerja menulis.
Tersirat bahwa KBST, tes prestasi, digunakan untuk memilih siswa — definisi operasional.
"Instruksi catur" tidak didefinisikan secara spesifik tetapi dibuat cukup jelas oleh deskripsi
prosedur intervensi, meskipun itu tidak jelas apakah itu termasuk 12 atau 20 sesi kelas.

HIPOTESIS
Tidak ada yang dinyatakan, tetapi hipotesis yang tersirat jelas adalah itu instruksi catur akan
meningkatkan kinerja tes kognitif siswa berisiko dibandingkan dengan "instruksi kelas
reguler".

SAMPEL
Sampel kenyamanan terdiri dari 38 siswa berusia 8 tahun ke 12 diidentifikasi sebagai
"berisiko" oleh tiga sekolah dasar di Seoul, Korea. Beberapa data demografis disediakan
tetapi tidak pada variabel seperti status sosial ekonomi itu akan membantu menilai
generalisasi. Kami pikir deskripsi lebih dari 6 siswa dengan ketidakmampuan belajar
seharusnya diberikan.

INSTRUMENTATION
Tes Keterampilan Dasar Korea tampaknya digunakan untuk itu pilih siswa, tidak ada
informasi reliabilitas atau validitas disediakan. Semua siswa diberikan dua tes sebelum dan
sesudah pelajaran 12- (?), Intervensi 3 bulan Titik. Tes Kecerdasan Nonverbal (TONI-3)
adalah "ukuran kemampuan kognitif bebas bahasa." Alternatif bentuk reliabilitas dikutip dan
dapat diterima. The Raven Progressive Matrices Test (RPM) juga nonverbal dan
dimaksudkan untuk mendapatkan kemampuan kognitif meskipun mereka dijelaskan agak
berbeda. Keandalan pengujian ulang adalah diberikan dan diterima. Korelasi dengan WISC-R
dikutip dan bagus. Kami pikir lebih banyak diskusi tentang validitas tes ini untuk sampel ini
seharusnya telah disediakan. Selain itu, kelompok eksperimen adalah diberikan kuis catur dan
peringkat keterampilan catur berasal dari 20 pertandingan dimainkan di Chessmaster 9000.

PROSEDUR / VALIDITAS INTERNAL


Penelitian ini adalah eksperimen sejati dalam sampel secara acak dibagi menjadi kelompok
eksperimen dan kontrol— instruksi catur versus kegiatan kelas reguler. Bukan itu jelas
mengapa kelompok itu berjumlah 20 dan 18 lebih banyak masing-masing dari 19.
Sehubungan dengan "karakteristik subjek" kelompok-kelompok tersebut terlihat serupa
dalam hal usia, ketidakmampuan belajar, dan gender. Ada indikasi, dibahas di bawah, itu
kelompok eksperimen memiliki kemampuan kognitif awal yang lebih tinggi. Kelompok
eksperimen memiliki lebih banyak siswa di urutan keenam kelas dan lebih sedikit di kelas
empat, yang mungkin terkait untuk keterampilan kognitif yang lebih tinggi dalam kelompok
ini Diberikan lebih banyak siswa kelas enam, tidak jelas mengapa kelompok eksperimen
(sedikit) lebih muda. Diberi batasan acak tugas dengan kelompok kecil, pasangan yang cocok
diikuti dengan desain tugas acak akan lebih disukai. Ancaman lokasi dan riwayat
dimungkinkan. Tampaknya tidak ada kehilangan subjek. Instrumentasi, data karakteristik
kolektor, pengujian, pematangan, dan regresi seharusnya dikontrol oleh desain. Data Bias
kolektor dimungkinkan karena kolektor jelas tahu kelompok mana yang mereka uji.
Penerapan ternyata dilakukan oleh satu guru, sehingga karakteristik guru tidak dapat
dipisahkan dari metode catur dan mungkin menjelaskan hasil. ternyata dilakukan oleh satu
guru, sehingga karakteristik guru tidak dapat dipisahkan dari metode catur dan mungkin
menjelaskan hasil.
tingkatan dimana hasil-hasil penelitian dapat dipercaya kebenarannya atau berkenaan dengan derajat akurasi
antardesain penelitian dan hasil yang dicapai.. Validitas internal merupakan hal yang esensial yang harus
dipenuhi jika peneliti menginginkan hasil studinya bermakna.Validitas internal mengacu pada kemampuan
desain penelitian untuk menyingkirkan atau membuat masuk akal penjelasan alternatif hasil, atau masuk akal
dugaan sementara (Campbell, 1957; Kazdin, 2003c).

ANALISIS DAN HASIL DATA


Meskipun ANOVA adalah analisis yang tepat untuk desain penelitian ini, penggunaannya
menyesatkan tanpa mengakui kekurangannya pengambilan sampel acak (lihat halaman 248
dan 249). Lebih lanjut, mengandalkan tes signifikan mengaburkan temuan. Itu Contoh
pertama dari ini adalah dalam perbandingan eksperimental dan kelompok kontrol pada
pretest, mungkin dilakukan di pengakuan bahwa penugasan acak bukan jaminan kesetaraan
dengan kelompok-kelompok kecil (lihat teks hal. 267). Di TONI-3 kami menghitung ukuran
efek (lihat halaman 248) dari 0,53 mendukung kelompok eksperimen. Data pada RPM tidak
konsisten antara Tabel 1 dan teks yang menyertainya tetapi juga menunjukkan rata-rata yang
agak lebih tinggi untuk kelompok eksperimen. Data untuk KBST sedikit nilai karena ukuran
kecil (tidak dijelaskan) kelompok (n 5 5 hingga n 5 12). Istilah interaksi dalam 2 oleh 2
desain menyediakan tes hipotesis. Dengan hormat baik tes, kurangnya "signifikansi"
mengaburkan perbedaan penting dalam perolehan. Ukuran efek untuk membandingkan
keuntungan kelompok tidak disediakan, tetapi perbedaan pada kedua tes mendukung
kelompok kontrol dan untuk TONI-3 perbedaan ukuran efek keuntungan sangat besar (Kel
5.29, vs Kon 5.68). Korelasi .52 antara peringkat keterampilan catur dan gain pada TONI-3
menunjukkan bahwa skill memang memprediksi gain.

DISKUSI / INTERPRETASI
Kami setuju bahwa penelitian ini tidak mendukung hipotesis tersirat bahwa pengajaran catur
akan meningkatkan keterampilan kognitif. Kami tidak setuju bahwa itu menunjukkan
"kurangnya efek kognitif. ”Kelompok eksperimen menunjukkan lebih sedikit peningkatan
pada kedua tes, secara substansial demikian juga pada TONI-3. Ini terutama mengejutkan
karena eksperimental Kelompok (catur) mendapat skor lebih tinggi pada pretest. Kami pikir
kemungkinan penjelasan untuk ini seharusnya sudah dieksplorasi. Kami pikir beberapa
diskusi hasil dengan 6 siswa dengan ketidakmampuan belajar seharusnya dimasukkan.
Korelasi antara gain pada TONI-3 dan catur peringkat keterampilan adalah hal yang menarik
tetapi bukan sebagai “prediktor utama bagi peningkatan keterampilan kognitif ”karena
menambahkan ini variabel ke multiple R hanya menambahkan 14% ke varian yang dapat
diprediksi dan karena kemampuan kognitif yang terbatas, meskipun penting, diuji. Kami
setuju bahwa topik ini pantas dipelajari lebih lanjut tetapi berharap penulis telah menawarkan
saran yang mencerminkan keprihatinan di atas.
Desain ini dikatakan sebagai pre-experimental design karena belum merupakan
eksperimen sungguh-sungguh karena masih terdapat variabel luar yang ikut
berpengaruh terhadap terbentuknya variabel dependen. Rancangan ini berguna untuk
mendapatkan informasi awal terhadap pertanyaan yang ada dalam penelitian. Bentuk
Pre- Experimental Designs ini ada beberapa macam antara lain :

a. One – Shoot Case Study (Studi Kasus Satu Tembakan)


Dimana dalam desain penelitian ini terdapat suatu kelompok diberi treatment
(perlakuan) dan selanjutnya diobservasi hasilnya (treatment adalah sebagai variabel
independen dan hasil adalah sebagai variabel dependen). Dalam eksperimen ini subjek
disajikan dengan beberapa jenis perlakuan lalu diukur hasilnya.

b. One – Group Pretest-Posttest Design (Satu Kelompok Prates-Postes)


Kalau pada desain “a” tidak ada pretest, maka pada desain ini terdapat pretest
sebelum diberi perlakuan. Dengan demikian hasil perlakuan dapat diketahui lebih
akurat, karena dapat membandingkan dengan keadaan sebelum diberi perlakuan.

c. Intact-Group Comparison
Pada desain ini terdapat satu kelompok yang digunakan untuk penelitian, tetapi dibagi
dua yaitu; setengah kelompok untuk eksperimen (yang diberi perlakuan) dan setengah
untuk kelompok kontrol (yang tidak diberi perlakuan).

2. True Experimental Design


Dikatakan true experimental (eksperimen yang sebenarnya/betul-betul) karena dalam
desain ini peneliti dapat mengontrol semua variabel luar yang mempengaruhi jalannya
eksperimen. Dengan demikian validitas internal (kualitas pelaksanaan rancangan
penelitian) dapat menjadi tinggi. Ciri utama dari true experimental adalah bahwa,
sampel yang digunakan untuk eksperimen maupun sebagai kelompok kontrol diambil
secara random (acak) dari populasi tertentu. Jadi cirinya adalah adanya kelompok
kontrol dan sampel yang dipilih secara random. Desain true experimental terbagi atas:

a. Posstest-Only Control Design


Dalam desain ini terdapat dua kelompok yang masing-masing dipilih secara random
(R). Kelompok pertama diberi perlakuan (X) dan kelompok lain tidak. Kelompok yang
diberi perlakuan disebut kelompok eksperimen dan kelompok yang tidak diberi
perlakuan disebut kelompok kontrol.

b. Pretest-Posttest Control Group Design.


Dalam desain ini terdapat dua kelompok yang dipilih secara acak/random, kemudian
diberi pretest untuk mengetahui keadaan awal adakah perbedaan antara kelompok
eksperimen dan kelompok kontrol.

c. The Solomon Four-Group Design.


Dalam desain ini, dimana salah satu dari empat kelompok dipilih secara random. Dua
kelompok diberi pratest dan dua kelompok tidak. Kemudian satu dari kelompok pratest
dan satu dari kelompok nonpratest diberi perlakuan eksperimen, setelah itu keempat
kelompok ini diberi posttest.
3. Quasi Experimental Design
Bentuk desain eksperimen ini merupakan pengembangan dari true experimental
design, yang sulit dilaksanakan. Desain ini mempunyai kelompok kontrol, tetapi tidak
dapat berfungsi sepenuhnya untuk mengontrol variabel-variabel luar yang
mempengaruhi pelaksanaan eksperimen. Walaupun demikian, desain ini lebih baik dari
pre-experimental design. Quasi Experimental Design digunakan karena pada
kenyataannya sulit medapatkan kelompok kontrol yang digunakan untuk penelitian.
Dalam suatu kegiatan administrasi atau manajemen misalnya, sering tidak mungkin
menggunakan sebagian para karyawannya untuk eksperimen dan sebagian tidak.
Sebagian menggunakan prosedur kerja baru yang lain tidak. Oleh karena itu, untuk
mengatasi kesulitan dalam menentukan kelompok kontrol dalam penelitian, maka
dikembangkan desain Quasi Experimental. Desain eksperimen model ini diantarnya
sebagai berikut:

a. Time Series Design


Dalam desain ini kelompok yang digunakan untuk penelitian tidak dapat dipilih secara
random. Sebelum diberi perlakuan, kelompok diberi pretest sampai empat kali dengan
maksud untuk mengetahui kestabilan dan kejelasan keadaan kelompok sebelum diberi
perlakuan. Bila hasil pretest selama empat kali ternyata nilainya berbeda-beda,
berarti kelompok tersebut keadaannya labil, tidak menentu, dan tidak konsisten.
Setelah kestabilan keadaan kelompok dapay diketahui dengan jelas, maka baru diberi
treatment/perlakuan. Desain penelitian ini hanya menggunakan satu kelompok saja,
sehingga tidak memerlukan kelompok kontrol.

b. Nonequivalent Control Group Design


Desain ini hampir sama dengan pretest-posttest control group design, hanya pada
desain ini kelompok eksperimen maupun kelompok kontrol tidak dipilih secara random.
Dalam desain ini, baik kelompok eksperimental maupun kelompok kontrol
dibandingkan, kendati kelompok tersebut dipilih dan ditempatkan tanpa melalui
random. Dua kelompok yang ada diberi pretes, kemudian diberikan perlakuan, dan
terakhir diberikan postes.

c. Conterbalanced Design
Desain ini semua kelompok menerima semua perlakuan, hanya dalam urutan perlakuan
yang berbeda-beda, dan dilakukan secara random.

4. Factorial Design
Desain Faktorial selalu melibatkan dua atau lebih variabel bebas (sekurang-kurangnya
satu yang dimanipulasi). Desain faktorial secara mendasar menghasilkan ketelitian
desain true-eksperimental dan membolehkan penyelidikan terhadap dua atau lebih
variabel, secara individual dan dalam interaksi satu sama lain. Tujuan dari desain ini
adalah untuk menentukan apakah efek suatu variabel eksperimental dapat
digeneralisasikan lewat semua level dari suatu variabel kontrol atau apakah efek suatu
variabel eksperimen tersebut khusus untuk level khusus dari variabel kontrol, selain
itu juga dapat digunakan untuk menunjukkan hubungan yang tidak dapat dilakukan
oleh desain eksperimental variabel tunggal.

Anda mungkin juga menyukai