Anda di halaman 1dari 84

MAKALAH METODOLOGI PENELITIAN

METODOLOGI PENELITIAN KUANTITATIF


(Penelitian Eksperimen,Penelitian Single-Subjek dan Penelitian Korelasi)

Untuk Memenuhi Tugas Mata Kuliah Metodologi Penelitian Pendidikan

Dosen Pengampu:
Dr. Sri Hastuti Noer, M.Pd.

Kelompok 4:
1. Ratih Dwi Anggreini (1923021012)
2. Aura Purwaningrum (1923021019)
3. Wahyu Anggraini (1923021023)
4. Mayang Kencana Vindra Jaya (1923021027)

MAGISTER PENDIDIKAN MATEMATIKA


FAKULTAS KEGURUAN DAN ILMU PENDIDIKAN
UNIVERSITAS LAMPUNG
2019
KATA PENGANTAR

Dengan mengucapkan puji dan syukur ke hadirat Allah SWT, kami dapat
menyelesaikan makalah ini sebagai tugas mata kuliah metodologi penelitian
pendidikan. Makalah ini disusun agar kita semua dapat memahami materi
metodologi penelitian kuantitatif yang bersumber dari buku “How To Design And
Evaluate Research In Education” yang ditulis oleh Jack R. Fraenkel dan Norman
E. Wallen.
Penyusunan makalah ini dimaksudkan untuk menjadi panduan dalam
pembelajaran maupun diskusi mahasiswa. Kami menyadari sepenuhnya bahwa
tugas ini masih jauh dari kesempurnaan dan masih banyak kekurangannya, hal ini
dikarenakan keterbatasan waktu, pengetahuan dan kemampuan yang kami miliki,
oleh karena itu kami sangat mengharapkan adanya saran dan kritik yang sifatnya
membangun untuk perbaikan dimasa yang akan datang.
Pada kesempatan ini, kami mengucapkan terima kasih kepada semua pihak yang
telah membantu terselesaikannya makalah ini. Semoga makalah ini dapat
bermanfaat bagi penulis dan pembaca pada umumnya.
BAB I
PENDAHULUAN

A. Latar Belakang

Penelitian dapat diartikan sebagai refleksi dari keinginan manusia yang selalu
berusaha untuk mengetahui sesuatu atau memenuhi keingintahuannya. Penelitian
bersifat sistematis sehingga perlu adanya metodologi penelitian. Metodologi
penelitian merupakan proses atau cara ilmiah untuk mendapatkan data yang akan
digunakan untuk keperluan penelitian. Terdapat beberapa metodologi penelitian,
salah satunya yaitu metodologi penelitian kuntitatif. Menurut Kasiram (2008)
Penelitian kuantitatif adalah suatu proses menemukan pengetahuan yang
menggunakan data berupa angka sebagai alat menganalisis keterangan mengenai
apa yang ingin diketahui. Metodologi penelitian kuantitatif meliputi penelitian
eksperimen, penelitian single-subjek, penelitian korelasi, penelitian kausal
komparatif dan penelitian survey.
Penelitian eksperimen digunakan untuk melihat dampak atau pengaruh suatu
variabel, dan menguji hipotesis sebab akibatnya. Terdapat juga penelitian single-
subjek yang merupakan suatu desain penelitian yang menekankan pada konsep
dasar perilaku dari individu sebagai tujuan utamanya. Selain itu, terdapat pula
penelitian korelasi yang merupakan penelitian yang menekankan pada ada
tidaknya hubungan antara dua variabel atau lebih.
Untuk lebih memahami mengenai penelitian eksperimen, penelitian single-
subjek dan penelitian korelasi secara lebih mendetail, kami menyusun materi ini
dalam sebuah makalah yang bersumber dari buku “how to design and evaluate
research in education”.

B. Rumusan Masalah

Masalah yang dikaji dalam makalah ini antara lain:


1. Apakah karakteristik dasar dari penelitian eksperimen, penelitian single-subjek
dan penelitian korelasi?
2. Bagaimanakah cara kontrol variabel luar dari penelitian eksperimen?
3. Bagaimana cara kontrol ancaman terhadap validitas internal dalam penelitian
eksperimen, penelitian single-subjek dan penelitian korelasi?
4. Apa saja jenis-jenis dari penelitian eksperimen dan penelitian single-subjek?
5. Apakah tujuan dari penelitian korelasi?
6. Bagaimana Step dasar dalam penelitian korelasi?
7. Apakah contoh dari penelitian eksperimen, penelitian single-subjek dan
penelitian korelasi?

C. Tujuan

Tujuan dari makalah ini antara lain:


1. Untuk mengetahui apa itu penelitian eksperimen, penelitian single-subjek, dan
penelitian korelasi.
2. Untuk mengetahui perbedaan dari penelitian eksperimen, penelitian single-
subjek dan penelitian korelasi.
3. Mengetahui Bagaimanakah cara kontrol variabel luar dari penelitian
eksperimen.
4. Untuk mengetahui cara kontrol ancaman terhadap validitas internal dalam
penelitian eksperimen, penelitian single-subjek dan penelitian korelasi
5. Untuk mengetahui jenis-jenis dari penelitian eksperimen dan penelitian single-
subjek dan tujuan dari penelitian korelasi.
6. Mengetahui step dasar untuk melakukan penelitian korelasi.
7. Dapat mengetahui contoh dari penelitian eksperimen, penelitian single-subjek
dan penelitian korelasi.
BAB II
PEMBAHASAN

A. PENELITIAN EKSPERIMEN
1. Keunikan Penelitian Eksperimental
Dari semua metodologi penelitian yang dijelaskan dalam buku ini,
penelitian eksperimental ada dalam dua hal yang sangat penting, ini adalah satu-
satunya jenis penelitian yang secara langsung berupaya mempengaruhi variabel
tertentu, dan bila diterapkan dengan benar, ini adalah tipe terbaik untuk pengujian
hipotesis tentang hubungan sebab-akibat. Dalam sebuah studi eksperimental,
peneliti melihat akibat dari setidaknya satu variabel independen pada satu atau
lebih variabel dependen. Variabel independen dalam eksperimen penelitian ini
juga sering disebut sebagai eksperimental atau variabel perlakuan.
Ketergantungan variabel juga dikenal sebagai kriteria atau hasil variabel, mengacu
pada hasil atau hasil penelitian.
Karakteristik utama dari penelitian eksperimental yang membedakannya
dari semua jenis penelitian lainnya bahwa peneliti memanipulasi variabel
independen. Mereka memutuskan sifat perlakuan yaitu, apa yang akan terjadi
pada subyek penelitian, kepada siapa itu harus diterapkan, dan sejauh mana.
Variabel independen sering dimanipulasi dalam penelitian pendidikan termasuk
metode pengajaran, jenis penugasan, bahan belajar, hadiah yang diberikan kepada
siswa, dan tipe pertanyaan yang diajukan oleh guru. Variabel dependen yang
sering dipelajari antara lain prestasi, minat dalam subjek, rentang perhatian,
motivasi, dan sikap menuju sekolah.
Setelah perlakuan diberikan sesuai dengan waktu yang ditetapkan, peneliti
mengamati atau mengukur kelompok yang menerima perlakuan berbeda (dengan
cara semacam posttest) untuk melihat apakah mereka berbeda. Cara lain
mengatakan bahwa para peneliti ingin melihat apakah perlakuan menimbulkan
perbedaan. Jika skor rata-rata kelompok pada posttest memang berbeda dan
peneliti tidak bisa temukan penjelasan alternatif yang masuk akal untuk perbedaan
ini, mereka dapat menyimpulkan bahwa perlakuan itu memang memiliki akibat
dan kemungkinan merupakan penyebab perbedaan.
Penelitian eksperimental, memungkinkan para peneliti melampaui deskripsi
dan prediksi, melampaui identifikasi hubungan, untuk setidaknya sebagian
penentuan apa yang menyebabkan mereka. Studi korelasional dapat menunjukkan
hubungan yang kuat antara tingkat sosial ekonomi dan prestasi akademik, tetapi
mereka tidak dapat menunjukkan bahwa meningkatkan sosial ekonomi level tentu
akan meningkatkan prestasi. Hanya penelitian eksperimental yang memiliki
kemampuan ini. Beberapa contoh aktual dari jenis studi eksperimental yang telah
dilakukan oleh peneliti pendidikan adalah sebagai berikut:
 “Kualitas pembelajaran dengan aktif melawan pasif set motivasi ”1
 "Perbandingan koperasi yang dibantu komputer, pembelajaran yang
kompetitif dan individualistis ”2
 “Pencegahan putus sekolah kelompok konseling intensif intervensi: . . .
mengisolasi remaja yang berisiko di dalam sekolah menengah atas ”3
 “Akibat pertanyaan siswa dan pertanyaan guru tentang akuisisi konsep ”4
 “Mengubah praktik mengajar di ruang kelas umum untuk meningkatkan
ikatan dan perilaku rendah berprestasi ”5
 “Belajar kosakata Mnemonic melawan nonmnemonic strategi untuk anak-
anak ”6

1. Karakteristik Penting dari Penelitian Eksperimental


Kata eksperimen memiliki sejarah panjang dan termasyhur dalam catatan
penelitian. Ini sering dipuji sebagai metode paling kuat yang ada untuk
mempelajari sebab dan akibat. Asal-usulnya kembali ke awal sejarah ketika,
manusia purba pertama kali bereksperimen dengan cara menghasilkan api. Orang
bisa membayangkan upaya coba-coba yang tak terhitung jumlahnya di pihak
mereka sebelumnya mencapai kesuksesan dengan memicu batu atau dengan
memutar spindle kayu di daun kering. Sebagian besar kesuksesan sains modern
adalah karena dirancang dengan cermat dan percobaan yang cermat
diimplementasikan.
Ide dasar yang mendasari semua penelitian eksperimental sangat sederhana:
Cobalah sesuatu dan secara sistematis amati apa yang terjadi. Eksperimen formal
terdiri dari dua kondisi dasar. Pertama, setidaknya dua (tetapi sering lebih) kondisi
atau metode dibandingkan dengan menilai akibat dari kondisi atau "perlakuan"
tertentu (variabel independen). Kedua, variabel independen dimanipulasi secara
langsung oleh peneliti. Perubahan direncanakan dan sengaja dimanipulasi untuk
mempelajari akibatnya pada satu atau lebih hasil (variabel dependen). Mari kita
bahas beberapa hal penting karakteristik penelitian eksperimental sedikit lebih
detail.

a) Perbandingan Kelompok
Eksperimen biasanya melibatkan dua kelompok subjek, yaitu kelompok
eksperimen dan kelompok kontrol atau grup pembanding, meskipun
dimungkinkan untuk melakukan percobaan dengan satu kelompok (dengan
menyediakan semua perlakuan untuk mata pelajaran yang sama) atau dengan tiga
kelompok atau lebih. Eksperimental kelompok menerima perlakuan seperti buku
teks yang baru atau metode pengajaran yang berbeda, sedangkan kelompok
kontrol tidak menerima perlakuan (atau perbandingan kelompok menerima
perlakuan berbeda). Kontrol atau kelompok pembanding sangat penting dalam
semua penelitian eksperimen, untuk itu memungkinkan peneliti untuk
menentukan apakah perlakuan memiliki akibat atau tidak.
Secara historis, kelompok kontrol murni adalah yang menerima tidak ada
perlakuan sama sekali. Sementara ini sering terjadi di dunia medis atau penelitian
psikologis, jarang benar dalam pendidikan penelitian. Kelompok kontrol hampir
selalu menerima perlakuan berbeda. Beberapa peneliti pendidikan lebih baik
merujuk pada kelompok pembanding daripada mengontrol kelompok.
Pertimbangkan sebuah contoh. Misalkan seorang peneliti berharap untuk
mempelajari metode pengajaran ilmu baru. Dia akan memiliki siswa dalam
kelompok percobaan diajarkan dengan metode baru, tetapi siswa dalam kelompok
pembanding akan terus diajarkan dengan metode guru mereka yang biasa
digunakan. Peneliti tidak akan mengelola metode baru ke kelompok eksperimen
dan minta kelompok kontrol tidak melakukan apa pun. Apa saja metode
pengajaran kemungkinan akan lebih efektif daripada tidak ada metode sama
sekali!
b) Manipulasi Variabel Independen
Karakteristik penting kedua dari semua percobaan adalah bahwa peneliti
secara aktif memanipulasi variabel independen. Apa artinya ini? Sederhananya,
artinya bahwa peneliti sengaja dan langsung menentukan apa bentuk variabel
independen yang akan diambil dan kemudian kelompok mana yang akan
mendapatkan formulir yang mana. Misalnya kalau variabel independen dalam
penelitian adalah jumlah antusiasme menampilkan instruktur, seorang peneliti
dapat melatih dua guru untuk menampilkan jumlah antusiasme yang berbeda
sebagaimana mereka mengajar kelas mereka.
Meskipun banyak variabel independen dalam pendidikan dapat dimanipulasi,
banyak lainnya tidak bisa. Contoh dari variabel independen yang dapat
dimanipulasi diantaranya: metode pengajaran, jenis konseling, kegiatan belajar,
tugas yang diberikan, dan bahan yang digunakan; contoh variabel independen
yang tidak dapat dimanipulasi diantaranya: jenis kelamin, etnis, usia, dan
preferensi agama. Peneliti dapat memanipulasi jenis kegiatan pembelajaran
dimana siswa terpapar di ruang kelas, tetapi mereka tidak dapat memanipulasi,
katakanlah, preferensi agama — yaitu, siswa tidak dapat "dibuat menjadi"
Protestan, Katolik, Yahudi, atau Muslim, misalnya, untuk melayani tujuan sebuah
pelajaran. Untuk memanipulasi variabel, peneliti harus memutuskan siapa yang
mendapatkan sesuatu dan kapan, dimana, dan bagaimana mereka akan
mendapatkannya.
Variabel independen dalam penelitian eksperimental dapat dibentuk dengan
beberapa cara — baik (1) satu bentuk variabel melawan yang lain; (2) kehadiran
lawan tidak adanya bentuk tertentu; atau (3) berbagai tingkat bentuk yang sama.
Contoh (1) akan menjadi studi membandingkan metode inkuiri dengan metode
ceramah instruksi dalam pengajaran kimia. Contoh dari (2) akan menjadi studi
yang membandingkan penggunaan transparansi melawan tidak ada transparansi
dalam pengajaran statistik. Sebuah contoh (3) akan menjadi studi yang
membandingkan akibat dengan jumlah antusiasme guru yang ditentukan berbeda
sikap siswa terhadap matematika. Baik (1) dan (2), variabel (metode) jelas
kategoris. Dalam (3), variabel yang dalam kenyataannya adalah kuantitatif
(tingkat antusiasme) diperlakukan sebagai kategori (akibat dari jumlah antusiasme
yang ditentukan akan dipelajari) dalam memerintahkan peneliti untuk
memanipulasi (yaitu, untuk mengendalikan) jumlah antusiasme.

c) Pengacakan
Aspek penting dari banyak eksperimen adalah acak tugas mata pelajaran ke
grup. Meskipun ada beberapa jenis eksperimen di mana tugas acak tidak mungkin,
peneliti mencoba menggunakan pengacakan jika memungkinkan. Ini merupakan
unsur penting dalam jenis eksperimen terbaik. Tugas acak serupa, tetapi tidak
identik, dengan konsep seleksi acak kita bahas dalam Bab 6. Cara penugasan acak
bahwa setiap individu yang berpartisipasi dalam percobaan memiliki peluang
yang sama untuk ditugaskan membandingkan salah satu kondisi eksperimental
atau kontrol. Pemilihan acak, di sisi lain berarti setiap anggota populasi memiliki
peluang yang sama untuk dipilih menjadi anggota sampel. Di bawah tugas acak,
setiap anggota sampel diberi nomor (sewenang-wenang), dan tabel angka acak
(lihat Bab 6) kemudian digunakan untuk memilih anggota kelompok eksperimen
dan kontrol.
Tiga hal harus diperhatikan tentang penugasan acak subyek ke kelompok.
Pertama, itu terjadi sebelum percobaan dimulai. Kedua, ini adalah proses
menugaskan atau mendistribusikan individu ke grup, bukan hasil distribusi
tersebut. Ini artinya Anda tidak bisa lihat dua kelompok yang sudah terbentuk dan
dapat mengetahui, hanya dengan melihat apakah mereka benar atau tidak
terbentuk secara acak. Ketiga, penggunaan tugas acak memungkinkan peneliti
untuk membentuk kelompok itu, tepat di permulaan penelitian, setara artinya
mereka berbeda hanya secara kebetulan di setiap variabel yang diminati. Di lain
kata, tugas acak dimaksudkan untuk menghilangkan ancaman variabel asing atau
tambahan tidak hanya yang peneliti sadari tetapi juga yang tidak mereka sadari
yang mungkin memengaruhi hasil penelitian. Ini adalah keindahan dan kekuatan
penugasan acak. Itu salah satu alasannya mengapa eksperimen secara umum lebih
efektif daripada jenis penelitian lain untuk menilai sebab-akibat hubungan.
Pernyataan terakhir ini ditempa oleh realisasinya bahwa kelompok dibentuk
melalui penugasan acak mungkin masih agak berbeda. Tugas acak memastikan
hanya bahwa grup tersebut setara (atau setidaknya sama dengan setara dengan
manusia yang bisa membuatnya) pada awalnya sebuah eksperimen.
Selain itu, tugas acak tidak ada jaminan kelompok yang setara kecuali kedua
kelompok tersebut cukup besar. Tidak seorang pun akan mengharapkan hasil
tugas acak dalam kesetaraan misalnya jika hanya lima mata pelajaran yang
ditugaskan masing-masing kelompok. Tidak ada aturan untuk menentukan harus
berapa besar kelompok tetapi kebanyakan peneliti tidak nyaman mengandalkan
tugas acak dengan kurang dari 40 mata pelajaran di setiap kelompok

2. Kontrol Variabel Luar

Peneliti dalam studi eksperimental memiliki peluang untuk melakukan


kontrol jauh lebih banyak daripada di kebanyakan bentuk penelitian lainnya.
Mereka menentukan perlakuan, pilih sampel, tetapkan individu untuk kelompok,
tentukan kelompok mana yang akan mendapatkan perlakuan, cobalah untuk
mengendalikan faktor lain selain perlakuan yang mungkin mempengaruhi hasil
penelitian, dan kemudian mengamati atau mengukur akibat perlakuan pada
kelompok ketika perlakuan selesai.
Dalam Bab 9, kami memperkenalkan gagasan validitas internal dan
membahas beberapa jenis ancaman terhadap keabsahan internal. Ini sangat
penting bagi peneliti yang melakukan sebuah studi eksperimental untuk
melakukan yang terbaik yaitu untuk menghilangkan atau meminimalkan akibat
yang mungkin dari ancaman ini. Jika peneliti tidak yakin apakah variabel yang
lain mungkin menjadi penyebab hasil yang diamati dalam sebuah studi, mereka
tidak dapat memastikan apa penyebab sebenarnya. Misalnya, jika seorang peneliti
berusaha membandingkan akibat dari dua metode pengajaran yang berbeda pada
siswa sikap terhadap sejarah tetapi tidak memastikan bahwa kelompok yang
terlibat setara dalam kemampuan, kemudian kemampuan mungkin penjelasan
alternatif yang mungkin (bukan perbedaan metode) untuk setiap perbedaan sikap
dari kelompok yang ditemukan pada posttest.
Secara khusus, peneliti yang melakukan studi eksperimen mencoba yang
terbaik untuk mengontrol setiap dan semua karakteristik subjek yang mungkin
mempengaruhi hasil penelitian. Mereka melakukan ini dengan memastikan bahwa
kedua kelompok setara mungkin pada semua variabel satu atau yang sedang
dipelajari (variabel independen).
Bagaimana peneliti meminimalkan atau menghilangkan ancaman karena
karakteristik subjek? Ada banyak cara. Ini adalah beberapa yang paling umum.

Pengacakan: Seperti yang kami sebutkan sebelumnya, jika subjek dapat secara
acak ditugaskan ke berbagai kelompok yang terlibat dalam studi
eksperimental, para peneliti dapat mengasumsikan bahwa grup tersebut
setara. Ini adalah cara terbaik untuk memastikan akibat satu atau lebih
variabel asing yang mungkin telah dikontrol.
Memegang variabel konstan tertentu: Idenya di sini adalah untuk
menghilangkan kemungkinan akibat suatu variabel dengan menghapusnya
dari ruang kerja. Misalnya, jika seorang peneliti mencurigai bahwa gender
dapat memengaruhi hasil penelitian, dia bisa mengendalikannya dengan
membatasi subyek penelitian untuk wanita dan dengan mengecualikan semua
laki-laki. Variabel gender dengan kata lain dianggap konstan. Namun, ada
biaya yang terlibat (karena hampir selalu ada) untuk kontrol ini sebagai
generalisasi dari hasil studi berkurang.
Membangun variabel ke dalam desain: Solusi ini melibatkan membangun
variabel ke dalam penelitian untuk menilai dampaknya. Ini adalah kebalikan
dari ide sebelumnya. Menggunakan contoh sebelumnya, the Peneliti akan
mencakup perempuan dan laki-laki (sebagai kelompok yang berbeda) dalam
desain penelitian dan kemudian menganalisis dampak gender dan metode
hasil.
Sesuai: Seringkali pasangan mata pelajaran dapat dicocokkan pada variabel
tertentu yang menarik. Jika seorang peneliti memisalkan usia dapat
mempengaruhi hasil sebuah studi, ia mungkin berusaha untuk mencocokkan
siswa sesuai untuk umur mereka dan kemudian menetapkan satu anggota dari
masing-masing pasangan (secara acak jika memungkinkan) untuk masing-
masing pasangan kelompok pembanding.
Menggunakan subyek sebagai kontrol mereka sendiri: Ketika subyek
digunakan sebagai kontrol mereka sendiri, kinerja mereka di bawah kedua
(atau semua) perlakuan dibandingkan. Dengan demikian, siswa yang sama
dapat diajarkan aljabar unit pertama dengan metode penyelidikan dan
kemudian dengan metode ceramah. Contoh lain adalah penilaian perilaku
individu selama periode waktu sebelum dan sesudah perlakuan dilaksanakan
untuk melihat apakah terjadi perubahan perilaku.
Menggunakan analisis kovarians: Seperti disebutkan dalam Bab 11, analisis
kovarians dapat digunakan untuk menyamakan kelompok secara statistik
berdasarkan pretest atau variabel lain. Skor posttest subjek di masing-masing
kelompok kemudian disesuaikan.
Kami akan segera menunjukkan sejumlah desain penelitian yang menggambarkan
bagaimana beberapa dari kontrol di atas dapat diimplementasikan dalam studi
eksperimental.

3. Desain Grup dalam Penelitian Eksperimental


Desain percobaan dapat mengambil berbagai formulir. Beberapa desain kami
sajikan di bagian ini lebih baik dari yang lain. Kenapa "lebih baik"? Karena dari
berbagai ancaman terhadap validitas internal yang diidentifikasi dalam Bab 9:
Desain yang bagus banyak mengendalikan ancaman ini, sementara desain yang
buruk hanya mengendalikan sedikit. Kualitas suatu percobaan tergantung pada
seberapa baik mengendalikan berbagai ancaman terhadap validitas internal.

a) Desain Eksperimental Lemah


Desain yang "lemah" tidak memiliki kontrol bawaan untuk ancaman terhadap
validitas internal. Selain variabel independen, ada sejumlah penjelasan yang
masuk akal lainnya untuk setiap hasil yang terjadi. Akibatnya peneliti
menggunakan salah satu desain yang mengalami kesulitan menilai evektifitas
variabel independen.
Studi Kasus Satu Tembakan. Dalam wadah sekali tembak desain studi, satu
kelompok terpapar perlakuan atau peristiwa dan variabel dependen selanjutnya
diamati (diukur) untuk menilai akibat dari perlakuan. Diagram desain ini adalah
sebagai berikut:’’
Desain Studi Kasus One-Shot
X O
Observasi Perlakuan (variabel dependen)
Simbol X mewakili pemaparan grup ke perlakuan yang menarik, sedangkan
O mengacu pada pengamatan (pengukuran) dari variabel dependen. Penempatan
simbol dari kiri ke kanan menunjukkan urutan waktu X dan O. Seperti yang Anda
lihat perlakuan X datang sebelum pengamatan variabel dependen O.
Misalkan seorang peneliti ingin melihat apakah buku teks baru meningkatkan
minat siswa pada sejarah. Dia menggunakan buku teks (X) selama satu semester
dan kemudian mengukur minat siswa (O) dengan skala sikap. Diagram dari
contoh ini adalah ditunjukkan pada Gambar 13.1.
Kelemahan paling jelas dari desain ini adalah tidak adanya kontrol apa pun.
Peneliti tidak punya cara untuk mengetahui apakah hasil yang diperoleh di O
(diukur dengan skala sikap) karena perlakuan X (buku teks). Desain tidak
menyediakan perbandingan apa pun, jadi peneliti tidak dapat membandingkan
hasil perlakuan (seperti diukur dengan skala sikap) dengan kelompok yang sama
sebelumnya menggunakan buku teks baru, atau dengan grup yang lain
menggunakan buku teks yang berbeda. Karena kelompok itu tidak diuji dengan
cara apa pun, peneliti tahu tentang apa kelompok itu sebelum menggunakan teks.

X O
Buku teks baru Skala sikap
untuk mengukur bunga
(Variabel tak bebas)
Gambarbebas)
13.1 Contoh Desain Studi Kasus Satu Tembakan

Dengan demikian, dia tidak tahu apakah perlakuannya sudah berakibat apa
pun. Sangat mungkin siswa yang menggunakan buku teks baru akan menunjukkan
sikap yang sangat menguntungkan menuju sejarah. Tapi pertanyaannya tetap,
apakah sikap-sikap ini dihasilkan oleh buku teks baru? Sayangnya, studi kasus
sekali pakai tidak membantu kami menjawab pertanyaan ini. Untuk memperbaiki
desain ini, perbandingan dapat dibuat dengan kelompok siswa lain yang memiliki
konten kursus yang sama disajikan dalam buku teks biasa. (Kami akan segera
menunjukkan desain seperti itu kepada Anda.) Untungnya, kelemahan dalam
desain sekali tembak sangat baik diketahui bahwa itu jarang digunakan dalam
penelitian pendidikan.
Desain Satu-Grup Pretest-Posttest Dalam desain satu kelompok pretest-posttest,
satu kelompok diukur atau diamati tidak hanya setelah menjadi terkena semacam
perlakuan, tetapi juga sebelumnya. Sebuah diagram desain ini adalah sebagai
berikut:
Desain Satu-Grup Pretest-Posttest
O X O
Pretest Perlakuan Posttest

Pertimbangkan contoh desain ini. Keinginan utama untuk menilai akibat dari
sesi konseling mingguan pada sikap siswa "sulit dijangkau" tertentu di
sekolahnya. Dia meminta para penasihat dalam program untuk bertemu sekali
seminggu dengan siswa ini selama 10 minggu, selama sesi mana siswa didorong
untuk mengekspresikan perasaan dan kekhawatiran mereka. Dia menggunakan
skala 20-item untuk mengukur sikap siswa terhadap sekolah dengan sebelum dan
sesudah periode 10 minggu. Gambar 13.2 menyajikan diagram desain penelitian.

Desain ini lebih baik daripada studi kasus sekali pakai (peneliti setidaknya
tahu apakah ada perubahan yang terjadi) tapi masih lemah. Sembilan ancaman
tidak terkendali untuk validitas internal yang mungkin juga menjelaskan hasil
pada posttest.
Mereka adalah sejarah, pematangan, instrumen pembusukan, karakteristik
pengumpul data, bias pengumpul data, pengujian, regresi statistik, sikap subyek,
dan penerapan. Setiap atau semua ini dapat mempengaruhi hasil penelitian.
Peneliti tidak akan tahu jika ada perbedaan antara pretest dan posttest karena
perlakuan atau satu atau lebih dari ancaman ini. Untuk perbaiki ini, kelompok
pembanding yang tidak menerima perlakuan bisa ditambahkan. Lalu jika ada
perubahan sikap terjadi antara pretest dan posttest, sang peneliti memiliki alasan
untuk percaya bahwa itu disebabkan oleh perlakuan (dilambangkan dengan X).

Desain Perbandingan Kelompok Statis. Di desain perbandingan kelompok


statis dua sudah ada atau utuh grup digunakan. Ini kadang-kadang disebut sebagai
grup statis, nama lain untuk desain. Desain ini kadang-kadang disebut
nonquivalent desain kelompok kontrol. Diagram desain ini adalah sebagai berikut:

Desain Perbandingan Kelompok Statis


X_____O
O

Garis putus-putus menunjukkan bahwa kedua kelompok sedang dibandingkan


sudah terbentuk yaitu, subjek tidak ditugaskan secara acak ke dua kelompok. X
melambangkan perlakuan eksperimental. Ruang kosong dalam desain
menunjukkan bahwa grup "kontrol" tidak menerima eksperimen perlakuan;
mungkin menerima perlakuan yang berbeda atau tidak ada perlakuan sama sekali.
Dua O ditempatkan persis vertikal satu sama lain, menunjukkan bahwa
pengamatan atau pengukuran dari dua kelompok terjadi pada waktu yang
bersamaan.
Perhatikan lagi contoh yang digunakan untuk menggambarkan oneshot desain
studi kasus. Kita bisa menerapkan grup statis desain perbandingan dengan contoh
ini. Peneliti akan (1) menemukan dua kelompok utuh (dua kelas), (2) ditugaskan
buku teks baru (X) ke salah satu kelas tetapi memiliki kelas lain menggunakan
buku teks biasa, dan kemudian (3) mengukur tingkat minat semua siswa di kedua
kelas pada saat yang sama (misalnya pada akhir semester). Gambar 13.3
menyajikan diagram dari contoh ini.
Meskipun desain ini memberikan kontrol yang lebih baik ancaman sejarah,
pematangan, pengujian, dan regresi, lebih rentan tidak hanya terhadap kematian
dan lokasi, tetapi juga, yang lebih penting, untuk kemungkinan diferensial
karakteristik subjek.

X O
Buku teks baru Skala sikap
untuk mengukur bunga
_ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ __ _ _ _ _ _ _
O
Buku teks biasa Skala sikap
untuk mengukur bunga

Gambar 13.3 Contoh Perbandingan Grup Statis Desain

Desain Pretest-Posttest Kelompok Statis. Desain pretest-posttest kelompok


statis berbeda dari desain perbandingan kelompok statis hanya dalam pretest, itu
diberikan kepada kedua kelompok. Diagram untuk desain ini adalah sebagai
berikut:

Desain Pretest-Posttest Kelompok Statis


O X O
O O

Dalam menganalisis data, skor pretest masing-masing individu adalah


dikurangi dari skor posttestnya, sehingga memungkinkan analisis "keuntungan"
atau "perubahan." Sementara ini memberikan yang lebih baik kontrol ancaman
karakteristik subjek (karena itu adalah perubahan pada setiap siswa yang
dianalisis), jumlah gain seringkali tergantung pada kinerja awal; itu adalah
kelompok yang mendapat skor lebih tinggi pada pretest kemungkinan akan
meningkat lebih (atau dalam beberapa kasus kurang), dan dengan demikian
karakteristik subjek masih ada beberapa ancaman. Selanjutnya, administrasi
sebuah pretest meningkatkan kemungkinan ancaman pengujian. Dalam pretest
digunakan untuk mencocokkan grup, desain ini menjadi kelompok kontrol pretest-
posttest hanya cocok desain (lihat halaman 269), desain yang jauh lebih efektif.
b) Desain Eksperimental Yang Benar
Bahan penting dari desain eksperimental yang benar adalah bahwa subyek
secara acak ditugaskan ke kelompok perlakuan. Seperti dibahas sebelumnya,
penugasan acak adalah tugas yang kuat untuk mengendalikan karakteristik subjek
ancaman terhadap validitas internal, pertimbangan utama dalam pendidikan
penelitian.

Kontrol Acak Hanya Desain Kelompok Posttest. Kontrol posttest hanya acak
desain kelompok melibatkan dua kelompok, keduanya dibentuk oleh tugas acak.
Satu kelompok menerima perlakuan eksperimental sementara yang lain tidak, dan
kemudian kedua kelompok dipostest pada variabel dependen. Sebuah diagram
desain ini adalah sebagai berikut:

Acak Hanya Posttest Desain Grup Kontrol


Kelompok perlakuan R X O
Kelompok kontrol R C O

Seperti sebelumnya, simbol X menunjukkan keterpaparan terhadap perlakuan


dan O mengacu pada pengukuran tergantung variabel. R mewakili penugasan acak
individu ke grup. C sekarang mewakili kelompok kontrol.
Dalam desain ini, kontrol ancaman tertentu sangat baik. Melalui penggunaan
tugas acak, ancaman karakteristik subjek, pematangan, dan statistik Regresi
dikontrol dengan baik untuk. Karena tidak ada Subjek dalam penelitian diukur dua
kali, pengujian bukan a kemungkinan ancaman. Ini mungkin yang terbaik dari
semua desain gunakan dalam studi eksperimental, asalkan setidaknya ada 40
subjek dalam setiap kelompok.
Sayangnya, ada beberapa ancaman terhadap validitas internal yang tidak
dikendalikan oleh desain ini. Pertama adalah kefanaan. Karena kedua kelompok
itu sama, kita mungkin mengharapkan tingkat putus sekolah yang sama dari
masing-masing kelompok. Namun, paparan terhadap perlakuan dapat
menyebabkan lebih banyak orang dalam grup eksperimen untuk keluar (atau tetap
di sini) daripada di kelompok kontrol. Ini dapat menyebabkan keduanya kelompok
menjadi berbeda dalam hal karakteristik mereka, yang pada gilirannya dapat
mempengaruhi hasil pada posttest. Untuk alasan ini, peneliti harus selalu
melaporkan berapa banyak mata pelajaran yang keluar dari masing-masing
kelompok selama sebuah eksperimen. Ancaman sikap (akibat Hawthorne) adalah
mungkin. Selain itu, implementasi, pengumpul data ancaman bias, lokasi, dan
sejarah mungkin ada. Ini ancaman terkadang dapat dikontrol dengan tepat
modifikasi pada desain ini.
Sebagai contoh desain ini, pertimbangkan hipotesis studi di mana seorang
peneliti menyelidiki akibat dari serangkaian lokakarya pelatihan sensitivitas di
fakultas moral di distrik sekolah menengah besar. Peneliti secara acak memilih
sampel 100 guru dari semua guru di kabupaten tersebut. Peneliti kemudian (1)
secara acak menugaskan para guru di kabupaten untuk dua kelompok; (2)
memaparkan satu kelompok, tetapi tidak yang lain, ke pelatihan; dan kemudian
(3) mengukur moral masing-masing kelompok menggunakan sebuah kuesioner.
Gambar 13.4 menyajikan diagram ini percobaan hipotetis.
Sekali lagi kami menekankan bahwa penting untuk tetap membersihkannya
perbedaan antara pemilihan acak dan tugas acak. Keduanya melibatkan proses
pengacakan, tetapi untuk tujuan yang berbeda. Pilihan acak, Anda akan recall,
dimaksudkan untuk memberikan sampel yang representatif. Tapi itu bisa atau
tidak bisa disertai secara acak tugas mata pelajaran ke grup. Tugas acak
dimaksudkan untuk menyamakan kelompok, dan seringkali tidak disertai dengan
seleksi acak.
Kontrol Pretest-Posttest Acak Desain Grup. Pretest-posttest acak
desain kelompok kontrol berbeda dari yang diacak desain kelompok kontrol
hanya-posttest hanya dalam penggunaan pretest. Dua kelompok subjek digunakan,
dengan keduanya kelompok diukur atau diamati dua kali. Pertama pengukuran
berfungsi sebagai pretest, yang kedua sebagai posttest. Tugas acak digunakan
untuk membentuk kelompok. Pengukuran atau pengamatan dikumpulkan pada
saat yang sama untuk kedua kelompok. Diagram desain ini mengikuti.
The Pretest-Posttest Acak Desain Grup Kontrol
Kelompok perlakuan R O X O
Kelompok kontrol R O C O

Penggunaan pretest meningkatkan kemungkinan pretestancaman interaksi


perlakuan, karena dapat "mengingatkan" anggota kelompok eksperimen, sehingga
menyebabkan mereka melakukan lebih baik (atau lebih buruk) pada posttest
daripada anggota kelompok kontrol. Sebuah trade-off adalah yang disediakannya
peneliti dengan cara memeriksa apakah kedua kelompok itu benar-benar serupa
yaitu, apakah acak tugas sebenarnya berhasil membuat setara dengan kelompok.
Ini sangat diinginkan jika jumlah di setiap kelompok kecil (kurang dari 30).
Jika pretest menunjukkan bahwa kelompok itu tidak setara, peneliti dapat
berupaya membuatnya dengan menggunakan salah satu desain yang cocok akan
kita bahas sebentar lagi. Pretest juga diperlukan jika jumlah perubahan dari waktu
ke waktu akan dinilai.
Mari kita ilustrasikan desain ini dengan menggunakan desain sebelumnya
contoh yang melibatkan penggunaan lokakarya sensitivitas. Gambar 13.5
menyajikan diagram bagaimana desain ini akan digunakan.

Desain Empat Kelompok Solomon Secara Acak. Solomon secara acak terdiri
dari empat kelompok desain adalah upaya untuk menghilangkan kemungkinan
akibat dari pretest. Ini melibatkan penugasan acak subjek untuk empat kelompok,
dengan dua kelompok yang dites dan dua tidak. Salah satu kelompok yang dites
dan salah satu kelompok yang tidak ditafsirkan terkena perlakuan eksperimental.
Keempat kelompok ini kemudian diuji coba. Diagram dari desain ini adalah
sebagai berikut:
Desain Empat Kelompok Solomon Secara Acak
Kelompok perlakuan R O X O
Kelompok kontrol R O C O
Kelompok perlakuan R X O
Kelompok kontrol R C O
Desain empat kelompok Solomon secara acak menggabungkan kelompok
kontrol pretest-posttest dan hanya posttest desain kelompok kontrol. Dua
kelompok pertama mewakili desain kelompok kontrol pretest-posttest, sedangkan
dua kelompok terakhir yang mewakili desain kelompok kontrol hanya posttest.
Gambar 13.6 menyajikan contoh acak Desain Solomon empat kelompok.
Desain empat kelompok Solomon secara acak menyediakan kontrol terbaik
dari ancaman terhadap validitas internal yang telah kita bahas. Namun,
kelemahannya adalah itu memerlukan sampel besar karena subjek harus
ditugaskan ke empat kelompok. Selanjutnya, melakukan penelitian melibatkan
empat kelompok sekaligus membutuhkan banyak hal jumlah energi dan upaya
dari pihak peneliti. Tugas Acak dengan Pencocokan. Dalam sebuah upaya
meningkatkan kemungkinan bahwa kelompok subjek dalam percobaan akan
setara, pasang individu dapat dicocokkan pada variabel tertentu. Itu pilihan
variabel yang cocok didasarkan pada penelitian sebelumnya, teori, dan atau
pengalaman peneliti. Anggota dari setiap pasangan yang cocok kemudian
ditugaskan ke kelompok eksperimen dan kontrol secara acak. Adaptasi ini dapat
dilakukan untuk kedua-satunya posttest desain kelompok kontrol dan desain
kelompok kontrol pretest-posttest, meskipun yang terakhir lebih umum. Diagram
desain ini disediakan di bawah ini.
individu dapat dicocokkan pada variabel tertentu. Itu pilihan variabel yang
cocok didasarkan pada penelitian sebelumnya, teori, dan / atau pengalaman
peneliti. Anggota dari setiap pasangan yang cocok kemudian ditugaskan ke
kelompok eksperimen dan kontrol secara acak. Adaptasi ini dapat dilakukan untuk
kedua-satunya posttest desain kelompok kontrol dan kontrol pretest-posttest
desain kelompok, meskipun yang terakhir lebih umum. Diagram desain ini
disediakan di bawah ini

Kontrol Acak Hanya Posttest


Desain Grup, Menggunakan Subjek yang Cocok
Kelompok perlakuan Mr X O
Kelompok kontrol Mr C O

Kontrol Acak Pretest-Posttest


Desain Grup, Menggunakan Subjek yang Cocok
Kelompok perlakuan Mr O X O
Kelompok kontrol Mr O C O

Simbol Mr mengacu pada kenyataan bahwa anggota setiap pasangan yang


cocok ditugaskan secara acak ke eksperimen dan kelompok kontrol.
Meskipun pretest dari variabel dependen umumnya digunakan untuk
memberikan skor yang cocok, pengukuran dari setiap variabel yang menunjukkan
hubungan yang substansial untuk variabel dependen sesuai. Sesuai dapat
dilakukan dengan salah satu atau kedua cara: mekanis atau secara statistik.
Keduanya membutuhkan skor untuk setiap mata pelajaran setiap variabel yang
akan dicocokkan subjeknya.

Gambar 13.7 Desain Kelompok Kontrol Acak Posttest Saja, Menggunakan Subjek
yang Cocok
Pencocokan mekanis adalah proses memasangkan dua orang yang nilainya
serupa pada variabel tertentu. Misalnya, dua gadis yang memiliki kemampuan
skor matematika dan skor tes kecemasan serupa mungkin cocok dengan variabel-
variabel tersebut. Setelah pencocokan selesai untuk seluruh sampel, pemeriksaan
harus dilakukan (melalui penggunaan poligon frekuensi) untuk memastikan kedua
kelompok tersebut memang setara pada setiap pencocokan variabel. Sayangnya,
dua masalah membatasi kegunaan pencocokan mekanik. Pertama, sangat sulit
cocok dengan lebih dari dua atau tiga variabel — orang saja jangan berpasangan
dengan lebih dari beberapa karakteristik, perlu memiliki sampel awal yang sangat
besar untuk menggambar. Kedua, untuk mencocokkan, hampir tidak bisa
dihindari bahwa beberapa mata pelajaran harus dihilangkan dari penelitian karena
tidak ada "kecocokan" untuk mereka yang dapat ditemukan. Maka sampel tidak
lagi acak meskipun mungkin mereka miliki sebelum pencocokan terjadi.
Sebagai contoh desain pencocokan mekanis dengan tugas acak, misalkan
seorang peneliti tertarik akibat dari pembinaan akademik pada titik kelas rata-rata
(IPK) siswa berprestasi dalam sains kelas. Peneliti secara acak memilih sampel 60
siswa dari populasi 125 siswa seperti disekolah dasar setempat dan
mencocokkannya secara berpasangan IPK, menemukan bahwa dia dapat
mencocokkan 40 dari 60. Dia kemudian secara acak menempatkan setiap subjek
dalam 20 pasangan yang dihasilkan baik eksperimental atau grup kontrol. Gambar
13.7 menyajikan contoh serupa.
Pencocokan statistik di sisi lain, tidak mengharuskan hilangnya subjek juga
tidak membatasi jumlah variabel yang cocok. Setiap mata pelajaran diberikan skor
dan "diprediksi" pada variabel dependen, berdasarkan korelasi antara variabel
dependen dan variabel (atau variabel) di mana subjek sedang cocok. Perbedaan
antara prediksi dan skor aktual untuk setiap individu kemudian digunakan untuk
membandingkan kelompok eksperimen dan kontrol.
Ketika pretest digunakan sebagai variabel yang cocok, perbedaan antara skor
yang diprediksi dan yang sebenarnya adalah disebut skor gain regressed. Skor ini
lebih disukai untuk mendapatkan skor yang lebih mudah (minus posttest skor
pretest untuk setiap individu) karena itu lebih terpercaya. Kami membahas
prosedur serupa di sebagian korelasi dalam Bab 15. Jika pencocokan mekanis
digunakan, masing-masing satu anggota pasangan yang cocok secara acak
ditugaskan ke eksperimen grup, yang lain ke grup kontrol.
Jika statistik cocok digunakan, sampel dibagi secara acak di awal,dan
penyesuaian statistik dilakukan setelah semua data telah dikumpulkan. Meskipun
beberapa peneliti menganjurkan penggunaan statistik lebih dari pencocokan
mekanik, pencocokan statistik tidak bisa salah. Itu utama kelemahannya adalah ia
menganggap bahwa hubungannya antara variabel dependen dan masing-masing
variabel prediktor dapat digambarkan dengan benar oleh garis lurus dari garis
melengkung. Prosedur mana pun yang digunakan, peneliti harus (dalam desain
ini) mengandalkan tugas acak untuk menyamakan grup pada semua variabel lain
yang terkait dengan variabel dependen.
c) Desain Quasi-Eksperimental
Desain kuasi-eksperimental tidak termasuk penggunaan tugas acak. Peneliti
yang menggunakan desain ini sebaliknya mengandalkan teknik lain untuk
mengontrol (atau di paling tidak mengurangi) ancaman terhadap validitas internal.
Kami akan menjelaskan beberapa teknik ini seperti yang kita bahas beberapa
desain kuasi-eksperimental. Desain Yang Cocok Saja. Desain ini berbeda dari
penugasan acak dengan pencocokan hanya pada kenyataannya bahwa tugas acak
tidak digunakan. Peneliti masih cocok dengan subjek dalam eksperimen dan
kelompok kontrol pada variabel tertentu, tetapi dia tidak memiliki jaminan bahwa
mereka setara pada orang lain. Mengapa? Karena meskipun cocok, subjek sudah
dalam kondisi utuh kelompok. Ini adalah batasan serius tetapi seringkali tidak
dapat dihindari ketika tugas acak tidak mungkin — yaitu, ketika kelompok utuh
harus digunakan. Ketika beberapa (katakanlah, 10 atau lebih) kelompok tersedia
untuk studi metode dan kelompok dapat secara acak ditugaskan untuk perlakuan
yang berbeda, desain ini menawarkan alternatif untuk penetapan acak dari mata
pelajaran. Setelah grup ditetapkan secara acak untuk perlakuan yang berbeda,
individu yang menerima satu perlakuan dicocokkan dengan individu yang
menerima perlakuan lain. Desain yang ditunjukkan pada Gambar 13.7 masih lebih
disukai. Harus ditekankan bahwa pencocokan (apakah mekanis atau statistik)
tidak pernah menjadi pengganti acak tugas. Selanjutnya, korelasi antara variabel
yang cocok dan variabel dependen harus cukup substansial. (Kami sarankan
setidaknya 0,40.) Sadarilah juga bahwa kecuali digunakan bersamaan dengan acak
tugas, kontrol pencocokan hanya untuk variabel dicocokkan. Diagram masing-
masing hanya cocok desain kelompok kontrol mengikuti.

Kontrol Acak Hanya Posttest


Desain Grup, Menggunakan Subjek yang Cocok
Kelompok perlakuan M X O
Kelompok kontrol M C O

Kontrol Acak Pretest-Posttest


Desain Grup, Menggunakan Subjek yang Cocok
Kelompok perlakuan M O X O
Kelompok kontrol M O C O
M dalam desain ini berarti bahwa subjek dalam masing-masing grup telah
dicocokkan (pada variabel tertentu) tetapi tidak secara acak ditugaskan ke grup.
Desain diimbangi. Diimbangi desain mewakili teknik lain untuk menyamakan
eksperimental dan kelompok pembanding. Dalam desain ini, masing-masing
kelompok terkena semua perlakuan, namun ada banyak, tetapi dalam urutan yang
berbeda. Sejumlah perlakuan mungkin terlibat. Contoh diagram untuk
penyeimbang desain yang melibatkan tiga perlakuan adalah sebagai berikut:

Pengaturan ini melibatkan tiga kelompok. Grup I menerima perlakuan 1 dan


posttest, kemudian menerima perlakuan 2 dan setelah tes, dan terakhir menerima
perlakuan 3 dan diposkan. Kelompok II menerima perlakuan 2 terlebih dahulu,
kemudian perlakuan 3, dan kemudian perlakuan 1, setelah posttest setiap
perlakuan. Kelompok III menerima perlakuan 3 terlebih dahulu, kemudian
perlakuan 1, diikuti oleh perlakuan 2, juga sedang diuji setelah setiap perlakuan.
Urutan yang diterima kelompok perlakuan harus ditentukan secara acak Peneliti
Howdo menentukan efektivitas berbagai perlakuan? Cukup dengan
membandingkan rata-rata skor untuk semua kelompok pada posttest untuk setiap
perlakuan. Di

Dengan kata lain, skor posttest rata-rata untuk semua kelompok perlakuan 1
dapat dibandingkan dengan posttest rata-rata skor untuk semua kelompok untuk
perlakuan 2, dan seterusnya, untuk bagaimanapun ada banyak perlakuan.
Desain ini mengontrol dengan baik untuk karakteristik subjek ancaman
terhadap validitas internal tetapi sangat rentan untuk gangguan multi-perlakuan
yaitu, kinerja selama perlakuan tertentu dapat dipengaruhi oleh satu atau lebih
perlakuan sebelumnya. Karena itu, hasil penelitian apa pun yang digunakan
peneliti desain yang seimbang harus diperiksa dengan cermat. Pertimbangkan dua
set data hipotetis yang ditunjukkan pada Gambar 13.8.
Interpretasi dalam penelitian 1 jelas: Metode X lebih unggul untuk kedua
grup terlepas dari urutan dan ke derajat yang sama. Namun, interpretasi dalam
studi 2 adalah jauh lebih kompleks. Secara keseluruhan, metode X muncul
unggul, dan dengan jumlah yang sama seperti dalam studi 1. Dalam kedua studi,
rata-rata keseluruhan untuk X adalah 12, sedangkan untuk Y adalah 8. In belajar
2, namun, tampaknya perbedaan antara X dan Y tergantung pada eksposur
sebelumnya ke yang lain metode. Kelompok I berkinerja jauh lebih buruk pada
metode Y ketika itu terkena setelah X, dan kelompok II dilakukan jauh lebih baik
pada X ketika terkena setelah itu metode Y. Ketika X atau Y diberikan pertama
kali dalam urutan, tidak ada perbedaan dalam kinerja. Bukan itu jelas bahwa
metode X lebih unggul dalam semua kondisi dalam penelitian 2, sedangkan ini
cukup jelas dalam studi 1. Desain Seri Waktu. Pra-dan khas desain posttest
diperiksa hingga sekarang melibatkan pengamatan atau pengukuran dilakukan
segera sebelum dan setelah perlakuan. Namun, desain deret waktu melibatkan
pengukuran berulang atau pengamatan lebih dari periode waktu sebelum dan
sesudah perlakuan. Itu benar-benar penjabaran dari desain satu kelompok pretest-
posttest disajikan pada Gambar 13.2. Jumlah yang luas data dikumpulkan pada
satu kelompok. Jika skor kelompok pada dasarnya sama pada pretest dan
kemudian jauh meningkatkan posttests, peneliti memiliki lebih banyak keyakinan
bahwa perlakuan tersebut menyebabkan perbaikan daripada jika hanya satu pretest
dan satu posttest diberikan. Contohnya mungkin seorang guru yang memberi tes
mingguan ke kelasnya selama beberapa minggu sebelum memberikan mereka
buku teks baru untuk digunakan, dan kemudian memantau bagaimana mereka
skor pada sejumlah tes mingguan setelah mereka gunakan teks. Diagram desain
seri waktu dasar adalah sebagai berikut:

Desain Seri-Waktu Dasar

O1 O2 O3 O4 O5 X O6 O7 O8 O9 O10
Ancaman terhadap validitas internal yang membahayakan penggunaan desain
ini termasuk sejarah (sesuatu bisa terjadi di antaranya pretest terakhir dan posttest
pertama), instrumentasi (jika, karena alasan tertentu, tes yang digunakan adalah
berubah setiap saat selama penelitian), dan pengujian (karena akibat latihan).
Kemungkinan pretesttreatment interaksi juga meningkat dengan penggunaan
beberapa pretest.
Efektifitas perlakuan dalam desain seri waktu pada dasarnya ditentukan
dengan menganalisis pola nilai tes yang dihasilkan dari beberapa tes. Gambar 13.9
menggambarkan beberapa kemungkinan pola hasil yang mungkin hasil dari
pengenalan variabel eksperimental (X). Garis vertikal menunjukkan titik di mana
perlakuan eksperimental diperkenalkan. Dalam gambar ini, the perubahan antara
periode waktu 5 dan 6 memberikan hal yang sama jenis data yang akan diperoleh
dengan menggunakan satu kelompok desain pretest-posttest. Pengumpulan data
tambahan sebelum dan sesudah pengenalan perlakuan, Namun, menunjukkan
betapa menyesatkan pretestpost satu kelompok desain bisa. Dalam (A),
peningkatannya adalah terbukti tidak lebih dari apa yang terjadi satu periode
pengumpulan data ke periode lainnya terlepas dari metode. Anda akan melihat
bahwa kinerjanya membaik

Gambar 13.9 Kemungkinan Pola Hasil dalam Time-Series Desain

dari waktu ke waktu, tetapi tidak ada tren atau peningkatan keseluruhan semu.
Dalam (B), keuntungan dari periode 5 hingga 6 tampak menjadi bagian dari tren
yang sudah jelas sebelum perlakuan dimulai (sangat mungkin contoh
pematangan). Di (D) skor yang lebih tinggi dalam periode 6 hanya sementara,
seperti kinerja segera mendekati apa itu sebelum perlakuan diperkenalkan
(menunjukkan adanya tambahan dampak sementara). Hanya di (C) kita memiliki
bukti dari akibat yang konsisten dari perlakuan.
Desain time-series adalah desain yang kuat ia rentan terhadap sejarah (suatu
peristiwa asing bisa terjadi setelah periode 5) dan instrumentasi (karena beberapa
administrasi ujian pada titik dalam waktu yang berbeda). Diperlukan sejumlah
besar pengumpulan data bahkan kemungkinan alasan mengapa desain ini jarang
digunakan dalam penelitian pendidikan. Dalam banyak penelitian khususnya di
sekolah, tidak mungkin untuk memberikan instrumen yang sama delapan hingga
sepuluh kali. Bahkan ketika itu mungkin, pertanyaan serius diajukan tentang
validitas instrumen interpretasi dengan begitu banyak administrasi. Pengecualian
adalah penggunaan perangkat yang tidak mencolok yang bisa diterapkan pada
banyak kesempatan, sejak interpretasi berdasarkan mereka harus tetap valid.

d) Desain Faktorial
Desain faktorial menambah jumlah hubungan yang dapat diperiksa dalam
studi eksperimental. Mereka pada dasarnya adalah modifikasi dari posttest-only
kelompok kontrol atau desain kelompok kontrol pretes-postes (dengan atau tanpa
penugasan acak), yang mengizinkan investigasi variabel independen tambahan.
Nilai lain dari desain faktorial adalah bahwa hal itu memungkinkan seorang
peneliti untuk mempelajari interaksi yang variabel independen dengan satu atau
lebih variabel lain, kadang-kadang disebut variabel moderator. Variabel
moderator mungkin baik variabel perlakuan atau karakteristik subjek variabel.
Diagram desain faktorial adalah sebagai berikut:

Desain Faktorial
Perlakuan R O X Y1 O
Kontrol R O C Y2 O
Perlakuan R X Y3 O
Kontrol R C Y4 O

Desain ini merupakan modifikasi dari pretest-posttest desain kelompok


kontrol. Ini melibatkan satu perlakuan dan satu kelompok kontrol dan variabel
moderator memiliki dua level (Y1 dan Y2). Dalam contoh ini, dua kelompok akan
menerima perlakuan (X) dan dua tidak mau (C). Itu kelompok yang menerima
perlakuan akan berbeda pada Y, namun seperti halnya kedua kelompok tidak
menerima perlakuan. Karena setiap variabel, atau faktor, memiliki dua tingkatan,
desain di atas disebut desain faktorial 2 by 2. Ini desain juga dapat diilustrasikan
sebagai berikut:
Ilustrasi Alternatif dari Contoh di Atas
X C
Y1
Y2

Variasi desain ini menggunakan dua atau lebih kelompok berbeda perlakuan
dan tidak ada kelompok kontrol. Pertimbangkan contoh yang telah kita gunakan
sebelum seorang peneliti membandingkan keefektifan metode inkuiri dan ceramah
dari instruksi tentang pencapaian dalam sejarah. Variabel independen dalam hal
ini (metode pengajaran) memiliki dua level — inquiry (X1) dan ceramah (X2).
Sekarang bayangkan Peneliti ingin melihat apakah prestasi juga dipengaruhi oleh
ukuran kelas. Dalam hal itu Y1 mungkin mewakili kelas kecil dan Y2 mungkin
mewakili kelas besar. Seperti yang kami sarankan di atas, dimungkinkan
menggunakan faktorial desain untuk menilai tidak hanya akibat terpisah dari
masing-masing variabel independen tetapi juga akibat bersama mereka. Di lain
kata-kata, peneliti dapat melihat bagaimana salah satu variabel mungkin
memoderasi yang lain (karenanya alasan untuk memanggil variabel ini variabel
moderator).
metode

Ukuran kelas Pertanyaan (X1) Ceramah (X2)

Kecil (Y1)
Besar (Y2)
Gambar 13.10 Menggunakan Desain Faktorial untuk Mempelajari Akibat Metode
dan Ukuran Kelas pada Prestasi
Yang ingin menyelidiki akibat dari metode pengajaran dan ukuran kelas
tentang prestasi dalam sejarah. Gambar 13.10 menggambarkan bagaimana
berbagai kombinasi ini variabel dapat dipelajari dalam desain faktorial.
Desain faktorial, oleh karena itu, adalah cara yang efisien untuk pelajari
beberapa hubungan dengan satu set data. Biarkan kami menekankan lagi,
bagaimanapun, bahwa kebajikan terbesar mereka terletak dalam kenyataan bahwa
mereka memungkinkan seorang peneliti untuk mempelajari interaksi antar
variabel.
Gambar 13.11 misalnya menggambarkan dua kemungkinan hasil untuk
desain faktorial 2 oleh 2 ditunjukkan pada Gambar 13.10. Skor untuk setiap
kelompok pada posttest (kuis 50 item tentang sejarah Amerika) ditampilkan di
kotak-kotak (biasanya disebut sel) masing-masing kombinasi metode dan ukuran
kelas.
Dalam studi (a) pada Gambar 13.11, metode penyelidikan adalah terbukti
lebih unggul di kelas kecil dan besar, dan kelas kecil lebih unggul daripada kelas
besar untuk keduanya metode. Karenanya tidak ada akibat interaksi. Dalam
belajar (B), siswa melakukan lebih baik di kecil daripada di kelas besar dengan
kedua metode; Namun, siswa di kelas kecil melakukan lebih baik ketika mereka
diajarkan oleh metode penyelidikan, tetapi siswa di kelas besar melakukan yang
lebih baik ketika mereka diajarkan dengan metode ceramah. Demikianlah, meski
pelajar melakukan lebih baik dikelas kecil daripada dikelas besar pada umumnya,
seberapa baik mereka bergantung pada metode pengajaran. Sebagai akibatnya
peneliti tidak dapat mengatakan metode tersebut selalu lebih baik itu tergantung
pada ukuran kelas dimana siswa diajarkan ada interaksi.

Gambar 13.11 Ilustrasi Interaksi & Tanpa Interaksi dalam Desain faktorial 2 per 2
dengan kata lain, antara ukuran dan metode kelas dalam mengubah prestasi yang
terpengaruh.
Misalkan desain faktorial tidak digunakan dalam penelitian (b). Jika peneliti
hanya membandingkan akibat kedua metodenya tanpa memperhitungkan ukuran
kelas, ia akan menyimpulkan bahwa tidak ada perbedaan dalam pengaruhnya pada
pencapaian (perhatikan bahwa sarana kedua kelompok 40). Penggunaan desain
faktorial memungkinkan kita untuk melihat bahwa efektivitas metode, dalam hal
ini, tergantung pada ukuran kelas di mana ia digunakan. Tampaknya suatu
interaksi ada antara metode dan ukuran kelas. Angka 13.12 mengilustrasikan
contoh akibat interaksi.
Desain faktorial yang melibatkan empat tingkat variabel independen dan
menggunakan modifikasi desain kelompok kontrol posttest-only dipekerjakan
oleh Tuckman.7 Dalam desain ini, variabel independen adalah jenis instruksi, dan
moderator adalah jumlah motivasi. Ini adalah desain faktorial 4 oleh 2 (Gambar
13.13). Banyak variasi tambahan juga dimungkinkan, seperti 3 oleh 3, 4 oleh 3,
dan 3 oleh 2 oleh 3 desain. Desain faktorial dapat digunakan untuk menyelidiki
lebih dari dua variabel, meskipun jarang lebih dari tiga variabel yang diteliti satu
desain.

Gambar 13.12 Akibat Interaksi


Gambar 13.13 Contoh dari faktorial 4 oleh 2 Desain

4. Kontrol Ancaman ke Internal Validitas: Ringkasan


Tabel 13.1 menyajikan evaluasi kami terhadap efektivitas masing-masing
desain sebelumnya dalam mengendalikan ancaman terhadap validitas internal
yang kita bahas di Bab 9. Anda harus ingat bahwa penilaian ini mencerminkan
penilaian kami tidak semua peneliti tentu setuju. Kita telah menetapkan dua nilai
tambah () untuk menunjukkan kontrol yang kuat (ancaman tidak mungkin terjadi),
satu tambah () untuk menunjukkan beberapa kontrol (ancaman mungkin terjadi), a
minus () untuk menunjukkan kontrol yang lemah (kemungkinan ancaman akan
terjadi) dan tanda tanya (?) untuk ancaman-ancaman yang memungkinkan karena
untuk sifat penelitian kita tidak bisa menentukan. Anda akan melihat bahwa
desain ini paling efektif mengendalikan ancaman karakteristik subjek, mortalitas,
sejarah, pematangan, dan regresi. Perhatikan bahwa kematian itu dikontrol dalam
beberapa desain karena subjek yang hilang adalah hilang karena metode
eksperimental dan kontrol, dengan demikian
Tabel 13.1 Keefektifan Desain Eksperimental dalam Mengontrol Ancaman
terhadap Validitas Internal

a) Kontroversi Dalam Penelitian


Apakah Placebo Bekerja? Akibat plasebo - harapan bahwa beberapa pasien
akan melakukannya menunjukkan peningkatan jika mereka diberi perlakuan apa
pun sama sekali, bahkan pil gula telah lama diakui oleh dokter dan orang lain
yang terlibat dalam uji klinis. Tetapi apakah ini akibatnya benar-benar ada? Dua
peneliti di Denmark baru-baru ini sering menyarankannya tidak. Mereka meninjau
114 uji klinis di mana pasien diberi obat nyata, plasebo, atau tidak ada perlakuan
sama sekali. Mereka laporan, diterbitkan dalam New England Journal of Medicine
di Mei 2001, menunjukkan bahwa “plasebo tidak menawarkan keuntungan yang
signifikan lebih dari 'tanpa perlakuan' untuk puluhan kondisi mulai dari pilek dan
mabuk laut akibat hipertensi dan penyakit Alzheimer (Pengecualian adalah
penghilang rasa sakit, yang tampaknya dibawa oleh pil gula untuk sekitar 15
persen pasien)" Para peneliti berspekulasi bahwa salah satu penjelasan tentang
akibat plasebo mungkin hanya terjadi keinginan yang tidak disadari oleh pasien
untuk menyenangkan dokter mereka. Bagaimana menurut anda? Apakah beberapa
pasien mencoba (secara tidak sadar) untuk menyenangkan dokter mereka?
memperkenalkan tidak ada manfaatnya juga. Ancaman lokasi adalah masalah
kecil dalam desain seri waktu karena lokasi di mana perlakuan diberikan biasanya
konstan sepanjang penelitian, hal yang sama berlaku untuk data karakteristik
kolektor, meskipun karakteristik tersebut mungkin menjadi masalah dalam desain
lain jika kolektor berbeda digunakan untuk berbagai metode. Ini biasanya mudah
kontrol, namun sayangnya desain time-series melakukannya menderita
kemungkinan kuat peluruhan instrumen dan bias kolektor data, karena data
(melalui pengamatan) harus dikumpulkan melalui banyak percobaan, dan
pengumpul data hampir tidak bisa disimpan dalam kegelapan untuk maksud
penelitian ini.
Bias tidak sadar pada bagian pengumpul data tidak dikendalikan oleh salah
satu dari desain ini, juga bukan merupakan implementasi akibat. Pelaksana atau
pengumpul data dapat, tanpa sengaja, mendistorsi hasil penelitian. Data
pengumpul harus tetap tidak tahu siapa yang menerima perlakuan yang mana,
apakah ini layak. Itu harus diverifikasi bahwa perlakuan diberikan dan data
dikumpulkan seperti yang dimaksudkan peneliti.
Seperti yang Anda lihat pada Tabel 13.1, ancaman pengujian mungkin terjadi
hadir dalam banyak desain, meskipun besarnya tergantung pada sifat dan
frekuensi instrumentasi terlibat. Ini dapat terjadi hanya ketika subjek merespon ke
instrumen lebih dari satu kesempatan.
Akibat sikap (atau demoralisasi) paling baik dikendalikan oleh desain
seimbang karena setiap mata pelajaran menerima keduanya (atau semua)
perlakuan khusus, yang tersisa desain dapat dikontrol dengan menyediakan yang
lain pengalaman "khusus" selama perlakuan alternatif. Perhatian khusus harus
dibuat dari double-blind (lihat halaman 260) percobaan. Studi semacam itu biasa
dilakukan di Indonesia obat tetapi sulit diatur dalam pendidikan. Elemen kunci
adalah bahwa baik subjek maupun peneliti tidak tahu identitas mereka yang
menerima setiap perlakuan. Ini paling mudah dicapai dalam studi medis dengan
cara dari plasebo (kadang-kadang pil gula) yang tidak bisa dibedakan dari obat
yang sebenarnya.
Regresi tidak akan menjadi masalah kecuali dalam satu kelompok desain
pretest-posttest, karena itu harus sama terjadi dalam kondisi eksperimental dan
kontrol jika itu terjadi sama sekali. Namun hal itu mungkin terjadi pada kelompok
statis desain kelompok kontrol pretest-posttest, jika ada perbedaan awal yang
besar antara kedua kelompok.

5. Mengevaluasi Kemungkinan dari Ancaman terhadap Validitas Internal


dalam Studi Eksperimental
Pertimbangan penting dalam merencanakan eksperimen studi atau dalam
mengevaluasi hasil studi yang dilaporkan adalah kemungkinan ancaman terhadap
validitas internal. Seperti yang kita miliki ditampilkan sejumlah kemungkinan
ancaman terhadap validitas internal mungkin ada. Pertanyaan yang harus
ditanyakan oleh peneliti adalah: Bagaimana kemungkinan apakah ada ancaman
khusus dalam penelitian ini?
Untuk membantu dalam menilai kemungkinan ini, kami menyarankan
mengikuti prosedur.
Langkah 1: Tanyakan: Faktor spesifik apa yang diketahui untuk mempengaruhi
variabel dependen atau secara logis diharapkan mempengaruhi variabel ini?
(Perhatikan bahwa peneliti tidak perlu khawatir dengan faktor-faktor yang
tidak terkait untuk apa yang mereka pelajari.)
Langkah 2: Tanyakan: Apa kemungkinan perbandingannya? kelompok berbeda
pada masing masing faktor ini? (perbedaan antara kelompok tidak dapat
dijelaskan pergi oleh faktor yang sama untuk semua kelompok.)
Langkah 3: Mengevaluasi ancaman berdasarkan caranya kemungkinan mereka
memiliki akibat, dan berencana untuk mengendalikan untuk mereka. Jika
ancaman yang diberikan tidak dapat dikendalikan, akui ini.
Pentingnya langkah 2 diilustrasikan pada Gambar 13.14. Dalam setiap diagram,
termometer menggambarkan kinerja subyek yang menerima metode.
Dibandingkan dengan mereka menerima metode B. Dalam diagram (a), subyek
menerima method Aperformed lebih tinggi pada posttest tetapi juga dilakukan
lebih tinggi pada pretest; demikian, perbedaan dalam prestasi pretest
menyumbang selisih pada posttest. Dalam diagram (b), subjek yang menerima
metode A tampil lebih tinggi pada posttest tetapi tidak melakukan lebih tinggi
pada pretest; dengan demikian, hasil posttest tidak bisa dijelaskan oleh, atau
dikaitkan dengan, pencapaian yang berbeda sebelum menerima metode.
Mari kita perhatikan contoh untuk menggambarkan bagaimana ini langkah
yang berbeda mungkin digunakan. Misalkan seorang peneliti ingin menyelidiki
akibat dari dua pengajaran yang berbeda metode (misalnya, ceramah melawan
instruksi penyelidikan) pada kemampuan berpikir kritis siswa (sebagaimana
diukur oleh skor pada tes berpikir kritis). Peneliti berencana untuk
membandingkan dua kelompok siswa kelas sebelas, satu kelompok diajar oleh
instruktur yang menggunakan ceramah metode, kelompok lain sedang diajar oleh
instruktur yang menggunakan metode penyelidikan. Asumsikan kelas itu utuh
akan digunakan daripada tugas acak ke grup. Beberapa ancaman terhadap
validitas internal dibahas dalam Bab 9 dipertimbangkan dan dievaluasi
menggunakan langkah-langkah yang baru saja disajikan. Kami berpendapat
bahwa jenis berpikir peneliti harus terlibat ketika merencanakan proyek penelitian

Karakteristik Subjek. Meski banyak kemungkinan karakteristik subjek dapat


memengaruhi kemampuan berpikir kritis, kami hanya mengidentifikasi dua di sini
(1) kemampuan berpikir kritis dan (2) gender.
1. Kemampuan berpikir kritis
Langkah 1: Pasca-perlakuan kritis kemampuan berpikir siswa dalam dua
kelompok adalah hampir pasti terkait dengan pemikiran kritis awal
kemampuan.
Langkah 2: Grup mungkin berbeda ditugaskan secara acak kecuali cocok.
Langkah 3: Kemungkinan memiliki akibat kecuali dikendalikan tinggi.
Gambar 13.14
Pedoman Penanganan Validitas Internal pada Grup Pembanding Studi
2. Jenis kelamin
Langkah 1: Kemampuan kritis pasca perlakuan mungkin terkait dengan gender.
Langkah 2: Jika kelompok berbeda secara signifikan dalam proporsi setiap jenis
kelamin, ada ancaman. Meskipun mungkin, ini tidak mungkin.
Langkah 3: Kemungkinan memiliki akibat kecuali dikendalikan: rendah.

Kematian. Langkah 1: Mortalitas kemungkinan akan memengaruhi posttreatment


skor pada setiap ukuran pemikiran kritis karena subjek yang keluar atau hilang
kemungkinan akan memiliki skor yang lebih rendah. Langkah 2: Grup mungkin
tidak akan berbeda dalam jumlah yang hilang, tetapi ini seharusnya diverifikasi.
Langkah 3: Kemungkinan memiliki akibat kecuali terkendali: sedang.

Lokasi Langkah 1: Jika lokasi implementasi perlakuan dan / atau pengumpulan


data berbeda untuk kedua kelompok, ini dapat mempengaruhi skor posttreatment
pada tes berpikir kritis. Skor posttreatment akan diharapkan untuk dipengaruhi
oleh sumber daya seperti ukuran kelas, ketersediaan bahan bacaan, film, dan
sebagainya. Langkah 2: Ancaman ini mungkin berbeda kelompok kecuali
dikontrol dengan menstandarkan lokasi untuk implementasi dan pengumpulan
data. Ruang kelas yang menggunakan setiap metode mungkin berbeda secara
sistematis kecuali langkah-langkah diambil untuk memastikan hal itu sumber daya
sebanding. Langkah 3: Kemungkinan memiliki akibat kecuali terkontrol sedang
hingga tinggi.

Peralatan.
1. Peluruhan instrumen. Langkah 1: Kerusakan instrumen dapat mempengaruhi
hasil apa pun. Langkah 2: Kerusakan instrumen bisa berbeda untuk kelompok. Ini
seharusnya tidak menjadi masalah besar, asalkan semua instrumen yang
digunakan diperiksa dengan cermat dan setiap perubahan yang ditemukan
dikoreksi. Langkah 3: Kemungkinan memiliki akibat kecuali dikendalikan:
rendah.
2. Karakteristik pengumpul data. Langkah 1: Pengumpul data karakteristik dapat
mempengaruhi skor pada kritis tes berpikir. Langkah 2: Ancaman ini mungkin
berbeda untuk grup kecuali dikontrol dengan menggunakan pengumpul data yang
sama (s) untuk semua grup. Langkah 3: Kemungkinan memiliki akibat kecuali
terkendali: sedang.
3. Bias pengumpul data. Langkah 1: Bias pasti bisa memengaruhi skor pada tes
berpikir kritis. Langkah 2: Ini ancaman mungkin berbeda untuk kelompok kecuali
dikontrol oleh pelaksana pelatihan dalam administrasi instrumen dan / atau
menjaga mereka agar tidak tahu kelompok perlakuan sedang diuji. Langkah 3:
Kemungkinan memiliki akibat kecuali dikendalikan: tinggi.

Pengujian. Langkah 1: Pretesting, jika digunakan mungkin mempengaruhi skor


posttest pada tes berpikir kritis. Langkah 2: Agaknya pretest akan mempengaruhi
kedua kelompok secara sama, dan tidak akan berinteraksi dengan metode, karena
instruktur menggunakan setiap metode mengajar kritis kemampuan berpikir.
Langkah 3: Kemungkinan memiliki akibat kecuali dikontrol: rendah.

Sejarah. Langkah 1: Peristiwa luar yang mungkin memengaruhi keterampilan


berpikir kritis sulit untuk dikira, tetapi mereka mungkin memasukkan hal-hal
seperti serial TV khusus berpikir, hadir di lokakarya distrik kritis berpikir oleh
beberapa siswa, atau partisipasi dalam tertentu kegiatan ekstrakurikuler (mis.,
debat) yang terjadi selama jalannya studi. Langkah 2: Dalam kebanyakan kasus,
ini Peristiwa akan mempengaruhi kedua kelompok secara setara dan karenanya
tidak mungkin merupakan ancaman. Peristiwa semacam itu harus dicatat dan
dampaknya terhadap masing-masing kelompok dinilai sedapat mungkin. Langkah
3: Kemungkinan memiliki akibat kecuali terkendali: rendah.

Pematangan. Langkah 1: Kedewasaan dapat memengaruhi hasil skor karena


pemikiran kritis mungkin terkait untuk pertumbuhan individu. Langkah 2:
Menganggap bahwa instruktur mengajar setiap metode selama periode waktu
yang sama, pematangan seharusnya tidak menjadi ancaman. Langkah 3:
Kemungkinan memiliki akibat kecuali dikendalikan: rendah. Sikap Subjek.
Langkah 1: Sikap subjek dapat mempengaruhi skor posttest. Langkah 2: Jika
anggota salah satu kelompok merasa bahwa mereka menerima apa pun "Perhatian
khusus," ini bisa menjadi ancaman. Sejauh mana perlakuan mana pun yang "baru"
harus dievaluasi. Langkah 3: Kemungkinan memiliki akibat kecuali dikendalikan:
rendah ke sedang.

Regresi. Langkah 1: Regresi tidak akan berpengaruh pada skor posttest kecuali
mata pelajaran dipilih berdasarkan skor ekstrim. Langkah 2: Ancaman ini tidak
mungkin \mempengaruhi kelompok secara berbeda, walaupun bisa juga demikian.
Langkah 3: Kemungkinan memiliki akibat kecuali dikendalikan rendah.

Penerapan. Langkah 1: Karakteristik instruktur cenderung mempengaruhi skor


posttreatment. Langkah 2: Karena instruktur yang berbeda mengajarkan metode
mereka mungkin juga berbeda. Ini dapat dikontrol dengan memiliki beberapa
instruktur untuk setiap metode dengan meminta setiap instruktur mengajar kedua
metode atau dengan instruksi pemantauan. Langkah 3: Kemungkinan memiliki
akibat kecuali dikendalikan tinggi. Caranya kemudian untuk mengidentifikasi
ancaman terhadap validitas internal adalah pertama, untuk memikirkan berbagai
variabel (kondisi, karakteristik subjek dan sebagainya) yang mungkin
mempengaruhi variabel hasil penelitian. Kedua, untuk memutuskan berdasarkan
bukti atau pengalaman apakah hal-hal ini akan mempengaruhi kelompok
pembanding secara berbeda. Jika demikian, pengaruh faktor-faktor ini dapat
memberikan alternatif penjelasan untuk hasilnya. Jika ini ancaman terhadap
validitas internal dari penelitian mungkin memang hadir dan perlu diminimalkan
atau dihilangkan. Kemudian harus dibahas dalam laporan akhir tentang proyek
penelitian.

a) Kontrol Eksperimental Perlakuan


Desain yang dibahas dalam bab ini dimaksudkan untuk meningkatkan semua
validitas internal suatu penelitian eksperimental. Seperti yang Anda lihat, masing-
masing memiliki kelebihan dan kekurangan dan masing-masing menyediakan cara
penanganan ancaman tetapi tidak yang lain.
Masalah lain bagaimanapun melintasi semua desain. Meskipun telah disentuh
di bagian sebelumnya khususnya sehubungan dengan lokasi dan implementasi
ancaman, itu layak mendapat perhatian lebih dari biasanya. Masalahnya adalah
bahwa kendali peneliti atas perlakuan eksperimental tentu saja, yang penting
persyaratan percobaan yang dilakukan dengan baik adalah peneliti itu memiliki
kendali atas perlakuan yaitu, mereka mengendalikan apa, siapa, kapan, dan
bagaimana. Aclear contoh kontrol peneliti adalah pengujian yang baru obat jelas
obatnya adalah perlakuan dan peneliti dapat mengontrol siapa yang mengaturnya,
berdasarkan apa kondisi, kapan diberikan, kepada siapa dan berapa banyak.
Sayangnya, para peneliti jarang memiliki tingkat ini dalam penelitian pendidikan.
Dalam situasi yang ideal, seorang peneliti dapat menentukan secara tepat
bahan perlakuan; dalam praktik yang sebenarnya, banyak perlakuan atau metode
yang terlalu rumit untuk digambarkan tepat. Perhatikan contoh yang kita miliki
sebelumnya diberikan sebuah penelitian yang membandingkan efektivitas
penyelidikan dan metode pengajaran ceramah. Apa tepatnya individu yang
mengimplementasikan setiap metode untuk dilakukan? Peneliti mungkin sangat
berbeda dalam jawaban mereka untuk pertanyaan ini. Ambiguitas dalam
menentukan dengan tepat apa yang pelaksana perlakuan lakukan mengarah pada
masalah besar dalam implementasi. Bagaimana para peneliti melatih para guru
untuk mengimplementasikan metode yang terlibat dalam studi jika mereka tidak
dapat menentukan karakteristik penting dari metode tersebut? Bahkan seandainya
spesifikasi yang memadai bisa dicapai dan metode pelatihan dikembangkan,
bagaimana para peneliti pastikan metode diimplementasikan dengan benar?
Masalah-masalah ini harus dihadapi oleh setiap peneliti menggunakan salah satu
desain yang telah kita bahas.
Pertimbangan masalah ini sering mengarah pada pertimbangan (dan
penilaian) dari kemungkinan trade-off. Itu kontrol terbesar kemungkinan terjadi
ketika peneliti yang melaksanakan perlakuan; ini, bagaimanapun juga
memberikan peluang terbesar untuk implementasi ancaman terjadi. Semakin
banyak peneliti menyebar implementasi dengan menambahkan pelaksana lain
untuk kepentingan tersebut mengurangi ancaman namun semakin dia mengambil
risiko distorsi atau pengenceran perlakuan. Kasus ekstrem adalah penggunaan
kelompok perlakuan yang ada yaitu, kelompok terletak oleh peneliti yang sudah
menerima tertentu perlakuan. Kebanyakan penulis menyebut ini sebagai kausal
komparatif atau studi ex post facto (lihat Bab 16) dan tidak menganggap mereka
termasuk dalam kategori penelitian eksperimental. Dalam studi tersebut, peneliti
harus menemukan grup yang menerima perlakuan yang ditentukan dan kemudian
gunakan desain yang hanya cocok atau jika ada waktu sebelum pelaksanaan
perlakuan desain seri waktu. Kami tidak diyakinkan seperti studi, jika perlakuan
diidentifikasi dengan cermat tentu saja inferior sehubungan dengan kesimpulan
sebab-akibat dibandingkan dengan studi di mana perlakuan ditugaskan kepada
guru (atau orang lain) oleh peneliti. Keduanya sama-sama terbuka untuk sebagian
besar ancaman yang telah kita diskusikan. Kelompok yang ada lebih rentan
terhadap subjek karakteristik, lokasi dan ancaman regresi dari eksperimen yang
sebenarnya tetapi tidak harus lebih dari eksperimen semu. Seseorang akan
mengharapkan lebih sedikit masalah dengan akibat sikap karena praktik yang ada
tidak diubah. Ada sejarah dan ancaman pematangan yang lebih besar karena
peneliti akan memiliki kontrol yang lebih sedikit. Implementasinya sulit dinilai.
Guru yang sudah menerapkan metode baru mungkin antusias jika mereka awalnya
memilih metode tetapi mereka juga mungkin guru yang lebih baik. Di sisi lain
guru ditugaskan untuk metode baru, bagi mereka mungkin antusias atau benci.
Kita menyimpulkan bahwa kedua jenis penelitian ini sah.
b) Contoh Eksperimental Penelitian
Di sisa bab ini, kami menyajikan publikasi contoh penelitian eksperimental.
Bersamaan dengan cetak ulang dari penelitian itu sendiri, kami mengkritik
penelitian tersebut, mengidentifikasi kekuatannya, dan mendiskusikan bidang
yang kami pikir dapat ditingkatkan. Kami juga melakukan ini di akhir Bab 14
hingga 17 dan 19 hingga 24, dalam setiap kasus menganalisis jenis studi dibahas
dalam bab ini. Dalam memilih studi untuk ditinjau, kami menggunakan kriteria
berikut:
 Studi harus mencontohkan khas tetapi tidak luar biasa, metodologi dan
memungkinkan kritik yang membangun.
 Studi harus memiliki nilai bunga yang cukup untuk dimiliki perhatian
siswa, meskipun spesifik profesional kepentingan tidak dapat ditangani
secara langsung.
 Penelitian harus dilaporkan secara ringkas.
Secara total, studi-studi ini mewakili keragaman khusus minat di bidang
pendidikan. Dalam mengkritik setiap studi ini, kami menggunakan seri
kategori dan pertanyaan yang seharusnya sekarang akrab bagi anda dan
mereka:
Tujuan / pembenaran: Apakah logis? Apakah ini meyakinkan? Apakah ini
cukup? Apakah penulis menunjukkan bagaimana caranya hasil penelitian
memiliki implikasi penting untuk teori, praktik, atau keduanya? Apakah asumsi
dibuat eksplisit?
Definisi: Apakah istilah utama didefinisikan dengan jelas? Jika tidak, apakah
mereka jelas dalam konteks?
Penelitian sebelumnya: Apakah pekerjaan sebelumnya pada topik telah tercakup
secara memadai? Apakah jelas terhubung ke belajar sekarang?
Hipotesis: Apakah mereka dinyatakan? tersirat? Sesuai untuk belajar?
Sampel: Apa jenis sampel yang digunakan? Apakah ini acak? Sampel? Jika tidak,
apakah itu dijelaskan secara memadai? Lakukan penulis merekomendasikan atau
menyiratkan generalisasi ke populasi? Jika demikian, apakah populasi target jelas
ditunjukkan? Apakah mungkin batasan untuk menggeneralisasi dibahas?
Instrumentasi: Apakah dijelaskan secara memadai? Apakah bukti keandalan
yang memadai disajikan? Apakah bukti validitas yang diberikan? Seberapa
persuasifnya bukti atau argumen untuk validitas kesimpulan terbuat dari
instrumen?
Prosedur / validitas internal: Ancaman apa yang terbukti? Apakah mereka
dikendalikan? Jika tidak, apakah mereka dibahas?
Analisis data: Apakah data dirangkum dan dilaporkan secara tepat? Apakah
statistik deskriptif dan inferensial (jika ada) digunakan dengan tepat? Apakah
statistik diartikan dengan benar? Apakah keterbatasan dibahas?
Hasil: Apakah disajikan dengan jelas? Apakah ini tertulis? ringkasan konsisten
dengan data yang dilaporkan? Diskusi / interpretasi: Apakah tempat penulis studi
dalam konteks yang lebih luas? Apakah mereka mengenali keterbatasan
penelitian, terutama yang berkaitan untuk populasi dan generalisasi ekologis
hasil?

B. PENELITIAN SINGLE-SUBJEK

1. Karakteristik Dasar dari Penelitian Single-subject


Semua desain yang dijelaskan dalam bab sebelumnya tentang penelitian
eksperimental melibatkan studi kelompok. Namun, kadang-kadang, desain
kelompok tidak sesuai untuk digunakan peneliti, terutama ketika instrumen yang
biasa tidak relevan dan pengamatan harus menjadi metode pengumpulan data.
Kadang-kadang tidak ada cukup subjek yang tersedia untuk membuat penggunaan
desain kelompok praktis. Dalam kasus lain, pengumpulan data intensif pada
beberapa individu sangat masuk akal. Para peneliti yang ingin mempelajari anak-
anak yang menderita cacat multipel (yang tuli dan buta, misalnya) mungkin hanya
memiliki sedikit anak yang tersedia untuk mereka, katakan enam atau kurang.
Tidak masuk akal untuk membentuk dua kelompok yang masing-masing terdiri
dari tiga orang dalam keadaan demikian. Lebih jauh, setiap anak mungkin perlu
diamati secara sangat rinci.
Desain single-subject adalah adaptasi dari desain time-series dasar yang
ditunjukkan pada Gambar 13.9 pada bab sebelumnya. Perbedaannya adalah bahwa
data dikumpulkan dan dianalisis hanya untuk satu subjek pada satu waktu. Mereka
paling sering digunakan untuk mempelajari perubahan perilaku yang ditunjukkan
oleh seseorang setelah mendapatkan intervensi atau perlakuan. Dikembangkan
terutama dalam pendidikan khusus, di mana banyak instrumentasi yang biasanya
tidak sesuai, desain single-subject telah digunakan oleh para peneliti untuk
menunjukkan bahwa anak-anak dengan sindrom Down, misalnya, mampu belajar
yang jauh lebih kompleks daripada yang diyakini sebelumnya. *

1. Desain Single-Subject
 Grafik dari desain single-subject
Peneliti single-subject menggunakan grafik garis untuk menyajikan data
mereka dan untuk menggambarkan efek intervensi atau perlakuan tertentu.
Gambar 14.1 menyajikan ilustrasi grafik tersebut. Variabel dependen (hasil)
ditampilkan pada sumbu vertikal (sumbu ordinasi, atau y). Misalnya, jika kita
mengajarkan keterampilan swa-bantu kepada anak yang sangat terbatas, jumlah
respons yang benar akan ditunjukkan pada sumbu vertikal.
Sumbu horizontal (absis, atau sumbu x) digunakan untuk menunjukkan
urutan waktu, seperti sesi, hari, minggu, percobaan, atau bulan. Sebagai aturan
praktis, sumbu horizontal harus berada di mana saja dari satu dan satu hingga dua
kali lebih lama dari sumbu vertikal.
Gambar 14.1. Grafik single-subject

Deskripsi kondisi yang terlibat dalam penelitian ini tercantum tepat di atas
grafik. Kondisi pertama biasanya baseline, diikuti oleh intervensi (variabel
independen). Garis kondisi, yang menunjukkan kapan kondisi telah berubah,
pisahkan kondisi. Titik-titik adalah titik data. Mereka mewakili data yang
dikumpulkan pada berbagai waktu selama penelitian. Mereka ditempatkan pada
grafik dengan menemukan persimpangan waktu ketika titik data dikumpulkan
(mis., Sesi 6) dan hasilnya pada waktu itu (enam tanggapan yang benar). Titik
data ini kemudian dihubungkan untuk menggambarkan tren dalam data. Terakhir,
ada keterangan gambar di dekat bagian bawah grafik, yang merupakan ringkasan
dari gambar, biasanya daftar variabel independen dan dependen.

 Desain A-B
Pendekatan dasar para peneliti menggunakan desain A-B adalah untuk
mengumpulkan data tentang subjek yang sama, beroperasi sebagai kontrolnya
sendiri, di bawah dua kondisi atau fase. Kondisi pertama adalah kondisi
pretreatment, biasanya disebut (seperti yang disebutkan sebelumnya) periode
awal, dan diidentifikasi sebagai A. Selama periode awal, subjek dinilai untuk
beberapa sesi sampai tampak bahwa perilaku tipikalnya telah ditentukan dengan
andal. Baseline sangat penting dalam penelitian single-subject karena merupakan
estimasi terbaik dari apa yang akan terjadi jika intervensi tidak diterapkan. Poin
data yang cukup harus diperoleh untuk menentukan gambaran yang jelas tentang
kondisi yang ada; tentunya seseorang harus mengumpulkan minimal tiga titik data
sebelum mengimplementasikan intervensi. Baseline, pada dasarnya, memberikan
perbandingan dengan kondisi intervensi.
Setelah kondisi dasar telah ditetapkan, kondisi perlakuan atau intervensi,
diidentifikasi sebagai B, diperkenalkan dan dipelihara untuk jangka waktu
tertentu. Biasanya, meskipun tidak harus, perilaku yang sangat spesifik diajarkan
selama kondisi intervensi, dengan instruktur yang berfungsi sebagai pengumpul
data — biasanya dengan mencatat jumlah respons yang benar (misalnya, jawaban
atas pertanyaan) atau perilaku (misalnya, melihat guru ) diberikan oleh subjek
selama sejumlah percobaan. Sebagai contoh desain A-B, pertimbangkan seorang
peneliti yang tertarik pada efek pujian verbal pada siswa sekolah menengah
pertama yang tidak responsif selama pengajaran matematika. Peneliti dapat
mengamati perilaku siswa selama, katakanlah, lima hari ketika instruksi dalam
matematika terjadi, kemudian pujilah dia secara lisan selama lima sesi dan amati
perilakunya segera setelah pujian. Gambar 14.2 menggambarkan desain A-B ini.

Gambar 14.2. Desain A-B


Seperti yang Anda lihat, lima langkah diambil sebelum intervensi dan lima
langkah lagi selama intervensi. Melihat data pada Gambar 14.2, intervensi
tampaknya telah efektif. Jumlah respon setelah intervensi (pujian) meningkat
secara nyata. Namun, ada masalah besar dengan desain A-B. Mirip dengan studi
kasus one-shot yang menyerupai, peneliti tidak tahu apakah ada perubahan
perilaku yang terjadi karena perlakuan. Ada kemungkinan bahwa beberapa
variabel lain (selain pujian) benar-benar menyebabkan perubahan, atau bahkan
perubahan itu akan terjadi secara alami, tanpa perlakuan sama sekali. Dengan
demikian desain A-B gagal mengendalikan berbagai ancaman terhadap validitas
internal; itu tidak menentukan efek dari variabel independen (pujian) pada
variabel dependen (responsif) sambil mengesampingkan efek yang mungkin dari
variabel-variabel asing. Akibatnya, peneliti biasanya mencoba untuk memperbaiki
desain A-B dengan menggunakan desain A-B-A. *
 Desain A-B-A
Ketika menggunakan desain A-B-A (kadang-kadang disebut desain
pembalikan), peneliti hanya menambahkan periode baseline lain. Ini sangat
meningkatkan desain. Jika perilaku selama periode perlakuan berbeda dari
perilaku selama periode awal, kami memiliki bukti kuat untuk efektivitas
intervensi. Dalam contoh kami sebelumnya, peneliti, setelah memuji siswa untuk
berbicara, lima hari, dapat mengurangi pujian dan mengamati perilaku siswa
selama lima hari lagi tanpa pujian. Ini akan mengurangi ancaman terhadap
validitas internal, karena tidak mungkin bahwa sesuatu akan terjadi pada waktu
yang tepat intervensi disajikan untuk menyebabkan peningkatan perilaku dan pada
saat yang tepat intervensi dihapus untuk menyebabkan penurunan perilaku.
Gambar 14.3 mengilustrasikan desain A-B-A.
Meskipun penurunan ancaman terhadap validitas internal adalah keuntungan
yang pasti dari desain A-B-A, ada kerugian etis yang signifikan untuk desain ini:
Ini melibatkan meninggalkan subjek dalam kondisi A. Banyak peneliti akan
merasa tidak nyaman untuk mengakhiri jenis studi ini tanpa menunjukkan
perbaikan akhir. Akibatnya, perpanjangan desain ini — desain A-B-A-B, sering
digunakan.

Gambar 14.3. Desain A-B-A


 Desain A-B-A-B
Dalam desain A-B-A-B, dua periode awal digabungkan dengan dua periode
perlakuan. Ini semakin memperkuat kesimpulan tentang efektivitas perlakuan,
karena memungkinkan efektivitas perlakuan untuk diperagakan dua kali. Bahkan,
perlakuan kedua dapat diperpanjang tanpa batas waktu jika seorang peneliti
menginginkannya. Jika perilaku subjek pada dasarnya sama selama fase perlakuan
dan lebih baik (atau lebih buruk) dari kedua periode awal, kemungkinan variabel
lain menjadi penyebab perubahan menurun secara nyata. Keuntungan lain di sini
jelas — masalah etis untuk meninggalkan subjek tanpa intervensi dihindari.
Untuk menerapkan desain A-B-A-B dalam contoh sebelumnya, peneliti akan
mengembalikan perlakuan eksperimen, B (pujian), selama lima hari setelah
periode baseline kedua dan mengamati perilaku subjek. Seperti dengan desain A-
B-A, peneliti berharap untuk menunjukkan bahwa variabel dependen (responsif)
berubah setiap kali variabel independen (pujian) diterapkan. Jika perilaku subjek
berubah dari garis dasar pertama ke periode perlakuan pertama, dari perlakuan
pertama ke awal kedua, dan seterusnya, peneliti memiliki bukti bahwa pujian
memang merupakan penyebab perubahan tersebut. Gambar 14.4 mengilustrasikan
hasil studi hipotesis yang melibatkan desain A-B-A-B.

Gambar 14.4. Desain A-B-A-B


Perhatikan bahwa garis dasar yang jelas ditetapkan, diikuti oleh peningkatan
respons selama perlakuan, diikuti oleh peningkatan dalam tanggapan ketika
perlakuan dihentikan, diikuti oleh peningkatan respons setelah perlakuan
dilembagakan kembali. Pola ini memberikan bukti yang cukup kuat bahwa itu
adalah perlakuan, bukan sejarah, pematangan, atau sesuatu, yang bertanggung
jawab untuk perbaikan.
Meskipun bukti seperti yang ditunjukkan pada Gambar 14.4 akan dianggap
sebagai argumen yang kuat untuk penyebab, Anda harus menyadari bahwa desain
ABA dan ABAB menderita keterbatasan: Kemungkinan bias pengumpul data
(individu yang memberikan perlakuan juga biasanya mengumpulkan data) dan
efek instrumentasi (kebutuhan akan periode pengumpulan data yang luas) dapat
menyebabkan perubahan dalam kondisi pengumpulan data.

 Desain B-A-B
Kadang-kadang ada saat-saat ketika perilaku seseorang begitu parah atau
mengganggu (mis., Pertarungan berlebihan baik di dalam maupun di luar kelas)
sehingga seorang peneliti tidak bisa menunggu terbentuknya garis dasar. Dalam
kasus seperti itu, desain B-A-B dapat digunakan. Desain ini melibatkan perlakuan
diikuti oleh baseline diikuti dengan kembali ke perlakuan. Desain ini juga sesuai
ketika ada kurangnya perilaku — misalnya, jika subjek tidak pernah menunjukkan
perilaku yang diinginkan (misalnya, memperhatikan) di masa lalu — atau ketika
intervensi sudah berlangsung (misalnya, penahanan setelah sekolah usai program)
dan seorang peneliti ingin membangun pengaruhnya. Gambar 14.5
mengilustrasikan desain B-A-B.
Gambar 14.5. Desain B-A-B

 Desain A-B-C-B
Desain A-B-C-B merupakan modifikasi lebih lanjut dari desain A-B-A. C
dalam desain ini mengacu pada variasi intervensi dalam kondisi B. Dalam dua
kondisi pertama, data dasar dan intervensi dikumpulkan. Selama kondisi C,
intervensi diubah untuk mengendalikan perhatian ekstra yang mungkin diterima
subjek selama fase B. Sebagai contoh, dalam contoh kami sebelumnya, orang
mungkin berpendapat bahwa itu bukan pujian yang bertanggung jawab atas
peningkatan respons (jika itu terjadi) pada bagian dari subjek, tetapi perhatian
ekstra yang diterima subjek. Oleh karena itu, kondisi C, mungkin pujian yang
diberikan tidak peduli bagaimana subjek merespons (yaitu, apakah ia menawarkan
tanggapan atau tidak). Dengan demikian, seperti yang ditunjukkan pada Gambar
14.6, kesimpulan dapat dicapai bahwa pujian kontinjensi (atau selektif) sangat
penting untuk meningkatkan daya tanggap, dibandingkan dengan peningkatan
pujian secara keseluruhan.
Gambar 14.6. Desain A-B-C-B

 Desain Multiple-Baseline
Alternatif untuk desain A-B-A-B adalah desain multiplebaseline. Desain
multi-baseline biasanya digunakan jika tidak mungkin atau tidak etis untuk
melakukan perlakuan dan kembali ke kondisi awal. Saat menggunakan desain
multi-baseline, peneliti melakukan lebih dari mengumpulkan data tentang satu
perilaku untuk satu subjek dalam satu pengaturan; mereka mengumpulkan
beberapa perilaku untuk satu subjek, memperoleh garis dasar untuk masing-
masing selama periode waktu yang sama.
Ketika menggunakan desain multi-baseline di seluruh perilaku, peneliti secara
sistematis menerapkan perlakuan pada waktu yang berbeda untuk setiap perilaku
sampai semuanya menjalani perlakuan. Jika perubahan perilaku dalam setiap
kasus hanya setelah perlakuan telah diterapkan, perlakuan dinilai menjadi
penyebab perubahan. Penting bahwa perilaku yang dirawat, bagaimanapun, tetap
independen satu sama lain. Jika perilaku 2, misalnya, dipengaruhi oleh pengenalan
perlakuan ke perilaku 1, maka efektivitas perlakuan tidak dapat ditentukan.
Diagram desain garis dasar berganda yang melibatkan tiga perilaku ditunjukkan
pada Gambar 14.7.

Gambar 14.7. Desain Multiple-Baseline

Dalam desain ini, perlakuan diterapkan pertama kali untuk mengubah


perilaku 1, kemudian perilaku 2, dan kemudian perilaku 3 sampai ketiga perilaku
menjalani perlakuan. Sebagai contoh, seorang peneliti dapat menyelidiki efek
"time-out" (mengeluarkan siswa dari kegiatan kelas untuk jangka waktu tertentu)
pada penurunan berbagai perilaku yang tidak diinginkan dari siswa tertentu.
Misalkan perilaku tersebut adalah (a) berbicara secara bergiliran; (B) merobek
lembar kerja; dan (c) membuat komentar menghina terhadap siswa lain. Peneliti
mulai dengan menerapkan perlakuan ("time-out") pertama untuk perilaku 1,
kemudian ke perilaku 2, dan kemudian ke perilaku 3. Pada titik itu, perlakuan
akan diterapkan pada ketiga perilaku. Semakin banyak perilaku yang dihilangkan
atau dikurangi, semakin efektif perlakuan dapat dinilai. Berapa kali peneliti harus
menerapkan perlakuan adalah masalah penilaian dan tergantung pada subyek yang
terlibat, pengaturan, dan perilaku yang peneliti ingin kurangi atau hilangkan (atau
dorong). Desain multi-baseline juga kadang-kadang digunakan untuk
mengumpulkan data pada beberapa subjek berkenaan dengan perilaku tunggal,
atau untuk mengukur perilaku subjek dalam dua atau lebih pengaturan yang
berbeda.
Gambar 14.8 mengilustrasikan efek perlakuan dalam studi hipotetis menggunakan
desain multi-baseline. Perhatikan bahwa masing-masing perilaku berubah hanya
ketika perlakuan diperkenalkan. Gambar 14.9 menggambarkan desain yang
diterapkan pada pengaturan yang berbeda.
Dalam praktiknya, hasil studi yang dijelaskan di sini jarang cocok dengan
model ideal di mana poin data sering menunjukkan lebih banyak fluktuasi,
membuat tren kurang jelas. Fitur ini membuat bias pengumpul data menjadi lebih
banyak masalah, terutama ketika perilaku yang dipermasalahkan lebih kompleks
daripada sekadar respons sederhana seperti mengambil objek. Bias kolektor data
dalam studi multi-baseline tetap menjadi perhatian serius.

Gambar 14.8. Desain Multiple-Baseline


Gambar 14.9. Aplikasi Desain Multiple-Baseline dalam pengaturan yang berbeda

2. Ancaman terhadap Validitas Internal dalam Penelitian Single-subject

Seperti yang kami sebutkan sebelumnya, sayangnya ada beberapa ancaman


terhadap validitas internal studi single-subject. Beberapa yang paling penting
melibatkan panjang kondisi dasar dan intervensi, jumlah variabel berubah ketika
berpindah dari satu kondisi ke kondisi lain, derajat dan kecepatan setiap
perubahan yang terjadi, pengembalian — atau tidak — dari perilaku ke tingkat
baseline, independensi perilaku, dan jumlah baseline. Mari kita bahas masing-
masing lebih detail.
a. Panjang Kondisi
Panjang kondisi. Panjang kondisi mengacu pada berapa lama kondisi garis dasar
dan intervensi berlaku. Ini pada dasarnya adalah jumlah titik data yang
dikumpulkan selama suatu kondisi. Seorang peneliti harus memiliki poin data
yang cukup (minimal tiga) untuk menetapkan pola atau tren yang jelas. Lihatlah
Gambar 14.10 (a) di halaman 308. Data yang ditunjukkan dalam kondisi dasar
tampak stabil, dan karenanya akan tepat bagi peneliti untuk memperkenalkan
intervensi. Pada Gambar 14.10 (b), titik data tampak bergerak ke arah yang
berlawanan dengan yang diinginkan, dan karenanya di sini juga akan tepat bagi
peneliti untuk memperkenalkan intervensi. Pada Gambar 14.10 (c), titik data
sangat bervariasi; tidak ada tren yang ditetapkan, dan karenanya peneliti harus
tetap dalam kondisi baseline untuk periode waktu yang lebih lama. Perhatikan
bahwa titik-titik data pada Gambar 14.10 (d) tampak bergerak ke arah yang sama
dengan yang diinginkan. Jika kondisi garis dasar akan berakhir pada saat ini dan
intervensi diperkenalkan, efek dari intervensi mungkin sulit untuk ditentukan.
Di dunia nyata, tentu saja, seringkali sulit mendapatkan poin data yang cukup
untuk melihat tren yang jelas. Seringkali ada masalah praktis seperti kebutuhan
untuk memulai studi karena kekurangan waktu atau masalah etika seperti subjek
yang menunjukkan perilaku yang sangat berbahaya. Namun demikian, stabilitas
poin data harus selalu diperhitungkan oleh mereka yang melakukan (dan mereka
yang membaca) penelitian single-subject.

Gambar 14.10. Variasi dalam Stabilitas Baseline


b. Jumlah Variabel Berubah Saat Bergerak dari Satu Kondisi ke Kondisi
Lain.
Ini adalah salah satu pertimbangan terpenting dalam penelitian single-subject.
Penting bahwa hanya satu variabel yang diubah pada satu waktu ketika berpindah
dari satu kondisi ke kondisi lainnya. Sebagai contoh, perhatikan contoh kami
sebelumnya di mana seorang peneliti tertarik untuk menentukan efek time-out
pada penurunan perilaku tertentu yang tidak diinginkan dari seorang siswa.
Peneliti harus berhati-hati bahwa satu-satunya perlakuan yang ia perkenalkan
selama kondisi intervensi adalah pengalaman time out. Ini hanya mengubah satu
variabel. Jika peneliti memperkenalkan tidak hanya pengalaman waktu habis
tetapi juga pengalaman lain (mis., Menasihati siswa selama waktu habis), ia akan
mengubah dua variabel. Dampaknya, perlakuan akan dikacaukan. Intervensi
sekarang akan terdiri dari dua variabel yang dicampur bersama. Sayangnya, satu-
satunya hal yang peneliti dapat simpulkan adalah apakah perlakuan kombinasi itu
efektif atau tidak. Dia tidak akan tahu apakah konseling atau waktu tunggu yang
menjadi penyebabnya. Jadi, ketika menganalisis desain single-subject, selalu
penting untuk menentukan apakah hanya satu variabel pada suatu waktu telah
berubah. Jika bukan ini masalahnya, kesimpulan apa pun yang diambil mungkin
keliru.

c. Derajat dan Kecepatan Perubahan


Peneliti juga harus memperhitungkan besarnya perubahan data pada saat
kondisi intervensi dilaksanakan (yaitu, ketika variabel independen diperkenalkan
atau dihapus). Lihat, misalnya, pada Gambar 14.11 (a). Kondisi dasar
mengungkapkan bahwa data memiliki stabilitas. Namun, ketika intervensi
diperkenalkan, perilaku subjek tidak berubah selama tiga sesi. Ini tidak
menunjukkan efek eksperimental yang sangat kuat. Jika variabel independen (apa
pun itu) efektif, orang akan menganggap bahwa perilaku subjek akan berubah
lebih cepat. Tentu saja mungkin bahwa variabel independen itu efektif, tetapi
tidak memiliki kekuatan yang cukup untuk membawa perubahan langsung (atau
perilaku tersebut mungkin telah tahan terhadap perubahan). Namun demikian,
para peneliti harus mempertimbangkan semua kemungkinan seperti itu jika ada
perubahan yang lambat atau tertunda begitu intervensi diperkenalkan. Gambar
14.11 (b) menunjukkan ada perubahan yang cukup cepat tetapi itu besarnya kecil.
Hanya pada Gambar 14.11 (c) kita melihat perubahan dramatis dan cepat begitu
intervensi diperkenalkan. Seorang peneliti akan lebih mungkin untuk
menyimpulkan bahwa variabel independen lebih efektif dalam kasus ini daripada
dia di salah satu dari dua variabel lainnya.

Gambar 14.11. Perbedaan Derajat dan Kecepatan Perubahan

d. Pengembalian ke Level Baseline


Lihat Gambar 14.12 (a). Perhatikan bahwa dalam kembali ke kondisi awal,
tidak ada perubahan perilaku yang cepat. Ini menunjukkan bahwa sesuatu yang
lain mungkin telah terjadi ketika kondisi intervensi diperkenalkan. Kami berharap
bahwa perilaku subjek akan kembali ke tingkat garis dasar cukup cepat jika
intervensi telah menjadi faktor penyebab dalam mengubah perilaku subjek. Fakta
bahwa perilaku subjek tidak kembali ke tingkat awal asli menunjukkan bahwa
satu atau lebih variabel asing mungkin telah menghasilkan efek yang diamati
selama kondisi intervensi. Di sisi lain, lihat Gambar 14.12 (b). Di sini kita melihat
bahwa perubahan dari intervensi ke tingkat awal sangat cepat dan cepat. Ini
menunjukkan bahwa variabel independen kemungkinan penyebab perubahan
dalam variabel dependen. Perhatikan, bagaimanapun, bahwa, karena perlakuan
dimaksudkan untuk memiliki dampak yang bertahan lama, pengembalian yang
lebih lambat ke awal mungkin diinginkan, meskipun itu akan memiliki
interpretasi yang rumit.

Gambar 14.12. Perbedaan dalam Pengembalian ke level Baseline

e. Perilaku Independen/Bebas
Kekhawatiran ini paling berlaku untuk studi multi-baseline. Bayangkan sejenak
bahwa seorang peneliti sedang menyelidiki berbagai metode pengajaran sejarah.
Peneliti mendefinisikan dua perilaku terpisah yang akan dia ukur. Ini termasuk (1)
kemampuan untuk menemukan ide sentral, dan (2) kemampuan untuk merangkum
poin-poin penting dalam berbagai dokumen sejarah. Peneliti mendapatkan data
dasar untuk masing-masing keterampilan ini dan kemudian mengimplementasikan
intervensi (memberikan lembar kerja yang memberikan petunjuk tentang
bagaimana menemukan ide-ide penting dalam dokumen sejarah). Kemampuan
subjek untuk menemukan ide sentral dalam dokumen meningkat dengan cepat dan
jauh. Namun, kemampuan subjek untuk merangkum poin-poin penting juga
meningkat. Sangat jelas bahwa kedua keterampilan ini tidak mandiri. Mereka
tampaknya terkait dalam beberapa cara, mungkin tergantung pada kemampuan
kognitif dasar yang sama, dan karenanya mereka meningkat bersama.

f. Jumlah Baseline
Untuk memiliki desain multi-baseline, seorang peneliti harus memiliki setidaknya
dua baseline. Meskipun baseline dimulai pada waktu yang sama, intervensi
diperkenalkan pada waktu yang berbeda. Seperti yang kami sebutkan sebelumnya,
kemungkinan bahwa variabel asing menyebabkan hasil ketika menggunakan
desain multi-baseline di dua perilaku berkurang, karena kecil kemungkinannya
bahwa peristiwa asing yang sama menyebabkan perubahan yang diamati untuk
kedua perilaku pada waktu yang berbeda. Oleh karena itu, probabilitas bahwa
peristiwa asing menyebabkan perubahan dalam desain multiple-baseline di tiga
perilaku lebih kecil.
Dengan demikian, semakin besar jumlah baseline, semakin besar probabilitas
bahwa intervensi adalah penyebab dari setiap perubahan perilaku, karena semakin
banyak perilaku yang kita miliki, kemungkinan bahwa variabel asing
menyebabkan perubahan secara bersamaan menurun.
Namun, ada masalah dengan sejumlah besar baseline. Semakin banyak garis dasar
yang ada, semakin lama perilaku selanjutnya harus tetap berada pada garis dasar
— yaitu, tidak menerima intervensi. Misalnya, jika kita mengikuti rekomendasi
yang disebutkan sebelumnya tentang menetapkan titik data yang stabil sebelum
kita memperkenalkan kondisi intervensi, ini berarti bahwa perilaku pertama
adalah pada awal untuk minimal tiga sesi, yang kedua untuk enam sesi, dan yang
ketiga untuk sembilan . Jika kita menggunakan empat garis dasar, perilaku
keempat akan berada dalam kondisi awal untuk 12 sesi! Ini adalah waktu yang
sangat lama untuk menjaga perilaku agar tidak menerima intervensi. Sebagai
aturan umum, bagaimanapun, penting untuk diingat bahwa semakin sedikit
jumlah baseline, semakin kecil kemungkinan kita dapat menyimpulkan bahwa itu
adalah intervensi daripada beberapa variabel lain yang menyebabkan perubahan
perilaku.

 Kontrol Ancaman terhadap Validitas Internal dalam Penelitian


Single-subject
Desain single-subject paling efektif dalam mengendalikan karakteristik subjek,
mortalitas, pengujian, dan ancaman sejarah; mereka kurang efektif dengan lokasi,
karakteristik pengumpul data, pematangan, dan ancaman regresi; dan mereka pasti
lemah ketika datang ke instrumen peluruhan, bias pengumpul data, sikap, dan
ancaman implementasi.
Ancaman lokasi paling sering hanya merupakan ancaman kecil dalam studi multi-
baseline, karena lokasi di mana perlakuan diberikan biasanya konstan selama
penelitian. Hal yang sama berlaku untuk karakteristik pengumpul data, meskipun
karakteristik tersebut dapat menjadi masalah jika pengumpul data diubah selama
studi.
Desain single-subject sayangnya memiliki kemungkinan peluruhan instrumen dan
bias kolektor data yang kuat, karena data harus dikumpulkan (biasanya melalui
pengamatan) melalui banyak uji coba, dan pengumpul data penelitian sulit
disimpan dalam kesalahan mengenai maksudnya.
Baik ancaman implementasi maupun efek sikap tidak dikontrol dengan baik
dalam penelitian single-subject. Baik pelaksana atau pengumpul data dapat, secara
tidak sengaja, merusak hasil penelitian. Bias pengumpul data adalah masalah
khusus ketika orang yang sama adalah pelaksana (mis., Bertindak sebagai guru)
dan pengumpul data. Pengamat kedua, yang merekam secara independen,
mengurangi ancaman ini tetapi menambah jumlah staf yang dibutuhkan untuk
menyelesaikan penelitian. Ancaman pengujian biasanya bukan ancaman, karena
mungkin subjek tidak dapat memengaruhi data pengamatan.

 Validitas Eksternal dalam Penelitian SingleSubject: Pentingnya


Replikasi
Studi single-subject lemah ketika datang ke validitas eksternal yaitu, generalisasi.
Seseorang tidak akan menganjurkan penggunaan perlakuan yang terbukti efektif
hanya dengan satu subjek! Akibatnya, penelitian yang melibatkan desain single-
subject yang menunjukkan perlakuan khusus untuk menjadi efektif dalam
mengubah perilaku harus bergantung pada replikasi-lintas individu daripada
kelompok-jika hasil seperti itu layak untuk digeneralisasi.

 Desain Single-Subject Lainnya


Ada berbagai desain lain yang kurang digunakan yang termasuk dalam kategori
single-subject. Salah satunya adalah desain multitreatment, yang memperkenalkan
perlakuan berbeda ke dalam desain A-B-A-B (mis., A-B-A-C-A). Desain
Alternating-treatments menggantikan dua atau lebih perlakuan yang berbeda
setelah periode awal awal (mis., A-B-C-B-C). Variasi ini diilustrasikan dalam
analisis studi dalam bab ini, yang menghilangkan baseline, menjadi desain B-C-B,
B-C-B-C, atau B-C-B-C-B. Desain multiprobe berbeda dari desain
multiplebaseline hanya dalam poin data yang lebih sedikit digunakan, dalam
upaya untuk mengurangi beban pengumpulan data dan menghindari ancaman
terhadap validitas internal. Akhirnya, fitur dari semua desain ini dapat
digabungkan. *

3. Contoh Penelitian Single-Subject


Dalam sisa bab ini, kami menyajikan contoh penelitian single-subject yang
diterbitkan diikuti oleh kritik terhadap kekuatan dan kelemahannya. Seperti yang
kami lakukan dalam kritik kami terhadap studi penelitian eksperimental
perbandingan kelompok dalam Bab 13, kami menggunakan konsep yang
diperkenalkan di bagian awal buku ini dalam analisis kami.

C. PENELITIAN KORELASI

1. Sifat dari Penelitian Korelasi

Penelitian korelasi, seperti penelitian kausal-perbandingan adalah contoh dari


apa yang kadang-kadang disebut Asosiasi penelitian. Dalam Asosiasi penelitian,
hubungan antara dua atau lebih variabel dipelajari tanpa berusaha untuk
mempengaruhi mereka. Dalam bentuk yang paling sederhana, correlational studi
menyelidiki kemungkinan hubungan antara dua variabel, meskipun penyelidikan
lebih dari dua variabel umum. Berbeda dengan penelitian eksperimental, namun,
ada tidak ada manipulasi variabel dalam penelitian correlational.
Penelitian korelasi juga kadang-kadang dirujuk sebagai bentuk penelitian
deskriptif karena ini menggambarkan hubungan antara variabel-variabel yang ada.
Cara ini menggambarkan hubungan ini, bagaimanapun, sangat berbeda dari
deskripsi yang ditemukan di jenis lain dari studi. Sebuah studi korelasional
menjelaskan sejauh mana dua atau lebih variabel kuantitatif yang terkait, dan ia
melakukannya dengan menggunakan koefisien korelasi.
Ketika korelasi ditemukan ada antara dua variabel, itu berarti bahwa nilai
dalam rentang tertentu pada satu variabel terkait dengan nilai dalam rentang
tertentu pada variabel lainnya. Anda akan ingat bahwa korelasi positif berarti nilai
tinggi pada satu variabel cenderung dikaitkan dengan nilai tinggi pada variabel
lainnya, sementara skor rendah pada satu dikaitkan dengan skor rendah di sisi
lain. Korelasi negatif, di sisi lain, berarti nilai tinggi pada satu variabel dikaitkan
dengan skor rendah pada variabel lainnya, dan skor rendah pada satu dikaitkan
dengan skor tinggi di sisi lain.

2. Tujuan Penelitian Korelasi


Penelitian korelasional dilakukan untuk satu dari dua tujuan dasar-baik untuk
membantu menjelaskan perilaku manusia yang penting atau untuk memprediksi
kemungkinan hasil.
a) Studi Penjelasan
Tujuan utama penelitian korelasional adalah untuk mengklarifikasi
pemahaman kita tentang fenomena penting dengan mengidentifikasi hubungan
antar variabel. Khususnya dalam psikologi perkembangan, di mana studi
eksperimental sangat sulit dirancang, banyak yang telah dipelajari dengan
menganalisis hubungan di antara beberapa variabel. Sebagai contoh, korelasi yang
ditemukan antara variabel seperti kompleksitas pidato orang tua dan tingkat
perolehan bahasa telah banyak diajarkan peneliti tentang bagaimana bahasa
diperoleh. Demikian pula, penemuan bahwa - antara variabel yang berkaitan
dengan kemampuan membaca - memori pendengaran menunjukkan korelasi yang
substansial dengan kemampuan membaca telah memperluas pemahaman kita
tentang fenomena pembacaan yang kompleks. Keyakinan saat ini bahwa merokok
menyebabkan kanker paru-paru, walaupun sebagian didasarkan pada studi
eksperimental terhadap hewan, sangat bergantung pada bukti korelasi antara
frekuensi merokok dan kejadian kanker paru-paru.
Peneliti yang melakukan studi penjelasan sering menyelidiki sejumlah
variabel yang mereka yakini terkait dengan variabel yang lebih kompleks, seperti
motivasi atau pembelajaran. Variabel yang ditemukan tidak terkait atau hanya
sedikit terkait (yaitu, bila korelasi di bawah 0.20 diperoleh) kemudian diturunkan
dari pertimbangan lebih lanjut, sementara yang ditemukan lebih terkait (yaitu, bila
korelasi di luar 0,40 atau 0,40 diperoleh) sering dijadikan fokus penelitian
tambahan, dengan menggunakan desain eksperimental, untuk melihat apakah
hubungan itu memang kausal.

b) Studi Prediksi
Tujuan kedua penelitian korelasional adalah prediksi: Jika ada hubungan yang
cukup besar antara dua variabel, kemungkinan untuk memprediksi skor pada satu
variabel jika skor pada variabel lain diketahui. Periset telah menemukan,
misalnya, bahwa nilai sekolah tinggi sangat terkait dengan nilai perguruan tinggi.
Makanya, nilai SMA bisa digunakan untuk memprediksi nilai kuliah. Kami akan
memprediksi bahwa orang dengan SMA berpendidikan tinggi cenderung memiliki
IPK tinggi di perguruan tinggi. Variabel yang digunakan untuk membuat prediksi
disebut variabel prediktor; variabel tentang prediksi yang dibuat disebut variabel
kriteria. Oleh karena itu, dalam contoh di atas, nilai sekolah menengah akan
menjadi variabel prediktor, dan nilai perguruan tinggi akan menjadi variabel
kriteria. Seperti yang telah kami sebutkan di Bab 8, studi prediksi juga digunakan
untuk menentukan validitas prediktif alat ukur.

c) Menggunakan Scatterplots dan Persamaan Prediksi Sederhana untuk


Memprediksi Skor
Prediksi bisa diilustrasikan melalui penggunaan scatterplots. Meskipun
scatterplots adalah alat yang cukup mudah digunakan dalam membuat prediksi,
namun tidak efisien saat pasangan skor dari sejumlah besar individu telah
dikumpulkan. Untungnya, garis regresi yang baru saja kita jelaskan dapat
dinyatakan dalam bentuk persamaan prediksi, yang memiliki bentuk sebagai
berikut:
d) Y’1 = a + bX1
dimana Y’1 = skor prediksi pada Y (variabel kriteria) untuk nilai i individu, X1 =
individual i pada X (variabel prediktor), dan a dan b adalah nilai yang dihitung
secara matematis dari nilai aslinya. Untuk rangkaian data tertentu, a dan b adalah
konstanta.
Kami telah menyebutkan sebelumnya bahwa IPK SMA telah ditemukan
sangat terkait dengan IPK perguruan tinggi. Dalam contoh ini, simbol Y’ adalah
singkatan dari IPK semester pertama yang diprediksi (variabel kriteria), dan X1
mewakili IPK individu (variabel prediktor). Mari kita asumsikan itu a =.18 dan b
=.73. Dengan mengganti persamaan, kita bisa memprediksi IPK perguruan tinggi
siswa semester satu. Jadi, jika IPK individu 3,5 orang, kami akan memprediksi
bahwa IPK perguruan tinggi pertamanya akan mencapai 2.735 (yaitu, 18+, 73
(3.5) = 2.735). Kami kemudian dapat membandingkan IPK semester-semester
sebenarnya mahasiswa itu ke IPK yang diprediksi. Jika ada kesamaan yang erat
antara keduanya, kita mendapatkan kepercayaan diri dalam menggunakan
persamaan prediksi untuk membuat prediksi masa depan.
Nilai prediksi ini tidak akan tepat, bagaimanapun, dan karenanya peneliti juga
menghitung indeks kesalahan prediksi, yang dikenal sebagai standar error of
estimate. Indeks ini memberikan perkiraan tingkat di mana nilai prediksi
kemungkinan tidak tepat. Semakin kecil standar error estimasi, semakin akurat
prediksi. Indeks kesalahan ini, seperti yang Anda duga, jauh lebih besar untuk
nilai r yang lebih kecil daripada r’s. *
Selanjutnya, jika kita memiliki lebih banyak informasi tentang individu-
individu yang ingin kita prediksi, kita harus dapat mengurangi kesalahan prediksi
kita. Inilah teknik yang dikenal dengan multiple regression (atau multiple
correlation) yang dirancang untuk dilakukan.

3. Teknik Korelasi Lebih Kompleks


a. Regresi Berganda
Regresi berganda adalah teknik yang memungkinkan peneliti untuk
menentukan korelasi antara variabel kriteria dan kombinasi terbaik dari dua atau
lebih variabel prediktor. Mari kita kembali ke contoh sebelumnya yang
melibatkan korelasi positif yang tinggi antara IPK SMA dan IPK semester
pertama. Misalkan juga ditemukan bahwa korelasi positif yang tinggi (r = .68)
ada antara IPK semester pertama dan skor verbal pada ujian masuk perguruan
tinggi SAT, dan korelasi positif yang cukup tinggi (r = .51) ada antara
matematika skor di SAT dan IPK semester pertama perguruan tinggi. Ada
kemungkinan, dengan menggunakan rumus prediksi regresi berganda, untuk
menggunakan ketiga variabel ini untuk memprediksi apa itu kemampuan siswa
IPK akan selama semester pertama di perguruan tinggi. Rumusnya mirip dengan
persamaan prediksi sederhana, kecuali bahwa sekarang mencakup lebih dari satu
variabel prediktor dan lebih dari dua konstanta. Dibutuhkan bentuk berikut:
Y’ = a + b1 X1 + b2X2 + b3X3
dimana Y’ sekali lagi merupakan singkatan dari IPK perguruan tinggi yang
diprediksi semester pertama; a, b1, b2, dan b3 adalah konstanta; X1 = IPK SMA ;
X2 = skor SAT verbal ; X3 = skor SAT matematika. Kita tahu bahwa IPK SMA
siswa adalah 3.5. Misalkan nilai SAT verbal dan matematika SAT nya masing-
masing adalah 580 dan 600. Dengan mensubstitusikan rumus, kami
memperkirakan bahwa IPK semester pertama siswa akan menjadi 3,15.
Y = .18 + .73(3.5) + .0005(580) + .0002(600)
= .18 + 2.56 + .29 +.12
= 3.15
Sekali lagi, nanti kita bisa membandingkan IPK semester pertama yang
sebenarnya diperoleh oleh siswa ini dengan prediksi skor untuk menentukan
seberapa akurat prediksi kita.

b. Koefisien Correlation berganda


Koefisien korelasi berganda, dilambangkan dengan R, menunjukkan kekuatan
korelasi antara kombinasi variabel prediktor dan variabel kriteria. Hal ini dapat
dianggap sebagai korelasi Pearson sederhana antara nilai aktual pada variabel
kriteria dan nilai prediksi pada variabel tersebut. Pada contoh sebelumnya, kami
menggunakan kombinasi dari IPK SMA, skor lisan SAT, dan nilai matematika
SAT untuk memprediksi bahwa IPK semester satu siswa tertentu akan menjadi
3,15. Kami kemudian bisa memperoleh IPK perguruan tinggi semesteran siswa
yang sama (mungkin 2,95, misalnya). Jika kita melakukan ini untuk 100 siswa,
kita kemudian dapat menghitung korelasi (R) antara IPK yang diprediksi dan
aktual. Jika R ternyata +1.00, misalnya, ini berarti bahwa nilai prediksi
berkorelasi sempurna dengan nilai aktual pada variabel kriteria. R +1 +1, tentu
saja, paling tidak biasa untuk didapatkan. Dalam prakteknya, Rs dari 0,70 atau
0,80 dianggap cukup tinggi. Semakin tinggi R, tentu saja, prediksi yang lebih
dapat diandalkan. Gambar 15.3 menggambarkan hubungan antara kriteria dan dua
prediktor. Jumlah IPK perguruan tinggi yang dihitung oleh IPK SMA (sekitar 36
persen) meningkat sekitar 13 persen dengan menambahkan nilai tes sebagai
prediktor kedua.

c. Koefisien Determinasi
Kuadrat korelasi antara prediktor dan variabel kriteria dikenal sebagai
koefisien determinasi, dilambangkan dengan r2. Jika korelasi antara IPK SMA dan
IPK perguruan tinggi, misalnya, sama dengan 0,60, maka koefisien determinasi
akan sama. 36. Apa artinya ini? Singkatnya, koefisien determinasi menunjukkan
persentase variabilitas di antara nilai kriteria yang dapat dikaitkan dengan
perbedaan nilai pada variabel prediktor. Jadi, jika korelasi antara IPK SMA dan
IPK perguruan tinggi untuk sekelompok siswa adalah 0,60, 36 persen (0,60)2 dari
perbedaan IPK perguruan tinggi siswa tersebut dapat dikaitkan dengan perbedaan
dalam IPK sekolah menengah mereka.
Interpretasi R2 (untuk regresi berganda) sama dengan r (untuk regresi
sederhana). Misalkan dalam contoh kita yang menggunakan tiga variabel
prediktor, koefisien korelasi berganda sama dengan 0,70. Koefisien determinasi,
sama dengan (0,70)2, atau 0,49. Dengan demikian, akan tepat untuk mengatakan
bahwa 49 persen variabilitas dalam variabel kriteria dapat diprediksi berdasarkan
tiga variabel prediktor. Cara lain untuk mengatakan ini adalah bahwa IPK SMA,
nilai SAT lisan, dan nilai SAT matematika (tiga variabel prediktor), diambil
bersamaan, menyumbang sekitar 49 persen variabilitas IPK perguruan tinggi
(variabel kriteria).
Nilai persamaan prediksi tergantung pada apakah bisa digunakan dengan
kelompok individu baru. Periset tidak pernah bisa memastikan persamaan prediksi
yang mereka kembangkan akan berhasil bekerja bila digunakan untuk
memprediksi skor kriteria untuk sekelompok orang baru. Sebenarnya, sangat
mungkin hal itu akan kurang akurat bila digunakan, karena kelompok baru tidak
akan identik dengan yang digunakan untuk mengembangkan persamaan prediksi.
Keberhasilan suatu persamaan prediksi dengan kelompok baru, oleh karena itu,
biasanya bergantung pada kesamaan kelompok terhadap kelompok yang
digunakan untuk mengembangkan persamaan prediksi yang awalnya.
d. Analisis Fungsi Diskriminan
Dalam kebanyakan penelitian prediksi, variabel kriteria bersifat kuantitatif-
yaitu, ini melibatkan skor yang dapat jatuh di mana saja sepanjang rangkaian dari
rendah ke tinggi. Contoh IPK perguruan tinggi kami sebelumnya adalah variabel
kuantitatif, karena nilai pada variabel dapat turun di mana saja atau antara 0.00
dan 4.00. Terkadang, bagaimanapun, variabel kriteria mungkin merupakan
variabel kategoris - yaitu, melibatkan keanggotaan dalam kelompok (atau
kategori) daripada skor sepanjang rangkaian. Misalnya, seorang peneliti mungkin
tertarik untuk memprediksi apakah seorang individu lebih menyukai jurusan
teknik atau jurusan bisnis. Dalam contoh ini, variabel kriteria dikotomis - individu
berada dalam satu kelompok atau kelompok lainnya. Tentu saja, variabel
kategoris bisa memiliki lebih dari dua kategori (misalnya jurusan teknik, jurusan
bisnis, jurusan pendidikan, jurusan sains, dan sebagainya). Teknik regresi
berganda tidak dapat digunakan bila variabel kriteria bersifat kategoris; Sebagai
gantinya, teknik yang dikenal sebagai analisis fungsi diskriminan digunakan. Itu
Tujuan analisis dan bentuk persamaan prediksi, bagaimanapun, serupa dengan
regresi berganda. Gambar 15.4 menggambarkan logika; perhatikan bahwa nilai
individu yang diwakili oleh enam wajah tetap sama untuk kedua kategori! Skor
orang tersebut dibandingkan dengan skor pertama dari para ahli kimia penelitian,
dan kemudian skor guru kimia.
e. Analisis Faktor
Ketika sejumlah variabel diselidiki dalam satu studi, analisis dan interpretasi
data bisa menjadi agak rumit. Oleh karena itu, seringkali diinginkan untuk
mengurangi jumlah variabel dengan mengelompokkan yang cukup atau sangat
berkorelasi satu sama lain menjadi faktor.
Analisis faktor adalah teknik yang memungkinkan peneliti menentukan
apakah banyak variabel dapat digambarkan oleh beberapa faktor. Perhitungan
matematis yang terlibat berada di luar cakupan buku ini, namun teknik dasarnya
melibatkan pencarian untuk "kelompok" variabel, yang semuanya berkorelasi satu
sama lain. Klaster berikutnya mewakili sebuah faktor. Studi tentang tes IQ
kelompok, misalnya, menunjukkan bahwa banyak nilai spesifik yang digunakan
dapat dijelaskan sebagai hasil dari sejumlah faktor yang relatif kecil. Sementara
kontroversial, hasil ini memang memberi satu sarana untuk memahami
kemampuan mental yang dibutuhkan untuk tampil dengan baik pada tes semacam
itu. Mereka juga menghasilkan tes baru yang dirancang untuk menguji
kemampuan yang teridentifikasi ini secara lebih efektif.
f. Analisis Jalur
Analisis jalur digunakan untuk menguji kemungkinan hubungan kausal antara
tiga atau lebih variabel. Beberapa teknik lain yang telah kita gambarkan dapat
digunakan untuk mengeksplorasi teori tentang kausalitas, namun analisis jalur
jauh lebih kuat daripada yang lainnya. Meskipun penjelasan rinci tentang teknik
ini terlalu teknis untuk dimasukkan di sini, gagasan penting di balik analisis jalur
adalah merumuskan sebuah teori tentang kemungkinan penyebab fenomena
tertentu (seperti keterasingan siswa) -yaitu, untuk mengidentifikasi variabel-
variabel penyebab yang dapat menjelaskan mengapa fenomena itu terjadi - dan
kemudian untuk menentukan apakah korelasi antara semua variabel konsisten
dengan teori.
Misalkan seorang peneliti berteori sebagai berikut: (1) Siswa tertentu lebih
terasing di sekolah daripada yang lain karena mereka tidak menganggap sekolah
menyenangkan dan karena mereka memiliki sedikit teman; (2) mereka tidak
menganggap sekolah menyenangkan sebagian karena mereka memiliki sedikit
teman dan sebagian karena mereka tidak menganggap kursus mereka sesuai
dengan kebutuhan mereka; dan (3) relevansi yang dirasakan dari kursus sedikit
terkait dengan jumlah teman. Peneliti kemudian akan mengukur masing-masing
variabel ini (tingkat keterasingan, relevansi pribadi dari kursus, kenikmatan di
sekolah, dan jumlah teman) untuk sejumlah siswa. Korelasi antara pasangan
masing-masing variabel kemudian akan dihitung. Mari kita bayangkan bahwa
peneliti memperoleh korelasi yang ditunjukkan dalam matriks korelasi pada Tabel
15.3.
Apa yang ditunjukkan tabel ini tentang kemungkinan penyebab keterasingan
siswa? Dua dari variabel (relevansi kursus di -.48 dan kenikmatan sekolah di -.53)
yang ditunjukkan dalam tabel adalah prediktor yang cukup besar tentang
keterasingan semacam itu. Namun demikian, untuk mengingatkan Anda lagi,
hanya karena variabel ini memprediksi keterasingan siswa, Anda seharusnya tidak
berasumsi bahwa hal itu menyebabkannya terjadi. Selanjutnya, ada masalah yang
ada dalam kenyataan bahwa kedua variabel prediktor berkorelasi satu sama lain.
Seperti yang dapat Anda lihat, kesenangan sekolah dan relevansi yang dirasakan
dari kursus tidak hanya memprediksi keterasingan siswa, tapi juga berkorelasi
sangat tinggi satu sama lain (r? .65). Sekarang, apakah relevansi yang dirasakan
dari kursus mempengaruhi keterasingan siswa secara independen dari kenikmatan
sekolah? Apakah kenikmatan sekolah mempengaruhi keterasingan siswa secara
independen terhadap persepsi relevansi kursus? Analisis jalur dapat membantu
peneliti menentukan jawaban atas pertanyaan-pertanyaan ini.
Analisis jalur, kemudian, melibatkan empat langkah dasar. Pertama, teori
yang menghubungkan beberapa variabel diformulasikan untuk menjelaskan
fenomena minat tertentu. Dalam contoh kita, peneliti berteori hubungan kausalitas
berikut: (1) Ketika siswa menganggap pelajaran mereka tidak terkait dengan
kebutuhan mereka, mereka tidak akan menikmati sekolah; (2) Jika mereka
memiliki sedikit teman di sekolah, ini akan berkontribusi pada kurangnya
kesenangan mereka, dan (3) semakin tidak disukai siswa sekolah dan semakin
sedikit teman yang dimilikinya, semakin terasing dia. Kedua, variabel yang
ditentukan oleh teori kemudian diukur dalam beberapa cara. * Ketiga, koefisien
korelasi dihitung untuk menunjukkan kekuatan hubungan antara masing-masing
pasangan variabel yang dipostulasikan dalam teori. Dan keempat, hubungan
antara koefisien korelasi dianalisis dalam kaitannya dengan teori.
Variabel analisis jalur biasanya ditunjukkan pada jenis diagram yang
digambarkan pada Gambar 15.5. † Setiap variabel dalam teori ditunjukkan pada
gambar. Setiap panah menunjukkan hubungan kausalitas yang dihipotesiskan ke
arah panah. Jadi, menyukai sekolah dihipotesiskan untuk mempengaruhi
keterasingan; Jumlah teman mempengaruhi kenikmatan sekolah, dan sebagainya.
Perhatikan bahwa dalam contoh ini semua panah mengarah ke satu arah saja. Ini
berarti bahwa variabel pertama dihipotesiskan untuk mempengaruhi variabel
kedua, namun tidak sebaliknya. Angka serupa (tapi tidak identik) dengan
koefisien korelasi dihitung untuk masing-masing pasangan variabel. Jika hasilnya
ditunjukkan pada Gambar 15.5, teori kausal peneliti akan didukung. Apakah kamu
melihat mengapa?
g. Pemodelan Struktur
Pemodelan struktural adalah metode yang canggih untuk mengeksplorasi dan
mungkin mengonfirmasi sebab akibat di antara beberapa variabel.
Kompleksitasnya berada di luar cakupan teks ini. Cukup dengan mengatakan
bahwa ia menggabungkan beberapa regresi, analisis jalur, dan analisis faktor.
Perhitungannya sangat disederhanakan dengan menggunakan program komputer;
program komputer yang paling banyak digunakan mungkin LISREL.1

4. Step Dasar dalam Penelitian Korelasi


a. Seleksi Problem
Variabel yang dimasukkan dalam studi korelasional harus didasarkan pada
pemikiran rasional yang tumbuh dari pengalaman atau teori. Peneliti harus
memiliki beberapa alasan untuk berpikir bahwa variabel tertentu mungkin
terkait. Seperti biasa, kejelasan dalam mendefinisikan variabel akan
menghindari banyak masalah di kemudian hari. Secara umum, tiga jenis
masalah utama adalah fokus studi korelasional:
1. Apakah variabel X berhubungan dengan variabel Y?
2. Seberapa baik variabel P memprediksi variabel C?
3. Apa hubungan antara sejumlah besar variabel, dan prediksi apa yang dapat
dibuat yang didasarkan pada mereka?
b. Sample
Sampel untuk penelitian korelasional, seperti dalam semua jenis penelitian,
harus dipilih secara hati-hati dan, jika mungkin, secara acak. Langkah pertama
dalam memilih sampel, tentu saja, adalah untuk mengidentifikasi populasi
yang tepat, yang bermakna dan dari mana data pada masing-masing variabel
kepentingan dapat dikumpulkan. Ukuran sampel minimum yang dapat
diterima untuk studi korelasional dianggap oleh kebanyakan peneliti tidak
lebih dari 30. Data yang diperoleh dari sampel yang lebih kecil dari 30 dapat
memberikan perkiraan tingkat hubungan yang tidak akurat. Sampel yang lebih
besar dari 30 kemungkinan besar memberikan hasil yang berarti.
c. Instrumen
Instrumen yang digunakan untuk mengukur dua (atau lebih) variabel yang
terlibat dalam studi korelasional dapat mengambil salah satu dari sejumlah
bentuk, namun harus menghasilkan data kuantitatif. Meskipun data kadang-
kadang dapat dikumpulkan dari catatan satu atau lain (transkrip nilai,
misalnya), sebagian besar penelitian korelasional melibatkan administrasi
beberapa jenis instrumen (tes, kuesioner, dan sebagainya) dan terkadang
pengamatan. Seperti halnya penelitian apapun, instrumen apa pun yang
digunakan harus menghasilkan skor yang andal. Dalam sebuah studi
penjelasan, instrumen juga harus menunjukkan bukti validitas. Jika mereka
tidak benar-benar mengukur variabel yang dimaksud, maka setiap korelasi
yang didapat tidak akan menjadi indikasi hubungan yang dimaksud. Dalam
sebuah studi prediksi, tidak penting bahwa kita mengetahui variabel apa yang
sebenarnya diukur - jika bekerja sebagai prediktor, ini berguna. Namun, studi
prediksi kemungkinan besar akan berhasil, dan pastinya lebih memuaskan,
kapan kita tahu apa yang kita ukur.
d. Pengumpulan Data
Dalam sebuah studi penjelasan, semua data pada kedua variabel biasanya akan
dikumpulkan dalam waktu yang cukup singkat. Seringkali, instrumen yang
digunakan diberikan dalam satu sesi, atau dalam dua sesi satu segera setelah
yang lain. Jadi, jika seorang peneliti tertarik untuk mengukur hubungan antara
kemampuan verbal dan ingatan, tes bakat verbal dan ingatan lain akan
diberikan secara dekat ke kelompok subyek yang sama. Dalam sebuah studi
prediksi, pengukuran variabel kriteria sering terjadi beberapa saat setelah
pengukuran variabel prediktor. Jika seorang peneliti tertarik untuk
mempelajari nilai prediktif dari tes bakat matematis, tes bakat mungkin
diberikan tepat sebelum awal kursus matematika. Keberhasilan dalam kursus
(variabel kriteria, seperti yang ditunjukkan oleh nilai kursus) kemudian akan
diukur pada akhir kursus.
e. Analisis Data dan Interpretasi
Seperti yang telah kita sebutkan sebelumnya, ketika variabel berkorelasi,
koefisien korelasi dihasilkan. Koefisien ini akan menjadi desimal, di antara
0.00 dan +1.00 atau -1.00. Semakin dekat koefisiennya adalah +1.00 atau -
1.00, semakin kuat hubungan. Jika tanda positif, hubungan positif,
menunjukkan bahwa nilai tinggi pada satu variabel cenderung memiliki nilai
tinggi pada variabel lainnya. Jika tanda negatif, hubungan negatif,
menunjukkan bahwa nilai tinggi pada satu variabel cenderung memiliki skor
rendah pada variabel lainnya. Koefisien yang berada pada atau mendekati 0,00
menunjukkan bahwa tidak ada hubungan antara variabel yang terlibat.

5. Apa Koefisien Korelasi


Penting untuk bisa menafsirkan koefisien korelasi secara masuk akal karena
sering muncul dalam artikel tentang pendidikan dan penelitian pendidikan.
Sayangnya, mereka jarang disertai dengan scatterplots, yang biasanya membantu
interpretasi dan pengertian.
Arti koefisien korelasi yang diberikan bergantung pada bagaimana
penerapannya. Koefisien korelasi di bawah 0,35 hanya menunjukkan sedikit
hubungan antar variabel. Hubungan semacam itu hampir tidak memiliki nilai
dalam pengertian prediktif. (Mungkin, penting untuk mengetahui bahwa variabel-
variabel tertentu tidak terkait. Jadi, kita akan menemukan korelasi yang sangat
rendah, misalnya antara tahun pengalaman mengajar dan jumlah siswa yang
terdaftar.) Korelasi antara 0,40 dan. 60 sering ditemukan dalam penelitian
pendidikan dan mungkin memiliki nilai teoritis atau praktis, tergantung pada
konteksnya. Korelasi minimal .50 harus diperoleh sebelum prediksi kasar dapat
dibuat mengenai individu. Meski begitu, prediksi semacam itu akan dikenai
kesalahan yang cukup besar. Hanya korelasi 0,65 atau lebih tinggi yang
memungkinkan prediksi individu yang cukup akurat untuk sebagian besar tujuan.
Korelasi di atas 0,85 menunjukkan adanya hubungan yang erat antara variabel
yang berkorelasi dan berguna dalam memprediksi kinerja individu, namun
korelasi yang tinggi ini jarang didapat dalam penelitian pendidikan, kecuali saat
memeriksa keandalan.
Koefisien korelasi juga digunakan untuk memeriksa reliabilitas dan validitas
skor yang diperoleh dari pengujian dan instrumen lain yang digunakan dalam
penelitian; Bila digunakan demikian, mereka disebut koefisien reliabilitas dan
validitas. Bila digunakan untuk memeriksa reliabilitas skor, koefisien harus paling
sedikit 0,70, sebaiknya lebih tinggi; banyak tes mencapai koefisien reliabilitas
0,90. Korelasi antara dua pencetak skor berbeda, yang bekerja secara independen,
setidaknya harus 0,90. Bila digunakan untuk memeriksa validitas skor, koefisien
minimal harus 0,50, dan sebaiknya lebih tinggi.

6. Ancaman terhadap Validitas Internal dalam Penelitian Korelasi


Perhatian utama peneliti adalah bahwa variabel asing dapat menjelaskan hasil
yang diperoleh. * Perhatian serupa berlaku untuk studi korelasional. Seorang
peneliti yang melakukan studi korelasional harus selalu waspada terhadap
penjelasan alternatif untuk hubungan yang ditemukan dalam data. Apa yang
mungkin menjelaskan adanya korelasi yang dilaporkan ada antara dua atau lebih
variabel?
Pertimbangkan lagi hipotesis bahwa harapan guru terhadap kegagalan
berkorelasi positif dengan perilaku mengganggu siswa. Seorang peneliti yang
melakukan penelitian ini hampir pasti memiliki urutan sebab dan akibat dalam
pikiran, kemungkinan besar harapan guru adalah penyebab parsial perilaku yang
mengganggu. Mengapa? Karena perilaku yang mengganggu tidak diinginkan
(karena jelas mengganggu pembelajaran akademis dan iklim kelas yang
diinginkan). Dengan demikian, akan sangat membantu untuk mengetahui apa
yang mungkin dilakukan untuk menguranginya. Sementara harapan guru tentang
kegagalan dapat dianggap sebagai variabel dependen, nampaknya kecil
kemungkinannya karena harapan semacam itu tidak akan menarik perhatian
mereka jika tidak berpengaruh pada siswa.
Jika memang maksud peneliti seperti yang telah kita gambarkan, mungkin ia
telah melakukan percobaan. Namun, sulit untuk melihat bagaimana harapan guru
dapat dimanipulasi secara eksperimental. Akan tetapi, mungkin untuk
mempelajari apakah upaya untuk mengubah harapan guru menghasilkan
perubahan dalam jumlah perilaku mengganggu, namun studi semacam itu
memerlukan pengembangan dan penerapan metode pelatihan. Sebelum memulai
pengembangan dan implementasi semacam itu, oleh karena itu, orang mungkin
bertanya apakah ada hubungan antara variabel utama. Inilah sebabnya mengapa
studi korelasional merupakan langkah awal yang tepat.
Korelasi positif yang dihasilkan dari penelitian semacam itu kemungkinan
besar akan dilihat setidaknya beberapa bukti yang menunjukkan bahwa
memodifikasi harapan guru akan menghasilkan perilaku yang kurang
mengganggu, sehingga membenarkan usaha percobaan lebih lanjut. (Mungkin
juga beberapa kepala sekolah atau pelatih guru ingin menerapkan mekanisme
untuk mengubah harapan guru sebelum menunggu konfirmasi eksperimental,
seperti profesi medis yang mulai memperingatkan tentang dampak merokok tanpa
adanya bukti eksperimental yang meyakinkan.) Sebelum berinvestasi waktu dan
sumber daya dalam mengembangkan metode pelatihan dan melakukan percobaan,
peneliti perlu percaya diri mungkin bahwa dia tidak salah mengartikan
koreksinya. Jika hubungan yang dia temukan benar-benar mencerminkan urutan
sebab-akibat yang berlawanan (perilaku siswa menyebabkan harapan guru), atau
jika keduanya merupakan hasil dari penyebab lain, seperti kemampuan siswa atau
status sosial ekonomi, perubahan harapan guru tidak mungkin dilakukan. disertai
dengan pengurangan perilaku yang mengganggu. Mantan masalah (arah sebab dan
akibat) sebagian dapat dihilangkan dengan menilai harapan guru sebelum terlibat
langsung dengan kelompok siswa. Masalah yang terakhir - penyebab lain - adalah
masalah yang kita suruh sekarang.
Dapat dikatakan bahwa ancaman semacam itu tidak relevan dengan
penggunaan penelitian korelasi yang prediktif. Argumennya adalah bahwa
seseorang dapat memprediksi bahkan jika hubungannya merupakan artefak dari
variabel lain. Dengan demikian, prediksi prestasi perguruan tinggi dapat dibuat
dari nilai sekolah menengah bahkan jika keduanya sangat terkait dengan status
sosial ekonomi. Meskipun kami setuju dengan kegunaan praktis dari ramalan
tersebut, kami percaya bahwa penelitian harus berusaha untuk menerangi
hubungan yang setidaknya memiliki potensi untuk mendapatkan penjelasan.
a. Karakteristik Subjek
Kapan pun dua atau lebih karakteristik individu (atau kelompok) berkorelasi, ada
kemungkinan bahwa karakteristik lain dapat menjelaskan hubungan yang
ditemukan. Dalam kasus tersebut, karakteristik lainnya dapat dikontrol melalui
teknik statistik yang dikenal sebagai korelasi parsial.
b. Lokasi
Ancaman lokasi dimungkinkan bila semua instrumen diberikan pada setiap subjek
di lokasi yang ditentukan, namun lokasinya berbeda untuk subyek yang berbeda.
Hal ini tidak biasa bagi peneliti untuk menemukan perbedaan dalam kondisi
pengujian, terutama bila tes individual diperlukan. Di satu sekolah, ruangan yang
nyaman, terang dan berventilasi mungkin tersedia. Di tempat lain, lemari
kustodian mungkin harus dilakukan. Kondisi tersebut dapat meningkatkan (atau
menurunkan) nilai subjek. Jika kedua tindakan tersebut tidak diberikan pada
semua subjek dalam kondisi yang sama, kondisi dan kondisi yang dikaji lebih
jauh mungkin tidak memperhitungkan hubungan tersebut. Jika hanya sebagian
kelompok, misalnya, merespons instrumen di ruangan yang tidak nyaman dan
tidak menyala, mereka mungkin mendapat nilai lebih rendah pada tes prestasi dan
merespons secara negatif skala penilaian yang disukai siswa untuk sekolah,
sehingga menghasilkan koefisien korelasi yang menyesatkan.
Demikian pula, kondisi di berbagai sekolah dapat menjelaskan hubungan yang
diamati. Korelasi negatif yang tinggi antara jumlah perilaku yang mengganggu di
kelas dan pencapaian mungkin hanyalah cerminan dari sumber daya yang
berbeda. Siswa di sekolah dengan sedikit materi sains dapat diharapkan untuk
melakukan hal yang kurang baik dalam sains dan juga mengganggu karena
kebosanan atau permusuhan. Satu-satunya solusi untuk masalah lokasi seperti ini
adalah untuk mengukur variabel asing (seperti tingkat sumber daya) dan
menggunakan korelasi parsial atau untuk menentukan korelasi secara terpisah
untuk setiap lokasi, asalkan jumlah siswa di setiap lokasi cukup besar (minimum n
dari 30).
c. Instrumentasi
 Peluruhan instrumen.
Dalam setiap penelitian menggunakan instrumen tertentu berkali-kali,
pikiran harus diberikan pada kemungkinan peluruhan instrumen. Ini kemungkinan
besar dalam penelitian observasional karena kebanyakan penelitian korelasional
lainnya tidak menggunakan instrumen berkali-kali (dengan subjek yang sama
setidaknya). Ketika kedua variabel tersebut diukur oleh perangkat pengamatan
pada saat yang bersamaan, perhatian harus dilakukan untuk memastikan bahwa
pengamat tidak menjadi lelah, bosan, atau lalai (ini mungkin memerlukan
penggunaan pengamat tambahan). Dalam sebuah studi di mana pengamat diminta
untuk merekam (selama periode waktu yang sama), jumlah "pertanyaan
pemikiran" yang diajukan oleh guru dan perhatian siswa, misalnya, pengamat
yang lelah (atau bosan) mungkin akan melewatkan kejadian masing-masing. ,
menghasilkan skor rendah untuk kelas pada kedua variabel, dan dengan demikian
distorsi dalam korelasi.
 Karakteristik Kolektor Data.
Karakteristik pengumpul data dapat menciptakan ancaman jika orang yang
berbeda mengelola kedua instrumen tersebut. Jenis kelamin, usia, atau etnisitas,
misalnya, dapat mempengaruhi tanggapan spesifik, terutama dengan instrumen
opini atau sikap, serta keseriusan responden menjawab pertanyaan tertentu. Orang
mungkin mengharapkan seorang kolonel Angkatan Udara berseragam, misalnya,
untuk menghasilkan nilai yang berbeda pada instrumen yang mengukur sikap
terhadap militer dan (secara terpisah) terhadap industri kedirgantaraan daripada
kolektor data sipil. Jika setiap kolektor data memberi kedua instrumen tersebut
pada beberapa kelompok, korelasi antara skor ini akan lebih tinggi akibat dampak
pengumpul data. Untungnya, ancaman ini mudah dihindari dengan masing-masing
instrumen diberikan oleh individu yang berbeda.
 Bias Data Kolektor
Ancaman instrumentasi lain dapat dihasilkan dari bias yang tidak disadari
oleh pengumpul data saat kedua instrumen diberikan atau dinilai oleh orang yang
sama. Hal ini tidak biasa, terutama dengan tes kinerja individual, untuk orang
yang sama untuk mengelola kedua tes tersebut kepada siswa yang sama, dan
bahkan selama periode waktu yang sama. Kemungkinan kinerja yang diamati atau
dinilai pada tes pertama akan mempengaruhi cara uji kedua dilakukan dan/atau
dinilai. Hampir tidak mungkin untuk menghindari ekspektasi berdasarkan tes
pertama, dan ini mungkin mempengaruhi perilaku pemeriksa pada pengujian
kedua. Skor tinggi pada tes pertama, misalnya, dapat menyebabkan ekspektasi
pemeriksa skor tinggi pada kedua, sehingga siswa diberi waktu tambahan atau
dorongan pada tes kedua. Meskipun instruksi yang tepat untuk mengelola
instrumen sangat membantu, solusi yang lebih baik adalah memiliki administrator
yang berbeda untuk setiap tes.
d. Pengujian
Pengalaman menanggapi instrumen pertama yang diberikan dalam studi
korelasional dapat mempengaruhi tanggapan subjek terhadap instrumen kedua.
Siswa diminta untuk menanggapi terlebih dahulu skala "menyukai guru", dan
kemudian segera setelah itu "menyukai studi sosial" cenderung melihat adanya
hubungan. Anda bisa membayangkan mereka berkata, mungkin, seperti, "Oh, saya
mengerti, jika saya tidak menyukai guru itu, saya tidak seharusnya menyukai
topik ini." Sejauh hal ini terjadi, hasil yang didapat bisa menyesatkan. Solusinya
adalah mengelola instrumen, jika mungkin, pada waktu yang berbeda dan dalam
konteks yang berbeda.
e. Mortalitas
Mortalitas, secara ketat, bukanlah masalah validitas internal dalam studi
korelasional karena siapa pun yang "hilang" harus dikeluarkan dari penelitian -
korelasi tidak dapat diperoleh kecuali seorang peneliti memiliki skor untuk setiap
orang pada kedua variabel yang diukur.
Ada kalanya, bagaimanapun, ketika kehilangan subjek mungkin membuat
hubungan lebih banyak (atau kurang) mungkin dalam data yang tersisa, sehingga
menciptakan ancaman terhadap validitas eksternal. Mengapa validitas eksternal?
Karena sampel yang sebenarnya diteliti seringkali bukan sampel yang awalnya
dipilih, karena kematian. Mari kita simak lagi penelitian yang menghipotesiskan
bahwa harapan guru terhadap kegagalan akan berkorelasi positif dengan jumlah
perilaku siswa yang mengganggu. Mungkin saja para guru yang menolak
berpartisipasi dalam penelitian ini adalah mereka yang memiliki harapan
kegagalan yang sangat rendah - yang, pada kenyataannya, mengharapkan siswa
mereka untuk mencapai tingkat yang tidak realistis. Tampaknya juga kelas-kelas
guru yang sama menunjukkan banyak perilaku mengganggu sebagai akibat
tekanan tidak realistis dari para guru ini. Kehilangan mereka akan meningkatkan
korelasi yang didapat. Karena tidak ada cara untuk mengetahui apakah
kemungkinan ini benar, satu-satunya hal yang peneliti dapat lakukan adalah
mencoba menghindari kehilangan subjek.

7. Mengevaluasi Ancaman terhadap Validitas Internal dalam Studi Korelasi


Evaluasi ancaman spesifik terhadap validitas internal dalam studi korelasional
mengikuti prosedur yang serupa dengan penelitian eksperimental.
Langkah 1: Tanyakan: Apa faktor spesifik yang diketahui mempengaruhi atau
secara logis dapat mempengaruhi salah satu variabel yang berkorelasi? Tidak
masalah variabel mana yang dipilih.
Langkah 2: Tanyakan: Berapakah kemungkinan masing-masing faktor ini
mempengaruhi variabel lain yang berkorelasi dengan yang pertama? Kita tidak
perlu khawatir dengan faktor yang tidak terkait dengan variabel lainnya. Faktor
harus dikaitkan dengan kedua variabel tersebut agar menjadi ancaman. *
Langkah 3: Evaluasi berbagai ancaman dalam hal kemungkinannya, dan
rencanakan untuk mengendalikannya. Jika ancaman tertentu tidak dapat
dikendalikan, ini harus diakui dan dibahas.
Seperti yang kita lakukan di Bab 13, mari kita pertimbangkan sebuah contoh
untuk menunjukkan bagaimana langkah-langkah ini dapat diterapkan. Misalkan
seorang peneliti ingin mempelajari hubungan antara keterampilan sosial (seperti
yang diamati) dan keberhasilan pekerjaan (seperti yang dinilai oleh supervisor)
dari sekelompok orang dewasa muda yang cacat dalam program pendidikan karir.
Tercantum di bawah ini adalah beberapa ancaman terhadap validitas internal yang
dibahas di Bab 9 dan evaluasi masing-masing.
 Karakteristik Subjek
Kami menganggap di sini hanya empat dari banyak karakteristik yang mungkin
ada.
1. Tingkat keparahan cacat. Langkah 1: Keberhasilan kerja yang terukur dapat
diharapkan terkait dengan tingkat keparahan cacat. Langkah 2: Tingkat
keparahan cacat juga bisa diharapkan terkait dengan keterampilan sosial. Oleh
karena itu, tingkat keparahan harus dinilai dan dikendalikan (menggunakan
korelasi parsial). Langkah 3: Kemungkinan memiliki efek kecuali
dikendalikan: tinggi.
2. Tingkat sosial ekonomi orang tua. Langkah 1: Tingkat sosioekonomi orang
tua kemungkinan berhubungan dengan keterampilan sosial. Langkah 2: Status
sosial ekonomi orang tua tidak mungkin terkait dengan keberhasilan pekerjaan
untuk kelompok ini. Meskipun diinginkan untuk mendapatkan data
sosioekonomi (untuk mengetahui lebih banyak tentang sampel), hal ini tidak
diprioritaskan. Langkah 3: Kemungkinan memiliki efek kecuali dikendalikan:
rendah.
3. Kekuatan fisik dan koordinasi.
Langkah 1: Karakteristik ini mungkin terkait dengan keberhasilan pekerjaan.
Langkah 2: Kekuatan dan koordinasi tidak mungkin terkait dengan
keterampilan sosial. Meskipun diinginkan untuk mendapatkan informasi
semacam itu, namun hal ini tidak diprioritaskan.
Langkah 3: Kemungkinan memiliki efek kecuali dikendalikan: rendah.
4. Penampilan fisik.
Langkah 1: Tampilan fisik kemungkinan berhubungan dengan keterampilan
sosial.
Langkah 2: Hal ini juga mungkin terkait dengan keberhasilan pekerjaan yang
dinilai. Oleh karena itu, variabel ini harus dinilai dan dikendalikan (sekali lagi
dengan menggunakan korelasi parsial).
Langkah 3: Kemungkinan memiliki efek kecuali dikendalikan: tinggi.
 Mortalitas
Langkah 1: Subjek "hilang" cenderung memiliki kinerja pekerjaan yang
buruk. Langkah 2: Subjek yang hilang juga cenderung memiliki keterampilan
sosial yang lebih buruk. Dengan demikian, kehilangan subjek bisa diharapkan
bisa mengurangi besarnya korelasi.
Langkah 3: Kemungkinan memiliki efek kecuali dikendalikan: moderat
sampai tinggi.
 Lokasi
Langkah 1: Karena subjek penelitian akan (mau tidak mau) bekerja di tempat
kerja yang berbeda dan dalam kondisi yang berbeda, lokasi mungkin terkait
dengan keberhasilan pekerjaan yang dinilai.
Langkah 2: Jika keterampilan sosial diamati di tempat, mungkin terkait
dengan kondisi situs yang spesifik. Meskipun ada kemungkinan bahwa
ancaman ini dapat dikendalikan dengan menilai secara independen lingkungan
tempat kerja, solusi yang lebih baik adalah menilai keterampilan sosial di
tempat umum seperti yang digunakan untuk pelatihan kelompok.
Langkah 3: Kemungkinan memiliki efek kecuali dikendalikan: tinggi.
 Instrumentasi
1. Peluruhan Instrumen. Langkah 1: Peluruhan instrumen, jika telah
terjadi, kemungkinan terkait dengan seberapa akurat keterampilan sosial
diukur. Pengamatan harus dijadwalkan, oleh karena itu, untuk mencegah
kemungkinan ini. Langkah 2: Peluruhan instrumen tidak akan
mempengaruhi peringkat pekerjaan. Oleh karena itu, kejadiannya tidak
akan diharapkan untuk memperhitungkan hubungan yang ditemukan
antara variabel utama. Langkah 3: Kemungkinan memiliki efek kecuali
dikendalikan: rendah.
2. Karakteristik kolektor data. Langkah 1: Karakteristik kolektor data
mungkin terkait dengan peringkat pekerjaan karena interaksi antara
pengumpul data dan supervisor merupakan bagian penting dari penelitian
ini. Langkah 2: Karakteristik kolektor data mungkin tidak terkait dengan
pengamatan keterampilan sosial mereka; Namun, untuk berada di sisi yang
aman, kemungkinan ini harus dikontrol dengan memiliki pengumpul data
yang sama mengamati semua subjek. Langkah 3: Kemungkinan memiliki
efek kecuali dikendalikan: moderat.
3. Data kolektor bias. Langkah 1: Peringkat keberhasilan pekerjaan tidak
boleh menjadi subjek bias kolektor data, karena supervisor yang berbeda
akan menilai setiap subjek. Langkah 2: Pengamatan keterampilan sosial
mungkin terkait dengan prakiraan pengamat tentang subjek, terutama jika
mereka memiliki pengetahuan sebelumnya tentang peringkat keberhasilan
kerja. Oleh karena itu, pengamat seharusnya tidak mengetahui peringkat
pekerjaan. Langkah 3: Kemungkinan memiliki efek kecuali dikendalikan:
tinggi.
 Pengujian. Langkah 1: Dalam contoh ini, kinerja instrumen pertama yang
diberikan tentu saja tidak dapat dipengaruhi oleh kinerja pada yang kedua.
Langkah 2: Dalam penelitian ini, skor pada instrumen kedua tidak dapat
dipengaruhi oleh kinerja pada tahap pertama, karena subjek tidak menyadari
kinerjanya pada instrumen pertama. Langkah 3: Kemungkinan memiliki efek
kecuali dikendalikan: nol.
BAB III
PENUTUP

A. Kesimpulan
Penelitian eksperimental adalah satu-satunya jenis penelitian yang secara
langsung berupaya mempengaruhi variabel tertentu, dan bila diterapkan dengan
benar, ini adalah tipe penelitian terbaik untuk pengujian hipotesis tentang
hubungan sebab-akibat.
Karakteristik penting dalam penelitian eksperimental diantaranya ::
1) perbandingan kelompok : melakukan perlakuan terhadap dua kelompok yaitu
eksperimen dan kontrol dengan menggunakan metode yang berbeda, untuk
mengetahui metode manakah yang cocok digunakan agar memperoleh tujuan
yang diharapkan.
2) memanipulasi variable independen : sengaja dan langsung menentukan apa
bentuk variabel independen yang akan diambil dan kemudian kelompok mana
yang akan mendapatkan formulir yang telah ditentukan
3) pengacakan : pengambilan sampel dilakukan secara acak.
Cara menghilangkan ancaman karena karakteristik subjek : pengacakan,
memegang variable konstan tertentu, membangun variable ke dalam design,
sesuai, menggunakan subyek sebagai kontrol, menggunakan analisis kovarian.
Desain eksperimental ilmiah diantaranya: studi kasus satu tembakan, desain satu
grup pretest-posttest, desain perbandingan kelompok statis, desain kelompok
pretest-posttest kelompok statis,
Desain quasi-eksperimental tidak termasuk penggunaan tugas acak, peneliti yang
menggunakan desain ini sebaliknya mengandalkan teknik lain untuk mengontrol
(atau di paling tidak mengurangi) ancaman terhadap validitas internal.

Penelitian Single-Subject merupakan penelitian yang melibatkan


pengumpulan data yang luas pada satu subjek dalam kurun waktu tertentu. Desain
single-subject ini paling sering digunakan untuk mempelajari perubahan perilaku
pameran individu setelah mendapatkan perlakuan atau intervensi dari beberapa
jenis.
Peneliti single-subject menggunakan grafik garis untuk menyajikan data dan
untuk menggambarkan efek dari intervensi atau perlakuan tertentu.
Jenis-jenis grafik desain single-subject antara lain: Design A-B, Desain A-B-A,
Desain A-B-A-B, Desain B-A-B, Desain A-B-C-D, dan Desain Multi-baseline.
Ada beberapa ancaman terhadap validitas internal yang berkaitan dengan desain
single-subject. Ini termasuk panjang baseline dan intervensi/perlakuan, jumlah
variabel berubah ketika berpindah dari satu kondisi ke kondisi lain.
Keunggulan desain single-subject antara lain: efektif dalam mengendalikan
karakteristik subjek, ancaman kematian, pengujian, dan riwayat. Sedangkan
kelemahannya, desain single-subject kurang efektif dengan lokasi, karakteristik
pengumpul data, pematangan, dan ancaman regresi dan lemah dalam hal
peluruhan instrumen, bias pengumpul data, sikap, dan ancaman implementasi
serta lemah dalam hal generalisasi.

Karakteristik utama dari penelitian korelasional adalah mencari asosiasi


antara variabel. Studi korelasional dilakukan untuk membantu menjelaskan
perilaku manusia yang penting atau untuk memprediksi kemungkinan hasil.
Variabel yang digunakan untuk membuat prediksi disebut variabel prediktor.
Sedangkan variabel tentang bagaimana prediksi dibuat disebut variabel kriteria.
Teknik-teknik korelasi yang kompleks antara lain: Regresi berganda, Koefisien
korelasi berganda (R), Analisis faktor, Analisis Jalur dan lain-lain.
Ancaman terhadap validitas internal studi korelasional mencakup karakteristik
subjek, lokasi, kerusakan instrumen, pengumpulan data, pengujian, dan kematian.

B. Saran
Penulis menyadari tidak menutup kemungkinan adanya kekurangan dalam
penulisan makalah ini. Oleh karena itu, pembaca diharapkan dapat menanggapi
pembahasan yang dijelaskan dalam makalah. Kritik dan saran pembaca
diharapkan dapat menyempurnakan penulisan makalah dikemudian hari.
DAFTAR PUSTAKA

Fraenkel, Jack R. dan Norman E. Wallen. 1932. How to Design and Evaluate
Research in Education. New York: McGraw-Hill.

Kasiram, Moh. 2008. Metodologi Penelitian. Malang: UIN-Malang Pers.

Anda mungkin juga menyukai