Anda di halaman 1dari 11

Nama : Adi M Rahmawati

NIM : 7772180041

Pasca Teknologi Pembelajaran semester 3

1. bedakan antara evaluasi, tes, penilaian dan pengukuran?

Jawab :

perbedaan antara tes, pengukuran dan penilaian terletak pada waktu dan fungsinya. Tes digunakan
sebagai alat atau media untuk memperoleh informasi tentang orang lain. Pengukuran digunakan
untuk memberi angka pada karakteristik tertentu yang dimiliki oleh orang, hal, atau obyek yang
diambil dari sebuah tes. Sedangkan penilaian digunakan untuk mengambil keputusan berdasarkan
data-data yang diperoleh berdasarkan pengukuran sebelumnya.

Perbedaannya terletak pada ruang lingkup dan pelaksanaannya. Ruang lingkup penilaian lebih
sempit dan biasanya hanya terbatas pada salah satu komponen atau aspek saja, seperti prestasi
belajar. Pelaksanaan penilaian biasanya dilakukan dalam konteks internal. Ruang lingkup evaluasi
lebih luas, mencangkup semua komponen dalam suatu sistem dan dapat dilakukan tidak hanya pihak
internal tetapi juga pihak eksternal.Evaluasi dan penilaian lebih bersifat komprehensif yang meliputi
pengukuran, sedangkan tes merupakan salah satu alat (instrument) pengukuran. Pengukuran lebih
membatasi pada gambaran yang bersifat kuantitatif (angka-angka) tentang kemajuan belajar peserta
didik, sedangkan evaluasi dan penilaian lebih bersifat kualitatif. Keputusan penilaian tidak hanya
didasarkan pada hasil pengukuran, tetapi dapat pula didasarkan hasil pengamatan dan wawancara.

2. jenis validitas dan realibilitas? Validitas untuk proses riset dan alat ukurnya!

Jawab :

1) Jenis Validitas

Menurut Sudijono (2009) terdapat berbagai jenis validitas, berikut ini jenis validitas ditinjau dari
pengujiannya validitasnya yaitu pengujian validitas secara rasional dan secara konten. Penhelasan
untuk masing masing validititas itu adalah sebagai berikut:

Pengujian Validitas Tes Secara Rasional

Validitas rasional adalah validitas yang diperoleh atas dasar hasil pemikiran, validitas yang diperoleh
dengan berpikir secara logis.

a. Validitas Isi (Content Validity)

Valditas isi berkaitan dengan kemampuan suatu instrumen mengukur isi (konsep) yang harus diukur.
Ini berarti bahwa suatu alat ukur mampu mengungkap isi suatu konsep atau variabel yang hendak
diukur.

Validitas isi dari suatu tes hasil belajar adalah validitas yang diperoleh setelah dilakukan
penganalisisan, penelususran atau pengujian terhadap isi yang terkandung dalam tes hasil belajar
tersebut. Validitas isi adalah yang ditilik dari segi isi tes itu sendiri sebagai alat pengukur hasil belajar
yaitu: sejauh mana tes hasil belajar sebagai alat pengukur hasil belajar peserta didik, isisnya telah
dapat mewakili secara representatif terhadap keseluruhan materi atau bahkan pelajaran yang
seharusnya diteskan (diujikan).

Misalnya test bidang studi IPS, harus mampu mengungkap isi bidang studi tersebut, pengukuran
motivasi harus mampu mengukur seluruh aspek yang berkaitan dengan konsep motivasi, dan
demikian juga untuk hal-hal lainnya. Menurut Kenneth Hopkin penentuan validitas isi terutama
berkaitan dengan proses analisis logis, dengan dasar ini Dia berpendapat bahwa validitas isi berbeda
dengan validitas rupa yang kurang menggunakan analisis logis yang sistematis, lebih lanjut dia
menyatakan bahwa sebuah instrumen yang punya validitas isi biasanya juga mempunyai validitas
rupa, sedang keadaan sebaliknya belum tentu benar.

b. Validitas konstruksi (Construct Validity)

Konstruk adalah kerangka dari suatu konsep, validitas konstruk adalah validitas yang berkaitan
dengan kesanggupan suatu alat ukur dalam mengukur pengertian suatu konsep yang diukurnya.
Menurut Jack R. Fraenkel validasi konstruk (penentuan validitas konstruk) merupakan yang terluas
cakupannya dibanding dengan validasi lainnya, karena melibatkan banyak prosedur termasuk
validasi isi dan validasi kriteria.

Validitas konstruksi juga dapat diartikan sebagai validitas yang ditilik dari segi susunan, kerangka
atau rekaannya. Adapun secara terminologis, suatu tes hasil belajar dapat dinyatakan sebagai tes
yang telah memiliki validitas konstruksi, apabila tes hasil belajar tersebut telalh dapat dengan secara
tepat mencerminkan suatu konstruksi dalam teori psikologis.

Pengujian Validitas Tes Secara Empirik

Validitas empirik adalah ketepatan mengukur yang didasarkan pada hasil analisis yang bersifat
empirik. Dengan kata lain, validitas empirik adalah validitas yang bersumber pada atau diperoleh
atas dasar pengamatan di lapangan.

a. Validitas ramalan (Predictive validity)

Validitas ramalan adalah suatu kondisi yang menunjukkan seberapa jauhkah sebuah tes telah dapat
dengan secara tepat menunjukkan kemampuannya untuk meramalkan apa yang bakal terjadi pada
masa mendatang. Contohnya apakah test masuk sekolah mempunyai validitas ramalan atau tidak
ditentukan oleh kenyataan apakah terdapat korelasi yang signifikan antara hasil test masuk dengan
prestasi belajar sesudah menjadi siswa, bila ada, berarti test tersebut mempunyai validitas ramalan.

b. Validitas bandingan (Concurrent Validity)

Tes sebagai alat pengukur dapat dikatakan telah memiliki validitas bandingan apabila tes tersebut
dalam kurun waktu yang sama dengan secara tepat mampu menunjukkan adanya hubungan yang
searah, antara tes pertama dengan tes berikutnya.

2) . Jenis-jenis Reliabilitas

1. Reliabiltas Tes Berulang (Test-retest reliability) Reliabiltas tes berulang adalah ukuran reliabilitas
yang diperoleh dengan pemberian dua kali tes yang sama selama periode waktu tertentu untuk
sekelompok individu. Contoh: Sebuah tes bahasa diberikan kepada siswa. Satu bulan kemudian tes
yang sama diberikan pada siswa yang sama. Jika skor keduanya menghasilkan koefisien korelasi
tinggi maka tes tersebut memiliki reliabilitas tinggi.
2. Reliabilitas Antar Penilai (Inter-rater atau Inter-observer Reliability) Reliabilitas antar penilai
adalah ukuran reliabilitas berdasarkan konsistensi penilaian dua responden berbeda terhadap suatu
konstruk, karena belum tentu pengamat manusia menafsirkan jawaban dengan cara yang sama.
Contoh: Peneliti meminta tanggapan dua hakim berbeda untuk memutuskan kasus yang sama. Jika
kedua hakim memberi tanggapan yang seragam maka instrumen dinyatakan reliabel.

3. Reliabilitas Konsistensi Internal (Internal consistency reliability) Reliabilitas konsistensi internal


adalah ukuran reliabilitas berdasarkan evaluasi item-item tes terhadap konstruk yang sama. Ada dua
jenis untuk reliabilitas ini yaitu:

o Rata-rata Korelasi Antar Item (Average inter-item correlation) Rata-rata korelasi antar item
diperoleh dengan mengambil semua item pada tes dan akhirnya menggunakan rata -rata semua
koefisien korelasi tersebut. Dengan kata lain instrumen dibelah sebanyak jumlah item kemudian
hasil koefisien korelasi digabung untuk mendapatkan rata-rata. Teknik ini populer dengan Alpha
Cronbach.

o Reliabilitas Belah Setengah (Split-half reliability) Reliabilitas belah setengah adalah teknik dengan
membelah item tes menjadi dua bagian untuk membentuk dua set item, kemudian skor total
masing-masing set item dikorelasikan. Jika koefisien korelasi tinggi maka reliabilitas tinggi.

3. bagaimana cara mengukur validitas dan reliabilitas?

Jawab :

1). Reliabilitas

Pengujian reliabilitas instrumen dapat dilakukan secara internal dan eksternal (Sugiyono,
2010). Secara internal, reliabilitas dapat diuji dengan menganalisis konsistensi butir-butir yang ada
pada instrumen dengan teknik internal consistency. Hal ini dilakukan dengan cara mengujicobakan
instrumen sekali saja, kemudian data yang diperoleh dianalisis dengan teknik belah dua dari
Spearman Brown (Split Half), KR-20, KR-21, dan Anova Hyot (Analisis Varians).

Secara eksternal, pengujian dapat dilakukan dengan cara berikut:

a. Test-retest. Pengujian test-retest dilakukan dengan cara mencobakan instrumen yang sama
beberapa kali pada responden yang sama, namun dilakukan dalam waktu yang berbeda. Reliabilitas
diukur dari koefisien korelasi antara percobaan pertama dengan yang berikutnya. Bila koefisien
korelasi positif dan signifikan maka instrumen tersebut sudah dinyatakan reliabel.

b. Equvalent. Pengujian dengan cara ini cukup dilakukan sekali, namun menggunakan dua
instrumen yang berbeda, pada responden yang sama, dan waktu yang sama. Reliabilitas dihitung
dengan cara mengkorelasikan antara data instrumen yang satu dengan data instrumen yang
dijadikan equivalent.

c. Gabungan. Pengujian dilakukan dengan cara mencobakan dua instrumen yang equivalent
beberapa kali kepada responden yang sama. Reliabilitas diukur dengan mengkorelasikan dua
instrumen, kemudian dikorelasikan pada pengujian kedua, dan selanjutnya dikorelasikan secara
silang.

Menurut Jacobs (1991), analisa reliabilitas dapat diukur dengan tiga cara yaitu BEST digitek test
scoring, Spearman Brown, dan Kuder-Richarson 20. Spearman Brown mengukur konsistensi
pengambilan aitem. Sedangkan KR-20 mengukur konsistensi jawaban terhadap semua aitem dan
menunjukkan dua sumber kesalahan, yaitu: pemilihan aitem dan heterogenitas dari sampel.
Reliabilitas juga dapat dijelaskan dengan standar eror pengukuran, yaitu memperkirakan seberapa
besar perubahan nilai individu ketika dilakukan pengulangan tes. Apabila reliabilitas nilai tes tinggi,
maka standar eror pengukuran tersebut rendah.

2). Validitas

Cara pengujian validitas sebagai berikut (Sugiyono, 2010):

a. Pengujian validitas konstruk

Pengujian validitas konstruk dapat menggunakan pendapat para ahli mengenai aspek yang akan
diukur. Kemudian dilakukan ujicoba instrumen pada sampel dari populasi yang akan digunakan.
Setelah data ditabulasikan, maka pengujian validitas konstruk dilakukan dengan analisis faktor, yaitu
dengan mengkorelasikan antar skor item instrumen dalam suatu faktor, dan mengkorelasikan skor
faktor dengan skor total. Pengujian validitas seluruh butir instrumen dalam satu variabel dapat juga
dilakukan dengan cara mencari daya pembeda skor tiap aitem dari kelompok yang memberikan
jawaban tinggi dan jawaban rendah. Pengujian analisis daya pembeda dapat menggunakan t-test.

b. Pengujian validitas isi

Untuk instrumen yang berbentuk tes, pengujian validitas isi dilakukan dengan membandingkan
antara isi instrumen dengan materi pelajaran yang telah diajarkan. Di sisi lain, pengujian validitas isi
dari instrumen yang akan mengukur efektivitas pelaksanaan program, dapat dilakukan dengan
membandingkan antara isi instrumen dengan isi atau rancangan yang telah ditetapkan. Untuk
menguji validitas butir-butir instrumen lebih lanjut, maka setelah dikonsultasikan kepada para ahli,
selanjutnya diujicobakan, dan dilakukan analisis aitem atau uji beda.

c. Pengujian validitas eksternal

Penngujian ini dilakukan dengan cara membandingkan (untuk mencari kesamaan) antara kriteria
yang ada pada instrumen dengan fakta-fakta empiris yang terjadi di lapangan. Bila terdapat
kesamaan, maka dapat dinyatakan instrumen tersebut memiliki validitas eksternal yang tinggi.

4. how to develop? Bagaimana mengembangkan validitas san reliabilitas?

Jawab :

Cara meningkatkan atau mengembangkan validitas dan reliabilitas

1. Mencatat bebas hal-hal penting serinci mungkin (setting,partisipan ataupun hal-hal terkait).

2. Mendokumentasikan secara lengkap dan rapi data yang terkumpul, proses pengumpulan data
maupun strategi analisisnya.

3. Menyertakan partner saat observasi untkmenghindari subyektifitas

4. Melakukan pengecekan dan pengecekan kembalidata,menguji kemungkinan dugaan-dugaan yg


berbeda.

Cara meningkatkan reliabilitas

1. Mengonsep satu variabel dengan jelas.


2. Setiap pengukuran harus merujuk pada satu dan hanya satu konsep/variabel. Sebuah variabel
harus spesifik agar dapat mengurangi intervensi informasi dari variabel lain.

3. Menggunakan level pengukuran yang tepat. Semakin tinggi atau semakin tepat suatu level
pengukuran, maka variabel yang dibuat akan semakin reliabel karena informasi yang dimiliki
semakin mendetail. Prinsip dasarnya adalah cobalah melakukan pengukuran pada level paling tepat
yang mungkin diperoleh.

4. Gunakan lebih dari satu indikator. Dengan adanya lebih dari satu indikator yang spesifik, peneliti
dapat melakukan pengukuran dari range yang lebih luas terhadap konten definisi konseptual.

5. Gunakan Tes Pilot, yakni dengan membuat satu atau lebih draft atau dalam sebuah pengukuran
sebelum menuju ke tahap hipotesis (pretest). Dalam penggunaan Pilot Studies, prinsipnya adalah
mereplikasi pengukuran yang pernah dilakukan oleh peneliti terdahulu dari literatur-literatur yang
berkaitan. Selanjutnya , pengukuran terdahulu dapat dipergunakan sebagai patokan dari
pengukuran yang dilakukan peneliti saat ini. Kualitas pengukuran dapat ditingkatkan dengan
berbagai cara sejauh definisi dan pemahaman yang digunakan oleh peneliti kemudian tetap sama.

5. dalam melaksanakan evaluasi pembelajaran, seorang evaluator harus memperhatikan prinsip


prinsip evaluasi pembelajaran. Coba anda jelaskan apa saja yang termasuk ke dalam prinsip prinsip
evaluasi pembelajaran!

Jawab :

Prinsip-prinsip Evaluasi

Evaluasi adalah suatu proses, yakni proses menentukan sampai berapa jauh kemampuan yang dapat
dicapai oleh siswa dalam proses belajar mengajar. Kemampuan yang diharapkan tersebut
sebelumnya sudah ditetapkan secara operational. Selanjutnya juga ditetapkan patokan pengukuran
hingga dapat diperoleh penilaian (value judgement), Karena itu dalam evaluasi diperlukan prinsip-
prinsip sebagai petunjuk agar dalam pelaksanaan evaluasi dapat lebih efektif. Prinsip-prinsip itu
antara lain:

1. Valid

Evaluasi pembelajaran harus dapat memberikan informasi yang akurat tentang proses dan hasil
belajar peserta didik. Tepat tidaknya hasil evaluasi ini antara lain dipengaruhi oleh penggunaan
teknik dan instrument evaluasi. Maka seorang evaluator perlu memperhatikan teknik dan
instrument yang akan digunakan agar sesuai dengan kemampuan atau jenis hasil belajar yang akan
di evaluasi. Misalnya, jika yang akan diukur adalah hasil belajar kognitif, maka teknik dan instrument
yang digunakan yang betul-betul cocok untuk mengukur hasil belajar kognitif tersebut, bukan yang
sebenarnya cocok untuk mengukur hasil belajar psikomotor atau afektif.

2. Berorientasi pada kompetensi

Penilaian kelas perlu disusun dan dirancang untuk mengukur apakah siswa telah menguasai
kemampuan sesuai dengan target yang ditetapkan dalam kurikulum. Materi yang dicakup dalam
penilaian kelas harus terkait secara langsung dengan indikator pencapaian kemampuan tersebut.
Ruang lingkup materi penilaian disesuaikan dengan tahapan materi yang telah diajarkan serta
pengalaman belajar siswa yang diberikan. Materi penugasan atau ulangan harus betul-betul
merefleksikan setiap kemampuan yang ditargetkan untuk dikuasai siswa. Materi yang tidak langsung
terkait dengan kemampuan tidak perlu dicakup dalam penilaian di kelas. Namun demikian, guru
tetap dapat mencatat hal-hal tersebut sebagai bahan dalam melakukan analisis dan umpan balik
hasil penilaian.

3. Mendidik

Di samping sebagai alat penilai hasil belajar, evaluasi juga perlu diterapkan sebagai upaya perbaikan
sikap dan tingkah laku di tinjau dari segi pedagogis. Karena evaluasi dan hasilnya diharapkan dapat
dipakai sebagai alat motivasi untuk siswa dalam kegiatan belajar.[1]

4. Adil dan objektif

Dalam melaksanakan evaluasi guru harus berlaku adil dan tanpa pilih kasih kepada semua peserta
didik. Guru juga hendaknya bertindak secara obyektif, apa adanya sesuai dengan kemampuan
peserta didik.[2]

5. Terbuka

Terbuka prosedur penilaian, kriteria penilaian, dan dasar pengambilan keputusan dapat diketahui
oleh pihak yang berkepentingan.

6. Berkesinambungan

Prinsip kesenambungan juga dikenal dengan istilah prinsip kontinuitas. Dengan prinsip
kesenambungan dimaksudkan disini bahwa evaluasi hasil belajar yang dilaksanakan secara teratur,
dan sambung menyambung dari waktu ke waktu. Dengan evaluasi hasil belajar yang di laksanakan
secara teratur, terencana, dan terjadwal itu maka dimungkinkan bagi evaluator untuk memperoleh
informasi yang dapat memberikan gambaran mengenai kemajuan atau perkembangan peserta didik,
sejak dari awal mulai mengikuti program pendidikan sampai pada saat-saat mereka mengakhiri
program pendidikan yang mereka tempuh itu. Evaluasi hasil belajar yang di laksanakan secara
berkesinambungan itu juga di maksudkan agar pihak evaluator (guru, dosen dan lain-lain) dapat
memperoleh kepastian dan kemantapan dalam menentukan langkah-langkah atau kebijakan-
kebijakan yang akan di ambil untuk masa-masa selanjutnya agar tujuan pendidikan dapat tercapai
secara baik.

7. Keseluruhan

Prinsip keseluruhan atau prinsip menyeluruh juga di kenal dengan istilah prinsip Komprehensif.
Dengan prinsip komprehensif disebut disini bahwa evaluasi hasil belajar dapat dikatakan terlaksana
dengan baik, apabil aevaluasi tersebut dilaksanakan secara bulat utuh dan menyeluruh. Dengan
kata lain evaluasi hasil belajar harus dapat mencangkup berbagai aspek yang dapat mengambarkan
perkembangan atau perubahan tingkah laku yang terdiri pada diri peserta didik. Dalam hubungan ini
evaluasi hasil belajar disamping dapat mengungkap aspek proses berpikir, (Kognitif Domain) juga
dapat mengungkapkan aspek kejiwaan lainnya, yaitu aspek nilai atau sikap (Physycimotor Domain)
yang melekat pada diri masing-masing individu peserta didik. Jika dikaitkan dengan proses
pembelajaran Pendidikan Agama Islam, maka evaluasi hasil belajar dalam mata pelajaran
Pendidikan Agama Islam hendaknya bukanhanya mengungkap pemahaman peserta didik terhadap
ajaran-ajaran agama islam, melainkan juga harus dapat mengungkap, sejauh mana peserta didik
dapat menghayati dan mengamalkan ajaran-ajaran islam tersebut dalam kehidupan mereka sehari-
hari.[3]

8. Bermakna
Hasil penilaian harus bermakna bagi guru, orangtua, anak didik dan pihak-pihak lain yang
membutuhkan untuk meningkatkan pertumbuhan dan perkembangan anak.

6. langkah langkah pengembangan instrument?

Jawab :

1. Pengembangan Spesifikikasi Instrumen

Spesifikasi instrumen adalah rancangan pokok (grand design) instrumen. Segala kegiatan dalam
pengembangan instrumen dilakukan berdasar atas spesifikasi itu. Karena itu spesifikasi ini harus
digarap secara hati-hati. Spesifikasi itu harus memuat secara lengkap semua hal yang harus
dilakukan, dan masing-masing harus disajikan secara spesifik. Hal-hal yang perlu dimuat dalam
spesifikasi itu adalah (a) wilayah yang direkam, (b) dasar konseptual atau dasar teoretis yang akan
dipakai sebagai landasan, (c) subjek yang akan diambil datanya, (d) tujuan pengambilan data, (e)
materi instrumen, (f) tipe butir pertanyaan atau pernyataan, (g) jumlah butir pertanyaan atau
pernyataan, (h) kriteria seleksi butir pertanyaan atau perrnyataan yang dianggap baik.

2. Penulisan Butir-butir Pertanyaan atau Pernyataan

Kemampuan untuk menulis pertanyaan atau pernyataan adalah perpaduan atara kiat dan hasil
latihan. Banyak buku-buku yang menyajikan cara-cara untuk menulis butir pertanyaanatau
pernyataan. Kaidah-kaidahnya dapat ditemukan dalam buku-buku tersebut yang antara lain juga
terdapat pada Daftar Pustaka buku ini. Di antara instrumen pengumpul data untuk atribut kognitif
yang paling popular dan karenanya juga paling banyak dipakai adalah tes pilihan ganda dengan lima
kemungkinan jawaban. Untuk atribut non kognitif, instrumen yang paling populer dan relatif paling
banyak digunakan adalah skala model Likert. Kedua model instrumen itu akan menghasilkan data
interval yaitu data yang paling diminati oleh para peneliti karena data interval memungkinkan
penggunaan Statistika Parametrik.

3. Telaah dan Revisi Butir-butir Pertanyaan atau Pernyataan

Butir-butir pertanyaan atau pernyataan itu harus ditelaah secara cermat apakah sudah sesuai
dengan yang dirancangkan, dan apakah perlu direvisi. Rujukan pokok dalam telaah ini adalah
spesifikasi instrumen. Telaah dan revisi butir-butir pertanyaan atau penyataan ini sebaiknya
dilakukan oleh suatu team, akan lebih bagus kalau diselenggarakan dalam semacam seminar, agar
butir-butir pertanyaan atau pernyataan itu dapat dicermati dari berbagai aspeknya. Aspek-aspek
utama yang perrlu dicermati adalah (a) kesesuaian dengan spesifikiasi, (b) kesesuaian dengan
landasan teoretis, (c) kesesuaian dengan format dilihat dari sudut ilmu pengukuran, (d) ketepatan
bahasa yang digunakan, dilihat dari sudut bahasa baku dan subjek yang memberikan response.

Guna memudahkan pekerjaan para penelaah, sebaiknya dibuatkan semacam daftar cek. Untuk
instrumen pengambil data kogintif, misalnya daftar cek itu adalah sebagai berikut.

Pastikan bahwa:

1. Kunci jawaban jelas-jelas benar,

2. Setiap alternative lainnya jelas salah,

3. Pertanyaan sesuai dengan indikatornya,


4. Pertanyaan memiliki tingkat kesulitan yang sesuai,

5. Konsep atau proses yang direkam jelas,

6. Istilah dan situasi dalam pertanyaan terdefinisi dengan jelas,

7. Para respponden mampu memahami apa yang diharapkan mereka lakukan,

8. Pertanyaan ditulis dalam bahasa dan ejaan yang benar,

9. Struktur tata bahasa untuk semua alternative jawaban konsisten dan sesuai,

10. Tidak ada pentujuk tentang jawaban yang benar.

4. Perakitan Butir-butir Pertanyaan atau pernyataan ke dalam Perangkat Instrumen

Butir-butir pertanyaan atau pernyataan itu harus dirakit menjadi satu instrumen yang siap untuk
diujicobakan. Hal penting yang harus selalu diingat adalah bahwa response terhadap sesuatu
petanyaan tidak boleh mempengaruhi response terhadap pertanyaan lain, karena secara teori
masing-masing pertanyaan itu bebas satu sama lain. Dalam perakitan ini sekaligus dirumuskan
petunjuk bagaiman caranya eresponse kepada pertanyaan-pertanyaan itu. Instrumen yagn telah
dirakit itu kemudian dicetak dan siap untuk duji cobakan.

5. Uji coba Instrumen

Uji coba merupakan langkah yang sangat penting dalam proses pengembangan instrument, karena
dari uij coba inilah diketahui informasi mengenai mutu instrumen yang dikembangkan itu. Syarat
utam uji coba adalah bahwa karakteristik subjek uji coba harus sama dengan karakteristik subjek
penelitian. Selain itu kondisi uji-coba (misalnya waktu, alat-alat yang dipakai, cara
penyelenggaraaan) juga harus sama dengan kondisi penelitian yang sebenarnya. Agar syarat-syarat
tersebut dapat terpenuhi maka uji coba instrumen itu harus dipersiapkan secara matang dan
dilaksanakan secara professional.

6. Analisis Hasil Uji Coba

Hasil uji coba itu lalu dianalisis. Butir demi butir pertanyaan-pertanyaan atau pernyataan-pernyataan
itu diteliti kualitasnya. Karena itu analisis ini pada umumnya lalu disebut analisis butir (item analysis).
Walaupun pada dasarnya polanya sama, namun analisis butir-butir pertanyaan (untuk atribut
kognitif) dan analisis butir-butir pertanyaan (untuk atribut non kognitif) mengandung perbedaan.
Perbedaan itu akan nyata dari uraian berikut.

a. Analisis Butir Pertanyaan

Dalam analisis butir-butir pertanyaan (untuk atribut kognitif) dicari informasi mengenai hal-hal
berikut ini.

(1) Distribusi response,

(2) Taraf kesukaran, dan

(3) Daya beda.


Distribusi response diperlukan untuk mengetahui efektif tidaknya alternative-alternatif pengecoh.
Taraf kesukaran butir soal diperlukan untuk mengetahui apakah taraf kesukaran butir soal sesuai
dengan yang telah direncanakan dalam spesifikasi instrumen. Taraf kesukaran ini biasanya
dilambangkan dengan hard p (proporsi yang menjawan benar). Daya beda soal diperlukan untuk
mengetahui seberapa akurat butir pertanyaan itu membedakan subjek yang lebih mampu dari
subjek yang kurang mampu. Daya beda ini biasa dihitung dengan mencari korelasi antara skor pada
butir itu dengan skor total (item total correlation rit). Teknik yang paling sesuai dengan sifat datanya
adalah korelasi biserial (biserial correlation, rbis)

Untuk melakukan analisis butir-butir pertanyaan ini telah tersedia berbagai program computer.
Program yang banyak digunakan adalah SPSS, atau yang lebih khusus I TEMAN.

b. Analisis Butir-butir Pernyaaan

Dalam analisis butir-butir pernyataan (misalnya skala model Likert) dicari informasi mengenai (1)
diatribusi response dan (2) daya beda butir pernyataan.

Dalam menganalisis butir-butir pernyataan ini dicari informasi apakah butir-butir pernyataan yang
dianalisis itu merupakan butir pernyataan yang baik. Butir pernyataan yang baik cirinya adalah (1)
semua kemungkinan jawaban terisi dan (2) distribusinya bermodus tunggal (uni modal).

7. Penentuan Perangkat Akhir Instrumen

Berdasar hasil analisis butir-butir pertanyaan atau pernyataan itu dipilih butir-butir pertanyaan atau
pernyataan yang baik sesuai dengan spesifikasi. Untuk butir-butir pertanyaan dipilih butir-butir yang
mempunyai harga p pada sebaran tertentu (misalnya dari 0,25 sampai 0,75 atau dari 0,20sampai
0,80) sesuai spesifikasi dan yang mempunyai harga rbis tertentu (misalnya sekurang-kurangnya 0,30
atau sekurang-kurangnya 0,25 atau sekurang-kurangnya 0,20). Butir-butir pertanyaan yang
memenuhi kedua kriteria itu dipilih sebagai butir-butir pertanyaan yang baik lalu dirakit menjadi
perangkat akhir instrument yang akan digunakan dalam penelitan.

Untuk butir-butir pertanyaan dipilih butir-butir yang memenuhi syarat berdasar distribusi response
dan yang mempunyai harga t signifikan (berdasar uji t satu ujung). Butir-butir pernyataan yang
memenuhi kedua kriteria itu dipilih sebagai butir-butir pernyataan yang baik dan dirakit menjadi
perangkat akhir instrumen yang akan digunakan dalam penelitian.

8. Pengujian Reliabilitas Instrumen

Reliabilitas instrumen merujuk kepada konsistensi hasil perekaman data (pengukuran) kalau
instrumen itu digunakan oleh orang atau kelompok orang yang sama dalam waktu berlainan atau
kalau instrumen itu digunakan oleh orang atau kelompok orang yang berbeda dalam waktu yang
sama atau dalam waktu yang berlainan. Karena hasilnya yang konsisten itu, maka instrumen itu
dapat dipercaya (reliable) atau dapat diandalkan (dependeable). Secara psikometris diteorikan,
reliabilitas sestau instrumen adalah proporsi variansi skor perolehan yang merupakan variansi skor
murni.

Ada tiga cara untuk mengestimasi reliabilitas instrumen itu yaitu:

a. Metode uji ulang (test-retest method)

b. Metode bentuk parallel (paralled form method), dan


c. Metode pengujian satu kali (single trial method)

Pada metode uji ulang seperangkat instrumen diberikan kepada sekelompok subjek dua kali, dengan
selang waktu tertentu (misalnya dua minggu atau tiga minggu). Lalu skor pada perekaman data yang
pertama dan skor pada perekaman data yang kedua itu dikorelasikan. Angka korelasi itulah yang
merupakan koefisien reiabilitas, rtt = rI II

Pada metode bentuk parallel disusun dua perangkat instrumen yang paralel (kembar), misalnya
perangkat A dan perangkat B. Kedua perangkat instrumen itu diberikan kepada satu kelompok
subjek dalam waktu beruntutan, atau dengan selang waktu sedikit skor pada perangkat A
dikorelasikan dengan skor pada perangkat B. koefisien korelasi itulah yang merupakan koefisien
reliabilitas, rtt = rAB

Kedua metode itu mengandung keterbatasan atau kesulitan, oleh karena itu di dalam praktek jarang
peneliti menggunakan kedua metode itu. Para peneliti pada umumnya memilih menggunakan
metode pengujian satu kali. Dalam metode pengujian satu kali seperangkat instrumen diberikan
kepada sekelompok subjek satu kali, lalu dengan cara tertentu diestimasi reliabilitas instrumen
tersebut. Sampai sekarang ada tujuh macam cara yang telah diusulkan oleh para ahli yaitu:

(1) Metode belah dua (split half method),

(2) Metode Rulon,

(3) Metode Flanagan,

(4) Metode KR20,

(5) Metode KR21,

(6) Metode analisis variansi (metode Hoyt), dan

(7) Metode alpha (Cronbach).

Terkecuali metode belah dua, keenam metode yang lain itu berdasarkan teori bahwa koefisien
reliabilitas sama dengan 1 dikurangi variansi kesalahan pengukuran dibagi variasni total (skor
perolehan).

Walaupun koefisiensi reliabilitas itu wujudnya adalah koefisien korelasi (karena memang diteorikan
berasal dari korelasi antara dua tes parallel), tetapi dalam menginterpretasikannya tidak didasarkan
harga kritis r dalam tabel korelasi, melainkan ditafsirkan berdasar galat baku pengukuran (strandart
error of measurement).

Dari bermacam-macam teknik untuk mengestimasi reliabilitas instrument itu aman yang terbaik,
tidak ada kesepakatan penuh diantara para ahli. Dalam praktek yang terjadi adalah semacam
“kesukaan”, yang terkait dengan pengalaman pribadi dan tersedianya program computer. Yang
pokok adalah si peneliti harus melaporkan menggunakan teknik mana dan hasilnya berapa, lalu
interpretasinya bagaimana.

9. Pengujian Validitas Instrumen

Validitas instrument didefinisikan “sejauh mana isntrumen itu merekam/mengukur apa yang
dimaksudkan untuk direkam/diukur”. Ada tiga landasan untuk melihat sejauh mana itu yaitu (a)
didasarkan pada isinya, (b) didasarkan pada kesesuaiannya dengan constructnya dan (c) didasarkan
pada keseseuaiannya dengan kriterianya yaitu instrument yang lain yang dimaksud untuk
merekam/mengukur hal yang sama. Jadi secara teori ada tiga macam validitas diatas berdasar
kriteria. Secara ideal setiap isntrumen pengumpul data penelitian harus memiliki ketiga macam
validitas itu. Akan tetapi seringkali keadaan ideal itu belum tentu tercapai, tetapi adalah merupakan
kewajiban akademik setiap peneiliti untuk berupaya menegakkan validitas instrument pengumpul
datanya, karena seperti telah disebutkan di muka, kualitas isntrumen ini akan sangat menentukan
validitas internal penelitian yang dilakukan.

a. Menegakkan Validitas Isi

Validitas isi ditegakkan pada langkah telaah dan revisi butir pertanyaan/butir pernyataan,
berdasarkan pendapat prosefional (professional judgement) para penelaah. Validitas isi secara
relative lebih mudah ditegakkan dibandign kedua macam validitas yang lainnya. Sebagai
pertanggungjawaban akademik, peneliti wajib menginformasikan secara lengkap proses penegakan
validitas isi ini termasuk daftar cek yang digunakan dalam proses validasi serta nama-nama peserta
dalam proses itu beserta kualifikasi akademiknya (daftar nama sebaiknya disajikan dalam Lampiran).

b. Menegakkan Validitas Construct

Sampai sekarang ada dua cara yang telah diusulkan untuk menegakkan validitas rekaan teoretis
yaitu (a) discriminant validation melalui multi trait-multi method dan (b) analisis faktor. Teknik multi
trait-multi method boleh dikatakan relative baru, dan belum banyak digunakan terutama karena
beban kerjanya yang tinggi. Peneliti harus menyiapkan lebih dari satu instrument untuk
merekam/mengukur lebih dari satu sifat. Dasar pikiran penerapan cara ini adalah hal-hal yang secara
teori berdekatan harus tinggi korelasinya.

Anda mungkin juga menyukai