Benar

VALIDITAS DAN REALIBILITAS
Keberhasilan mengungkapkan hasil dan proses belajar siswa sebagaimana adanya

(objektivitas hasil penilaian) sangat bergantung pada kualitas alat penilaiannya di samping pada
cara pelaksanaannya.
Suatu alat penilaian dikatakan mempunyai kualitas yang baik apabila alat tersebut memiliki
atau memenuhi dua hal, yakni ketepatan atau validitasnya dan ketetapan atau keajegannya atau
reliabilitasnya.
1. Validitas
Validitas berkenaan dengan ketetapan alat penilaian terhadap konsep yang dinilai sehingga
betul-betul menilai apa yang yang seharusnya dinilai. Sebagai contoh menilai kemampuan
siswa dalam matematika. Misalnya diberikan soal dengan kalimat yang panjang dan berbelit-
belit sehingga sukar ditangkap maknanya. Akhirnya siswa tidak dapat menjawab karena tidak
memahami pertanyaannya. Contoh lain adalah menilai kemampuan berbicara, tetapi ditanyakan
mengenai tata bahasa atau kesusastraan seperti puisi atau sajak. Penilaian tersebut tidak tepat
(valid). Validitas tidak berlaku universal sebab bergantung pada situasi dan tujuan penilaian.
Alat penilaian yang telah valid untuk suatu tujuan tertentu belum otomatis akan valid untuk
tujuan yang lain.
a. Macam-Macam Validitas
Di dalam buku Encyclopedia of Educational Evaliation yang ditulis oleh Scarvia B.
Anderson dan kawan-kawan disebutkan:
A test is valid if it measures what it purpose to measure. Atau jika diartikan lebih kurang
demikian: sebuah tes dikatakan valid apabila tes tersebut mengukur apa yang hendak diukur.
Dalam bahasa Indonesia valid disebut dengan istilah sahih.
Sebenarnya pembicaraan validitas ini bukan ditekankan pada tes itu sendiri tetapi pada
hasil pengetesan atau skornya.
Secara garis besar ada dua macam validitas, yaitu validitas logis dan validitas empiris.
1) Validitas Logis
Istilah validitas logis mengandung kata logis berasal dari kata logika atau validitas
logis sering juga disebut sebagai analisis kualitatif yaitu berupa penalaran atau penelaahan.
Dengan makna demikian maka validitas logis untuk sebuah instrumen yang memenuhi
persyaratan valid berdasarkan hasil penalaran. Kondisi valid tersebut dipandang terpenuhi
karena instrumen yang bersangkutan sudah dirancang secara baik, mengikuti teori dan
ketentuan yang ada. Sebagaimana pelaksanaan tugas lain misalnya membuat sebuah karangan,
jika penulisan sudah mengikuti aturan mengarang, tentu secara logis karangannya sudah baik.
Berdasarkan penjelasan tersebut maka instrumen yang sudah disusun berdasarkan teori
penyusunan instrumen, secara logis sudah valid. Dari penjelasan tersebut dapat dipahami
bahwa validitas logis dapat dicapai apabila instrumen disusun mengikuti ketentuan yang ada.
Dengan demikian, dapat disimpulkan bahwa validitas logis tidak perlu diuji kondisinya tetapi
langsung diperoleh sesudah instrumen tersebut selesai disusun.
Ada dua macam validitas logis yang dapat dicapai oleh sebuah instrumen, yaitu validitas
isi dan validitas konstrak (construct validity). Validitas isi bagi sebuah instrumen menunjuk
suatu kondisi sebuah instrumen yang disusun berdasarkan isi materi pelajaran yang dievaluasi.
Selanjutnya validitas konstrak sebuah instrumen menunjuk suatu kondisi sebuah instrumen
yang disusun berdasarkan konstrak aspek-aspek kejiwaan yang seharusnya dievaluasi.
Untuk menganalisis soal ditinjau dari segi teknis, isi, dan editorial. Analisis secara teknis
dimaksudkan sebagai penelaahan soal berdasarkan prinsip-prinsip pengukuran dan format
penulisan soal. Analisis secara isi dimaksudkan sebagai penelaahan khusus yang berkaitan
dengan kelayakan pengetahuan yang ditanyakan. Analisis secara editorial dimaksudkan sebagai
penelaahan yang khususnya berkaitan dengan keseluruhan format dan keajegan editorial dari
soal yang satu ke soal yang lainnya.
Analisis kualitatif lainnya dapat juga dikategorikan dari segi materi, konstruksi, dan
bahasa. Analisis materi dimaksudkan sebagai penelaahan yang berkaitan dengan substansi
keilmuan yang ditanyakan dalam soal serta tingkat kemampuan yang sesuai dengan soal.
Analisis konstruksi dimaksudkan sebagai penelaahan yang umumnya berkaitan dengan teknik
penulisan soal. Analisis bahasa dimaksudkan sebagai penelaahan soal yang berkaitan dengan
penggunaan bahasa Indonesia yang baik dan benar menurut EYD. Melalui analisis kualitatif
dapat diketahui berfungsi tidaknya sebuah soal.
2) Validitas Empiris
Istilah validitas empiris memuat kata empiris yang artinya pengalaman. Sebuah
instrumen dapat dikatakan memiliki validitas empiris apabila sudah diuji dari pengalaman.
Analisis soal secara kuantitatif menekankan pada analisis karakteristik internal tes melalui data
yang diperoleh secara empiris. Karakteristik internal secara kuantitatif dimaksudkan meliputi
parameter soal tingkat kesukaran, daya pembeda dan reliabilitas. Khusus soal-soal pilihan
ganda, dua tambahan parameter yaitu dilihat dari peluang untuk menebak atau menjawab soal
benar dan berfungsi tidaknya pilihan jawaban, yaitu penyebaran semua alternative jawaban dari
subyek-subyek yang dites. Salah satu tujuan dilakukannya analisis adalah untuk meningkatkan
kualitas soal, yaitu apakah suatu soal dapat diterima karena telah didukung oleh data statistik
yang memadai, diperbaiki karena terbukti terdapat beberapa kelemahan atau bahkan tidak
digunakan sama sekali karena terbukti secara empiris tidak berfungsi sama sekali.
Sebagai contoh sehari-hari, sesorang dapat diakui jujur oleh masyarakat apabila dalam
pengalaman dibuktikan bahwa orang tersebut memang jujur. Contoh lain, seseorang dapat
dikatakan kreatif apabila dari pengalaman dibuktikan bahwa orang tersebut sudah banyak
menghasilkan ide-ide baru yang diakui berbeda dari hal-hal yang sudah ada. Dari penjelasan
dan contoh-contoh tersebut diketahui bahwa validitas empiris tidak dapat diperoleh hanya
dengan menyusun instrumen berdasarkan ketentuan seperti halnya validitas logis, tetapi harus
dibuktikan melalui pengalaman.
Ada dua macam validitas empiris, yakni ada dua cara yang dapat dilakukan untuk menguji
bahwa sebuah instrumen memang valid. Pengujian tersebut dilakukan dengan membandingkan
kondisi instrumen yang bersangkutan dengan kriterium atau sebuah ukuran. Kriterium yang
digunakan sebagai pembanding kondisi instrumen dimaksud ada dua cara, yaitu yang sudah
tersedia dan yang belum ada tetapi akan terjadi di waktu yang akan datang. Bagi instrumen
yang kondisinya sesuai dengan kriterium yang sudah ada tersedia, yang sudah ada disebut
memiliki validitas ada sekarang, yang ada dalam istilah bahasa inggris disebut memiliki
concurrent validity. Selanjutnya instrumen yang kondisinya sesuai dengan kriterium yang
diramalkan akan terjadi, disebut memiliki validitas ramalan atau validitas prediksi, yang dalam
istilah bahasa inggris disebut memiliki predictive validity.
Ada empat jenis validitas yang sering digunakan, yakni:
a) Validitas isi (content validity)
Sebuah tes dikatakan memilki validitas isi apabila mengukur tujuan khusus tertentu yang
sejajar dengan materi atau isis pelajaran yang diberikan. Oleh karena materi yang diajarkan
tertera dalam kurikulum maka validitas isi ini sering juga disebut validitas kurikuler.
Validitas isi berkenaan dengan kesanggupan alat penilaian data mengukur isi yang
seharusnya. Artinya, tes tersebut mampu mengungkapkan isi suatu konsep atau variabel yang
hendak diukur. Misalnya tes hasil belajar bidang studi IPS harus bisa mengungkapkan isi
bidang studi tersebut. Hal ini bisa dilakukan dengan cara menyusun tes yang bersumber dari
kurikulum bidang studi yang hendak diukur. Disamping kurikulum dapat juga diperkaya
dengan melihat atau mengkaji buku sumber.
Tes hasil belajar tidak mungkin dapat mengungkapkan semua materi yang ada dalam
bidang studi tertentu sekalipun hanya untuk satu semester. Oleh sebab itu, harus diambil
sebagian dari materi dalam bentuk sampel tes. Sampel harus dapat mencerminkan materi yang
terkandung dalam sseluruh materi bidang studi. Cara yang ditempuh dalam menetapkan sampel
tes adalah memilih konsep-konsep materi yang esensial. Misalnya menetapkan sejumlah
konsep dari setiap pokok bahasan yang ada. Dari setiap konsep dikembangkan beberapa
pertanyaan tes. Disinilah pentingnya peranan kisi-kisi sebagai alat untuk memenuhi validitas
isi. Dalam hal tertentu untuk tes yang telah disusun sesuai dengan kurikulum (materi dan
tujuannya) agar memenuhi validitas isi, dapat pula dimintakan bantuan ahli bidang studi untuk
menelaah apakah konsep materi yang diajukan telah memadai atau tidak sebagai sampel tes.
Dengan demikian validitas isi tidak memerlukan uji coba dan analisis statistic atau dinyatakan
dalam bentuk angka-angka.
b) Validitas konstruksi (construct validity)
Sebuah tes dikatakan memiliki validitas konstruksi apabila butir-butir soal yang
membangun tes tersebut mengukur setiap aspek berfikir seperti yang disebutkan dalam tujuan
instruksional khusus. Dengan kata lain jika butir-butir soal mengukur aspek berfikir tersebut
sudah sesuai dengan aspek berfikir yang menjadi tujuan instruksional.
Sebagai contoh jika rumusan Tujuan Instruksional Khusus (TIK). Siswa dapat
membandingkan antara efek biologis dan efek psikologis, maka butir soal pada tes merupakan
perintah agar siswa membedakan anatar dua efek tersebut.
Konstruksi dalam pengertian ini bukanlah susunan seperti yang sering dijumpai dalam
teknik, tetapi merupakan rekaan psikologis yaitu suatu rekaan yang dibuat oleh para ahli ilmu
jiwa yang dengan suatu cara tertentu memerinci isi jiwa atas beberapa aspek seperti ingatan
(pengetahuan), pemahaman, aplikasi dan seterusnya. Dalam hal ini, mereka menganggap
seolah-olah jiwa dapat dibagi-bagi. Tetapi sebenarnya tidak demikian. Pembagian ini hanya
merupakan tindakan sementara untuk mempermudah mempelajari.
Seperti halnya validitas isi, validitas konstruksi dapat diketahui dengan cara memerinci dan
memasangkan setiap butir soal dengan setiap aspek dalam TIK. Pengerjaannya dilakukan
berdasarkan logika bukan pengalaman.
c) Validitas ada sekarang (concurrent validity)
Validitas ini lebih umum dikenal dengan validitas empiris. Sebuah tes dikatakan memiliki
validitas empiris jika hasilnya sesuai dengan pengalaman. Jika ada istilah sesuai tentu ada
dua hal yang dipasangkan. Dalam hal ini hasil tes dipasangkan dengan hasil pengalaman.
Pengalaman selalu mengenai hal yang telah lampau sehingga data pengalaman tersebut
sekarang sudah ada (ada sekarang, concurrent).
Dalam membandingkan hasil sebuah tes maka diperlukan suatu kriterium atau alat
banding. Maka hasil tes merupakan sesuatu yang dibandingkan. Untuk jelasnya di bawah ini
dikemukakan sebuah contoh.
Misalnya seorang guru ingin mengetahui apakah tes sumatif yang disusun sudah valid atau
belum. Untuk ini diperlukan sebuah kriterium masa lalu yang sekarang datanya dimiliki.
Misalnya nilai ulangan harian atau nilai ulangan sumatif yang lalu.
d) Validitas prediksi (predictive validity)
Memprediksi artinya meramal, dengan meramal selalu mengenai hal yang akan datang jadi
sekarang belum terjadi. Sebuah tes dikatakan memiliki validitas prediksi atau validitas ramalan
apabila mempunyai kemampuan untuk meramalkan apa yang akan terjadi pada masa yang akan
datang.
Misalnya tes masuk Perguruan Tinggi adalah sebuah tes yang diperkirakan mampu
meramalkan keberhasilan peserta tes dalam mengikuti kuliah di masa yang akan datang. Calon
yang tersaring berdasarkan hasil tes diharapkan mencerminkan tinggi-rendahnya kemampuan
mengikuti kuliah. Jika nilai tesnya tinggi tentu menjamin keberhasilannya kelak. Sebaliknya
seorang calon dikatakan tidak lulus tes karena memiliki nilai tes yang rendah jadi diperkirakan
akan tidak mampu menikuti perkuliahan yang akan datang.
Sebagai alat pembanding validitas prediksi adalah nilai-nilai yang diperoleh setelah peserta
tes mengikuti pelajaran di Perguruan Tinggi. Jika ternyata siapa yang memiliki nilai tes lebih
tinggi gagal dalam ujian semester 1 dibandingkan dengan yang dahulu nilai tesnya lebih rendah
maka tes masuk yang dimaksud tidak memiliki validitas prediksi.
b. Validitas Butir Soal atau Validitas Item
Apa yang sudah dibicarakan di atas adalah validitas soal secara keseluruhan tes. Di
samping mencari validitas soal perlu juga dicari validitas item. Jika seorang peneliti atau
seorang guru mengetahui bahwa validitas soal tes misalnya terlalu rendah atau rendah saja,
maka selanjutnya ingin mengetahui buti-butir tes manakah yang menyebabkan soal secara
keseluruhan tersebut jelek karena memiliki validitas rendah. Untuk keperluan inilah dicari
validitas butir soal.
Pengertian umum untuk validitas item adalah demikian sebuah item dikatakan valid
apabila mempunyai dukungan yang besar terhadap skor total. Skor pada item menyebabkan
skor total menjadi tinggi atau rendah. Dengan kata lain dapat dikemukakan di sini bahwa
sebuah item memiliki validitas yang tinggi jika skor pada item mempunyai kesejajaran dengan
skor total. Kesejajaran ini dapat diartikan dengan korelasi sehingga untuk mengetahui validitas
item digunakan rumus korelasi seperti sudah diterangkan di atas.
Untuk soal-soal bentuk objektif skor untuk item biasa diberikan dengan 1 (bagi item yang
dijawab benar) dan 0 (item yang dijawab salah), sedangkan skor total selanjutnya merupakan
dari skor untuk semua item yang membangun soal tersebut.
c. Tes Terstandar sebagai Kriterium dalam Menentukan Validitas
Tes terstandar adalah tes yang telah dicobakan berkali-kali sehingga dapat dijamin
kebaikannya. Di Negara-negara berkembang biasa tersedia tes semacam ini, dan dikenal
dengan nama standardized test. Sebuah tes terstandar biasanya memiliki identitas antara lain:
sudah dicobakan berapa kali dan di mana, berapa koefisien validitas, reliabilitas, taraf
kesukaran, daya pembeda dan lain-lain keterangan yang dianggap perlu.
Cara menentukan validitas soal yang menggunakan tes terstandar sebagai kriterium
dilakukan dengan mengalikan koefisien validitas yang diperoleh dengan koefisien validitas tes
terstandar tersebut.
d. Validitas Faktor
Selain validitas soal secara keseluruhan dan validitas butir atau item, masih ada lagi yang
perlu diketahui validitasnya, yaitu faktor-faktor atau bagian keseluruhan materi. Setiap
keseluruhan materi pelajaran terdiri dari pokok-pokok bahasan atau mungkin sekelompok
pokok bahasan yang merupakan satu kesatuan.
2. Reliabilitas
a. Arti Reliabilitas Bagi Sebuah Tes
Sudah diterangkan dalam persyaratan tes, bahwa reliabilitas berhubungan dengan masalah
kepercayaan. Suatu tes dapat dikatakan mempunyai taraf kepercayaan yang tinggi jika tes
tersebut dapat memberikan hasil yang tetap. Maka pengertian reliabilitas tes, berhubungan
dengan masalah ketetapan hasil tes. Atau seandainya hasilnya berubah-ubah, perubahan yang
terjadi dapat dikatakan tidak berarti.
Konsep tentang reliabilitas ini tidak akan sulit dimengerti apabila pembaca telah
memahami konsep validitas. Tuntutan bahwa instrumen evaluasi harus valid menyangkut
harapan diperolehnya data yang valid, sesuai dengan kenyataan. Dalam hal reliabilitas ini
tuntutannya tidak jauh berbeda. Jika validitas terkait dengan ketepatan objek yang tidak lain
adalah tidak menyimpangnya data dari kenyataan, artinya bahwa data tersebut benar, maka
konsep reliabilitas terkait dengan pemotretan berkali-kali. Instrumen yang baik adalah
instrumen yang dapat dengan ajeg memberikan data yang sesuai dengan kenyataan.
Yang sering ditangkap kurang tepat bagi pembaca adalah adanya pendaat bahwa ajeg
atau tetap diartikan sebagai sama. Dalam pembicaraan evaluasi ini tidak demikian. Ajeg
atau tetap tidak selalu harus sama, tetapi mengikuti perubahan secara ajeg. Jika keadaan si A
mula-mula berada lebih rendah dibandingkan dengan B, maka jika diadakan pengukuran ulang,
si A juga berada lebih rendah dari B. Itulah yang dikatakan ajeg atau tetap, yaitu sama dalam
kedudukan siswa di antara anggota kelompok yang lain. Tentu saja tidak dituntut semuanya
tetap. Besarnya ketetapan itulah menunjukkan tingginya reliabilitas instrumen.
Sehubungan dengan reliabilitas ini, Scarvia B. Anderson dan kawan-kawan menyatakan
bahwa persyaratan bagi tes, yaitu validitas dan reliabilitas ini penting. Dalam hal ini validitas
lebih penting, dan reliabilitas ini perlu, karena menyokong terbentuknya validitas. Sebuah tes
mungkin reliable tetapi tidak valid. Sebalinya, sebuah tes yang valid biasanya reliable.
A reliable measure in one that provides consistent and stable indication of the
characteristic being investigated.
Untuk dapat memperoleh gambaran yang ajeg memang sulit karena unsur kejiwaan
manusia itu sendiri tidak ajeg. Misalnya kemampuan, kecakapan, sikap dan sebagainya
berubah-ubah dari waktu ke waktu.
Beberapa hal yang sedikit banyak mempengaruhi hasil tes banyak sekali. Namun secara
garis besar dapat dikelompokkan menjadi 3 hal:
1) Hal yang berhubungan dengan tes itu sendiri, yaitu panjang tes dan kualitas butir-
butir soalnya
Tes yang terdiri dari banyak butir, tentu saja lebih valid dibandingkan dengan tes yang
hanya terdiri dari beberapa butir soal. Tinggi rendahnya validitas menunjukkan tinggi
rendahnya reliabilitas tes. Dengan demikian maka semakin panjang tes, maka reliabilitasnya
semakin tinggi. Dalam menghitung besarnya reliabilitas berhubung dengan penambahan
banyaknya butir soal dalam tes ini ada sebuah rumus yang diberikan oleh Spearman dan Brown
sehingga terkenal dengan rumus Spearman Brown.
Rumusnya adalah:
nr
rnn =
1 + (n - 1) r
Ket:
rnn = Besarnya koefisien reliabilitas sesudah tes tersebut ditambah
butir soal baru
n = Berapa kali butir-butir soal itu ditambah
r = Besarnya koefisien reliabilitas sebelum butir-butir soalnya
ditambah
2) Hal yang berhubungan dengan tercoba (testee)
Suatu tes yang dicobakan kepada kelompok yang terdiri dari banyak siswa akan
mencerminkan keragaman hasil yang menggambarkan besar-kecilnya reliabilitas tes. Tes yang
dicobakan kepada bukan kelompok terpilih, akan menunjukkan reliabilitas yang lebih besar
daripada yang dicobakan pada kelompok tertentu yang diambil secara dipilih.
3) Hal yang berhubungan dengan penyelenggaraan tes
Sudah disebutkan bahwa faktor penyelenggaraan tes yang bersifat administrative sangat
menentukan hasil tes.
Contoh:
a) Petunjuk yang diberikan sebelum tes dimulai akan memberikan ketenangan kepada
para tes-tes dalam mengerjakan tes, dan dalam penyelenggaraan tidak akan banyak terdapat
pertanyaan. Ketenangan ini tentu saja akan berpengaruh terhadap hasil tes.
b) Pengawas yang tertib akan mempengaruhi hasil yang diberikan oleh siswa terhadap
tes. Bagi siswa-siswa tertentu adanya pengawasan yang terlalu ketat menyebabkan rasa jengkel
dan tidak dapat dengan leluasa mengerjakan tes.
c) Suasana lingkungan dan tempat tes (duduk tidak teratur, suasana disekelilingnya
ramai dan sebagainya) akan mempengaruhi hasil tes.
Adanya hal-hal yang mempengaruhi hasil tes ini semua, secara tidak langsung akan
mempengaruhi reliabilitas soal tes.
b. Cara-Cara Mencari Besarnya Reliabilitas
Sekali lagi reliabilitas adalah ketetapan suatu tes apabila diteskan kepada subjek yang
sama. Untuk mengetahui ketetapan ini pada dasarnya dilihat kesejajaran hasil. Seperti halnya
beberapa teknik juga menggunakan rumus korelasi product moment untuk mengetahui
validitas, kesejajaran hasil dalam reliabilitas tes.
Kriterium yang digunakan untuk mengetahui ketetapan ada yang berada di luar tes
(consistency eternal) dan pada tes itu sendiri (consistency internal).
1) Metode bentuk paralel (equivalent)
Tes paralel atau tes equivalent adalah dua buah tes yang mempunyai kesamaan tujuan,
tingkat kesukaran dan susunan, tetapi butir-butir soalnya berbeda. Dalam istilah bahasa Inggris
disebut alternative-form method (parallel forms).
Dengan metode bentuk parallel ini, dua buah tes yang paralel misalnya tes Matematika seri
A yang akan dicari reliabilitasnya dan tes seri B diteskan kepada sekelompok siswa yang sama,
kemudian hasilnya dikorelasikan. Koefisien korelasi dari kedua hasil tes inilah yang
menunjukkan koefisien reliabilitasnya tes seri A. jika koefisiennya tinggi maka tes tersebut
sudah reliable dan dapat digunakan sebagai alat pengetes yang terandalkan.
Dalam menggunakan metode tes paralel ini pengetes harus menyiapkan dua buah tes dan
masing-masing dicobakan pada kelompok siswa yang sma. Oleh karena itu, ada orang
menyebutkan sebagai double test-double-trial method. Penggunaan metode ini baik karena
siswa dihadapkan kepada dua macam tes sehingga tidak ada faktor masih ingat soalnya yang
dlam evaluasi disebut adanya practice-effect dan carry-over effect, artinya ada faktor yang
dibawa oleh pengikut tes karena sudah mengerjakan soal tersebut.
Kelemahan dari metode ini adalah bahwa pengetes pekerjaannya berat karena harus
menyusun dua seri tes. Lagi pula harus tersedia waktu yang lama untuk mencobakan dua kali
tes.
2) Metode tes ulang (test-retest method)
Metode tes ulang dilakukan orang untuk menghindari penyusunan dua seri tes. Dalam
menggunakan teknik atau metode ini pengetes hanya memiliki satu seri tetapi dicobakan dua
kali. Oleh karena tesnya hanya satu dan dicobakan dua kali, maka metode ini dapat disebut
dengan single-test-double-trial method. Kemudian hasil dari kedua kali tes tersebut dihitung
korelasinya.
Untuk tes yang banyak mengungkap pengetahuan (ingatan) dan pemahaman, cara ini
kurang mengena karena tercoba akan masih ingat akan butir-butir soalnya. Ooleh karena itu,
tenggang waktu antara pemberian tes pertama dengan kedua menjadi permasalahan tersendiri.
Jika tenggang waktu terlalu sempit, siswa masih banyak ingat materi. Sebaliknya kalau
tenggang waktu terlalu lama, maka faktor-faktor atau kondisi tes sudah akan berbeda dan siswa
sendiri barangkali sudah mempelajari sesuatu. Tentu saja faktor-faktor ini akan berpengaruh
pula terhadap reliabilitas.
Pada umumnya hasil tes yang kedua cenderung lebih baik daripada hasil tes pertama. Hal
ini tidak mengapa karena pengetes harus sadar akan adanya practice effect dan carry over
effect. Yang penting adalah adanya kesejahteraan hasil atau ketetapan hasil yang diyunjukkan
oleh koefisien korelasi yang tinggi.
3) Metode belah dua atau split-half method
Kelemahan penggunaan metode dua-tes dua kali percobaan dan satu-tes dua kali percobaan
diatasi dengan metode ketiga ini yaitu metode belah dua. Dalam menggunakan metode ini
pengetes hanya menggunakan sebuah tes dan dicobakan satu kali. Oleh karena itu, disebut juga
single-test-single-trial method.
Berbeda dengan metode pertama dan kedua yang setelah diketemukan koefisien korelasi
langsung ditafsirkan itulah koefisiensi reliabilita, maka dengan ketiga metode ini tidak dapat
demikian. Pada waktu membelah dua dan mengkorelasikan dua belahan, baru diketahui
reliabilitas separo tes.
MENGANALISIS BUTIR SOAL
Kegiatan analisis butir soal memiliki banyak manfaat, di antaranya (1) dapat membantu
pengguna tes dalam mengevaluasi kualitas tes yang digunakan, (2) relevan bagi penyusunan tes
informal seperti tes yaitu, disiapkan guru untuk siswa di kelas, (3) mendukung penulisan butir
soal yang efektif, (4) secara materi dapat memperbaiki tes di kelas, (5) meningkatkan validitas
soal dan reliabilitas (Anastasi & Urbina, 1997:1-72).
Nitko (1996:308-309) juga menguraikan manfaat kegiatan analisis butir soal, di antaranya untuk:
(1) menentukan apakah suatu fungsi butir soal sesuai dengan yang diharapkan, (2) memberi
masukan kepada siswa tentang kemampuan dan sebagai dasar untuk bahan diskusi di kelas, (3)
memberi masukan kepada guru tentang kesulitan siswa, (4) memberi masukan pada aspek
tertentu untuk pengembangan kurikulum, (5) merevisi materi yang diukur, (6) meningkatkan
keterampilan penulisan soal.
Analisis butir soal merupakan suatu kegiatan yang dilakukan untuk meyakinkan bahwa butir-
butir soal tersebut bermutu dan memenuhi kriteria yang ditentukan. Analisis butir soal dapat
dilakukan baik secara kualitatif maupun kuantitatif
Analisis Butir Soal Secara Kualitatif

Pada prinsipnya analisis butir soal secara kualitatif dilaksanakan berdasarkan kaidah penulisan
soal (tes tertulis, perbuatan dan sikap). Aspek yang diperhatikan dalam penelaahan secara
kualitatif mencakup aspek materi, konstruksi, bahasa atau budaya, dan kunci jawaban atau
pedoman penskorannya.
Ada beberapa teknik yang dapat digunakan untuk menganalisis butir soal secara kualitatif, yaitu
teknik moderator dan teknik panel.
1. Teknik moderator merupakan teknik berdiskusi yang di dalamnya terdapat satu orang
sebagai penengah. Berdasarkan teknik ini, setiap butir soal didiskusikan secara bersama-
sama dengan beberapa ahli, seperti guru yang mengajarkan materi, ahli materi, penyusun
atau pengembang kurikulum, ahli penilaian, ahli bahasa, dan orang yang memiliki latar
belakang psikologi.
2. Teknik panel yakni suatu teknik menelaah butir soal berdasarkan kaidah penulisan butir
soal. Kaidah itu di antaranya materi, konstruksi, bahasa atau budaya, kebenaran kunci
jawaban atau pedoman penskoran. Caranya beberapa penelaah diberikan butir-butir soal
yang akan ditelaah, format penelaahan, dan pedoman penilaian atau penelaahan.
Analisis butir soal secara kualitatif dilakukan dalam rangka meningkatkan validitas, baik
validitas tampak (face validity), validitas isi (content validity), maupun validitas konstruk
(construct validity). Analisis ini melibatkan ahli bidang studi atau ahli materi dengan pendekatan
expert judgment. Dengan menggunakan kaidah penulisan soal, setiap butir soal ditelaah
apakah telah memenuhi kaidah, baik dari aspek materi, konstruksi, maupun bahasa. Pada
prinsipnya, teknik analisis ini dapat diterapkan pada tes constructed response, selected response,
tes perbuatan , maupun instrumen non tes.
Analisis Butir Soal Secara Kuantitatif
Penelaahan soal secara kuantitatif adalah penelaahan butir soal didasarkan pada data empirik.
Data empirik ini diperoleh dari soal yang telah diujikan. Ada dua pendekatan dalam analisis
secara kuantitatif, yaitu pendekatan secara klasik dan modern,
Analisis butir soal secara klasik adalah proses penelaahan butir soal melalui informasi dari
jawaban peserta tes guna meningkatkan mutu butir soal yang bersangkutan dengan menggunakan
teori tes klasik. Analisis butir secara modern adalah penelaahan butir soal dengan menggunakan
teori respons butir atau Item Response Theory (IRT). Teori ini merupakan suatu teori yang
menggunakan fungsi matematika untuk menghubungkan antara peluang menjawab benar suatu
butir dengan kemampuan siswa.
Aspek yang diperhatikan dalam butir analisis soal secara klasik adalah setiap butir soal ditelaah
dari segi: tingkat kesukaran butir, daya pembeda butir, dan penyebaran pilihan jawaban (untuk
soal bentuk selected response item) atau frekuensi pada setiap pilihan jawaban. Berikut ini
disajikan penjelasan lebih lanjut mengenai beberapa aspek di atas.
1. Tingkat Kesukaran (TK)
Tingkat kesukaran soal adalah peluang menjawab benar suatu soal pada tingkat kemampuan
tertentu yang biasanya dinyatakan dalam bentuk indeks. Indeks tingkat kesukaran ini umumnya
dinyatakan dalam bentuk proporsi yang besarnya berkisar dari 0 sampai 1 (Aiken, 1994: 66).
Semakin besar indeks tingkat kesukaran yang diperoleh dan hasil hitungan, berarti semakin
mudah soal itu. Suatu soal memiliki TK= 0 berarti tidak ada siswa yang mampu menjawab benar
dan bila memiliki TK= 1 berarti semua siswa menjawab benar. Perhitungan indeks tingkat
kesukaran ini dilakukan untuk setiap nomor soal. Pada prinsipnya, skor rata-rata yang diperoleh
peserta tes pada butir soal yang bersangkutan dinamakan tingkat kesukaran butir soal itu. Rumus
ini dipergunakan untuk soal selected response item, yaitu (Nitko, 1996: 310):
Tingkat Kesukaran (TK) =
Tingkat kesukaran butir soal biasanya dikaitkan dengan tujuan tes. Misalnya, untuk keperluan
ujian semester digunakan butir soal yang memiliki tingkat kesukaran sedang, untuk keperluan
seleksi digunakan butir soal yang memiliki tingkat kesukaran tinggi atau sukar, dan untuk
keperluan diagnostik biasanya digunakan butir soal yang memiliki tingkat kesukaran rendah atau
mudah.
Untuk mengetahui tingkat kesukaran soal bentuk constructed response digunakan rumus berikut
ini.
Mean = Jumlah skor siswa tes pada suatu soal/ jumlah peserta didik
Tingkat kesulitan= Mean/ skor maksimum yang ditetapkan.
Klasifikasi tingkat kesukaran soal dapat menggunakan kriteria berikut :
No. Range Tingkat Kesukaran Kategori Keputusan

1. 0,7 1,0 Mudah Ditolak/ direvisi
2. 0,3 0,7 Sedang Diterima
3. 0,0 0,3 Sulit Ditolak/ diterima
Tingkat kesukaran butir soal dapat mempengaruhi bentuk distribusi total skor tes. Untuk tes yang
sangat sukar (TK <_ 0,25) distribusinya berbentuk positif skewed, sedangkan tes yang mudah
(TK _> 0,80) distribusinya berbentuk negatif skewed.
Tingkat kesukaran butir soal memiliki dua kegunaan, yaitu untuk guru dan untuk pengujian dan
pengajaran (Nitko, 1996: 310313). Kegunaan bagi guru di antaranya: (a) sebagai pengenalan
konsep terhadap pembelajaran ulang dan memberi masukan kepada siswa tentang hasil belajar
mereka, (b) memperoleh informasi tentang penekanan kurikulum atau mencurigai terhadap butir
soal yang bias. Adapun kegunaannya bagi pengujian dan pengajaran adalah: (a) pengenalan
konsep yang diperlukan untuk diajarkan ulang, (b) tanda-tanda terhadap kelebihan dan
kelemahan pada kurikulum sekolah, (c) memberi masukan kepada siswa, (d) tanda-tanda
kemungkinan adanya butir soal yang bias, (e) merakit tes yang memiliki ketepatan data soal.
2. Daya Pembeda (DP)
Daya pembeda soal adalah kemampuan suatu butir soal dapat membedakan antara siswa yang
telah menguasai materi yang ditanyakan dan siswa yang belum menguasai materi yang diujikan.
Daya pembeda butir soal memiliki manfaat berikut. Pertama, untuk meningkatkan mutu setiap
butir soal melalui data empiriknya. Berdasarkan indeks daya pembeda, setiap butir soal dapat
diketahui apakah butir soal itu baik, direvisi, atau ditolak. Kedua, untuk mengetahui seberapa
jauh masing-masing butir soal dapat mendeteksi atau membedakan kemampuan siswa, yaitu
siswa yang telah memahami atau belum memahami materi yang diajarkan guru. Apabila suatu
butir soal tidak dapat membedakan kedua kemampuan siswa itu maka butir soal itu dapat
dicurigai kemungkinannya: (a) kunci jawaban butir soal itu tidak tepat, (b) butir soal itu memiliki
dua atau lebih kunci jawaban yang benar, (c) kompetensi yang diukur tidak jelas, (d) pengecoh
tidak berfungsi, (e) materi yang ditanyakan terlalu sulit sehingga banyak siswa yang menebak,
dan (f) sebagian besar siswa yang memahami materi yang ditanyakan berpikir ada yang salah
informasi dalam butir soalnya. Indeks daya pembeda setiap butir soal biasanya dinyatakan dalam
bentuk proporsi. Semakin tinggi indeks daya pembeda soal berarti semakin tinggi kemampuan
soal yang bersangkutan membedakan siswa yang telah memahami materi dengan siswa yang
belum memahami materi. Indeks daya pembeda berkisar antara -1,0Q sampai dengan + 1,00.
Jika daya pembeda negatif (kurang dari 0) berarti lebih banyak kelompok bawah (peserta tes
yang tidak memahami materi) menjawab benar soal dibanding dengan kelompok atas (peserta tes
yang memahami materi yang diajarkan). Hasil perhitungan dengan menggunakan rumus di atas
dapat menggambarkan tingkat kemampuan soal dalam membedakan antar peserta tes yang telah
memahami materi yang diujikan dan peserta tes yang belum memahami materi yang diujikan.
Adapun kriteria yang dapat digunakan adalah sebagai berikut (Cracker & Algina, 1986: 315).
No. Range Daya Kategori Keputusan Pembeda

1. 0,40-1,00 Sangat memuaskan Diterima
2. 0,30 0,39 Memuaskan Diterima
3. 0,20 0,29 Tidak memuaskan Ditolak/direvisi
4. 0,00- 0,19 Sangat tidak memuaskan Direvisi total
Analisis Pengecoh
Indeks pengecoh:
Keterangan:
IP = Indeks pengecoh
P = jumlah peserta didik yang memilih pengecoh
N = jumlah peserta didik yang ikut tes
B = jumlah peserta didik yang menjawab benar
n = jumlah opsi
1 = bilangan tetap
Adapun kualitas pengecoh berdasarkan indeksnya adalah:
76% - 125% = sangat baik
51% -75% atau 126% - 150% = baik
26%- 50% atau 151% - 175% = kurang baik
0% - 25% atau 176% - 200% = jelek
Lebih dari 200% = sangat jelek
SPESIFIKASI TES
Langkah awal dalam mengembangkan tes adalah menetapkan spesifikasi tes yang berisi
tentang uraian yang menunjukkan keseluruhan karakteristik yang harus dimiliki suatu tes.
Spesifikasi tes akan mempermudah dalam menulis soal dan siapa saja yang menulis soal akan
menghasilkan tingkat kesulitan yang relatif sama. Tabel spesifikasi yang juga dikenal dengan
kisi-kisi adalah sebuah tabel yang didalamnya dimuat rincian materi tes dan tingkah laku beserta
proporsi yang dikehendaki oleh penilai, dimana pada tiap petak dari tabel tersebut diisi dengan
angka-angka yang menunjukan banyaknya butir soal yang akan dikeluarkan dalam tes hasil
belajar. Penyusunan spesifikasi tes mencakup beberapa kegiatan, yaitu :
a. Menentukan Tujuan Tes
Terdapat empat macam tes yang digunakan lembaga pendidikan, yaitu tes penempatan,
tes diagnostik, tes formatif, dan tes sumatif.
b. Menyusun Kisi- Kisi
Kisi-kisi merupakan tabel matrik yang berisi spesifikasi soal-soal yang akan dibuat.
Kisi- kisi ini merupakan acuan bagi pembuat soal sehingga siapapun yang menulis
soal akan menghasilkan soal yang isi dan tingkat kesulitannya relatif sama.
Terdapat empat langkah dalam mengembangkan kisi-kisi tes, yaitu :
1. Menulis tujuan umum
2. Membuat daftar pokok bahasan dan sub pokok bahasan yang akan diujikan
3. Membuat indikator
4. Menentukan jumlah soal tiap pokok bahasan dan subpokok bahasan
c. Menentukan Bentuk Tes
Sebagai alat pengukur perkembangan dan kemajuan belajar peserta didik, apabila
ditinjau dari segi bentuk soal-soal, dapat dibedakan menjadi dua macam, yaitu tes belajar
bentuk uraian (tes subjektif), dan tes hasil belajar bentuk obyektif. Bentuk tes objektif
yang sering digunakan adalah bentuk pilihan ganda, benar-salah, menjodohkan, dan
uraian objektif.
Tes obyektif bentuk true-false adalah salah satu bentuk tes obyektif dimana butir-
butir soal yang diajukan dalam tes hasil belajar itu berupa pernyataan, pernyataan ada
yang benar dan ada yang salah.
Multiple choice test terdiri atas suatu keterangan atau pemberitahuan tentang
suatu pengertian yang belum lengkap. Dan untuk melengkapinya harus memllilih satu
dari beberapa kemungkinan jawaban yang telah disediakan.
Matching test dapat diganti dapat diganti dengan istilah mempertandingan,
mencocokkan, memasangkan, atau menjodohkan. Matching test terdiri atas satu seri
pertanyaan dan satu seri jawaban. Masing-masing pertanyaan mempunyai tercantum
dalam seri jawaban
Complection test biasa kita sebut dengan istilah tes isian, tes menyempurnakan,
atau tes melengkapi. complection test terdiri atas kalimat-kalimat yang ada bagian-
bagiannya yang dihilangkan. Bagian yang dihilangkan atau yang diisi oleh murid ini
adalah merupakan pengertian yang kita minta dari murid
Soal bentuk pilihan ganda adalah soal bentuk benar salah juga, tetapi dalam
bentuk jamak. Test ini diminta membenarkan atau menyalahkan setiap item dengan tiap
pilihan jawaban. Kemungkinan jawaban itu biasanya sebanyak tiga atau empat buah,
tetapi adakalanya dapat juga lebih banyak (untuk tes yang akan diolah dengan komputer
banyaknya option diusahakan 4 buah).
Tes uraian dapat dikategorikan uraian objektif dan non-objektif. Tes uraian yang
objektif sering digunakan pada sains dan teknologi atau bidang sosial yang jawaban
soalnya sudah pasti, dan hanya satu jawaban yang benar. Tes uraian non-objektif sering
digunakan pada bidang ilmu sosial, yaitu yang jawabannya luas dan tidak hanya satu
jawaban yang benar, tergantung argumentasi peserta tes. Bentuk tes dikatakan non-
objektif apabila penilaian yang dilakukan cenderung dipengaruhi subjektivitas dari
penilai. Tes uraian pada umumnya berbentuk esai (uraian). Tes bentuk esai adalah
sejenis tes kemampuan belajar yang memerlukan jawaban yang bersifat pembahasan atau
uraian kata-kata. Ciri-ciri pertanyaannya didahului dengan kata-kata seperti uraikan,
jelaskan, mengapa, bagaimana, bandingkan, simpulkan, dan sebagainya. Soal-soal bentuk
esai menuntut kemampuan siswa untuk dapat mengorganisir, menginterpretasi,
menghubungkan pengertian-pengertian yang telah dimiliki. Dengan singkat dapat
dikatakan bahwa tes esai menuntut siswa untuk dapat mengingat-ingat dan mengenal
kembali, dan terutama harus mempunyai daya kreativitas yang tinggi.
d. Menentukan Panjang Tes

Penentuan panjang tes berdasarkan pada cakupan materi ujian dan kelelahan peserta
tes. Pada umumnya tes tertulis menggunakan waktu 90 menit sampai 150 menit,
namun untuk tes jenis praktek bisa lebih dari itu. Penentuan panjang tes berdasarkan
pengalaman saat melakukan tes. Khusus untuk tes baku penentuan waktu berdasarkan
hasil uji coba. Namun tes untuk ulangan di kelas penentuan waktu berdasarkan
pengalaman dari tiap tenaga pengajar.Waktu yang diperlukan untuk mengerjakan tes
bentuk pilihan ganda adalah 2 sampai 3 menit untuk tiap butir soal bergantung pada
tingkat kesulitan soal. Untuk tes bentuk uraian tes ditentukan berdasarkan pada
kompleksitas jawaban yang dituntut. Soal-soal bentuk esai biasanya jumlahnya tidak
banyak, hanya sekitar 5-10 buah dalam waktu kira-kira 90-120 menit
MENULIS SOAL TES
Penulisan soal merupakan langkah menjabarkan indikator menjadi pernyataan-pernyataan

yang karakteristiknya sesuai dengan kisi-kisi yang telah dibuat. Setiap pertanyaan perlu disusun
dengan baik sehingga jelas hal yang ditanyakan dan jelas pula jawabannya.
Menurut Sumadi Surybrata, secara umum kemampuan khusus yang harus dimiliki bagi
penulis soal adalah:
1. Penguasaan pengetahuan yang diteskan
2. Kesadaran akan tata nilai yang mendasari pendidikan
3. Pemahaman akan karakteristik individu yang dites
4. Kemampuan membahas gagasan
5. Penguasaan akan teknik penulisan soal, dan
6. Kesadaran akan kekuatan dan kelemahan dalam menulis soal
Fungsi tes tidak semata-mata sebagai alat ukur saja, melainkan memiliki fungsi motivasi
dan pembentukan sikap bagi peserta didik. Oleh karena itu penulisan soal hendaknya memahami
nilai-nilai yang mendasari pendidikan, seperti tujuan pendidikan, filsafat pendidikan, sistem
pendidikan, psikologi, garis-garis besarnya saja. Dalam menulis soal diperlukan kemampuan
untuk membahas gagasan dalam bahasa verbal yang jelas dan mudah dipahami maksudnya,
sebab soal merupakan wakil dari pendidik yang hadir dihadapan peserta didikoleh karena itu
penulisan soal membutuhkan bahasa yang lugas dan tidak berbelit-belit.
Dalam penulisan butir-butir soal, baik dalam bentuk tes objektif maupun tes essai
(uraian), terdapat syarat-syarat penyusunannya. Syarat penyusunan tes objektif terdiri dua bagian
yaitu:
1. Syarat-syarat umum
Berikut ini beberapa syarat yang perlu diperhatikan dalam menyusun objective test :
1. Tiap bentuk dari tes objektif harus didahului dengan penjelasan atau anjuran bagaimana
cara mengerjakannya.
2. Penjelasan atau anjuran itu harus diusahakan jangan terlalu panjang, tetapi jelas bagi
yang menjawabnya (disesuaikan dengan tingkat sekolah dan kecakapan bahasa anak).
3. Hindarkan pertanyaan yang mempunyai lebih dari satu pengertian atau yang dapat
diartikan atau ditafsirkan bermacam-macam.
4. Tiap-tiap butir soal haruslah tetap, gramatikanya baik sehingga tidak membingungkan
dan menimbulkan salah tangkap.
5. Jangan menyusun item secara langsung menjiplak dari buku, karena item yang demikian
hanya memaksa siswa untuk menghafal dan kurang merangsang siswa untuk berfikir.
6. Harus diteliti jangan sampai item yang satu mempermudah atau mempersukar item yang
lain (terutama dalam menyusun true-false dan multiple choice).
7. Janganlah item yang satu bergantung pada item yang lain atau item yang terdahulu
2. Syarat-syarat Khusus
a) Untuk completion atau fill-in
1. Bahasa hendaknya jelas, kalimat jangan terlalu panjang sehingga mudah dipahami.
2. Yang dihilangkan atau harus diisi (titik-titik) janganlah mengenai satu hal saja, tetapi harus
beberapa hal. Misalnya dalam sejarah, yang dihilangkan jangan hanya tanggal dan
tahunnya atau nama tokoh-tokoh atau peristiwa, tetapi harus mencakup semua hal
tersebut.
3. Jawaban (isi titik-titik) jangan merupakan kalimat panjang. Sebab kalau demikian, bukan tes
objektif lagi, melainkan menyerupai tes essay.
4. Jumlah jawaban (titik-titik) harus tertentu supaya memudahkan pengetes untuk menskornya
(10, 20, 25 dan sebagainya)
b) Untuk true-false
1. Hindarkan item yang dapat dinilai benar dan salah secara meragukan.
2. Soal-soal atau item tidak boleh mengandung kata-kata yang merupakan atau terlalu
menunjukkan jawabannya. Misalnya dengan digunakannya kata-kata: kadang-kadang,
mungkin, sudah pasti, barangkali, selalu, dan sebagainya.
3. Sedapat mungkin hindarkanlah statement yang negatif, yang mengandung kata tidak atau
bukan.
4. Hindarkanlah kalimat yang terlalu panjang atau kalimat majemuk yang meragukan.
c) Untuk multiple choice
1. Statement harus jelas merumuskan suatu masalah. Tentukanlah sebelumnya bahwa hanya
ada satu jawaban yang paling benar dan tepat.
2. Baik statement maupun option sedapat mungkin jangan merupakan suatu kalimat yang
terlalu panjang.
3. Hindarkanlah option yang tidak ada sangkut-pautnya satu sama lain. Dengan kata lain,
option (pilihan jawaban) hendaknya homogen.
Sedangkan dalam penulisan butir-butir soal esai, perlu kiranya guru atau pembuat tes
memperhatikan hal-hal berikut ini:
1. Sebelum memulai menulis soal yang dimaksud, hendaknya jelas dalam pikiran kita
proses mental manakah yang kita harapkan dari mudrid untuk menjawab soal tersebut.
Guru atau penyusun tes harus benar-benar memahami macam-macam jenis respons stimulus
(jenis soal) yang diperlukan untuk menimbulkan atau memancing keluarnya respons-respons
tersebut.
2. Gunakanlah bahan-bahan atau himpunan bahan-bahan dalam menyusun soal-soal essay
tersebut.
3. Mulailah pertanyaan atau soal essay itu dengan kata-kata seperti : Bandingkan,
Berilah alasan, Berilah contoh-contoh yang sesuai, Terangkan bagaimana....,
Jelaskan/ramalkan apa yang terjadi jika...., dan Jelaskan bagaimana pendapat
Anda. Janganlah memulai soal essay dengan kata-kata: Apa, Siapa, Kapan, atau
Bilamana dan Berapa
4. Tulislah pertanyaan atau soal essay itu sedemikian rupa sehingga tugas apa yang harus
dilakukan siswa jelas dan tidak mempunyai arti ganda (ambiguous) bagi setiap murid.
5. Soal essay berhubungan dengan hal-hal yang merupakan controversial issue dalam
masayarakat. Penyusunannya hendaklah diarahkan untuk menilai bagaimana pendapat
dan pengertian siswa terhadap issue yang ditanyakan, dan bukan untuk menuntut siswa
agar menerima suatu kesimpulan atau cara pemecahan tertentu. Kita menegetahui bahwa
banyak issue yang dialami individu dan masyarakat tidak ada jawaban atau kesimpulann
yang bersifat umum atau yang dianggap benar oleh semua orang.
6. Usahakan agar soal essay yang kita susun itu benar-benar dapat menimbulkan perilaku
yang kita kehendaki untuk dilakukan oleh siswa. Soal-soal essay buatan guru seringkali
bersifat kurang menuntut kemampuan skill atau aplikasi seperti:
7. Sesuaikan panjang-pendeknya dan kompleksitas jawaban dengan tingkat kematangan

siswa.
MENELAAH SOAL TES

Menelaah soal perlu dilakukan untuk memperbaiki soal jika ternyata dalam pembuatannya masih
ditemukan kekurangan dan kesalahan. Telaah dilakukan oleh ahli yang secara bersama atau
individu mengoreksi soal yang telah dibuat.
Wawancara atau interview merupakan salah satu alat penilaian nontes yang
dipergunakan untuk mendapatkan informasi tertentu tentang keadaan responden dengan jalan
tanya jawab sepihak. Dikatakan sepihak karena pertanyaan-pertanyaan yang diajukan dalam
kegiatan wawancara hanya berasal dari pihak pewawancara, sementara responden hanya
bertugas sebagai penjawab. Maksud diadakan wawancara sebagaimana dikutip Moleong dari
Lincoln dan Guba (1985:266), antara lain mengonstruksi orang, kejadian, organisasi,
perasaan, motivasi, tuntutan, kepedulian, dan sebagainya.
Ada banyak pembagian wawancara yang dilakukan para ahli. salah satu diantaranya
adalah membagi wawancara kedalam dua bentuk, yaitu wawancara bebas dan wawancara
terpimpin. Wawancara terpimpin adalah kegiatan wawancara yang pertanyaan-pertanyaan
serta kemungkinan-kemungkinan jawabannya telah dipersiapkan pihak pewawancara,
sehingga responden tinggal memilih jawaban yang sudah dipersiapkan pewawancara. Adapun
dalam Wawancara bebs, responden diberi kebebasan untuk menjawab pertanyaan-pertanyaan
pewawancara sesuai dengan pendapatnya tanpa terikat oleh ketentuan-ketentuan yang telah
dibuat pewawancaranya. ( Hamdani, 2011: 318).
Adapun menurut Zainal Arifin (2012:158) Wawancara merupakan salah satu bentuk
alat evaluasi jenis non-tes yang dilakukan melalui percakapan dan tanya jawab, baik langsung
maupun tidak langsung dengan peserta didik. Pengertian wawancara langsung adalah
wawancara yang dilakukan secara langsung antara pewawancara (interviewer) atau guru
dengan orang yang diwawancarai (interviewee) atau peserta didik tanpa melalui perantara,
sedangkan wawancara tidak langsung artinya pewawancara atau guru menanyakan sesuatu
kepada peserta didik melalui perantaraan orang lain atau media. jadi, tidak menemui langsung
kepada sumbernya.
Tujuan wawancara adalah sebagai berikut:
1. Untuk memperoleh informasi secara langsung guna menjelaskan suatu hal atau situasi dan
kondisi tertentu .
2. Untuk melengkapi suatu penyelidikan ilmiah
3. Untuk memperoleh data agar dapat mempengaruhi situasi atau orang tertentu.
Wawancara juga dapat dilengkapi dengan alat bantu berupa tape recorder (alat
perekam suara), sehingga jawaban atas pertanyaan-pertanyaan yang diajukan dapat dicatat
secara lebih lengkap. Penggunaan pedoman wawancara dan alat bantu perekam suara itu akan
sangat membantu kepada pewawancara dalam mengategorikan dan menganalisis jawaban-
jawaban yang diberikan oleh peserta didik atau orang tua peserta didik untuk pada akhirnya
dapat ditarik kesimpulan

Benar

Diunggah oleh

Informasi Dokumen

Judul Asli

Hak Cipta

Format Tersedia

Bagikan dokumen Ini

Bagikan atau Tanam Dokumen

Opsi Berbagi

Apakah menurut Anda dokumen ini bermanfaat?

Apakah konten ini tidak pantas?

Hak Cipta:

Format Tersedia

Benar

Diunggah oleh

Hak Cipta:

Format Tersedia

VALIDITAS DAN REALIBILITAS

Keberhasilan mengungkapkan hasil dan proses belajar siswa sebagaimana adanya

Analisis Butir Soal Secara Kualitatif

Analisis Butir Soal Secara Kuantitatif

1. Tingkat Kesukaran (TK)

Tingkat Kesukaran (TK) =

Tingkat kesulitan= Mean/ skor maksimum yang ditetapkan.

Klasifikasi tingkat kesukaran soal dapat menggunakan kriteria berikut :

No. Range Tingkat Kesukaran Kategori Keputusan

2. Daya Pembeda (DP)

No. Range Daya Kategori Keputusan Pembeda

d. Menentukan Panjang Tes

MENULIS SOAL TES

Penulisan soal merupakan langkah menjabarkan indikator menjadi pernyataan-pernyataan

7. Sesuaikan panjang-pendeknya dan kompleksitas jawaban dengan tingkat kematangan

MENELAAH SOAL TES

Anda mungkin juga menyukai