Anda di halaman 1dari 10

LATAR BELAKANG

Secara teoritis terdapat hubungan timbal balik antara tujuan pembelajaran, proses
pembelakaran dan penilaian hasil belajar. Perhatikan skema berikut.

Tujuan
Pembelajaran

Proses Penilaian
Pembelajaran Hasil Belajar

Jika tujuan pembelajaran yang telah dirumuskan sudah tepat dan proses
pembembelajaran yang telah dilaksanakan sudah maksimal maka salah satu hal yang perlu
dicermati adalah alat penilaian hasil belajar. Apakah alat ukur yang telah digunakan (dalam
hal ini tes yang telah disusun atau instrumen yang digunakan) mempunyai kualitas baik
sehingga dapat digunakan untuk mengukur tujuan pembelajaran yang telah ditetapkan?

Untuk menjawab permasalahan ini perlu dipelajari lebig rinci berbagai cara yang dapat
ditempuh untuk meningkatkan kualitas alat instrumen yang digunakan agar benar-benar dapat
mengukur apa yang ingin diukur. Pada makalah ini akan membahas mengenai pengujian
kualitas alat ukur atau instrumen melalui validitas dan reliabilitas hasil pengukuran,
menganalisis butir soal dan bagaimana meningkatkan kualitas butir soal berdasarkan hasil
analisis serta bagaimana meningkatkan kualitas alat ukur non-tes.

RUMUSAN MASALAH

Berdasarkan uraian di atas, dapat dirumuskan beberapa masalah yang perlu pemecahan
dalam evaluasi pembelajaran yaitu :

1. Bagaimanakah konsep validitas ?


2. Bagaimanakah konsep reliabilitas ?
3. Bagaimanakah perbedaan validitas dan reliabilitas ?
4. Bagaimanakah hubungan antara validitas dan reliabilitas ?
5. Bagamanakah menentukan tingkat kesukaran butir soal ?
6. Bagamanakah menentukan daya beda butir soal ?
7. Bagamanakah menganalisis butir soal ?
8. Bagamanakah memperbaiki kualitas alat ukur ?
TUJUAN

Setelah mempelajari makalah ini Anda akan dapat meningkatkan kualitas alat ukur
yang Anda gunakan secara rinci Anda dapat :

1. Menjelaskan konsep validitas;


2. Menjelaskan konsep reliabilitas;
3. Membedakan validitas dan reliabilitas;
4. Menjelaskan hubungan antara validitas dan reliabilitas;
5. Menentukan tingkat kesukaran butir soal;
6. Menentukan daya beda butir soal;
7. Menganalisis butir soal; dan
8. Memperbaiki kualitas alat ukur.

MANFAAT

Manfaat yang diharapkan dari penulisan makalah ini, yaitu:

1. Bagi siswa:
Siswa dapat mengikuti proses belajar mengajar dengan nyaman
Siswa dapat bertukar pikiran dengan teman dan guru
2. Bagi Guru:
Membantu guru memperbaiki proseses evaluasi pembelajaran.
Membantu meningkatkan profesionalisme guru.
3. Bagi sekolah
Sebagai acuan dalam menilai kerja guru
Sebagai dasar dalam menentukan arah kemajuan sekolah

PEMBAHASAN

A. Validitas dan Reliabilitas Hasil Pengukuran

Untuk mengukur sesuatu kita harus dapat


memilih alat ukur yang sesuai agar kita dapat
memperoleh hasil pengukuran yang tepat.
Sebagai contoh, seorang pemanah akan
dinyatakan sebagai pemenang jika hasil
bidikannya dapat dengan tepat mengenai
sasaran yaitu daerah lingkaran yang paling
dalam atau yang paling mendekati lingkaran
yang paling dalam. Jika hasil bidikan peserta
didik dapat mengenai daerah di lingkaran
paling dalam maka ia akan memperoleh skor tertinggi dan perolehan skor tersebut
semakin berkurang jika hasil bidikannya jauh dari sasaran. Karena anak panah yang
harus dilepaskan tidak hanya satu maka pemanah dituntut untuk tetap dapat melepaskan
anak panahnya tepat mengenai sasaran.
Hasil bidikan dari peserta bisa tepat mengenai sasaran atau juga melesat dari
sasaran. Hasil yang sama dapat terjadi pada saat anda mengukur hasil belajar siswa.
Jika alat ukur yang anda gunakan tidak anda persiapkan dengan cermat maka skor yang
anda peroleh tidak dapat menggambarkan dengan tepat tingkat kemampuan siswa. Dari
penjelasan tersebut terdapat dua masalah pokok yang harus diperhatikan dalam
menyusun alat ukur hasil belajar yang baik yaitu masalah yang berhubungan dengan
ketepatan hasil pengukuran dan ketetapan hasil pengukuran. Masalah yang
berhubungan dengan ketepatan hasil pengukuran inilah yang dikenal dengan istilah
validitas sedangkan masalah–masalah yang berhubungan dengan ketetapan hasil
pengukuran dikenal dengan istilah reliabilitas.
1. Validitas
Alat ukur yang baik adalah alat ukur yang dapat dengan tepat mengukur apa
yang ingin diukur. Jika kita ingin mengukur panjang sebuah meja maka kita harus
dapat memilih alat ukur yang tepat untuk mengukur panjang meja tersebut. Untuk
menghitung waktu tempuh pelari cepat dalam perlombaan lari cepat 100 meter
maka kita juga harus dapat memilih alat ukur yang tepat untuk digunakan.
Demikian juga jika kita ingin mengukur hasil belajar siswa maka kita juga
dituntut untuk menggunakan alat ukur ( dalam hal ini tes ) yang dapat dengan
tepat mengukur hasil belajar yang kita harapkan.
Pengertian validitas mengacu pada ketepatan interpretasi yang dibuat dari
hasil pengukuran atau evaluasi ( Gronlund dan Linn, 1990). Secra umum validitas
ada tiga jenis :
a. Validitas isi (content validity)
Validitas isi diperlukan untuk menjawab pertanyaan “ sejauh mana
item – item yang ada dalam tes dapat mengukur keseluruhan materi yang
telah diajarkan “. Tinggi rendahnya validitas isi dapat ditetapkan
berdasarkan analisis rasional atau pertimbangan ahli terhadap isi tes
tersebut. Hal ini merupakan tuntutan yang harus dipenuhi oleh tes hasil
belajar. Tinggi rendahnya validitas isi suatu tes dapat dilihat pada
perencanaan atau kisi–kisi tes. Semakin representatif materi yang dapat
ditanyakan dalam tes tersebut menunjukkan semakin tinggi validitas isinya.
b. Validitas konstrak (construct validity)
Validitas konstrak mengacu pada sejauh mana alat ukur tersebut dapat
mengungkap keseluruhan konstrak yang digunakan sebagai dasar dalam
penyusunan tes tersebut. Yang dimaksud dengan konstrak disini adalah
konsep hipotesis (hipotetical concept) yang digunakan sebagai dasar dalam
penyusunan alat ukur. Validitas konstrak ini banyak digunakan terutama
dalam pengukuran–pengukuran psikologi seperti pengukuran sikap, minat,
tingkah laku dan sebagainya. Campbell dan Fiske (Demari Mardapi, 2004)
mengembangkan satu pendekatan untuk menentukan validitas konstrak
dengan menggunakan teknik multi trait-multi method. Validasi dengan
multi trait–multi method dilakukan dengan menggunakan lebih dari satu
metode untuk mengukur lebih dari satu acam trait(sifat). Dengan
menggunakan matrik korelasi sehingga interkorelasi antara trait dan metode
dapat dilihat dengan jelas.
c. Validitas yang dikaitkan dengan kriteria tertentu (criterion related validity).
Jika suatu tes dimaksudkan untuk memprediksi keberhasilan
seseorang di masa yang akan datang atau dimaksudkan untuk mengetahui
kesesuaian antara pengetahuan dan ketrampilan yang dimiliki maka alat
ukur yang digunakan harus mempunyai criterion related validity yang
tinggi.
2. Reliabilitas
Pengertian reliabilitas mengacu pada ketetapan hasil yang diperoleh dari
suatu Pengukuran ( Grondlund dan Linn, 1990 ). Salah satu cara untuk
mengetahui ketetapan atau reliabilitas suatu pengukuran, dapat diperoleh dengan
cara melakukan pengukuran dua kali. Hasil pengukuran dikatakan mempunyai
reliabilitas yang tinggi jika hasil pengukuran pertama hampir sama dengan hasil
pengukuran kedua. Dan sebaliknya hasil pengukuran dikatakan mempunyai
reliabilitas yang rendah jika hasil pengukuran pertama jauh berbeda dengan hasil
pengukuran kedua. Hubungan antar skor yang diperoleh pada pengukuran
pertama dengan kedua akan menghasilkan angka korelasi bergerak antara -1
sampai dengan +1. Semakin tinggi angka koefisien reliabilitas (mendekati 1)
maka semakin tinggi reliabilitas tersebut. Suatu perangkat tes dinyatakan cukup
reliabel jika mempunyai reliabilitas lebih besar 0,5 (Fernandes, 1984). Untuk
menghitung koefisien korelasinya dapat dihitung dengan menggunakan formula
korelasi product-moment sebagai berikut :
𝑁 Σ𝑋𝑌 − (Σ𝑋)(Σ𝑌)
𝑟 𝑥𝑦 =
√𝑁 Σ𝑋 2 − (Σ𝑋)2 × √𝑁ΣY 2 − (ΣY)2
Dimana :
r xy : Koefisien korelasi dari xy
N : Jumlah data
X : Data pertama
Y : Data kedua
Konsep reliabilitas diatas merupakan konsep reliabilitas dalam arti
stabilitas tes. Sebenarnya masih ada dua konsep reliabilitas yang lain, yaitu
konsep reliabilitas dalam arti equivalent tes dan konsep relialibilitas dalam
arti konsistensi internal.
Konsep reliabilitas dalam arti equivalent tes dimaksudkan untuk
mengetahui apakah dua set tes yang digunakan paralel atau tidak. Keparalelan
dua set tes ini diperoleh dengan cara mengembangkan dua set tes yang paralel
dari kisi-kisi tes yang sama kemudian masing-masing tes tersebut diujikan pada
dua kelas yang mempunyai tingkat kemampuan yang sama. Hasil kedua tes
tersebut dikorelasikan, jika hasil korelasinya tinggi, hal ini menunjukan kedua tes
paralel. koefisien korelasinya dapat dihitung dengan menggunakan formula
korelasi product-moment.
konsep reliabilitas dalam arti konsistensi internal dimaksudkan untuk
mengetahui apakah kumpulan butir soal yang ada dalam satu set tes tersebut
mengukur dimensi hasil belajar yang sama atau tidak. Konsep reliabilitas dalam
asrti konsistensi dapat dihitung menggunakan formula Kuder-Richardson (KR-20
atau KR-21). Jika hasil korelasinya tinggi, hal ni menunjukan bahwa antara butir
soal dalam satu set tes tersebut adalah konsisten dengan yang lain.
B. Hubungan Antara Validitas dan Reliabilitas

Ketetapan hasil pengukuran (reliabilitas) sangat diperlukan untuk memperoleh


alat ukur yang dapat memberkan hasil pengukuran yang tepat (valid).Walaupun
demikian alat ukur yang mempunyai reliabilitas yang tinggi belum tentu secara
otomatis mempunyai validitas yang tinggi. Karena tingginya validitas dapat
memberikan informasi yang salah tentang apa yang ingin Anda ukur.
C. Meningkatkan Reliabilitas Tes
Reliabilitas suatu tes dapat ditingkatkan dengan menambah jumlah butir soal ke
dalam tes tersebut. Butiran soal yang homogen artinya butiran soal-soal yang mengukur
hal yang sama dengan butir soal yang sudah ada. Penambahan butiran soal tidak akan
menaikkan reliabilitas tes jika butiran soal yang ditambahkan tidak homogen dengan
butiran soal yang telah ada.
Untuk menghitung penambahan butir soal menggunakan rumus Spearman-
Brown:
𝐽𝑟𝑦𝑦
𝑟𝑥𝑥 =
1 + (𝐽 − 1)𝑟𝑦𝑦

Dimana :

𝑟𝑥𝑥 : Reabilitas sebelum penambahan butir soal

𝑟𝑦𝑦 : Reabilitas setelah penambahan butir soal

J : Rasio jumlah butir soal setelah dan sebelum penambahan


D. Analisis dan Perbaikan Instrumen

Menurut Nitko (1983), analisis butir soal menggambarkan suatu proses


pengambilan data dan penggunaan informasi tentang tiap-tiap butir soal terutama
tentang respon siswa terhadap setiap butir soal. Lebih lanjut dikatakan bahwa arti
penting penggunaan analisis butir soal adalah sebagai berikut :

1. Untuk mengetahui apakah butir soal – butir soal yang disusun sudah berfungsi
sesuai dengan apa yang dikehendaki oleh penyusun soal. Untuk menentukan
apakah soal–soal yang kita susun telah berfungsi sebagaimana seharusnya maka
kita harus memperhatikan hal–hal sebagai berikut :
a. Apakah soal–soal yang disusun sudah sesuai untuk mengukur perubahan
tingkah laku seperti telah dirumuskan dalam tujuan instruksional khusus ?
b. Apakah tingkat kesukaran sudah kita perhatikan ?
c. Apakah soal tersebut sudah mampu membedakan antara siswa yang pandai
dengan siswa yang kurang pandai ?
d. Apakah kunci soal yang kita buat sudah benar sesuai dengan maksud soa ?
e. Jika menggunakan tes pilihan berganda, apakah pengecoh yang kita pilih
sudah berfungsi dengan baik ?
f. Apakah soal tersebut dapat ditafsirkan ganda atau tidak ?
2. Sebagai umpan balik bagi siswa untuk mengetahui kemampuan mereka dalam
menguasai suatu materi.
3. Sebagai umpan balik bagi guru untuk mengetahui kesulitan – kesulitan yang
dialami siswa dalam memahami suatu materi.
4. Sebagai acuan untuk merevisi soal.
5. Untuk memperbaiki kemapuan kita dalam menulis soal.

Pada saat kita mengujikan suatu set soal untuk mengambil keputusan penting
tentang hasil belajar siswa maka idealnya kita harus yakin bahwa set soal tersebut
adalah valid dan reliabel. Validitas set soal dapat diketahui dari kisi–kisi soal
sedangkan reliabelitas soala baru dapat diketahui setelah uji coba. Dalam rangka
memperoleh reliabilitas set soal inilah analisis butir soal dilakukan. Dalam
menganalisis butir soal paling tidak ada dua karakteristik butir soal yang perlu
diperhatikan yaitu tingkat kesukaran dan daya beda butir–butir soal.

E. Analisis Butir Soal

Pada saat Anda mengujikan suatu set soal untuk mengambil keputusan pennting
tentang hasil belajar siswa maka idealnya Anda harus yakn bahwa set soal tersebut
adalah valid dan reliabel. Dalam angka memperoleh reliabilitas set soal ini lah analisis
butir soal dilakukan.

1. Tingkat Kesukaran Butir Soal


Tingkat kesukaran merupakan salah satu karakteristik yang dapat
menunjukkan kualitas butir soal tersebut apakah termasuk mudah, sedang, atau
sukar.Suatu butir soal dikatakan mudah jika sebagian besar siswa dapat
mengerjakan dan benar dan dikatakan sukar jika sebagian besar siswa tidak dapat
menjawab dengan benar. Besarnya tingkat kesukaran butir soal, dapat dihitung
dengan memperhatikan proporsi peserta tes yang menajawab benar terhadap
setiap butir soal. Secara matematis tingkat kesukaran butir soal dapat dihitung
dengan rumus :

𝐵
𝑝=
𝑁
Dimana :

p : Indeks tingkat kesukaran butir soal

B : Jumlah peserta tes yang menjawab benar

N : Jumlah seluruh peserta

Menurut Fernandes (1984) kategori tingkat kesukaran butir soal adalah :

P > 0,75 : tinggi

0,25 ≤ P ≥ 0,75 : sedang

P ≤ 0,24 : rendah

Butir soal yang dianggap sangat bermanfaat(useful) adalah butir soal yang
mempunyai tingkat keskuran dalam kategori sedang.

2. Daya Beda (D)

Daya beda butir soal memiliki pengertian seberapa jauh butir soal tersebut
dapat membedakan kemamuan individu peserta tes. Butir soal didukung potensi
daya beda yang baik, akan mampu membedakan peserta didik yang memiliki
kemampuan tinggi (pandai) dengan peserta didik yang berkemampuan rendah
(kurang pandai). Daya beda butir soal dapat dihitung dengan menggunakan rumus
:

D = PA - PB

dimana :

D = indeks daya beda butir soal

PA = proprosi kelompok atas yang menjawab benar .

PB = proporsi kelompok bawah yang menjawab benar.


3. Analisis Butir Soal Sederhana

Untuk melakukan analisis butir soal secara sederhana, berikut ini disajikan
langkah-langkah dalam menganalisis butir soal :

a. Hitunglah jumlah jawaban yang benar untuk seluruh siswa.


b. Berdasarkan jumlah jawab yang benar dari seluruh siswa tersebut susunlah
skor siswa mulai dari skor tertinggi ke skor terndah.
c. Berdasarkan urutan skor tersebut tentukan siswa yang termasuk dalam
siswa kelompok atas dan siswa yang termasuk dalam kelompok bawah.
d. Hitunglah jumlah siswa dalam kelompok atas yang memilih tiap-tiap
alternatif jawaban yang disediakan
e. Dengan cara yang sama hitung jumlah siswa dalam kelompok bawah yang
memilih tiap-tiap alternatif jawaban yang disediakan
f. Hitung jumlah seluruh peserta tes (kelompok atas, tengah, dam bawah)
yang menajwab benar.
g. Hitung tingkat kesukaran butir soal dan daya beda dengan menggunakan
rumus yang telah disediakan.
4. Menganalisis Tes Uraian.

Pada umumnya analisis butir soal memang dilakukan untuk pilihan ganda
seperti contoh yang telah dibahas di atas. Tetapi sebetulnya kita bisa menganalisis
tes uraian yang telah diujikan dengan cara yang cukup mudah.

Cara menganalisis tes uraian oleh Whitney dan Sabers (Mehrens dan
Lehmann, 1984) sebagai berikut :

a. Tentukan jumlah yang termasuk dalam kelompok atas (25%) dan kelompok
bawah (25%)
b. Hitung jumlah skor kelompok atas dan jumlah skor kelompok bawah
c. Hitung tingkat kesukaran dan daya beda setiap butiran soal dengan rumus
berikut:

ΣA + ΣB − (2Nskormin )
𝑝=
2N(skormaks − skormin )

ΣA − ΣB
𝐷=
N(skormaks − skormin )

Dimana :
ΣA : Jumlah skor kelompok atas
ΣB : Jumlah skor kelompok bawah
N : 25 % peseerta didik
skormaks : Skor maksimal setiap butir soal
skormin : Skor minimal setiap butir soal
5. Memperbaiki Butir Soal

Beberapa hal dalam memperbaiki butiran soal sebagai berikut :

a. Perhatikan tingkat kesukaran butir soal. Butir soal dianggap baik jika
mempunyai tingkat kesukaran (p) antara 0.25 sampai dengan 0.75 atau yang
mendekati angkat tersebut.
b. Perhatikan daya beda butir soal. Butir soal dianggap baik jika kunci atau
jawaban yang dianggap benar mempunyai daya beda positif tinggi dan
alternative jawaban mempunyai daya beda negative dan ada salah satu
alternative jawaban mempunyai daya beda positif, maka butir soal tersebut
perlu ditelaah kembali,sebab ada kemungkinan terjadi salah kunci.
d. Memperbaiki Instrumen Non-Tes

Prosedur memperbaiki instrumen non-tes:

a. Meminta pakar untuk meriview atau menelaah instrument,


b. Uji coba kelapangan.
c. Analisis hasil uji coba dengan menggunakan program analisis instrument
yang relevan.
d. Melihat kualitas instrument seperti validitas, reliabilitas serta kualitas sosal
e. Memperbaiki butir soal yang lemah
f. Uji coba butir soal yang telah diperbaiki sampai yakin instrument non-tes
yang akan digunakan dapat dipertanggung jawabkan kualitasny.

Penyebab butir soal kurang baik antara lain :

a. Penggunaan bahasa kurang komukatif


b. Kalimat bersifat ambiguous (dapat ditafsirkan ganda)
c. Pertanyaan atau pernyataan yang dibuat menyimpang dari indikator
d. Pertanyaan atau pernyataan tidak mengukur trait (sifat) yang akan diukur.

KESIMPULAN

Berdasarkan uraian yang telah dipaparkan di atas dapat disimpulkan beberapa hal,
yaitu:

Masalah yang berhubungan dengan ketepatan hasil pengukuran inilah yang


dikenal dengan istilah validitas sedangkan masalah–masalah yang berhubungan dengan
ketetapan hasil pengukuran dikenal dengan istilah reliabilitas. Ketetapan hasil
pengukuran (reliabilitas) sangat diperlukan untuk memperoleh alat ukur yang dapat
memberkan hasil pengukuran yang tepat (valid).
Validitas set soal dapat diketahui dari kisi–kisi soal sedangkan reliabelitas soal
baru dapat diketahui setelah uji coba. Dalam rangka memperoleh reliabilitas set soal
inilah analisis butir soal dilakukan. Dalam menganalisis butir soal paling tidak ada dua
karakteristik butir soal yang perlu diperhatikan yaitu tingkat kesukaran dan daya beda
butir–butir soal.
analisis butir soal menggambarkan suatu proses pengambilan data dan
penggunaan informasi tentang tiap-tiap butir soal terutama tentang respon siswa
terhadap setiap butir soal.

Anda mungkin juga menyukai