Prinsip pengukuran hasil belajar pada dasarnya dapat dikenakan pada dua aspek perubahan
atau pertumbuhan fisik (biologis) dan perkembangan psikis (psikologis). Pengukuran
pertumbuhan fisik lebih mudah dilakukan dibandingkan dengan pengukuran psikis (psikologis).
Pengukuran pertumbuhan fisik dapat dilakukan secara lansung dngan menggunakan alat ukur
yang tingkat validitasnya terukur, sedangkan pengukuran atribut psikologis pada dasarnya
pengukuran terhadap performansi tipikal, yaitu penampilan yang merupakan karakter tipikal
seseorang yang cendrung muncul dalam bentuk respon terhadap situasi-situasi tertentu yang
sedang dihadapi.
Pembelajaran merupakan suatu system yang komplek mencakup banyak elemen yang saling
berkaitan satu sama lain untuk mencapai tujuan tertentu. Dalam prosesnya melalui tiga tahap
utama yakni : perencanaan, pelaksanaan, evaluasi. Evaluasi membutuhkan instrument yang
bukan hanya mampu mengukur keberhasilan ilmu (kognitif), melainkan juga nilai afektif dan
keterampilan (Psikomotor). Dengan kata lain, setiap aspek yang ada dalam proses pembelajaran
membutuhkan alat ukur yang tepat dan sesuai agar data yang diperoleh sesuai dengan keadaaln
dilapangan. Oleh karena itu dibutuhkan instrument untuk mengukur berbagai aspek dalam proses
pembelajaran baik untuk ranah afektif maupun psikomotor. Salah satu bentuk intrumen yang
diberikan adalah berupa tes yang biasa diwakili oleh beberapa soal.
1. ANALISIS KUALITAS BUTIR SOAL
a. Pengertian analisis kualitas butir soal
Kegiatan menganalisis butir soal merupakan suatu kegiatan yang harus dilakukan guru untuk
meningkatkan mutu soal yang telah tertulis. Kegiatan ini merupakan proses pengumpulan ,
peringkasan, dan penggunaan informasi dari jawaban siswa untuk membuat keputusan tentang
setiap penilaian (Nitko, 1996 :308)
Analisis tes dan butir soal merupakan suatu tahap yang harus ditempuh untuk mengetahui
derajat kualitas suatu tes, baik tes secara keseluruhan maupun butir soal yang menjadi bagian
dari tes tersebut. sebab itu, tes digunakan guru harus memiliki kualitas yang baik. Analisis tes
berkaitan dengan pertanyaan apakah tes itu mampu dijadikan sebagai alat ukur benar-banar
mampu mengukur apa yang hendak diukur, dan sampai dimana tes tersebut dapat diandalkan dan
berguna.
b. Tujuan anlisis kualitas butir soal
Penelaahan kualitas butir soal, menurut Aiken (1994:63) memiliki tiga tujuan, antara lain :
Untuk mengkaji dan menelaah setiap butir soal agar memperoleh soal yang bermutu
dalam sebuah tes yang dibuat guru adalah untuk mengidentifikasi kekurangan-kekurangan
dalam tes atau dalam pembelajaran.
kelas)
mendukung penulisan butir soal yang efektif
secara materi dapat memperbaiki tes di kelas
diskusi di kelas
memberi masukan kepada guru tentang kesulitan siswa
memberi masukan pada aspek tertentu untuk pengembangan kurikulum
merevisi materi yang dinilai atau diukur
meningkatkan keterampilan penulisan soal
d. Proses dan prosedur analisis kualitas butir soal
Dalam melaksanakan analisis butir soal, para penulis soal dapat menganalisis secara
kualitatif dalam kaitannya dengan isi dan bentuknya, dan kuantitatif dalam kaitannya dengan isi
dan statistiknya. Analisis kualitas mencakup pertimbangan validitas isi konstruk, sedangkan
analisis kuantitatif mencakup pengukuran kesulitan butir soal dan diskriminasi soal termasuk
validitas soal dan reliabilitasnya.
Dengan demikian, ada dua cara yang dapat digunakan dalam penelahaan butir soal, yaitu
penelaahan secara kualitatif dan kuantitatif. Kedua teknik ini masing-masing memiliki
keunggulan dan kelemahan. Oleh karena itu, teknik terbaik adalah menggunakan keduanya
(Penggabungan)
i.
ii.
didasarkan pada data empirik dari butir soal yang bersangkutan. Data empirikini diperoleh dari so
al yang telah diujikan.
yaitu
dilaksanakan sehari-
soal
bentuk
obyektif)
atau
Analisi butir soal secara modern adalah penelahaan butir soal dengan menggunakan Item
Response Theory (IRT). Atau teori jawaban butir soal. Teori ini merupakan suatu teori yang
menggunakan fungsi matematika untuk menghubungkan antara peluang menjawab benar
suatu soal dengan kemampuan siswa.
Ada 4 macam model IRT yang dikembangkan menurut Hambleton dan Swaminathan
Model suatu parameter , yaitu untuk menganalisis data yang hanya menitikberatkan
banyak memberi informasi tentang butir soal atau peserta tes (Asmawi Zainul, dkk : 1997). Pada
analisis butir soal secara klasikal, seperti yang dijelaskan oleh Depdikbud (1997) tingkat
kesukaran dapat diperoleh dengan beberapa cara antara lain : a). skala kesukaran linier; b). skala
bivariat; c). indeks davis; d). proporsi menjawab benar.
Cara yang paling umum digunakan adalah proporsi menjawab benar atau proportion correct,
yaitu jumlah peserta tes yang menjawab benar pada soal yang dianalisis dibandingkan dengan
peserta tes seluruhnya. Dalam analisis item ini digunakan proportion correct p. Untuk menyusun
suatu naskah ujian sebaiknya digunakan butir soal yang mempunyai tingkat kesukaran
berimbang, yaitu : soal berkategori sukar sebanyak 25%, kategori sedang 50% dan kategori
mudah 25%.
Dalam penggunaan butir soal dengan komposisi seperti di atas, maka dapat diterapkan
penilaian berdasar acuan norma atau acuan patokan. Bila komposisi butir soal dalam suatu
naskah ujian tidak berimbang, maka penggunaan penilaian acuan norma tidaklah tepat, karena
informasi kemampuan yang dihasilkan tidaklah akan berdistribusi normal. Walaupun demikian
ada yang berpendapat bahwa soal-soal yang dianggap baik adalah soal-soal yang sedang, yaitu
soal-soal yang mempunyai indeks kesukaran berkisar antara 0,26 0,75.
Berbagai kriteria tersebut mempunyai kecenderungan bahwa butir soal yang memiliki indeks
kesukaran kurang dari 0,25 dan lebih dari 0,75 sebaiknya dihindari atau tidak digunakan, karena
butir soal yang demikian terlalu sukar atau terlalu mudah, sehingga kurang mencerminkan alat
ukur yang baik. Namun demikian menurut Suharsimi Arikunto (2001) soal-soal yang terlalu
mudah atau terlalu sukar tidak berarti tidak boleh digunakan. Hal ini tergantung dari tujuan
penggunaannya. Jika dari peserta tes banyak, padahal yang dikehendaki lulus hanya sedikit maka
diambil peserta yang terbaik, untuk itu diambilkan butir soal tes yang sukar. Demikian
sebaliknya jika kekurangan peserta tes, maka dipilihkan soal-soal yang mudah.
Selain itu, soal-soal yang sukar akan menambah motivasi belajar bagi siswa-siswa yang
pandai, sedangkan soal-soal yang mudah akan membangkitkan semangat kepada siswa yang
lemah.
2) Daya beda
Daya beda butir soal ialah indeks yang menunjukkan tingkat kemampuan butir soal
membedakan kelompok yang berprestasi tinggi (kelompok atas) dari kelompok yang berprstasi
rendah (kelompok bawah) diantara para peserta tes (Asmawi Zainul, dkk : 1997). Suryabrata
(1999) menyatakan tujuan pokok mencari daya beda adalah untuk menentukan apakah butir soal
tersebut memiliki kemampuan membedakan kelompok dalam aspek yang diukur, sesuai dengan
perbedaan yang ada pada kelompok itu.
Daya beda butir soal yang sering digunakan dalam tes hasil belajar adalah dengan
menggunakan indeks korelasi antara skor butir dengan skor totalnya. Daya beda dengan cara ini
sering disebut validitas internal, karena nilai korelasi diperoleh dari dalam tes itu sendiri. Daya
beda dapat dilihat dari besarnya koefisien korelasi biserial maupun koefesien korelasi point
biserial. Dalam analisis ini digunakan nilai koefisien korelasi biserial untuk menentukan daya
beda butir soal. Koefisien korelasi biserial menunjukkan hubungan antara dua skor, yaitu skor
butir soal dan skor keseluruhan dari peserta tes yang sama.
Koefisien daya beda berkisar antara 1,00 sampai dengan +1,00. Daya beda +1,00 berarti
bahwa semua anggota kelompok atas menjawab benar terhadap butir soal itu, sedangkan
kelompok bawah seluruhnya menjawab salah terhadap butir soal itu. Sebaliknya daya beda 1,00
berarti bahwa semua anggota kelompok atas menjawab salah butir soal itu, sedangkan kelompok
bawah seluruhnya menjawab benar terhadap soal itu. Daya beda yang dianggap masih memadahi
untuk sebutir soal ialah apabila sama atau lebih besar dari +0,30.
Bila lebih kecil dari itu, maka butir soal tersebut dianggap kurang mampu membedakan
peserta tes yang mempersiapkan diri dalam menghadapi tes dari peserta yang tidak
mempersiapkan diri. Bahkan bila daya beda itu menjadi negatif, maka butir soal itu sama sekali
tidak dapat dipakai sebagai alat ukur prestasi belajar.
Oleh karena itu butir soal tersebut harus dikeluarkan dari perangkat soal. Makin tinggi daya
beda suatu butir soal, maka makin baik butir soal tersebut, dan sebaliknya makin rendah daya
bedanya, maka butir soal itu dianggap tidak baik (Asmawi Zainul, dkk : 1997).
Evaluasi hasil belajar antara lain mengunakan tes untuk melakukan pengukuran
hasil belajar. Tes dapat didefinisikan sebagai seperangkat pertanyaan dan/atau tugas
yang direncanakan untuk memperoleh informasi tentang trait, atribut pendidikan,
psikologik atau hasil belajar yang setiap butir pertanyaan atau tugas tersebut
mempunyai jawaban atau ketentuan yang dianggap benar. Pengukuran diartikan
sebagai pemberian angka pada status atribut atau karakteristik tertentu yang dimiliki
oleh orang, hal, atau objek tertentu menurut aturan atau formulasi yang jelas. Penilaian
adalah suatu proses untuk mengambil keputusan dengan menggunakan informasi yang
diperoleh melalui pengukuran hasil belajar baik yang menggunakan instrumen test
maupun non-test. Penilaian dimaksudkan untuk memberi nilai tentang kualitas hasil
belajar secara klasik tujuan evaluasi hasil belajar adalah untuk membedakan kegagalan
dan keberhasilan seorang peserta didik.
a.
Wawancara
dan mendalam. Wawancara dapat direkam sehingga jawaban siswa bisa dicatat secara
lengkap. Melalui wawancara, data bisa diperoleh dalam bentuk kualitatif dan kuantitatif.
Pertanyaan yang tidak jelas dapat diulang dan dijelaskan lagi, begitupun dengan
jawaban yang belun jelas. Ada dua jenis wawancara, yakni wawancara terstruktur dan
wawanncara bebas. Dalam wawancara berstruktur kemungkinan jawaban telah
disiapkan sehingga siswa tinggal mengkategorikannya kepada alternatif jawaban yang
telah dibuat. Keuntungannya ialah mudah diolah dan dianalisis untuk dibuat
kesimpulan. Sedangkan untuk wawancara bebas, jawaban tidak perlu disiapkan
sehingga siswa bebas mengemukakan pendapatnya. Keuntungannya ialah informasi
lebih padat dan lengkap sekalipun kita harus bekerjakeras dalam menganalisisnya
sebab jawabannya bisa beraneka ragam.
Ada tiga aspek yang harus diperhatikan dalam melaksanakan wawancara.
1.
suasana keakraban.
2.
Pencataan hasil wawancara di mana dicatat saat itu juga supaya tidak lupa.
b.
Kuisioner
c.
Skala
Skala adalah alat untuk mengukur sikap , nilai, minat dan perhatian, dll, yang disusun
dalam bentuk pernyataan untuk dinilai oleh responden dan hasilnya dalam bentuk
rentangan nilai sesuatu dengan kriteria yang ditentukan.
1.
Skala Penilaian
Skala penilaian mengukur penampilan atau perilaku orang lain oleh seseorang
melalui pernyataan perilaku individu pada suatu titik yang bermakna nilai. Titik atau
kategori diberi nilai rentangan mulai dari yang tertinggi sampai yang terendah, bisa
dalam bentuk huruf atau angka. Hal yang penting diperhatikan dalam skala penilaian
adalah kriteria skala nilai, yakni penjelasan operasional untuk setiap alternatif jawaban.
Adanya kriteria yang jelas akan mempermudah pemberian penilaian. Skala penilaian
lebih tepat digunakan untuk mengukur suatu proses, misalnya proses mengajar pada
guru, siswa, atau hasil belajar dalam bentuk perilaku seperti keterampilan, hubungan
sosial siswa, dan cara memecahkan masalah. Skala penilaian dalam pelaksanaannya
dapat digunakan oleh dua orang penilai atau lebih dalam menilai subjek yang sama.
Maksudnya agar diperoleh hasil penilaian yang objektif mengenai perilaku subjek yang
dinilai.
2.
Skala sikap
Skala sikap digunakan untuk mengukur sikap seseorang terhadap objek tertentu.
Hasilnya berupa kategori sikap, yakni mendukung (positif), menolak (negatif), dan
netral. Sikap pada hakikatnya dapat diartikan reaksi seseorang terhadap suatu stimulus
yang dating kepada dirinya.
Ada tiga komponen sikap yakni:
a.
c.
tersebut.
Skala sikap dinyatakan dalam bentuk pernyataan untuk dinilai oleh responden, apakah
pernyataan itu didukung atau ditolaknya, melalui rentangan nilai tertentu. Oleh karena
itu, pernyataan yang diajukan dibagi ke dalam dua kategori yakni pernyataan positif dan
pernyataan negatif. Salah satu skala yang sering digunakan adalah Likert. Dalam skala
Likert, pernyataan-pernyataan yang diajukan baik pernyataan positif maupun negatif,
dinilai oleh subjek dengan sangat setuju, setuju, tidak punya pendapat, tidak setuju, dan
sangat tidak setuju. Skor yang diberikan terhadap pilihan tersebut bergantung pada
penilai asal penggunaannya konsisten. Yang jelas, skor untuk pernyataan positif atau
negatif adalah kebalikannya.
d.
Observasi
Observasi atau pengamatan sebagai alat penilaian banyak digunakan untuk mengukur
tingkah laku individu ataupun proses terjadinya suatu kegiatan yang dapat diamati, baik
dalam
situasi
yang
sebenarnya
maupun
dalam
situasi
buatan.
proses yang terjadi dalam situasi yang sebenarnya dan langsung diamati oleh
pengamat.
2.
menggunakan alat seperti mikroskop utuk mengamati bakteri, suryakanta untuk melihat
pori-pori kulit.
3.
pengamat harus melibatkan diri atau ikut serta dalam kegiatan yang dilaksanakan oleh
individu atau kelompok yang diamati, sehingga pengamat bisa lebih menghayati,
merasakan dan mengalami sendiri seperti inddividu yang sedang diamatinya.
Observasi untuk menulai proses belajar mengajar dapat dilakasanakan oleh guru di
kelas pada saat siswa melakukan kegaitan belajar. Untuk itu gurutidak perlu terlalu
formal memperhatikan perilaku siswa, tetapi ia mencatat secara teratur gejaka dan
perilaku yang ditunjukkan oleh setiap siswa.
e.
Studi kasus
Studi kasus pada dasarnya mempelajari secara intensif seorang individu yang
dipandang mengalami kasus tertentu. Misalnya mempelajari secara khusus anak nakal,
anak yang tidak bisa bergaul dengan orang lain, anak yang selalu gagal dalam belajar,
dan lain lain. Kasus tersebut dipelajari secara mendalam dan dalam kurun waktu yang
cukup lama. Mendalam artinya mengungkapkan semua variabel yang menyebabkan
terjadinya kasus tersebut dari berbagai aspek yang mempengaruhi dirinya. Penekanan
yang utama dalam studi kasus adalah mengapa individu melalukan apa yang
dilakukannya dan bagaimana tingkah lakunya dalam kondisi dan pengaruhnya terhadap
lingkungan. Datanya bisaa diperoleh berbagai sumbar seperti orang tua, teman
dekatnya, guru, bahkan juga dari dirinya. Kelebihan studi kasus adalah bahwa subjek
dapat dipelajari secara mendalam dan menyeluruh. Namun, kelemahannya sesuai
dengan sifat studi kasus bahwa informasi yang diperoleh sifatnya subjektif, artinya
hanya untuk individu yang bersangkutan, dan belum tentu dapat digunakan untuk kasus
yang sama pada individu yang lain.
penilaian sikap terhadap materi pelajaran. Berawal dari sikap positif terhadap
mata pelajaran akan melahirkan minat belajar, kemudian mudah diberi motivasi serta lebih
mudah dalam menyerap materi pelajaran.
b.
Penilaian sikap terhadap guru. Peserta didik perlu memilki sikap positif
terhadap guru, sehingga ia mudah menyerap materi yang diajarkan oleh guru.
c.
sikap positif terhadap proses pembelajaran, sehingga pencapaian hasil belajar bisa maksimal.
Hal ini kembali kepada guru untuk pandai-pandai mencari metode yang kira-kira dapat
merangsang peserta didik untuk belajar serta tidak merasa jenuh.
d.
Penilaian sikap yang berkaitan dengan nilai atau norma yang berhubungan
dengan suatu materi pelajaran. Misalnya peserta didik mempunyai sikap positif terhadap
upaya sekolah melestarikan lingkungan dengan mengadakan program penghijauan sekolah.
e.
ang relevan dengan mata pelajaran. Peserta didik memiliki sikap positif terhadap
berbagai kompetensi setiap kurikulum yang terus mengalami perkembangan sesuai dengan
kebutuhan.
Sedangkan untuk mengukur sikap dari beberapa aspek yang perlu dinilai, dapat
dilakukan dengan beberapa cara, antara lain: observasi perilaku, pertanyaan langsung,
laporan pribadi, dan penggunaan skala sikap. Observasi perilaku di sekolah dapat dilakukan
dengan menggunakan buku catatan yang khusus tentang kejadian-kejadian yang berkaitan
dengan siswa selama di sekolah. Contoh guru membuat bagan catatan observasi.
Hari/tanggal
Senin,
24/10/16
Nama Siswa/i
Ahmad
Catatan
Belajar
Inggris
bersemangat
Tindak Lanjut
Bahasa Diberi
penjelasan
tidak tentang
manfaat
belajar
bahasa
Inggris
Kolom catatan diisi dengan berbagai kejadian yang berhubungan dengan peserta didik
yang bersangkutan baik positif maupun negatif, sedangkan kolom tindak lanjut diisi dengan
upaya-upaya yang ditempuh sebagai solusi dari setiap kejadian yang menimpa peserta didik.
Pernyataan
S
Kegiatan
di
sekolah
kegiatan
kurang
Ramadhan
Ramadhan
Pilihan sikap
S
N
T
S
S
TS
Kemudian hasil penilain sikap dapat digunakan sebagai umpan balik untuk
melakukan pembinaan terhadap peserta didik. Guru dapat memantau setiap perubahan
perilaku yang dimunculkan peserta didik dengan melakukan pengamata