Anda di halaman 1dari 36

Materi EP-1

PENGERTIAN TES, PENGUKURAN, PENILAIAN DAN EVALUASI

A. Pendahuluan
Untuk dapat melakukan evaluasi yang layak, maka seorang evaluator (orang yang
bertindak melakukan evaluasi) harus memahami substansi dasar tentang konstruksi tes
dan perangkat teknik untuk mengukur kelayakan suatu tes. Oleh karena itu pada sesi ini
pembicaraan akan dimulai dari bagaimana mengkonstruksi tes yang baik dan baru
membahas bagaimana prosedur melakukan evaluasi suatu tes dan hasil pengukuran dari
tes itu.
Pada sisi yang lain pembicaraan tentang defisini tentang tes, pengukuran, penilaian, dan
evaluasi perlu ditelaah secara cermat lebih dahulu, agar menjadi landasan kuat untuk
mengantar pemahaman lebih lanjut.

B. Tes, Pengukuran, Penilaian dan Evaluasi

1. Pengertian Tes, Pengukuran, Penilaian dan Evaluasi


Menurut Allen & Yen, 1979 (Djemari Mardapi, 2008:1) “Pengukuran adalah
penetapan angka dengan cara yang sistematik untuk menyatakan keadaan individu”;
keadaan itu dapat mencakup kemampuan kognitif, afektif, dan psikomotor. Kini telah
dikembangkan untuk kemampuan mengendalikan emosi.
Menurut TGAT, 1987 (Djemari Mardapi, 2008:1) penilaian atau asesmen
mencakup semua cara yang digunakan untuk menilai unjuk kerja individu atau kelompok.
Prosesnya meliputi pengumpulan bukti-bukti tentang pencapaian belajar peserta didik
yang didapatkan dengan cara tes maupun non tes. Definisi asesmen berkaitan dengan
semua proses pendidikan, seperti karakteristik peserta didik, karakteristik metode
mengajar, kurikulum, fasilitas, dan administrasi.
Evaluasi merupakan tindakan penetapan nilai atau implikasi suatu perilaku, baik
individu atau lembaga. Pengukuran, penilaian dan evaluasi menurut Griffin dan Nix,
1991 (Djemari Mardapi, 2008:1) adalah bersifat herarkhi atau berjenjang. Pengukuran

1
adalah tindakan membandingkan hasil pengamatan dengan kriteria, sementara penilaian
atau asesmen adalah tindakan menafsirkan atau menjelaskan hasil pengukuran, dan
evaluasi adalah penetapan tentang nilai atau implikasi dari perilaku hasil pengukuran dan
penilaian. Jadi setiap tindakan evaluasi selalu didahului oleh tindakan pengukuran dan
penilaian, sehingga di sini menjadi jelas bahwa tindakan penilaian harus didahului oleh
tindakan pengukuran.

1. Tes
Tes dapat didefinisikan sebagai suatu pertanyaan atau tugas yang direncanakan
untuk memperoleh informasi tentang trait atau atribut pendidikan atau psikologi yang
setiap butir pertanyan atau tugas itu mempunyai jawaban atau ketentuan yang dianggap
benar (Zainul & Nasution, 2001: 3). Sebagai konsekuensinya setiap tes menuntut adanya
tanggapan atau respon dari peserta didik (subjek yang dikenai tes) dan karenanya
disimpulkan sebagai trait yang dimiliki oleh peserta didik atau subjek yang sedang dicari
informasinya. Oleh sebab itu jika ada tugas atau pertanyaan yang harus dikerjakan oleh
peserta didik tetapi tidak ada jawaban atau tidak ada respon berupa jawaban yang benar
atau salah, maka hal itu bukanlah tes. Miller (2008: 1) menyatakan bahwa:
“tests are formal assessment instruments used to judge students’ cognitive ability
in an academic discipline as well as to gather quantitative information about
student’ psychomotor performance (physical skills) and affective characteristics
(e.g. attitudes, emotions, interests, and values).

Tes pada umumnya terdiri dari seperangkat himpunan pertanyaan, pernyataan,


atau tugas yang diadministrasikan dan dikenakan kepada peserta didik atau sekelompok
peserta didik. Berhubung adanya kendala keterbatasan waktu dan faktor lainnya, tes
hanya mengukur sebagian saja (sampel) dari suatu perilaku objek pengukuran. Jadi tes
memiliki keterbatasan, tidak mampu mengukur semua informasi tentang apa yang sudah
dipelajari oleh peserta didik, kecuali hanya dipilih sebagai sampel dari objek kawasan
yang telah dipelajari oleh peserta didik. Untuk dapat mewakili kawasan atau objek yang
dicari informasinya dari apa yang telah dipelajari oleh peserta didik maka digunakanlah
kisi-kisi tes atau blue print test dalam merancangnya.

2
2. Pengukuran
Hampir setiap hari kita selalu berhadapan dengan tindakan pengukuran. Saat kita
akan berangkat ke kuliah kita sudah punya kriteria waktu yakni jam berapa harus tiba di
kampus, misalnya jam 8.00. Atas dasar kriteria ini kita mempertimbangkan jam berapa
harus mulai berangkat dari rumah jika jarak tempuh rumah dengan kampus 30 kilometer.
Apabila diperkirakan kondisi jalan lancar tidak macet dan kecepatan rata-rata per
kilometer 60 km/jam, berarti berangkat dari rumah paling tidak harus pukul 7.30. Contoh
semacam ini adalah salah satu tindakan yang di dalam tindakan itu ada unsur pengukuran.
Contoh yang lain, pada saat kita akan membeli kertas untuk membuat tugas paper kita
mencari kertas yang berukuran kwarto dan bukan yang folio. Tindakan memilih ukuran
kertas yang kwarto ini telah melalui tindakan pengukuran yakni membanding ukuran
panjang dan lebar kertas yang sesuai dengan ketentuan ukuran kertas yang dipersyaratkan
dalam pembuatan paper. Jika demikian, apa sebenarnya pengukuran itu?
Pengukuran pada dasarnya merupakan kegiatan penentuan angka bagi suatu objek
secara sistematik, untuk menggambarkan karakteristik objek tersebut. Dalam penentuan
karakteristik pada objek pengukuran, sedapat mungkin dihindari adanya kesalahan
pengukuran. Kesalahan pengukuran bersumber dari alat ukur, cara mengukur, dan
kondisi objek yang diukur (Djemari Mardapi, 2008:2). Sementara ahli lain Miller (2008:
2) membuat definisi pengukuran sebagai berikut:
“Measurement is a quantitative description of an individual’s achievement on a
single test or multiple assessments (e.g. a student answered 9 to 10 or 90% of the
test questions correctly).

Hasil pengukuran melalui tes dan penilaian (asesmen) digunakan untuk melihat unjuk
kerja atau sebagai dasar pemberian nilai (grade). Informasi dari hasil pengukuran juga
dapat digunakan untuk: (1) memantau kemajuan belajar peserta didik, (2) membantu
perencanaan pengembangan karir peserta didik, (3) mengelompokan peserta didik
berdasarkan minat, sikap, dan kesiapannya, (4) membuat keputusan tentang kebijakan
pendidikan, (5) untuk perbaikan kurikulum, dan (6) untuk mengetahui efektivitas
pengajaran.
Pada kegiatan evaluasi hasil belajar akan dihadapi masalah-masalah yang
berkaitan dengan alat ukur yang digunakan, cara menggunakan, cara penilaian, dan

3
evaluasinya. Alat ukur yang memenuhi kaidah pengukuran harus memiliki bukti
kesahihan (validitas) dan kehandalan (reliabilitas).
Kesahihan alat ukur dari segi konstruknya dapat dilihat sejauh mana alat ukur
mengukur apa yang sebenarnya diukur. Secara teori pengukuran, substansinya harus satu
dimensi (unidimensionality). Untuk melihat apakah tes memiliki sifat satu dimensi
tentang konstruknya dapat dianalisis dengan pendekatan analisis faktor (factor analysis)
atau dengan analisis konfirmasi faktor (confirmatory factor analysis). Analisis faktor
dapat dilakukan dengan bantuan software SPSS dan analisis konfirmasi faktor dapat
dilakukan dengan software AMOS atau Lisrel. Lebih lanjut telaah tentang konstruksi alat
ukur dapat ditinjau dari aspek materi, teknik penulisan soal, dan bahasa yang digunakan.
Kesahihan alat ukur dari segi isi dapat dilihat dari kisi-kisinya. Kisi-kisi alat ukur
berisi tentang materi yang diujikan, bentuk soal, tingkat berpikir yang diacu, bobot soal,
dan cara penskoran. Kisi-kisi dikatakan baik jika sudah mewakili cakupan bahan ajar.
Cakupan bahan ajar yang dipilih dengan kriteria (1) pokok bahasannya esensial, (2)
memiliki nilai aplikasi, (3) berkelanjutan, dan (4) dibutuhkan untuk mempelajari
matapelajaran lain. Lamanya waktu untuk mengerjakan soal juga perlu menjadi kriteria.
Alat ukur yang baik, memiliki kesalahan pengukuran minimal dan hasil
pengukuran cenderung konstan walaupun dipakai berulang-ulang pada tingkat
kemampuan objek yang relatif tetap. Kesalahan pengukuran dapat bersifat acak dan
bersifat sistematik. Kesalahan pengukuran mengakibatkan under atau over estimate hasil
pengukuran. Kesalahan acak bersumber dari variasi kondisi fisik dan mental subjek yang
diukur dan yang mengukur. Kesalahan sistematik bersumber dari alat ukurnya, yang
diukur, dan yang mengukur. Contoh kesalahan sistematik, misalnya memberi skor murah
atau mahal pada semua peserta didik. Jika murah atau mahal untuk kelompok tertentu,
maka telah terjadi bias pengukuran. Berdasarkan kenyataan betapa rumitnya melakukan
pengukuran yang acapkali mengandung kesalahan sistematik dan acak, muncullah teori
pengukuran. Ada dua teori yang bebeda asumsi kini telah banyak ditelaah orang, yakni
teori tes klasik atau clacical test theory (CTT) dan teori modern atau item response theory
(IRT).
Teori tes klasik berasumsi bahwa (a) skor yang diperoleh individu dari hasil
pengukuran dapat diurai menjadi skor sebenarnya dan skor kesalahan, (b) tidak ada

4
hubungan antara skor yang sebenarnya dengan skor kesalahan. Berangkat dari dua asumsi
ini maka berkembanglah rumus-rumus untuk menghitung tingkat kesahihan (validitas)
dan tingkat kehandalan (reliabilitas).
Teori tes klasik memiliki kelemahan, antara lain: (a) ketergantungan statistik butir
pada karakteristik kelompok yang diukur, akibatnya besaran statistik butir bervariasi dari
satu kelompok terhadap kelompok yang lain, lebih lanjut sulit membandingkan
kemampuan kelompok atau individu yang satu dengan yang lain. Kelemahan ini telah
dirasakan untuk pengukuran pada objek alam (karakteristiknya lebih konstan) dan
semakin dirasakan jika objek pengukuran adalah manusia (karakteristiknya labil). Atas
dasar kelemahan ini maka dikembangkan oleh para pakar tentang teori tes modern (IRT)
dengan mengacu dan berusaha mengembangkan analisis untuk estimasi kemampuan
seseorang tanpa dipengaruhi oleh alat ukur yang digunakan. Statistik butir diupayakan
juga tidak tergantung pada karakteristik individu yang diukur.

3. Asesmen atau Penilaian


Istilah asesmen acapkali diikuti secara lengkap menjadi asesmen kelas (classroom
assessment); secara kosa kata istilah asesmen diterjemah menjadi penilaian. Asesmen
kelas atau asesmen/penilaian cakupan berlakunya ada dalam konteks pengajaran dan
pembelajaran di kelas. Ditilik dari komponen sistem pendidikan maka asesmen hanya
mencakup hubungan antara komponen Input-Proses-Output dalam sistem; sementara jika
komponen Outcome tercakup di dalam kajian tersebut maka disebut Evaluasi Program
(program evaluation). Evaluasi program berarti meliputi cakupan Input-Proses-Output-
Outcome, yakni mulai dari masukan (peserta didik dan lainnya) hingga diperoleh lulusan
atau keluaran yang sudah diterima oleh pengguna tenaga kerja di masyarakat. Asesmen
atau penilaian kelas yang dikaji berhubungan dengan substansi capaian hasil belajar dari
konteks intervensi melalui pengajaran dan pembelajaran di kelas, terdiri dari capaian
hasil belajar berupa ranah pengetahuan (cognitive), sikap (afektive), dan keterampilan
(psikomotoric). Sementara evaluasi program yang dikaji adalah aspek kebermanfaatan
dari suatu proses pendidikan yang terkait dengan analisis kebermanfaatan secara sosial
(social benefit analysis) dan analisis kebermanfaatan secara ekonomis (economics benefit
analysis). Kebermanfaatan secara sosial lebih berorientasi pada imbaljasa sosial yakni

5
terbentuknya modal sosial (social capital) pada diri lulusan yang sering dikenal dengan
karakter atau soft skill dengan karakteristik memiliki sikap religius, nasionalis, mandiri,
gotong royong, dan integritas. Kebermanfaatan secara ekonomis lebih berorientasi pada
kebermanfaatan dari investasi terhadap kegiatan pendidikan para lulusan, yang sering
digunakan kriteria ukurannya adalah rerata lama waktu tempuh studi, rerata waktu tunggu
memperoleh pekerjaan, rerata percepatan waktu pengembalian modal (payback periode),
tingkat pendapatan bersih nilai kini (net present value) dari ekspektasi suatu pekerjaan
yang dijabat oleh lulusan, tingkat rentabilitas dari modal yang terserap untuk dana
pendidikan lulusan (rate of return), dan beberapa pendekatan perhitungan lainnya yang
bisa dikaji lebih jauh dalam kajian tentang biaya manfaat pendidikan (education cost
benefit analysis). Kajian-kajin baik dari aspek modal sosial maupun dari kebermanfaatan
secara ekonomis menyadarkan betapa pentingnya usaha untuk meningkatkan mutu
pendidikan.
Usaha peningkatan mutu pendidikan dapat ditempuh dengan berbagai cara antara
lain dengan peningkatan kualitas pembelajaran dan sistem penilaiannya. Antara keduanya
terdapat hubungan timbal balik (reciprocal) saling menentukan, kondisi sistem
pembelajaran yang baik memberi dampak pada hasil belajar yang baik, iklim atau
suasana belajar yang baik juga menentukan hasil belajar, sehingga dapat ditegaskan
bahwa hasil penilaian menjadi tolok ukur kualitas sistem pembelajaran. Sistem
pembelajaran yang baik akan memotivasi pendidik untuk memilih strategi mengajar dan
memotivasi peserta didik yang paling tepat yang memungkinkan peserta didik menjadi
terdorong untuk terus meningkatkan intensitas belajarnya. Jadi peningkatan sistem
penilaian merupakan hal yang urgen atau penting untuk peningkatan mutu pendidikan
baik dari perencanaan, proses implementasi, dan evaluasinya.
Penilaian meliputi semua cara untuk menilai unjuk kerja atau hasil kerja yang
berfokus pada individu yakni prestasi belajar yang dicapai individu. Prosesnya adalah
menghimpun bukti-bukti tentang pencapaian belajar peserta didik antara lain melalui tes
untuk ranah pengetahuan, pengamatan atau observasi untuk ranah keterampilan dan
laporan diri atau skala sikap untuk ranah sikap. Penilaian yang baik memerlukan data dan
proses pengukuran yang baik untuk ketiga ranah pengetahuan, sikap dan keterampilan.

6
Menurut Bento, 1994 (Djemari Mardapi, 2008:6) penilaian mulai dikenal sebagai
cara membelajarkan seseorang dirintis oleh staf pengajar Fakultas Alverno sejak 20 tahun
yang lalu. Ini merupakan contoh bagaimana mengubah lembaga melalui program
penilaian. Terkait dengan itu, menurut Chittenden, 1991 (Djemari Mardapi, 2008:6)
kegiatan penilaian dalam pembelajaran perlu diarahkan kepada: (1) penelusuran; yakni
menelusuri kesesuaian proses pembelajaran dengan rencana, (2) pengecekan, yakni
mencari informasi tentang kekurangan pada peserta didik selama proses pembelajaran,
(3) pencarian, yakni mencari dan menemukan penyebab kekurangan yang timbul dalam
proses pembelajaran, dan (4) penyimpulan, yakni menyimpulkan tentang tingkat
pencapaian belajar peserta didik.
Peningkatan mutu pendidikan memerlukan alat ukur yang sahih (valid) dan
handal (reliabel). Pada sisi lain terdapat 2 acuan yang digunakan untuk penilaian, yakni
acuan norma (norm reference test) dan acuan kriteria (creterion reference test).
Penafsiran hasil tes antara kedua acuan ini berbeda (karena asumsi yang digunakan
berbeda) sehingga informasi yang didapat juga berbeda. Penggunaan acuan yang mana
yang tepat, tergantung pada karakteristik kemampuan pada bidang studi yang diukur dan
tujuan yang ingin dicapai.

4. Evaluasi
Sebagaimana telah disebut di atas bahwa evaluasi bertujuan untuk meningkatkan
kinerja individu atau lembaga, sehingga kegiatan evaluasi merupakan rangkaian kegiatan
dalam meningkatkan kualitas kinerja, atau produktivitas lembaga dalam melaksanakan
program. Titik sentral dari evaluasi adalah individu. Dalam konteks pendidikan kinerja
yang dievaluasi adalah menyangkut individu berupa hasil belajar dalam kelompok atau
kelas. Hasil evaluasi akan menyajikan informasi tentang seberapa jauh pencapaian
program dan informasi pencapaian program ini menjadi bahan informasi untuk perbaikan
atau pengayaan program.
Para ahli ada keselarasan dalam menjelaskan pengertian evaluasi. Griffin & Nix,
1999 menyatakan evaluasi adalah judgement terhadap nilai hasil dari tindakan
pengukuran; sedangkan menurut Tyler, 1950 menyebutkan evaluasi sebagai proses
penentuan sejauh mana tujuan pendidikan telah dicapai (Djemari Mardapi, 2008: 8-9).

7
Djemari Mardapi, 2008 menyimpulkan bahwa evaluasi didefinisikan sebagai proses
mengumpulkan informasi untuk mengetahui pencapaian belajar kelas atau kelompok.
Hasil evaluasi diharapkan dapat mendorong pendidik untuk mengajar lebih baik dan
memotivasi peserta didik untuk belajar lebih baik. Jadi evaluasi menyajikan informasi
untuk kepentingan evaluasi program pembelajaran bagi kelas dan pendidik untuk
meningkatkan kualitas proses belajar mengajar.
Berhubung hasil evaluasi program pembelajaran bersifat multi dimensi, maka
evaluasi yang hanya membandingkan antara unjuk kerja dan tujuan, telah mendapatkan
kritik para ahli karena terlalu menyempitkan persoalan dalam ragam kasus di bidang
pendidikan. Hasil program pembelajaran beragam, ada yang terkait langsung dengan
tujuan pendidikan (intended) dan ada yang tidak (unintended), selain itu ada yang
berdampak positif dan ada yang berdampak negatif. Oleh karena itu cara pendekatan
evaluasi yang goal free lebih tepat digunakan untuk mengevaluasi program pembelajaran,
karena betapa pun tujuan program untuk meningkatkan prestasi belajar, tetapi masih ada
tujuan atau dampak ikutan lain berupa rasa percaya diri, kreativitas, kemandirian,
keuletan dan sebagainya. Astin (1993) mempertegas bahwa cakupan evaluasi untuk
program pembelajaran di sekolah setidaknya meliputi masukan, lingkungan sekolah, dan
keluarannya. Orientasi evaluasi saat ini sering hanya mengarah pada ranah kognitif dan
jarang kepada ranah afektif, berhubung ranah afektif sulit mengukurnya walaupun juga
penting bagi evaluator untuk memenuhi tujuan peningkatan kualitas dan kinerja lembaga.
Lingkungan sekolah baik iklim akademik dan iklim sosial, sama-sama memiliki peranan
yang tidak bisa diabaikan. Iklim akademik menunjuk pada kegiatan akademik baik di
dalam kelas mau pun di luar kelas, sementara iklim sosial adalah terciptanya hubungan
sosial antara pendidik, peserta didik dan sivitas akademik yang lain di sekolah.
Ditilik dari cakupannya, evaluasi bisa bersifat makro dan mikro. Evaluasi makro
cenderung menggunakan sampel dalam melakukan telaah suatu program dan dampaknya,
dengan sasaran program pendidikan yang dirancang untuk memperbaiki bidang
pendidikan. Pada sisi lain evaluasi mikro biasanya digunakan untuk evaluasi di tingkat
kelas, yaitu untuk mengetahui tingkat pencapaian hasil belajar peserta didik baik ranah
kognitif maupun ranah yang lain.

8
Terdapat dua kategori evaluasi pengajaran, yakni evaluasi formatif dan evaluasi
sumatif. Evaluasi formatif bertujuan untuk memperbaiki proses belajar mengajar
sehingga sifatnya on going mengikuti proses, dan dengan demikian dapat diketahui
tujuan-tujuan belajar yang masih belum dicapai dan yang sudah dicapai sehingga dapat
dilakukan tindakan perbaikan atau remidi dan pengayaan lanjut. Evaluasi sumatif
bertujuan mengetahui tingkat pencapaian hasil belajar setelah seluruh proses kegiatan
belajar mengajar terselesaikan, sehingga sifatnya adalah sesaat atau snap shoot pada akhir
dari seluruh proses kegiatan. Implikasi dari evaluasi sumatif akan diperoleh ketetapan
lulus atau tidak lulus bagi peserta didik. Agar peserta didik dapat terlibat belajar dalam
iklim akademik dengan baik, maka dalam kepentingan kegiatan pengukuran dan
penilaian kepada mereka perlu dijelaskan di awal pengajaran tentang pentingnya
penentuan nilai akhir. Komponen-komponen penilaian, bobot penilaian dan cara
pendekatan yang digunakan dalam penilaian perlu diberitahukan kepada peserta didik.
Thorndike telah menyitir melalui teori belajar behavioristiknya, dalam hukum
belajar “law of effect” dinyatakan bahwa dampak dari evaluasi ada dua: (1) jika hasilnya
baik atau sukses, maka akan memberikan motivasi yang semakin kuat bagi peserta didik;
tetapi (2) jika hasilnya jelek atau gagal, maka akan menimbulkan frustrasi bagi peserta
didik. Hasil evaluasi dengan demikian dapat digunakan untuk mengetahui karakteristik
peserta didik, yakni yang naik motivasi belajarnya, yang tetap, dan yang menjadi turun
motivasinya. Atas dasar ini maka dibutuhkan suatu sistem evaluasi yang dapat memenuhi
tujuan untuk pendorong peningkatan kualitas pendidikan secara menyeluruh yang
berangkat dari acuan hasil belajar peserta didik dibandingkan dengan acuan kriteria,
sehingga dapat dicari kelemahan dan keunggulan dalam proses kegiatan belajar-mengajar
dan dicari upaya untuk penanggulangan kelemahannya.

C. Acuan Norma dan Acuan Patokan/kriteria


Terdapat dua macam pendekatan yang digunakan untuk menyiapkan dan
menafsirkan hasil tes, yaitu acuan norma (norm reference test) dan acuan kriteria/patokan
(criterion reference test). Asumsi yang digunakan oleh masing-masing pendekatan ini
berbeda mengenai kemampuan seseorang yang dinilai. Teknik analisis butir pada kedua
acuan ini ada yang berbeda ada juga yang sama. Penafsiran hasil tes dari kedua acuan ini

9
berbeda sehingga memberikan hasil informasi yang berbeda maknanya. Pendekatan mana
yang terbaik antara keduanya tergantung pada karakteristik bidang studi yang diukur dan
tujuan yang ingin dicapai.
Tes acuan norma menggunakan asumsi bahwa kemampuan seseorang itu berbeda
dan dapat digambarkan menurut distribusi normal. Perbedaan itu harus ditunjukkan oleh
hasil pengukuran. Misal setelah peserta didik mengikuti kegiatan pembelajaran selama
satu semester peserta didik dites. Hasil tes ini dibandingkan dengan kelompoknya,
sehingga dapat diketahui kedudukan seseorang. Acuan ini diterapkan pada tes untuk
tujuan seleksi, karena sesuai dengan tujuannya adalah untuk membedakan kemampuan
seseorang. Acuan ini juga digunakan untuk mengetahui hasil belajar seseorang yang
batasnya sangat luas, misalnya untuk ilmu-ilmu sosial.
Sebaliknya acuan kriteria berasumsi bahwa hampir semua orang bisa belajar apa
saja, hanya faktor waktu pencapaian yang membedakan. Oleh sebab itu dalam penilaian
acuan kriteria dibutuhkan adanya program remedi. Penafsiran harga skore selalu
dibandingkan dengan kriterium yang ditetapkan lebih dulu. Hasil tes dinilai lulus dan
tidak lulus. Lulus berarti bisa melakukan tindakan tertentu menurut kriteria, tidak lulus
berarti belum bisa melakukan tindakan tertentu menurut kriteria. Acuan ini banyak
digunakan untuk bidang sain dan teknologi serta pada pelajaran praktik.
Untuk menyusun sebuah tes yang baik perlu diketahui tentang berbagai hal masalah tes
yang memenuhi syarat. Antara lain dari pengertian tes dibanding dengan istilah penilaian
dan pengukuran, serta penelaahannya serta pemanfaatan hasil dari tes bagi kepentingan
membuat informasi untuk perbaikan pengajaran.

D. Penyusunan Tes
1. Pengertian Tes
Tes adalah himpunan pertanyaan yang harus dijawab atau pernyataan yang harus
dipilih atau juga tugas yang harus dikerjakan oleh peserta didik (orang yang dites) dengan
tujuan untuk mengukur perilaku tertentu dari peserta didik yang bersangkutan.
Pengukuran adalah tindakan membandingkan suatu objek dengan tolok ukur tertentu dan
diperoleh hasil pengukuran berupa skor atau data pengukuran. Tes merupakan alat yang
berlaku sebagai tolok ukur. Penilaian adalah tindakan mengambil keputusan atas

10
informasi yang diolah berdasarkan pada skor hasil pengukuran. Jadi tes, pengukuran dan
penilaian merupakan serangkaian kegiatan yang berhubungan, tes untuk mengukur, dan
hasil pengukuran berupa skor kemudian diolah menjadi informasi untuk tindakan
penilaian yakni mengambil keputusan.
Dalam kasus tes prestasi belajar, maka yang akan diukur adalah tingkat
kemampuan peserta didik dalam menguasai bahan pelajaran yang telah diajarkan
kepadanya atau yang telah dipelajarinya. Atas dasar ini maka perlu dibedakan antara
’prestasi belajar’ dengan ’hasil belajar’. Hasil belajar meliputi aspek pembentukan watak,
sedangkan prestasi belajar hanya meliputi kawasan pengetahuan atau kognitif dan
keterampilan. Tes untuk mengukur prestasi baik pengetahuan maupun keterampilan dapat
dipilah menjadi dua jenis yakni tes kemampuan (power test) dan tes kecepatan (speed
test). Perbedaan di antara keduanya adalah:
(1) Prinsip tes kemampuan adalah tidak adanya batasan waktu di dalam pengerjaannya.
Jika waktu pengerjaan tidak dibatasi, maka hasil tes benar-benar mengungkapkan
kemampuan peserta didik. Jika ada batasan waktu, maka akan menyebabkan peserta didik
tidak dapat menunjukkan seluruh kemampuan yang dimilikinya sehingga skor yang
dihasilkan tidak menunjukkan seluruh kemampuan sebenarnya. Dalam praktik
penyelenggaraan tes yang memenuhi prinsip ini jarang dilakukan, dengan asumsi bahwa
suatu pelaksanaan tes adalah sebagai tes kemampuan jika sebagian besar peserta didik
dapat menyelesaikan tes dalam waktu yang disediakan. Oleh sebab itu dalam penyusunan
kisi-kisi faktor waktu perlu menjadi pertimbangan yang rasional.
(2) Pada tes kecepatan, yang diukur adalah kecepatan peserta didik dalam memikirkan
atau mengerjakan sesuatu. Pokok persoalan dalam tes kecepatan adalah tugas yang harus
diselesaikan dalam satu kurun waktu tertentu. Lazimnya tugas untuk tes kecepatan relatif
mudah karena yang diukur adalah kecepatan mengerjakannya atau memikirkannya,
bukan kemampuan yang lain.
Dari dua macam tes ini, maka yang sering dilakukan oleh para guru/tutor/dosen adalah
mengkonstruksi tes kemampuan dan bukan tes kecepatan.

2. Syarat-syarat Tes yang Baik

11
Tes pada dasarnya sebuah perangkat alat untuk mengukur. Sebuah alat ukur perlu
mantap ditinjau dari berbagai segi, sehingga hasil pengukurannya dapat dipercaya
adanya. Atas dasar ini maka tes sebagai alat ukur perilaku belajar, harus memenuhi
persyaratan.
Syarat-syarat itu:
(1) Valid (sahih), hanya mengukur satu dimensi atau satu aspek saja. Sering terjadi
sebuah tes mengandung lebih dari satu dimensi, misal tes matematika ternyata selain
mencakup dimensi matematika juga mencakup pemahaman terhadap bahasa untuk
menulis soal itu. Jika ini terjadi maka tes menjadi tidak valid. Untuk hal demikian
maka perlu disusun subtes-subtes yang berdimensi tunggal yang mengukur satu
aspek saja. Hasil pengukuran subtes-subtes jika dikorelasikan harus menunjukan
korelasi yang tingggi satu sama lain dari subtes-subtes tersebut.
(2) Handal (reliabel). Handal mencakup kecermatan hasil pengukuran, dan keajegan
(konsisten) hasil pengukuran. Kecermatan ditentukan oleh banyaknya informasi dan
jarak rentang dari skala yang digunakan. Mengukur berat badan kita dengan
timbangan emas (Neraca) atau dengan Tonase (timbangan yang ada di Jembatan
timbang) hasilnya tidak secermat jika menggunakan Timbangan badan yang
memang diperuntukan untuk itu. Demikian juga mengukur prestasi belajar. Jika tes
dengan jumlah soal yang banyak dan seluruh soalnya bertaraf kesukaran sedang bagi
peserta didik, tentu akan lebih cermat daripada tes yang soalnya berjumlah sedikit
dan tingkat kesukarannya jauh merentang antara terlalu mudah atau terlalu sulit.
Oleh sebab itu soal yang baik tentu taraf kesukarannya diupayakan homogen dan
kisaran hasil pengukuran tidak terlalu jauh di bawah atau di atas kemampuan tingkat
pencapaian belajar peserta didik.
Jika mendasarkan hal ini maka tindakan menetapkan proporsi soal mudah, sedang
dan sukar dalam membuat kisi-kisi tes, menyalahi kaidah teori kehandalan hasil
pengukuran dari suatu tes. Jika peserta didik heterogen tingkat kemampuannya,
maka menurut prinsip teori kehandalan pengukuran peserta didik tersebut harus
dikelompok-kelompokkan menjadi beberapa kelompok yang relatif homogen.
Kemudian untuk setiap kelompok disediakan tes yang tingkat kesukarannya sesuai
dengan tingkat kemampuannya. Adalah wajar jika kemudian ada pandangan bahwa

12
setiap peserta didik seharusnya diberikan tes yang tepat bagi tingkat kemampuan
dirinya saja atau disebut individualized atau tailored testing. Maka dewasa ini
muncullah inovasi tentang bank soal berbasis komputer atau computer adaptive
testing (CAT).
Ada dua syarat tentang keajegan atau konsistensi yakni keajegan internal dan
keajegan eksternal. Keajegan internal adalah tingkat sejauh mana butir-butir soal
sebuah tes homogen baik dari segi tingkat kesukaran maupun dari segi bentuk soal
dan prosedur menjawabnya. Untuk itu disyaratkan pentingnya kecermatan tes yang
sesuai dengan tingkat kemampuan peserta didik.
Tingkat keterhandalan skor tes dalam arti (1) homogenitas butir soal, dan (2)
kehandalan butir soal tersebut dalam mengungkap perbedaan kemampuan peserta
didik; dapat diukur dengan indeks alpha dari Cronbach. Khusus untuk tes yang
dikhotomus (bentuk benar/salah) teknik perhitungan indeks alpha dapat
disederhanakan dengan Kuder dan Richardson (KR20 dan KR21).
Berikutnya adalah keajegan eksternal. Persoalannya di sini adalah sejauh mana skor
hasil tes kepada sekelompok peserta didik akan tetap sama sepanjang kemampuan
para peserta didik tersebut masih belum berubah. Untuk ini dapat ditempuh dua cara.
Pertama, dengan membayangkan sekelompok orang menempuh sebuah tes berulang-
ulang sampai tak terhingga, dengan asumsi bahwa (1) kemampuan peserta didik
tersebut tak berubah, dan (2) peserta didik tersebut tidak akan mempelajari isi tes.
Kedua, dengan membayangkan sekelompok peserta didik menempuh seperangkat tes
paralel yang tak terhingga banyaknya (dibutuhkan tes paralel karena disadari bahwa
jika tesnya tetap sama maka peserta didik akan mempelajari isi tes tersebut). Jika
dari dua cara ini dapat dihasilkan skor yang sama pada setiap pengukurannya, maka
alat ukur (tes) tersebut telah memenuhi syarat keajegan eksternal. Dalam praktik tak
pernah dapat dilakukan. Lazimnya cukup disajikan dua tes paralel atau sebuah tes
disajikan dua kali (test-retest). Ukuran keajegan lazimnya dihitung dengan korelasi.
Dengan cara ini maka sering ditempuh cara mudah, yakni dengan membelah tes
menjadi ganjil-genap atau belahan pertama dan belahan kedua. Dari hasil korelasi ini
kemudian dilakukan taksiran indeks keajegan eksternalnya dari tes yang
bersangkutan, seandainya jumlahnya dilipatkan dua kali.

13
3. Skala Pengukuran
Pengukuran yang terbaik jika menghasilkan ukuran dengan skala mutlak (ratio
scale). Artinya angka nol yang dihasilkan benar-benar menunjukkan absensi (tidak ada
besaran) dari dimensi yang diukur. Tes prestasi belajar pada umumnya hanya
menghasilkan skor dalam skala interval (jika semua butirnya homogen baik dari segi isi
materi, bentuk, maupun taraf kesukaran). Yang terjadi selalu ada variasi pada ketiga hal
tersebut sehingga hasil pengukuran tidak ’equi-interval’. Inilah sebenarnya sumber
kesalahan dalam penafsiran hasil tes dan dalam mengambil keputusan terhadap suatu
ujian.
Jenis skala lainnya, adalah skala ordinal. Pada skala ini yang ada adalah informasi
tentang tinggi rendahnya posisi obyek pada dimensi yang diukur. Ukuran tinggi dan
ukuran rendahnya tidak diketahui, yang ada hanyalah ranking. Hasil pengumpulan data
melalui rating dan skala sikap atau angket biasanya berupa skala ordinal.
Jenis skala berikutnya adalah skala nominal. Skala yang dihasilkan adalah bersifat
klasifikasi atau kategori atau nominal saja, hanya berdasar pada label atau atribut belaka.

4. Prosedur Konstruksi Tes


Proses penyusunan tes mulai dari penyiapan hingga dapat diaplikasikan mengikuti
langkah-langkah atau prosedur:
(1) penentuan tujuan tes
(2) penyusunan kisi-kisi tes
(3) penulisan soal
(4) penelaahan soal (review dan revisi soal)
(5) uji-coba soal, dan analisisnya
(6) perakitan soal menjadi perangkat tes
(7) penyajian tes
(8) scoring
(9) pelaporan hasil tes
(10) pemanfaatan hasil tes

14
Setiap tahap atau langkah dapat dijelaskan sebagai berikut:
(1) Penentuan tujuan
Semua tes bertujuan. Untuk kepentingan pendidikan tujuannya adalah untuk
mengetahui penguasaan peserta didik dalam pokok bahasan tertentu setelah diajarkan.
Dapat juga bertujuan untuk diagnosa kesulitan belajar. Pendek kata tujuan tes harus jelas
sehingga dapat memberi arah dan lingkup pengembangannya.
(2) Penyusunan kisi-kisi tes
Kisi-kisi atau ‘test blue print’ atau juga dikenal tabel spesifikasi tes, menyatakan
deskripsi mengenai ruang lingkup dan isi dari apa yang akan diujikan, serta memberikan
rincian soal-soal yang diperlukan oleh tes tersebut. Ada empat langkah dalam
mengembangkan kisi-kisi tes, yaitu (a) menuliskan kompetensi dasar, (b) menuliskan
materi pokok, (c) menentukan indikator, dan (d) menentukan jumlah soal.
Kompetensi dasar digunakan sebagai acuan dalam merumuskan indikator-indikator yang
akan diukur, hal ini untuk menjamin adanya validitas isi. Yang penting lagi adalah
kompetensi dasar yang ingin dicapai dan jenis tagihannya untuk mengukur pencapaian
hasil belajar.
Contoh: Kisi-kisi tes

(3) Penulisan soal


Langkah ini adalah menjabarkan indikator jenis dan tingkat perilaku yang akan
diukur menjadi pertanyaan-pertanyaan yang karakteristiknya sesuai dengan perincian
dalam kisi-kisi. Jadi setiap pertanyaan perlu dibuat sedemikian rupa sehingga jelas apa
yang ditanyakan dan jelas pula jawaban apa yang dituntut kepada peserta didik. Kualitas
setiap butir soal akan menentukan mutu tes secara keseluruhan.
(4) Telaah soal

15
Review dan revisi merupakan langkah penting untuk mengetahui kekurangan
yang ada pada soal. Lazimnya telaah soal mencakup kawasan teoritiknya (kualitatif) dan
kuantitatif (hasil pengukuran tes) yang dilakukan oleh orang lain diluar penulis soal yang
bekerja dalam tim dan terdiri dari ahli bidang studi, pengukuran dan bahasa. Penelaahan
berkisar pada domain materi, domain konstruksi dan domain bahasa. Domain materi
mengacu pada terwakili tidaknya cakupan atau ruang lingkup materi kurikulum; sedang
domain konstruksi lebih mengacu kepada substansi tingkat kedalaman penguasaan (jika
menggunakan taksonomi Blooms misalnya tingkat yang relevan adalah pemahaman,
aplikasi dan analisis), dan untuk domain bahasa mengacu kepada substansi komunikatif
tidaknya soal bagi peserta didik. Sebuah kata dapat mengandung makna yang berbeda,
untuk itu perlu dikaji mana yang tepat digunakan untuk menulis soal.
(5) Uji-coba soal
Langkah ini ditujukan untuk mendapatkan informasi empirik, apakah benar soal
telah mengukur apa yang seharusnya diukur. Informasi itu antara lain menyangkut aspek
keterbacaan soal, tingkat kesukaran soal, pola jawaban, tingkat daya pembeda, pengaruh
budaya dan sebagainya yang bermanfaat untuk memperbaiki validitas soal.
(6) Perakitan soal
Untuk memperoleh hasil pengukuran yang menyeluruh dari suatu obyek
pengukuran, maka soal perlu dirakit atau dihimpun kedalam sebuah perangkat alat ukur
yang terpadu. Dalam kaitan langkah ini persoalan penting adalah urutan nomor soal,
pengelompokan bentuk soal, tata lay-out soal, dan sebagainya.
(7) Penyajian tes
Langkah penyajian tes yang perlu diperhatikan adalah faktor waktu, petunjuk cara
menjawab/mengerjakan, ruang dan tempat mengerjakan bagi peserta didik. Yang jelas
faktor administrasi dan penyelenggaraan turut menentukan kualitas hasil pengukuran.
(8) Skoring
Langkah ini merupakan tindakan pemeriksaan jawaban peserta didik, diikuti
dengan pemberian angka. Angka dimaksud merupakan informasi kuantitatif dari peserta
didik. Skoring harus obyektif. Untuk tes uraian biasanya diperlukan rubrik atau marking
scheme.
Contoh marking scheme:

16
• TIK: peserta didik dapat menghitung luas empat persegi panjang dan mengubah
satuan ukurannya

(9) Pelaporan
Setelah dilakukan skoring, hasil tes perlu dilaporkan. Laporan perlu disampaikan
kepada peserta didik, orangtuanya, dan pihak-pihak terkait yang membutuhkan. Laporan
penting artinya bagi kebutuhan informasi untuk mengambil kebijakan lanjut atas hasil
pengukuran dengan tes itu.
(10) Pemanfaatan hasil
Laporan hasil tes dapat dimanfaatkan tergantung pada tujuannya. Seringkali
dimanfaatkan untuk perbaikan sistem atau penyempurnaan proses kegiatan belajar
mengajar, mau pun sebagai data penentuan kebijakan (remedial dan pengayaan). Bagi
seorang pendidik, pemanfaatan hasil tes untuk sarana analisis kuantitatif merupakan
pekerjaan mulia dan bernilai guna. Di satu sisi untuk membina profesinya dan di sisi lain
dapat memelihara daur hidup tes untuk menjadi bank soal atau siklus kehidupan
konstruksi tes itu sendiri. Dalam praktik tindakan ini sangat langka ditemui untuk profil
profesi seorang pendidik, karena umumnya usai penyelenggaraan tes pekerjaan berhenti
hanya sampai membuat laporan saja, dan tidak menindaklanjuti untuk analisis
kuantitatifnya.

5. Bentuk-bentuk Tes
Bentuk-bentuk tes yang lazim digunakan diklasifikasikan dalam:
(1) Bentuk objektif: antara lain :
1. pilihan ganda
2. benar-salah
3. isian/jawaban singkat
4. menjodohkan

17
(2) Bentuk uraian
Setiap bentuk soal memiliki keunggulan dan kelemahan, dan memiliki kesesuaian
untuk mengukur aspek tertentu. Bentuk tes yang tepat ditentukan oleh tujuan tes, jumlah
peserta, waktu tersedia untuk memeriksa, cakupan materi, dan karakteristik matapelajaran
yang diujikan.
Soal pilihan ganda memang lebih tepat jika untuk mengukur cakupan materi yang lebih
banyak dan luas, misalnya untuk tujuan tes sumatif atau untuk ujian, ulangan umum,
ujian akhir semester dan sebagainya. Soal bentuk uraian lebih tepat untuk mengukur
kemampuan mengekspresikan pendapat, sehingga cocok untuk tujuan tes formatif atau
ulangan harian tetapi memiliki kelemahan bias subyektivitas dalam penilaian. Untuk itu,
bentuk tes yang akan digunakan perlu dipertimbangkan dalam mengkonstruksikan tes.
Setiap bentuk tes memiliki keunggulan dan kelemahan masing-masing, berikut diulas
masing-masing bentuk tes tersebut.
(1) Bentuk tes objektif, terdiri dari :
D. pilihan ganda
E. benar-salah
F. isian/jawaban singkat
G. menjodohkan
(2) Bentuk uraian
ad. (1) Bentuk Objektif:
Tes bentuk bentuk objektif cocok untuk mengukur kemampuan-kemampuan:
mengingat dan mengenal kembali fakta-fakta, memahami hubungan antara dua hal atau
lebih, dan mengaplikasikan prinsip-prinsip. Dalam bentuk objektif tugas peserta didik
adalah memanipulasikan data yang telah ada dalam butir soal. Jika dalam bentuk esai
maka peserta didik harus menciptakan sendiri, harus mencari sendiri unsur-unsur yang
dibutuhkan untuk menjawab soal yang bersangkutan. Tes bentuk objektif memiliki
keunggulan dan kelemahan juga.
Kelemahan tes bentuk objektif:
a. Tes objektif hanya tepat digunakan untuk mengevaluasi kemampuan mengingat
kemabali, mengenal kembali, mengasosiasikan antara dua hal, memahami hubungan,
dan mengaplikasikan prinsip-prinsip.

18
b. Tes objektif dapat membuat peserta didik tidak terbiasakan mengemukakan gagasan
secara tertulis dengan menggunakan kata-kata dan kalimat sendiri.
c. Peserta didik berpeluang sangat besar untuk bertindak menebak jawaban untuk soal
yang dirasa sulit dan tindakan ini sukar dilacak.
d. Proses berpikir peserta didik tidak dapat diikuti oleh karena yang dapat dilihat hanya
pilihan jawaban yang dipilih oleh peserta didik.
e. Dimungkinkan terjadi saling menyontek dalam memberikan jawaban di antara peserta
didik, karena pola lembar jawaban seragam.
Keunggulan-keunggulan tes objektif:
a. Tugas-tugas yang harus dilakukan oleh peserta didik sudah pasti seperti memilih,
menjodohkan, mengisi, atau memberikan jawaban singkat.
b. Jumlah butir soal adalah besar sehingga representatif.
c. Kunci jawaban dapat dipersiapkan secara pasti bila butir-butir soal disusun dengan
baik. Di samping itu kunci jawaban bersifat mutlak, sehingga hasil ujian dengan soal
bentuk tes objektif dapat dikoreksi oleh siapa pun sepanjang kunci jawaban telah
tersedia.
d. Tidak ada kemungkinan bagi peserta didik untuk mengemukakan hal-hal yng tidak
relevan dengan persoalan karena tugas peserta didik sudah pasti.
e. Kunci jawaban tes bentuk objektif adalah pasti dan mutlak, oleh karena itu jawaban
peserta didik pun juga sudah pasti dan mutlak, benar atau salahnya.
Ragam dari tes bentuk objektif dan keunggulan serta kelemahannya:
1) Soal tes bentuk pilihan ganda
Keunggulan-keunggulannya:
a. Dapat dipergunakan untuk mengukur semua tataran kognitif, yakni
kemampuan mengingat dan mengenal kembali fakta-fakta, memahami
hubungan dua hal atau lebih, mengaplikasikan prinsip-prinsip,
menganalisis, dan mengevaluasi.
b. Dapat digunakan untuk semua bidang studi, terutama jika bermaksu
mengevaluasi aspek-aspek verbal dan matematis.
Kelemahannya adalah:

19
a. Menyusunnya relatif sukar oleh karena tidak mudah mencari alternatif-
alternatif jawaban yang homogen. Kelemahan ini tidak perlu menjadi
penghalang untuk menggunakan bentuk ini.
b. Untuk menjawabnya membutuhkan waktu yang cukup lama, apalagi
kalau menuntut kemampuan peserta didik untuk melakukan
pembandingan antar alternatif-alternatif jawaban yang homogen, atau
menuntut pengertian yang fundamental.
Teknik pensekoran untuk tes bentuk pilihan ganda, yaitu dengan
menjumlahkan jumlah butir yang dijawab benar oleh peserta didik, apabila
tidak digunakan koreksi terhadap tebakan. Jika koreksi terhadap tebakan
digunakan, maka cara pensekoran menggunakan formula berikut:

S = R- W/(n-1)

S = sekor dengan koreksi terhadap tebakan


R = jumlah butir yang dijawab benar
W= jumlah butir yang dijawab salah
n = jumlah alternatif jawaban

2) Soal tes bentuk benar-salah


Keunggulan-keunggulannya:
c. Memungkinkan penyusun soal tes memasukkan bahan sebanyak-
banyaknya tanpa khawatir akan waktu pengerjaannya.
d. Memungkinkan penyusun soal tes untuk mengajukan masalah-masalah
yang praktis.
e. Relatif mudah disusun.
Kelemahan-kelemahannya:
a. Isi soal terbatas pada fakta-fakta atau penetahuan hafalan yang dangkal.
b. Sangat memungkinkan peserta didik melakukan guessing atau tebakan
dalam memberikan jawaban.
c. Umumnya rumusan-rumusan soalnya kabur.

20
Teknik pensekoran untuk tes bentuk benar-salah yaitu dengan
menjumlahkan jumlah butir yang dijawab benar oleh peserta didik, apabila
tidak digunakan koreksi terhadap tebakan. Jika koreksi terhadap tebakan
digunakan, maka cara pensekoran menggunakan formula berikut:
1) S = R-W

2) S = T- 2.W
S = sekor dengan koreksi terhadap tebakan
R = jumlah butir yang dijawab benar
W= jumlah butir yang dijawab salah
T = jumlah soal

3) Soal tes bentuk Isian/jawaban singkat


Keunggulan-keunggulannya:
f. Kemungkinnan guessing atau untuk menebak-nebak jawabannya relatif
kecil.
g. Mudah disusun.
Kelemahannya adalah:
a. Penyekoran sukar, karena jawaban peserta didik bervariasi.
b. Berhubung isi soal tes bentuk isian/jawaban singkat terbatas pada fakta-
fakta hafalan, maka kurang tepat jika dipergunakan untuk mengevaluasi
perubahan-perubahan perilaku yang ditimbulkan oleh hasil belajar.
Teknik pensekoran untuk tes bentuk isian/jawaban singkat, setiap soal diberi
angka 2(dua).

4) Soal tes bentuk menjodohkan


Keunggulan-keunggulannya:
h. Dapat mencakup sejumlah fakta yang cukup banyak tanpa
membutuhkan waktu lama untuk menjawabnya.
i. Sangat berguna untuk menentukan apakah peserta didik dapat
mengasosiasikan antara kata-kata dengan definisinya, peristiwa dengan

21
tempat dan waktu terjadinya, sebab-akibat, pengertian dengan
simbolnya, penulis dengan karyanya, negarawan dengan karyanya, dan
sosiasi lain sejenisnya.
j. Dapat dipergunakan untuk mengevaluasi tingkat kesangupan peserta
didik dalam mempergunakan keterangan-keterangan yang telah
dipelajarinya.
Kelemahannya adalah:
a. Menyusunnya relatif sukar.
b. Hanya tepat digunakan apabila bahan pelajaran yang telah dipelajari
peserta didik cukup luas.
Teknik pensekoran untuk tes bentuk menjodohkan, setiap nomor alternatif
jawaban diberi angka 2(dua).

ad. (2) Bentuk Uraian


Soal tes bentuk uraian cocok untuk mengukur pengetahuan-pengetahuan yang
bersifat faktual, sehingga sebenarnya yang lebih tepat adalah kalau menyusun soal tes
uraian itu untuk mengukur hasil-hasil belajar yang bersifat kompleks. Terdapat dua
bentuk tes uraian yang dikenal dengan uraian terbatas dan uraian bebas. Tes uraian
terbatas tepat digunakan untuk mengevaluasi hasil belajar yang kompleks berupa
kemampuan-kemampuan:
(1) menjelaskan hubungan sebab-akibat
(2) melukiskan aplikasi prinsip-prinsip
(3) mengajukan argumentasi-argumentasi yang relevan.
(4) Merumuskan hipotesis-hipotesis dengan tepat.
(5) Merumuskan kesimpulan-kesimpulan secara tepat.
(6) Merumuskan asumsi-asumsi secara tepat
(7) Melukiskan keterbatasan-keterbatasan data
(8) Menjelaskan metoda dan prosedur
(9) Dan yang semacamnya yang menuntut kemampuan peserta didik untuk melengkapi
jawabannya.

22
Sedangkan tes uraian bebas, tepat digunakan untuk mengevaluasi hasil belajar yang
bersifat kompleks berupa kemampuan-kemampuan:
(1) menghasilkan, menyusun, dan menyatakan ide-ide.
(2) Memadukan berbagai hasil belajar dari berbagai bidang studi.
(3) Merekayasa bentuk-bentuk orisinal seperti mendesain.
(4) Mengevaluasi nilai dari suatu ide.

Kelemahan:
a. Mutu jawaban peserta didik sangat tergantung kepada kemampuannya memilih
kata-kata atau kalimat yang tepat untuk merumuskan jawabannya. Oleh sebab itu
dimungkinkan terjadi dua orang peserta didik yang memiliki ide yang sama atas
suatu masalah yang sama akan tetapi memperoleh nilai yang tidak sama. Hal ini
disebabkan oleh karena peserta didik yang satu lebih pandai memilih kata-kata
atau kalimat yang tepat daripada peserta didik yang lain dalam merumuskan
jawabannya.
b. Jumlah soal tes bentuk uraian sangat terbatas oleh karena untuk menjawab setiap
soal bentuk uraian memerlukan waktu yang lama dan energi yang relatif besar.
Oleh karena itu dalam mengalokasikan waktu ujian selama 90 sampai dengan 100
menit setidaknya hanya cukup untuk disajikan 5 sampai 10 butir soal. Akibatnya
seluruh bahan yang telah dipelajari oleh peserta didik, tidak seluruhnya dapat
diturunkan ke daam soal karena terbatas jumlahnya. Dengan kata lain tes uraian
seringkali dikatakan tidak representatif. Keadaan ini akan lebih parah jika ujian
hanya dilaksanakn hanya sekali selama satu semester.
c. Tingkat kebenaran jawaban adalah subjektif. Hal ini disebabkan karena jawaban-
jawaban peserta didik atas soal bentuk uraian merupakan tafsiran subjektif dari
peserta didik yang bersangkutan. Sementara itu pendapat korektor atas jawaban
peserta didik juga merupakan tafsiran subjektif pula.
d. Ada kemungkinan peserta didik mengemukakan hal-hal yang tidak relevan
dengan soalnya. Jika hal itu terjadi maka koreksinya sulit, waktunya lama dan
membosankan.

23
e. Pada umumnya hanya dapat dikoreksi oleh penyusunnya sendiri. Jika jumlah
peserta didik besar maka koreksinya membutuhkan waktu yang lama.
f. Skor soal tes bentuk uraian kurang reliabel bila dibandingkan dengan skor soal tes
bentuk objektif.
g. Seringkali peserta didik lebih mementingkan panjang jawaban daripada mutu
jawaban. Kecenderungan ini menyebabkan jawaban-jawaban yang panjang sulit
dikoreksi dan memakan waktu yang lama.
Keunggulan:
a. jawabannya berupa uraian-uraian yang harus disusun dengan kata dan kalimat
sendiri. Hal ini menuntut peserta didik untuk terampil dalam memilih kata dan
kalimat secara tepat dalam merumuskan jawaban-jawabannya.
b. Soal tes bentuk uraian tidak hanya menuntut peserta didik mampu mengingat dan
mengenal kembali segala apa yang telah dipelajari akan tetapi sekaligus juga
menuntut peserta didik untuk mampu mengintegrasikan segala apa yang telah
dipelajari.
c. Kemungkinan menebak (guessing) sangat kecil. Sekiranya jawaban yang
diberikan adalah tebakan, maka sangat mudah untuk diketahui.
d. Soal tes bentuk uraian sangat tepat untuk mengevaluasi hasil-hasil belajar yang
kompleks yang tidak dapat dievaluasi dengan alat yang lainnya. Kemampuan-
kemamuan yang kompleks tersebut adalah seperti yang telah diuraikan di atas.
e. Relatif mudah disusun daripada soal tes bentuk obyektif.
f. Proses berpikir peserta didik dapat dilacak dari jawaban-jawabannya.
g. Tes bentuk uraian lebih menekankan pengintegrasian dan aplikasi berpikir dan
pemecahan masalah daripada hanya memanipulasi informasi-informasi faktual.
Teknik pensekoran untuk tes bentuk uraian objektif mengikuti prosedur berikut:
a) Menggunakan pensekoran analitik. Pensekoran dengan cara ini digunakan untuk soal-
soal yang batas dan ruang lingkup jawabannya sudah jelas dan terbatas. Jawaban soal
ujian diuraikan dalam suatu urutan tertentu dengan rubrik atau marking scheme.
Sekor dari jawaban butir soal merupakan penjumlahan dari sejumlah sekor dari tiap
respon pada soal tersebut.

24
b) Menggunakan pensekoran dengan skala global. Cocok digunakan untuk pensekoran
tes dengan jawaban yang luas. Caranya adalah dengan membaca satu persatu jawaban
peserta didik secara keseluruhan untuk tiap butir yang sama kemudian meletakan
dalam kategori-kategori secara berjenjang dari yang terbaik hingga yang kurang baik,
bisa tiga sampai lima kategori. Tiap jawaban peserta didik dimasukkan dalam salah
satu kategori tersebut, dan selanjutnya tiap jawaban dalam tiap kategori diberi sekor
sesuai kualitas isi jawaban. Kualitas jawaban ditetapkan oleh penilai secara terbuka,
artinya ada data, ada unsur analisis, dan ada kesimpulan.
c) Disarankan tindakan pensekoran seperti ini dilakukan keseluruhan untuk semua
peserta didik dalam setiap butir soal yang sama tanpa ada penundaan atau selang
waktu agar tidak terjadi perbedaan dalam pemberian sekor, baru jika sudah selesai
untuk koreksi butir soal tertentu dilanjutkan lagi koreksi butir soal berikutnya dengan
prosedur yang sama pada butir soal sebelumnya.
d) Bila mungkin hilangkan identitas peserta didik dan diganti dengan kode tertentu, agar
dapat dihindari adanya bias penilaian dari kesan baik dan kesan jelek terhadap peserta
didik.
Hasil pensekoran untuk tes uraian objektif biasanya diubah dalam skala 100. Jika sekor
yang didapat peserta didik adalah 15 dari sekor maksimum soal 20, maka sekor yang
diberikan menjadi 15/20 x 100 = 75.

Teknik pensekoran untuk tes bentuk uraian bebas mengikuti prosedur berikut:
a) Gunakan pembobotan soal terlebih dahulu sebelum koreksi dilakukan. Pembobotan
suatu soal tergantung pada soal yang lain dalam perangkat tes yang sama. Artinya bila
soal uraian merupakan satu-satunya soal, maka pemberian bobot tidak bisa dilakukan.
b) Berikan bobot tiap soal dengan mempertimbangkan karakteristik ruang lingkup soal,
yakni esensialitasnya, tingkat kedalaman materi yang ditanyakan, dan tingkat
kesukaran soal dimaksud.
c) Gunakan skala penskoran yang tepat, apakah skala 10 atau 100. Jika menggunakan
skala 10 maka jumlah seluruh bobot soal menjadi 100, dan jika menggunakan skala
100 maka jumlah seluruh bobot menjadi 1000.

25
d) Tetapkan sekor yang diperoleh masing-masing peserta didik dengan cara membagi
skor mentah yang diperoleh dengan skor mentah maksimum soal kemudian dikalikan
dengan bobot soal tersebut. Formula yang dipakai adalah:

S = a/b x c

S= sekor butir soal


a= sekor mentah yang diperoleh peserta didik untuk butir soal tertentu
b= sekor maksimum butir soal tersebut.
c= bobot soal
e) Setelah diperoleh semua sekor butir soal, maka jumlahkan sekor butir soal tersebut
dan diperoleh total sekor peserta didik (TST). TST = jumlah dari S untuk seluruh
butir soal.
Contoh :
Menghitung total sekor peserta didik pada skala 10 jika TST = Total bobot soal (skala
100)
No. Skor mentah Skor mentah Bobot soal Total sekor
diperoleh pada maksimum per peserta didik
tiap butir butir (TST)
1 60 60 20 20
2 40 40 30 30
3 20 20 30 30
4 20 20 20 20
Juml. 140 140 100 100

Menghitung total sekor peserta didik pada skala 10 jika TST ≠ Total bobot soal (skala
100)
No. Skor mentah Skor mentah Bobot soal Total sekor
diperoleh pada maksimum per peserta didik
tiap butir butir (TST)
1 30 60 20 10
2 40 40 30 30
3 20 20 30 30
4 10 20 20 10

26
Juml. 100 140 100 80

(3) Tes Domain Afektif


Di atas sudah banyak disinggung tes untuk domain kognitif, berikut perlu diulas
sedikit agar diketahui untuk tes domain yang lain yakni afektif dan konatif (psikomotor).
Domain hasil belajar afektif berbeda dengan domain kognitif, karena memang teknik
pengukuran dan pengumpulan datanya agak berbeda.
1) Instrumen Afektif
Dua komponen domain afektif yang penting untuk diperhatikan, yakni sikap dan
minat terhadap belajar. Sikap peserta didik terhadap pelajaran bisa negatif atau positif,
bahkan bisa netral. Yang diharapkan adalah sikap positif sehingga mendorong minat
untuk belajar lebih baik. Peserta didik yang berminat pada pelajaran tertentu
dimungkinkan prestasi belajarnya akan lebih baik dan meningkat secara berkelanjutan
dengan optimal dibanding mereka yang kurang berminat. Tugas pendidik adalah
membina dengan membangkitkan minat dan kemudian meningkatkannya khususnya
terhadap bidang mata pelajaran yang dikelolanya. Dampaknya akan dapat meningkatkan
kualitas proses pembelajaran.

Prosedur pengembangan instrumen untuk menggali sikap dan minat adalah:


a. pilih domain afektif yang akan dinilai (sikap atau minat)
b. tentukan indikator minat atau sikap
c. pilih tipe skala yang digunakan
d. telaah instrumen oleh sejawat
e. perbaiki instrumen setelah mendapat koreksi sejawat
f. siapkan kuesioner atau inventori laporan diri
g. skor inventori
h. analisis hasil inventori skala minat dan atau sikap

2) Penskoran Hasil Pengukuran Hasil Belajar Afektif


Andaikan minat peserta didik diukur dengan skala Likert dengan jumlah butir 10,
dan rentang skor menggunakan skala 5 (1-5), maka skor terendah minat peserta didik

27
adalah 5 dan tertinggi adalah 50. Median skor yang didapat akan berada antara 10 dengan
50 atau sebesar 30. Jika media dipakai untuk membuat kategori dan dibuat 4(empat)
kategori, maka skala 10 – 20 tergolong tidak berminat, skala 21 – 30 kurang berminat,
skala 31 – 40 berminat, dan skala 41 – 50 sangat berminat.

(4) Tes Domain Psikomotor


Domain belajar psikomotor juga berbeda dengan domain kognitif dan afektif, oleh
karenanya memerlukan prosedur pengukuran dan cara gradasi yang berbeda dalam
penskorannya.
1) Penyusunan tes domain psikomotor
Bentuk tes psikomotor lebih tertuju pada upaya mengukur penampilan atau
kinerja yang telah dikuasai oleh peserta didik. Bentuknya bisa menggunakan tes tulis, tes
identifikasi, tes simulasi dan atau tes unjuk kerja. Tes tulis disini sasarannya pada
kemampuan peserta didik dalam menampilkan karyanya, apakah berupa desain alat,
desain grafis, dan semacamnya. Tes identifikasi lebih tertuju pada kemampun
mengidentifikasi sesuatu, misal menemukan bagian-bagian yang tak berfungsi dari suatu
alat, bagian yang salah dari suatu prosedur dan semacamnya. Tes simulasi berguna untuk
melihat penampilan peserta didik tentang kemampuan peragaan karena media yang
sesungguhnya tidak ada. Penguasaan ketrampilan melalui peragaan alat tiruan dianggap
mewakili kemampuan yang harus dikuasai untuk menghadapi alat sesungguhnya. Tes
unjuk kerja, ini dilakukan dengan alat sesungguhnya. Tujuannya untuk diketahui tentang
penguasaan dan ketrampilan penggunaan alat secara langsung oleh peserta didik.

2) Bentuk tes psikomotor


Karena obyek yang diukur untuk kemampuan psikomotor lebih pada aspek unjuk
kerja dan penampilan, maka bentuk-bentuk yang relevan untuk itu antara lain : (1) daftar
cek, (2) skala penilaian (rating scale). Penggunaannya dapat dilakukan setiap waktu tak
terikat secara formal sebagaimana tes tulis. Misalnya digunakan saat mengobservasi
peserta didik saat melakukan praktikum. Daftar cek praktis digunakan untuk jumlah
sasaran subyek yang relatif besar dan unjuk kerja perbuatan yang beresiko cukup tinggi.
Skala penilaian (rating scale) tepat untuk sasaran subyek yang relatif sedikit, dan

28
perbuatan yang diukur adalah yang resikonya relatif ringan sehingga pengukuran dapat
merentang dari paling tidak sempurna sampai paling sempurna.

3) Penyusunan tes psikomotor dengan daftar cek


Isi daftar cek pada dasarnya rangkaian tindakan untuk mengerjakan sesuatu yang
merupakan indikator dari keterampilan perbuatan yang diukur. Maka dari itu langkah
penyusunannya dimulai dari (1) identifikasi indikator penguasaan keterampilan yang
diujikan, (2) susun indikator penampilan sesuai dengan urutan kerjanya, (3) gunakan
daftar susunan indikator ini untuk mengamati pemunculan peristiwanya saat subyek yang
diamati sedang melakukan tindakan yang diujikan. Jika muncul beri tanda cek indikator
yang bersangkutan. Kesimpulan subyek dinyatakan terampil jika subyek teramati mampu
melakukan urutan tindakan dengan benar. Untuk itu maka indikator yang dirumuskan
dalam butir-butir daftar cek adalah ranah perbuatan yang sudah pasti, tinggal mengamati
muncul dan tidaknya dalam perbuatan subyek.

4) Penyusunan tes psikomotor dengan skala penilaian


Prinsip penyusunan daftar cek dapat digunakan untuk penyusunan skala penilaian.
Langkah pertama cari indikator unjuk keterampilan, kemudian susun indikator ini.
Setelah itu lakukan penetapan skala penilaiannya ditinjau dari unsur ketepatan
penampilan unjuk kerja subyek. Skala 1 sampai dengan 5 dipandang lebih tepat untuk ini.
Ragam penskalaan cukup banyak, misalnya Likert, Thurstone, Bogardus, Semantik
Differensial dan lainnya. Dilihat segi pelaku yang melakukan pengamatan, maka ada
dikenal self rating, peer rating, peer nomination dan peer ranking.

5) Penskoran Hasil Pengukuran Hasil Belajar Psikomotor


Hasil pengukuran dari daftar cek ataupun dari skala penilaian, dapat dikategori
melalui median hasil pengukuran skala. Tetapi perlu kehati-hatian dalam memaknai hasil
pengukuran ini. Hasil pada kategori sempurna belum tentu bahwa subyek peserta didik
mampu unjuk kerja seluruh indikator sempurna semuanya, perlu dicermati butir-butir
indikator yang masih perlu perbaikan. Apalagi jika tampilan perbuatan yang diujikan

29
merupakan unjuk kerja yang absolut sempurna, sehingga peserta didik akan dinyatakan
lulus jika mencapai kondisi seluruh indikator pada level sempurna.

E. Evaluasi Soal Evaluasi Hasil Belajar (EHB)


Melakukan evaluasi soal EHB bertujuan mengetahui kualitas butir soal.
Meskipun butir-butir soal EHB telah dilakukan evaluasi sebelum digunakan, namun
dalam proses perbaikannya tetap memerlukan langkah pengkajian lebih lanjut untuk
memenuhi ragam variabilitas peserta didik dan tetap terjaminnya kualitas tes. Ada dua
langkah bisa ditempuh: (1) telaah kualitatif, yakni telaah yang dilakukan oleh sejawat
dalam kelompok keahlian yang sama; tepat digunakan jika sebelum tes digunakan; (2)
telaah kuantitatif, yakni telaah didasarkan pada hasil penggunaan tes, dan dilaksanakan
tentu setelah tes dicobakan atau digunakan. Hasil telaah digunakan untuk tujuan memberi
masukan perbaikan tes. Pada langkah lanjut hasil tes dinalisis untuk mengetahui
kompetensi dasar yang telah dicapai dan yang belum dicapai. Mekanisme analisis soal
dapat dilihat pada diagram berikut.

30
Gambar 1. Mekanisme Analisis Soal
Prasyarat bagi penyusun tes untuk dapat menyusun dan menelaah tes adalah (1)
menguasai materi yang diujikan, (2) menguasai teknik penulisan soal, dan (3) menguasai
penggunaan Bahasa Indonesia yang tepat dan benar.
Sasaran telaah meliputi (1) domain materi, (2) domain konstruksi dan (3) domain
bahasa. Domain materi berkait dengan substansi ilmu yang diteskan dan tingkat berpikir
yang diliput. Domain konstruksi berkait dengan teknik penulisan soal, baik bentuk
obyektif maupun non-obyektif dengan berbagai ragamnya. Domain bahasa, berkait
dengan masalah kejelasan (arti komunikatif) hal yang ditanyakan.
Kualitas soal juga harus dilihat dari aspek tingkat berpikir yang dituntutkan untuk
mengerjakan soal. Jika taksonomi Bloom yang digunakan sebagai dasar, maka soal
dinyatakan baik jika berorientasi pada ranah pemahaman, aplikasi dan analisis. Substansi
pengecoh dalam soal bentuk pilihan perlu diperhatikan, seharusnya berlaku sebagai

31
jawaban salah jika dalam bentuk uraian. Tes atau soal EHB pada dasarnya tes
kemampuan dan bukan tes kecepatan, oleh karena itu perlu dipertimbangkan faktor waktu
untuk mengerjakannya. Soal-soal yang memenuhi domain materi, konstruksi dan bahasa
merupakan soal yang dapat digunakan untuk ujian.
Langkah lanjut dari hasil ujian dapat dianalisis untuk mengetahui
konsep-konsep/tema yang belum dipahami oleh peserta didik. Untuk ini media perangkat
lunak sudah tersedia seperti misalnya Iteman MicroCat dan lainnya.
Penyebab konsep belum dipahami peserta didik dapat bersumber dari kemampuan peserta
didik yang rendah, strategi mengajar dosen yang tidak tepat, bahan ajar yang sulit.
Informasi tentang hal ini penting untuk rujukan melakukan tindakan diagnosa dan
perbaikan baik untuk guru/dosen/tutor yang bersangkutan atau sejawat yang membina
matapelajaran prasyarat.
Perlu disadari bahwa soal sebagai alat ukur tentu selalu mengandung salah
pengukuran. Sumber salah pengukuran adalah (1) penentuan materi, (2) pihak yang
diukur, (3) pihak yang mengukur, dan (4) lingkungan. Untuk mengatasi salah ukur dari
pihak yang diukur dapat dilakukan banyak kali ulangan pengukuran.

32
Lembar telaah soal: bentuk melengkapi (Completion test)
Nomor soal
Aspek Persyaratan yang ditelaah
1 2 3 4 5 6 7 8 9 10
DOMAIN MATERI
1. Butir soal sesuai dengan indikator
2. Batasan pertanyaan dan jawaban yang
diharapkan jelas
3. Isi materi sesuai dengan tujuan
pengukuran
4. Isi materi yang ditanyakan sesuai dengan
jenjang, jenis sekolah, dan tingkat kelas
DOMAIN KONSTRUKSI
5. Rumusan kalimat dalam bentuk kalimat
terbuka (yang belum lengkap) yang
hanya memerlukan tambahan kata yang
merupakan jawaban/kunci.
6. Buti soal tidak bergantung pada butir
soal sebelumnya.
DOMAIN BAHASA
7. Rumusan kalimat komunikatif
8. Kalimat menggunakan bahasa yang baik
dan benar, sesuai dengan jenis
bahasanya
9. Rumusan kalimat tidak menimbulkan
penafsiran ganda atau salah pengertian
10. Menggunakan bahasa/kata yang umum
(bukan bahasa lokal)
11. Rumusan soal tidak mengandung kata
yang dapat menyinggung perasaan
peserta didik

33
Lembar telaah soal:bentuk pilihan ganda (multiple choice)
Nomor soal
Aspek Persyaratan yang ditelaah
1 2 3 4 5 6 7 8 9 10
DOMAIN MATERI
1. Butir soal sesuai dengan indikator
2. Hanya ada satu kunci atau jawaban yang
benar
3. Isi materi sesuai dengan tujuan
pengukuran
4. Isi materi sesuai dengan jenjang, jenis
sekolah, dan tingkatan kelas
5. Pilihan/jawaban benar-benar berfungsi,
jika pilihan/jawaban merupakan hasil
perhitungan, maka pengecoh berupa
pilihan yang salah rumus/salah hitung
DOMAIN KONSTRUKSI
6. Pokok soal (stem) dirumuskan dengan
jelas
7. Rumusan soal dan pilihan dirumuskan
dengan tegas
8. Pokok soal tidak memberi
petunjuk/mengarah kepada pilihan
jawaban yang benar
9. Pokok soal tidak mengandung
pernyataan negatif ganda
10. Bila terpaksa menggunakan kata
negatif, maka harus digarisbawahi atau
dicetak miring
11. Pilihan jawaban homogen
12. Hindari adanya alternatif
jawaban:”seluruh jawaban diatas
benar” atau ”tak satu pun jawaban di
atas benar” dsb.
13. Panjang alternatif/pilihan jawaban
relatif sama, jangan ada yang sangat
panjang dan ada yang sangat pendek
14. Pilihan jawaban dalam bentuk
angka/waktu diurutkan
15. Wacana, gambar, atau grafik benar-
benar berfungsi
16. Antar butir soal tidak bergantung satu
sama lain
DOMAIN BAHASA
17. Rumusan kalimat komunikatif
18. Kalimat menggunakan bahasa yang

34
baik dan benar, sesuai dengan jenis
bahasanya
19. Rumusan kalimat tidak menimbulkan
penafsiran ganda atau salah pengertian
20. Menggunakan bahasa/kata yang umum
(bukan bahasa lokal)
21. Rumusan soal tidak mengandung kata-
kata yang dapat menyinggung perasaan
peserta didik

Untuk mengatasi salah ukur dari pihak pengukur, perlu dilakukan latihan agar
traitnya berlaku standar. Kesalahan dari pihak pengukur seringkali akibat bias subyektif
dalam penilaian. Untuk itu soal harus ditelaah sungguh-sungguh, dan perlu digunakan
pedoman skoring (marking scheme) atau rubrik guna penyekoran lebih objektif.
Perlu diingat bahwa pengukuran dengan tes seringkali hanya tertuju pada dimensi
domain kognitif. Jika diinginkan meliput pada domain lain maka perlu disediakan alat
ukur tersendiri yang hasilnya disajikan dalam bentuk profil.

Daftar Pertanyaan bahan diskusi:


(1) Sekiranya Anda menjadi pemegang matakuliah Evaluasi Pengajaran, manakah di
antara pendekatan penilaian yang ada (acuan norma dan acuan kriteria) yang lebih
tepat digunakan dalam menilai kelulusan peserta didik.
(2) Jika anda nanti menjadi guru dan mengajar di SMA, salah satu tugas Anda adalah
membuat tes. Manakah yang harus anda buat dan kembangkan, tes kemampuan atau
tes kecepatan? Jelaskan mengapa demikian?

Referensi
Asmawi Zainul & Noehi Nasution (2001). Penilaian hasil belajar. Jakarta: PPUT, Dirjen
Dikti, Depdiknas.
Astin, W. Alexander (1993). Assessment for exellence. Phonix: The Oryx Press.
Depdiknas Dirjen Dikdasmen (2004) Pedoman umum pengembangan penilaian:
Kurikulum berbasis kompetensi Sekolah Menengah Atas. Jakarta: Dikmenum.
Depdiknas Dirjen Dikdasmen (1999) Pengelolaan pengujian bagi Guru mata pelajaran.
Jakarta: Dikmenum.
Djemari Mardapi (2008) Teknik penyusunan instrumen tes dan nontes. Yogyakarta: Mitra
Cendikia Press.
Ebel, R.L. (1979). Essential of educational measurement. New Jerseey: Printice-Hall,
Inc.

35
Miller, P.W. (2008). Measurement and teaching. Munster: Patrick W. Miller &
Associates.
Nitko, A.J. (1996) Curriculum Based Assessment. JSEP ADB Loan No. 1194-INO
Subino (1987) Konsruksi dan analisis tes: Suatu pengantar kepada teori tes dan
pengukuran. Depdikbud. Dirjen Dikti. Jakarta: PPLPTK.
Supriyono (1998). Teknik evaluasi: Petunjuk praktis bagi guru. Palangkaraya: Kanwil
Depdikbud.

36

Anda mungkin juga menyukai