PENYUSUN :
1. Aidah
2. Alia Rosna Arlaeli
3. Dewi Purnama Sari
4. Dewi Maharani
5. Lilis Lisnawati
6. Santi Susanti
Tahun 2015
BAB I PENDAHULUAN
Memang tidak semua orang menyadari bahwa setiap saat kita selalu
melakukan pekerjaan evaluasi. Dalam beberapa kegiatan sehari-hari, kita
jelas-jelas mengadakan pengukuran dan penilaian.
Dari dua kalimat diatas kita sudah menemui tiga buah istilah, yaitu
evaluasi, pengukuran, dan penilaian. Sementara orang memang lebih
cenderung mengartikan ketiga kata tersebut sebagai suatu pengertian yang
sama sehingga dalam penggunaannya hanya tergantung dari kata mana
yang siap untuk diucapkan dan sementara orang yang lainnya
membedakan ketiga istilah tersebut. Dan untuk memahami apa persamaan,
perbedaan ataupun hubungan antara ketiganya, dapat dipahami melalui
contoh-contoh di bawah ini :
a. Apabila ada orang yang akan memberi sebatang pensil kepada kita
dan kita disuruh memilih antara dua pensil yang tidak sama
panjangnya maka tentu saja kita akan memilih yang “panjang” kita
tidak akan memilih yang “pendek” kecuali ada alasan yang sangat
khusus.
b. Pasar merupakan suatu tempat bertemunya orang-orang yang akan
menjual dan membeli. Sebelum menentukan barang yang akan
dibeli. Seorang pembeli akan memilih dahulu mana barang yang
lebih “baik” menurut ukurannya. Apabila ia ingin membeli jeruk,
dipilihnya jeruk yang besar, kuning dan kulitnya halus. Semuanya
itu dipertimbangkan karena menurut pengalaman sebelumnya, jenis
jeruk-jeruk yang demikian ini rasanya akan manis, sedangkan jeruk
yang masih kecil, hijau dan kulitnya agak kasar, biasanya masam
rasanya.
Dari contoh-contoh diatas ini dapat kita simpulkan bahwa sebelum
menentukan pilihan, kita melakukan penilaian terhadap benda-benda yang
akan kita pilih. Pada contoh pertama kita memilih nama pensil yang lebih
panjang, sedangkan contoh kedua kita menentukan dengan pikiran kita
atas jeruk yang baik, yaitu rasanya yang manis.
Untuk dapat mengadakan penilaian, kita melakukan pengukuran
terlebih dahulu. Jika ada penggaris, maka sebelum menentukan mana
pensil yang lebih panjang, kita ukur dahulu kedua pensil tersebut, dan
setelah mengetahui berapa panjang masing-masing pensil itu, kita
melakukan penilaian dengan melihat bandingan panjang antara kedua
pensil tersebut. Dapatkah kita menyatakan “ini pensil panjang, dan ini
pensil “pendek”. Maka pensil yang panjang itulah yang kita ambil.
Untuk menentukan penilaian mana jeruk yang manis, kita tiidak
menggunakan “ukuran manis”, tetapi menggunakan ukuran besar, kuning
dan halus kulitnya. Ukuran ini tidak mempunya wujud seperti kayu
penggaris yang sudah ditera, tetapi diperoleh berdasarkan pengalaman.
Sebenarnya kita juga mengukur, yakni membandingkan jeruk-jeruk
yang ada dengan ukuran tertentu. Setelah itu kita menilai dan menentukan
pilihan, mana jeruk yang paling memenuhi ukuran itulah yang kita ambil.
Dengan demikian kita mengenal dua macam ukuran, yakni ukuran
yang terstandar (meter, kilogram, takaran dan sebagainya) dan ukuran
tidak standar (depa, jengkal, langkah dan sebaginya), dan ukuran perkiraan
berdasarkan hasil pengalaman (jeruk manis adalah yang kuning, besar dan
halus kulitnya)
Dua langkah kegiatan yang dilalui sebelum mengambil barang
untuk kita ituah yang disebut mengadakan evaluasi, yakni mengukur dan
menilai. Kita dapa mengadakan penilaian sebelum kita mengadakan
pengukuran.
Mengukur adalah membandingkan sesuatu dengan satu ukuran.
Pengukuran bersifat kuantitatif
Menilai adalah mengambil suatu keputusun terhadap suatu dengan
ukuran baik buruk. Penilaian bersifat kualitatif.
Mengadakan evaluasi meliputi kedua langkah diatas, yakni
mengukur dan menilai.
2. Penilaian Pendidikan
Meskipun kini memiliki makna yang lebih luas, namun pada awalnya
pengertian evaluasi pendidikan selalu dikaitkan dengan prestasi belajar
siswa. Definisi yang pertama dikembangkan oleh Ralph Tyler (1950).
Ahli ini mengatakan bahwa evaluasi merupakan sebuah proses
pengumpulan data untuk menentukan sejauh mana, dalam hal apa, dan
bagian mana tujuan pendidikan sudah tercapai, jika belum, bagaimana
yang belum dan apa sebabnya. Definisi yang lebih luas dikemukakan oleh
dua orang ahli lain yakni Cronbach dan Stufflebeam. Tambahan definisi
tersebut adalah bahwa proses evaluasi bukan sekedar mengukur sejauh
mana tujuan tercapai, tetapi digunakan untuk membuat keputusan.
Input
Input adalah bahan mentah yang dimasukan ke dalam transformasi.
Dalam dunia sekolah maka yang dimaksud dengan bahan mentah
adalah calon siswa yang baru akan memasuki sekolah. Sebelum
memasuki suati tingkat sekolah (institusi), calon siswa itu dinilai
dahulu kemampuannya. Dengan penilaian itu ingin diketahui
apakah kelak ia akan mampu mengikuti pelajaran dan
melaksanakan tugas-tugas yang akan diberikan kepadanya.
Output
Yang dimaksud sebagai output atau keluaran adalah bahan jadi
yang dihasilkan oleh transformasi. Yang dimaksud dalam
pembicaraan ini adalah siswa lulusan sekolah yang bersangkutan.
Untuk dapat menentukan apakah seoarang siswa berhak lulus atau
tidak, perlu diadakan kegiatan penilaian, sebagai alat penyaring
kualitas.
Transformasi
Transformasi dapat diibaratkan sebagai sebuah mesin yang
berproses mengubah bahan mentah menjadi susuatu agar berada
dalam keadaan matang. Menurut kamus inggir-indonesia, kata
transform terdiri dari dua kata, trans (terjemahan-perubahan) dan
form (bentuk). Jadi trasformasi dalam pembelajaran diartikan
sebagai proses pergantian atau perubahan bentuk atau pengolahan
sesuatu agar berubah menjadi bentuk lain. Transformasi yang
sedang kita bicarakan ini adalah transformasi dalam arti umum
sebagaimana yang dipahami oleh umum yaitu pergantian bentuk
antara sebelum dan sesudah mengikuti kegiatan di sebuah lembaga
pendidikan. Siswa yang sedang belajar diumpamakan sesuatu yang
dimasukan ke dalam pemrosesan untuk diubah dari “belum tahu
atau belum dapat” agar menjadi”sudah tahu atau sudah dapat”.
3. Mengapa Menilai
Jika seblum membeli jeruk kita tidak memilih dahulu mana jeruk yang
baik dibandingkan dengan yang kurang baik, maka akan memperoleh
jeruk seadanya.
Mungkin baik, tetapi juga kemungkinan tidak baik. Yang jelas kita
belum tentu memperoleh jeruk yang berkualitas baik jika tidak didahului
dengan kegiatan menilai.
Evaluasi Bab 1
1. Subjek Evaluasi
Yang dimaksud dengan subjek evaluasi adalah orang yang melakukan
pekerjaan evaluasi. Siapa yang dapat disebut sebagai subjek evaluasi untuk
setiap tes, ditentukan oleh suatu antara pembagian tugas atau ketentuan yang
berlaku.
Contoh:
a. Untuk melaksanakan evaluasi tentang prestasi belajar atau pencapaian
maka sebagai subjek evaluasi adalah guru.
b. Untuk melaksanakan evaluasi sikap yang menggunakan sebuah skala maka
sebagai subjeknya dapat meminta petugas yang ditunjuk, dengan didahului
oleh suatu latiahan melaksanakan evaluasi tersebut.
c. Untuk melaksanakan evaluasi serhadap kepribadian dimana menggunakan
sebuah alat ukur yang sudah distandarisasikan maka subjeknya adalah ahli-
ahli psikologi. Disamping alatnya yang harus bersifat rahasia, maka subjek
evaluasi haruslah seorang yang betul-betul ahli karena jawaban dan tingkah
laku orang yang dites harus diiterprestasikan dengan cara tertentu.
Tidak setiap orang dapat menafsirkan jawaban tes kepribadian ini,
sehingga hanya orang yang telah mempelajari tes secara mendalam yang dapat
melakukannya. Demikian juga dengan tes intelegensi, subjek pelakunya harus
seorang ahli.
Dalam keterangan ini, penulis mengkategorikan pelaksanaan evaluasi
sebagai subjek evaluasi, ada pandangan lain yang disebut subjek evaluasi
adalah siswa, yakni orang dievaluasi. Dalam hal ini yang dipandang sebagai
objek misalnya : prestasi matematika, kemampuan membaca, kecepatan lari,
dan sebagainya. Pandangan lain lagi mengklasifikasikan siswa sebagai objek
evaluasi dan guru sebagai subjeknya.
2. Objek Evaluasi
Yang dimaksud dengan objek atau sasaran evaluasi adalah hal-hal yang
menjadi pusat perhatian untuk dievaluasi. Apapun yang ditentukan oleh
evaluator atau penilai untuk dievaluasi, itulah yang disebut dengan objek
evaluasi. Pada waktu evaluator ingin menilai berat badan siswa, naja yang
menjadi objek evaluasi adalah berat badan siswa, sedang angka yang
menunnjukan beberapa berat badan siswa dimaksud, misalnya 34 kilogram, 40
kilogram dan sebagainya adalah hasil evaluasi. Jika evaluastor ingin menilai
keterampilan siswa dalam menggunakan termometer, maka yang menjadi
objek evaluasi adalah benar tidaknya gerakan tangan siswa ketika memegang
alat, kemampuan siswa untuk menentukan berapa lama termometer diletakan
di bagian badann, kemudian juga kemampuan siswa dalam membaca skala
yang ada pada termometer. Gambaran tentang benar salanya menggunakan
termometer adalah hasil evaluasi.
Dengan masih menggunakan diagram tentang transformasi yang ada di bab 1,
maka yang menjadi objek evaluasi adalah semua unsur atau komponen yang
ada dalam transformasi tersebut. Agar diperoleh gambaran yang menyeluruh
tentang mutu dan kebenaran kinerja transformasi, maka yang dijadikan objek
evaluasi adalah semua aspek yang terkait dengan kinerja transformasi, yaitu
(1) masukan mentah, (2) masukan instrumental, (3) masukan lingkungan (4)
proses transformasi itu sendiri dan (5) keluaran, yaitu hasil dari transformasi.
Masukan mentah sebagai objek evaluasi
Dalam transformasi pembelajaran, siswa berstatus sebagai objek didik. Ahli-
ahli pendidikan angkatan lama berpendapat bahwa siswa adalah objek
pendidikan, kini pendapat seperti itu ditentang oleh ahli-ahli pembaharuan.
Dalam kegiatan pendidikan siswa adalah subjek yang aktif, bukan sekedar
objek pasif yang dapat diperlakukan dan diarahkan menurut kehendak. Dalam
berbicara tentang objek evaluasi ini mungkin ada pembaca yang terkacaukan
pengertiannya. Siswa yang dalam proses pembelajaran berstatus sebagai
subjek, dalam evaluasi dia merupakan objek evalausi, karena dicermati untuk
diketahui kinerjanya ketika mengikuti pembelajaran. Sekali lagi jangan keliru.
Dalam proses pendidikan, siswa berstatus sebagai subjek didik-siswa
aktif belajar
Dalam evaluasi, kinerja berstatus sebagai objek evaluasi-kinerja
siswa dicermati dan diperhatikan oleh evaluator.
Aspek-aspek yang menjadi objek evaluasi berkenaan dengan siswa sebagai
masukan mentah, masukan instrumental, dan masukan lingkungan dapat
dikembangkan dari apa yang sudah disampaiakn di bab1, apabila evaluatpr
merasa kurang tepat atau masing menginginkan hal-hal yang dievaluasi,
silahkan mendaftar lagi hal-hal lain menurut kebutuhan, beberapa hal yang
perlu dibicarakan dalam objek evaluasi adalah :a) Penilaian dalam KBK (b)
penilaian tiga ranah psikologis.
3. Sasaran Evaluasi
Apabila kita kembali kepada diagram di bab 1, kita akan ingat kembali apa
yang menjadi sasaran dari penilaian. Objek atau sasaran penilaian adalah
segala sesuatu yang menjadi titik pusat pengamatan karena penilaian
menginginkan informasi tentang sesuatu tersebut.
Dengan masih menggunakan diagram tentang transformasi maka sasaran
penilaian untuk unsur-unsurnya meliputi, input, transformasi dan output
a. Input
Calon siswa sebagai pribadi yang utuh dapat ditinjau dari beberapa segi
menghasilkan bermacam-macam bentuk tes yang digunakan sebagai alat
untuk mengugkur. Aspek yang bersifat rohani setidaknya mencakup
4(empat) hal.
1) Kemampuan
Untuk dapat mengikuti program dalam suatu lembaga/sekolah institusi
maka calon siswa harus memiliki kemampuan yang sepadan. Alat ukur
yang digunakan untuk mengukur kemampuan ini disebut tes
kemampuan atau attitude test.
2) Kepribadian
Kepribadian adalah suatu yang terdapat pada diri manusia dan
menampakan bentuknya dalam tingkah laku. Dalam hal-hal tertentu.
Informasi tentang kepribadian sangat diperlukan. Alat untuk
mengetahui kepribadian seseorang disebut tes kepribadian atau
personality test.
3) Sikap-sikap
Sebenarnya sikap ini merupakan bagian dari tingkah laku manusia
sebagai gejala atau gambaran kepribadian yang memancar keluar.
Namun, karena sikap ini merupakan suatu yang paling menonjol dan
sangan dibutuhkan dalam pergaulan maka banyak orang yang
menginginkan informasi khusus tentangnya. Alat untuk mengetahui
keadaan sikap seseorang dinamakan tes sikap atau attitude tes. Oleh
karen tes ini berupa skala. Maka disebut sikap attitude scale.
4) Intelegensi
Untuk mengetahui tingkat intelegensi ini diguanakan tes intelegensi
yang sudah banyak diciptakan oleh para ahli. Dalam hal ini yang
terkenal adalah tes buatan binet dan simo yang dikenal dengan tes
Binet-Simon. Selain itu adalagi tes-tes lain misalnya SPM, Tintum, dan
sebagainya. Dari hasil tes akan diketahui IQ orang tersebut. IQ
bukanlan intelegensi. IQ berbeda dengan intelegensi karena IQ
hanyalah angka yang memberikan petunjuk tinggi rendahnya
intelegensi seseorang. Dengan pengertian ini maka kurang benarlah
jika ada orang mengatakan “IQ jongkok” karena IQ adalah berupa
angka. Mestinya IQ rendah diartikan bahwa angkanya rendah.
Berkenaan dengan hubungan antara sikap dan kepribadian,
A.N. Oppenheim dalam bukunya Questionnnaire Design and Attitude
Measurement mengahukan gambar seperti tertera pada halaman
selanjutnya. Dari gambar ini jelas bahwa kepribadian merupakan
sesuatu yang ada dalam diri manusia dan sangat dalam letaknya
sehingga sangat susah dilihat.
b. Transformasi
telah dijelaskan bahwa banyak unsur yang terdapat dalam transformasi
yang semuanya dapat menjadi sasaran atau objek penilaian demi
diperolehnya hasil pendidikan yang diharapkan. Unsur-unsur dalam
transformasi yang menjadi objek penilaian antara lain :
a) Kurikulum/materi
b) Metode dan cara penilaian
c) Sarana pendidikan
d) Sistem administrasi
e) Guru dan personal lainnya.
c. Output
Penilaian terhadap lulusan suatu sekolah dilakukan untuk mengetahui
seberapa jauh tingkap pencapaian/prestasi belajar mereka selama
mengikuti program. Alat yang digunakan untuk mengukur pencapai ini
disebut tes pencapaian atau achievement test.
Kecenderungan yang ada sampai saat ini di sekolah adalah bahwa
guru hanya menilai prestasi belajar aspek kognitif atau kecerdasan saja.
Alatnya adalah tes tertulis. Aspek psikomotorik, apalagi efektif, sangat
langka dijamah oleh guru. Akibatnya, dapat kita saksikan, yakni para
lulusannya hanya menguasai teori tetapi tidak terampil melakukan
pekerjaan keterampialan. Juga tidak mampu mengaplikasikan pengetahuan
yang sudah mereka kuasai. Lemahnya pembelajaran dan evaluasi terhadap
aspek afektif ini, jika kita mau instrospeksi, telah berakitab merosotnya
ahklak para lulusan. Yang selanjutnya berdampak luas pada merosotnya
akhlah bangsa.
Evaluasi Bab 2
1. Prinsip Evaluasi
Ada satu prinsip umum dan penting dalam kegiatan evaluasi, yaitu adanaya
triangulasi atau hubungan erat tiga komponen, yaitu:
a. Tujuan pembelajaran
b. Kegiatan pembelajaran atau KBM, dan
c. Evaluasi.
Triangulasi tersebut dapat digambarkan dalam bagan sebagai berikut:
Tujuan
4 5 6 7 8
Biasanya angka-angka yang digunakan direapkan pada skala dengan
jarak yang sama. Meletakannya secara bertingkat dari yang rendah
ke yang tinggi. Dengan demikian, skala ini dinamakan skala
bertingkat. Kita dapat menilai hampir segala sesuatu dengan skala.
Dengan maksud agar pencatatannya dapat objektif, maka penilaian
terhadap penampilan atau penggambaran kepribadian seseorang
disajikan dalam bentuk skala.
Contoh:
2 3 4 8
1 T i d ak
Sangat tidak s u k a
suka Biasa Suka Sangat suka
Contoh:
Tingkat pendidikan yang sekarang anada ikuti adalah
: SD SLTP SLTA
Perguruan Tinggi
Tidak
No Pernyataan Penting Biasa
Penting
1 Melihat pemandangan indah
2 Olahraga tiap hari
3 Melihat film
4 Belajar menari
5 Tulisan bagus
Ada pendapat yang mengatakan bahwa sebenarnya skala bertingkat
dapat digolongkan ke dalam daftar cocok karena dalam skala
bertingkatm responden juga diminta untuk memberikan tanda cocok
pada pilihan yang tepat.
4) Wawancara (interview)
Wawancara atau interview adalah suatu metode atau cara yang
digunakan untuk mendapatkan jawaban dari responden dengan
tanya-jawab sepihak. Dikatakan sepihak karena dalam wawacara ini
responden tidak diberi kesembapan sama sekali untuk mengajukan
pertanyaan. Pertanyaan hanya diajukan oleh suubjek evaluasi.
Wawancara dapat dilakukan dengan 2 (dua) cara, yaitu:
a) Wawancara bebas, dimana responden mempunyai kebebasan
untuk mengutarakan pendapatnya tanpa dibatasi oelh patokan
yang telah dibuat oleh subjek evaluasi
b) Wawancara terpimpin, yaitu wawancara yang dilakukan oleh
subjek evaluasi dengan cara mengajukan pertanyaan pertanyaan
yang sudah disusun terlebih dahulu. Dalam hal ini, responden
tinggal memilih jawaban yang sudah dipersiapkan oleh penanya.
Jawaban itu kadang-kadang bersifat memimpin dan
mengarahkan, dan jawaban sudah dipimpin oleh sebuah daftar
cocok.
5) Pengamatan (observation)
Pengamatan atau observasi adalah suatu teknik yang dilakukan
dengan cara mengadakan pengamatan secara teliti srta pencatatan
secara sistematis.
Ada 3 macam observasi
a) Obeservasi partisipan, yaitu observasi yang dilakukan oleh
pengamat, dalam hal in pengamat memasuki dan mengikuti
kegiatan kelompok yang sedang diamati. Observasi partisipan
dilaksanakan sepenuhnya jika pengamat betul-betul mengikuti
kegiatan kelompok, bukan hanya pura-pura. Dengan demikian ia
dapat menghayati dan merasakan seperti apa yang diraskan
orang-orang dalam kelompok yang diamati.
Contoh:
Untuk mengamati kehidupan mahasiswa penyewa kamar,
pengamat menjadi mahasiswa dan menyewa kamar.
b) Observasi sistematik, yaitu observasi dimana faktor faktor yang
diamati sudah didaftar secara sistematis dan sudah diatur
menurut kategorinya. Berbeda dengan observasi partisipanm,
maka dalam observasi sistematik ini pengamat berada diluar
kelompok, dengan demikianm pengamat tidak dibingungkan
oleh situasi yang melingkungi dirinya.
c) Observasi eksperimental terjadi jika pengamat tidak
berpartisipasi dalam kelompok, dalam hal ini, ia dapat
mengendalikan unsur-unsur penting dalam situasi sedemikian
rupa sehingga situasi itu dapat diatur sesuai denangan tujuan
evaluasi.
6) Riwayat hidup
Riwayat hidup adalah gambaran tentang keadaan seseorang selama
masa kehidupannya. Dengan mempelajari riwayat hidup. Maka
subjek evaluasi akan dapat menarik suatu kesimpulan tentang
kepribadian, kebiasaan, dan sikap dari objek yang dinilai.
b. Teknik Tes
Apakah sebenarnya tes itu? Ada bermacam-macam rumusan tentang
tes. Didalam bukunya yang berjudul evaluasi pendidikan, Amir Daien
Indrakusuma mengatakan demikian:
”tes adalah suatu alat atau prosedur yang sistematis dan objektif
untuk memperoleh data-data atau keterangan-keterangan yang
diinginkan tentang seseoarang, dengan cara yang boleh dikatakan
tepat dan cepat”
Selanjutnya, di dalam buku teknik-teknik evaluasi Muchtar Bukhori
mengatakan:
“Tes ialah suatu percobaan yang diadakan untuk mengetahui ada
atau tidaknya hasil-hasil pelajaran tertentu pada seorang murid
atau kelompok murid.”
Definisi terakhir yang dikemukakan disini adalah definisi yang dikutif
Webster’s Collegiate.
“Test=any series of questions or exercieses or other means of
measurng the skill, knowledge, intelegence, capacities of aptitudes
or an individual or group”
Yang lebih kurang artinya:
“Tes adalah serentetan pertanyaan atau latihan atau alat lain yang
digunakan untuk mengukur keterampilan, pengetahuan,
intelegensi,kemampuan atau bakat yang dimiliki oleh individu atau
kelompok”
Kutipan ini disajikan dalam buku Encyclopedia of Educational
Evaluation. Yang di dalam buku tersebut diterangkan pula bahwa
pengertiannya dipersempit dengan menyederhanakan definisi menjadi
demikian:
“Tes is comprehensive assesment of an individual or to an entire
program evaluation effort”
Artinya:
“Tes adalah penilaian yang komprehensif terhadap seorang
individu atau keseluruhan usaha evaluasu program”
Dari beberapa kutipan dan uraian diatas, dapat disimpulkan bahwa tes
merupakan suatu alat pengumpul informasi, tetapi jika dibandingkan
dengan alat-alat yang lain. Tes bersifat lebih resmi karena penuh dengan
batasan-batasan. Mengingat betapa pentingnya tes ini, maka uraian
yang lebih terperinci akan disampaikan secara terpisah pada bab-bab
lain.
Apabila rumusan yang telah disebutkan di atas dikaitkan dengan
evaluasi yang dilakukan di sekolah, khususnya di suatu kelas, maka tes
mempunyai fungsi ganda, yaitu untuk mengukur siswa dan untuk
mengukur keberhasilan program pengajaran, dalam bagian ini hanya
akan dibicarakan tes untuk mengukur keberhasilan siswa.
Ditinjau dari segi kegunaan untuk mengukur siswa, tes dibagi menjadi 3
yaitu”
1) tes diagnostik
2) tes formatif, dan
3) tes sumatif
keterangan masing-masing tes adalah sebagai berikut.
1) Tes diagnostik
Seorang guru yang baik, tentu akan merasa bahagia apabila dapat
membantu siswanya dapat mencapai kemajuan secara maksimal
sesuai dengan kemampuan yang dimiliki.
Untuk mengetahui apakah bantuan yang diberikan sudah memadai,
maka diadakan suatu penilaian. Namun, informasi hasil penilaian ini
tidak akan ada gunanya seandainya tidak digunakan untuk bahan
pertimbangan bagi tindakan selanjutnya
Seperti halnya seoarng dokter, sebelum menentukan obat apa yang
akan diberikan kepada pasien, dokter melakukan pemeriksaan
secara teliti dahulu. Misalnya, memeriksa denyut nadi, suara nafas,
reaksi lutut, urine, darah, dan sebagainya. Demikian juga seorang
guru terhadap siswa, guru harus mengadakan tes yang maksudnya
untuk mendiagnosis. Tes ini disebus tes diagnostik.
Tes diagnostik adalah tes yang digunkan untuk mengetahui
kelemahan-kelemahan siswa sehingga berdasarkan hal tersebut
dapat dilakaukan penganganan yang tepat. Dengan mengingat
bahwa sekolah sebagai sebuah transformasi, maka letak tes
diagnostik dapat dilihat pada gambar di bawah ini:
Input Output
ke1 dilakukan terhadap calon sis
Tes wa sebagai
untuk mengetahui apakah calon siswa sudah menguasai
pengetahuan yang merupakan dasar untuk menerima pengetahuan di
sekolah. Dalam pembicaraan tes secara umum, tes ini disebut tes
penjajakan masuk yang dalam istilah inggris disebut entering
behaviur test. Dalam penggalan kecil, tes diagnostik ke-1 dilakukan
untuk mengukur tingkat penguasaan pengetahuan dasar untuk dapat
menerima pengetahuan lanjutannya. Pengetahuan dasar ini biasa
disebut dengan pengetahuan bahan prasyarat (preruqisite) oleh
karena itu tes ini disebut juga tes prasayarat atau prereuisite test.
Test diagnostik ke-2 dilakukan terhadap calon siswa yang akan
mulai mengikuti program. Apabila cukup banyak calon siswa yang
diterima sehingga diperlukan lebih dari satu kelas, maka untuk
pembagian kelas diperlukan suatu pertimbangan khusus. Apakah
anak yang baik akan disatukan di satu kelas atau semua kelas akan
diisi dengan campuran anak baik, sedang atau semua kelas akan
diisi dengan campuran anak baik, sedan atau kurang. Ini semua
memerlukan informasi yang dapat diperoleh dengan cara
mengadakan tes diagnostik. Dengan demikian, tes diagnostik telah
berfungsi sebagai tes penempatan (placement Test).
Test diagnostik ke-3 dilakukan terhadap siswa yang sedang belajar
tidak semua siswa dapat menerima pelajaran yang diberikan oleh
guru dengan lancar. Sebagai guru yang bijaksana, sebaiknya
sesekali melakukan tes diagnostik. Untuk mengetahui bagian mana
dari materi pelajaran yang diberikan belum dikuasai oleh siswa
Test diagnostik ke-4 diadakan pada waktu siswa mengakhiri
pelajaran. Dengan tes ini guru akan dapat mengetahui tingkat
penguasaan siswa terhadap bahan yang ia berikan.
2) Tes formatif
Dari kata form yang merupakan dasar dari istilah formati, maka
evaluasi formatif dimaksudkan untuk mengetahui sejauh mana
siswa telah terbentuk setelah mengikuti program tertenu. Dalam hal
ini, tes formatif dapat juga dipandadang sebagai tes diagnostik pada
akhir pelajaran.
Evaluasi formatif atau tes formatif diberikan pada akhir setiap
program. Tes ini merupakan post-test atau tes akhir proses.
Evaluasi formatif mempunyai manfaat bai bagi siswa, guru mapun
program itu sendiri:
a) Manfaat bagi siswa
Digunakan untuk mengetahui apakah siswa sudah menguasai
materi program secara menyeluruh
Merupakan penguatan (reinforcement) bagi siswa. Dengan
mengetahi bahwa tes yang dikerjakan sudah menghasilkan
skor tinggi sesuai yang diharapkan, maka siswa merasa
mendapat “anggukan kepala” dari guru, dan ini merupakan
suatu tanda bahwa apa yang sudah dimiliki merupakan
pengetahuan yang sudah benar. Dengan demikian, maka
pengetahuan itu akan bertambah membekas diingatan.
Disamping itu, tanda keberhasilan suatu pelajaran akan
memperbesar motivasi siswa untuk belajar giat, agar
mempertahankan atau memperoleh nilai yang lebih baik.
Usaha perbaiakanm dengan umpan balik (feed back) yang
diperoleh setelah melakukan tesm siswa mengetahui
kelemahan-kelemahanya. Bahkan dengan teliti siswa
mengetahui bab atau bagian mana yang belum dikuasainya.
Dengan demikian siswa akan termotivasi untuk
meningkatkan penguasaan materi.
Sebagai diagnosis. Bahan pelajaran yang sedang dipelajari
oleh siswa merupakan serangkaian pengetahuan.
Keterampilan, atau konsep. Dengan mengetahui hasil tes
formatif, siswa dengan jelas dapat mengetahui bagian mana
dari materi pelajaran yang masih dirasakan sulit.
b) Manfaat bagi guru
Dengan telah mengetahui hasil tes formatif yang diadakan,
maka guru:
Mengetahui sampai sejauh mana materi yang diajarkan sudah
dapat diterima oleh siswa. Hal ini juga akan menentukan
apakah guru perlu mengganti metode pengajaran (strategi)
yang lama.
Mengetahui bagian-bagian mana dari materi pelajaran yang
belum dikuasai siswa. Apabila bagian yang belum dikuasai
merupakan materi dasar bagi pelajaran yang lain, maka
bagian itu harus diterangkan lagi dan barangkali memerlukan
cara atau media lain untuk memperjelas apabila tidak
diulangi, maka akan mengganggu kelancaran pemberian
materi pelajaran selanjutnya dan siswa akan semakin tidak
menguasainya.
Contoh:
D
a
p
at meramalkan sukses dan tidaknya seluruh program yang
akan diberikan.
c) Manfaat bagi program
Setelah diadakan tes formatif maka diperoleh hasil. Dari hasil
tersebut dapat diketahui:
Apakah program yang telah diberikan merupakan program
yang tepat, dalam arti sesuai dengan kecakapan anak.
Apakah program tersebut membutuhkan pengetahuan-
pengetahuan prasyarat yang belum diperhitungkan.
Apakah diperlukan alat, sarana dan prasarana untuk
mempertingggi hasil yang akan dicapai.
Apakah metode, pendekatan, dan alat evaluasi yang
digunakan sudah tepat.
3) Tes sumatif
Evaluasi sumatf atau tes sumatif dilaksanakan setelah berakhirnya
pemberian sekelompok atau sebuah program yang lebih besar.
Dalam pengalaman di sekolah tes formatif dapat disamakan dengan
ulangan harian, dengakan tes sumatif ini dapat disamakan dengan
ulangan umum yang biasanya dialakanakan pada tiap hari smester,
secara diagramis maka hubungan antara tes formatif dengan tes
sumatif ini tergambar sebagai berikut:
1. Pengertian
Istilah tes diambil dair kata testum, suatu pengertian dalam bahasa prancis
kuno yang berarti piring untuk menyisihkan logam-logam mulia. Ada pula
yang mengartikan sebagai sebuah piring yang dibuat dari tanah.
Seoarang ahli bernama James MC. Cattel, pada tahun 1890 telah
memperkenalkan pengertian tes ini kepada masyarakat melalui buku yang
berjudul Mental Test and Measurement. Selanjutnya, di Amerika Serikat tes
berkembang dengan cepat sehingga dalam tempo yang tidak begitu lama
masyarakat mulai menggunakannya.
Banyak ahi yang mulai mengembangkan tes ini untuk berbagai
bidang, namun yang terkenal adalah sebuah tes intelegensi yang disusunn
oleh seoarang prancis bernama Binet, yang kemudan dibantu tes BinetSimon
(1904). Dengan alat ini Binet dan Simon berusaha untuk membeda-bedakan
anak menurut tingkat intelegensinya. Dan pekerjaan Binet dan Simon inilah
kemudian kita kenal istilah-istilah umur kecerdasan (mental age), umur
kalender (chronological age) dan indeks kecerdasan, intelegensi kuesioner
atau inteligence quotient (IQ).
Sebagai perkembangannya, Yarkes di Amerika Serikat menyusun tes
kelompok (group test) yang digunakan untuk menyeleksi calon militer
sebanyak-banyaknya dalam waktu yang singkat. Diperlukan pada waktu
perang dunia 1, tes ini dikenal denga nama Army Alpha dan Army Betha.
Didorong oleh munculnya statistik dalam penganalisaan data dan
informasi, maka akhirnya tes ini digunakan dalam berbagai bidang seperti tes
kemampuan dasar, tes kesalahan perhatian, tes ingatan, tes minat, tes sikap.
Dan sebagainya. Yang dikenal penggunanya di sekolah hanyalah tes prestasi
belajar.
Sebelum sampai kepada uraian lebih jauh. Maka akan diterakan
dahulu arti dari beberapa istilah-istilah yang berhubungan dengan tes ini.
- Tes
(sebelum adanya ejaan yang disempurnakan dalam bahasa indonesia
ditulis dengan test) adalah merupakan alat atau prosedur yang digunakan
untuk mengetahui atau mengukur suatu dalam suasana dengan cara dan
aturan-atuaran yang sudah ditentukan. Untuk mengerjakan tes ini
tergantung dari petunjuk yang diberikan. Misalnya, melingkari salah satu
huruf di depan pilihan jawaban, menerangkan, mencoret jawaban salahm
melakukan tugas atau suruhan, menajawab secara lisan dan sebagainya
- Testing
Testing merupakan saat pada waktu tes itu dilaksnakan. Dapat juga
dikatakan testing adalah saat pengambilan tes.
- Testee
(dalam istilah bahasa indonesia tercoba) adalah responden yang sedang
mengerjakan tes. Orang-orang inilah yang akan dinilai atau diukur, baik
mengenai kemampuan, minat, bakat, pencpaian, dan sebagainya.
- Tester
(dalam istilah indonesia:pencoba), adalah orang yang diserahi untuk
melaksnakan pengambilan tes terhadap para responden.
Dengan kata lain, tester adalah subjek evaluasi (tetapi adakalany hanya
orang yang ditunjuk oleh subjek evaluasi untuk melaksnakan tugasna)
tugas tester antara lain:
a. Mempersiapkan ruangan dan perlengkapan yang diperlukan
b. Membagikan lembaran tes dan alat-alat lain untuk mengerjakan
c. Menerangkan cara mengerjakan tes
d. Mengawasi responden mengerjakan tes
e. Memberikan tanda-tanda waktu
f. Mengumpulkan pekerjaan responden
g. Mengisi berita acara atau laporan yang diperlukan ( jika ada)
2. Persyaratan Tes
b. Reliabilitas
Kata reabilitas dalam bahasa indonesia diambil dari kata reliability dalam
bahasa inggris, berasal dari kata reliable yang artinya dapat dipercaya.
Seperti halnya islilah validitas dan valid, kekacauan dalam penggunaan
istilah “reliabilitas” sering dikacaukan dengan istilah “reliable”. reliabel.
Reliabilitas merupakan kata benda sedangakan reliabilitas merupakan
kata sifat atau kata keadaaan.
Seoang dikatakan dapat dipercaya jika orang tersebut selalu bicara
ajeg. Tidak berubah-ubah pembicaraannya dari waktu ke waktu.
Contoh:
Demikian pula halnya sebuah tes. Tes tersebut dikatakan dapat dipercaya jika memberikan h
c. Objektivitas
Dalam pengertian sehari-hari dengan cepat diketahui bahwa objektif
berarti tidak adanya unsur pribadi yang mempengaruhi. Lawan dari
objektif adalah subjektif, artinya terdapat unsur pribadi yang masuk
memengaruhi. Sebuah tes dikatakan memiliki objektivitas apabila dalam
melaksanakan tes itu tidak ada faktor subjektif yang memengaruhi. Hal ini
terutama terjadi pada sistem skoringnya.
Apabila dikaitkan dengan reliabilitas maka objektivitas menekankan
ketetapan (consistency) pada sistem skoring, sedangkan reliabilitas
menekankan ketetapan dalam hasil tes.
Ada 2 (dua) faktor yang memengaruhi subjektivitas dari suatu tes, yaitu
bentuk tes dan penilai.
1) Bentuk tes
Tes yang berbentuk uraian, akan memberi banyak kemungkinan
kepada si penilai untuk memberikan penilaian menrut caranya sendiri.
Dengan demikian maka hasil dari seoarang siswa yang mengerjakan
soal-soal dari sebuah tes akan dapat berbeda apabila dinilai oleh dua
orang penilai. Itulah sebabnya pada waktu ini ada kecenderungan
penggunaan tes objektif di berbagai bidang. Untuk menghindari
masuknya unsur subjektivitas dari penilai. Maka sistem skoringnya
dapat dilakukkan dengan cara sebaik-baiknya, antara lain dengan
membuat pedoman skoring terlebih dahulu.
2) Penilai
Subjektivias dari penilai akan dapat masuk secara agak leluasa.
Terutama dalam tes bentuk uraian. Faktor-faktor yang memengaruhi
subjektifitas. Anatara lain. Kesan penilai terhadap siswa. Tulisan
bahasa. Waktu mengadakan penilaian, kelelahan dan sebagainya.
Untuk menghindari atau mengurangi masuknya unsur subjektifitas
dalam pekerjaan penilaian, maka penilaian atau evaluasi ini harus
dilaksanakan dengan mengingat pedoman. Pedoman yang dimaksud
terutama menyangkut masalah pengadministrasian, yaitu kontinuitas
dan komprehensivitas
a) Evaluasi harus dilakukan secara kontinu (terus –menerus), dengan
evaluasi yang berkali-kali dilakukan maka guru akan memperoleh
gambaran yang lebih jelas tentang keadaan siswa. Tes yang
diadakan secara on the spot dan hanya satu atau dua kali. Tidak
akan dpat memberikan hasil yang objektif tentang keadaan
seorang siswa. Faktor kebetulan. Akan sangat mengganggu
hasilnya. Kalau misalnya ada orang anak yang sebetulnya pandai,
tetapi pada waktu mengadakan tes dia sedang dalam kondisi yang
jelek karena semalaman merawat ibunya yang sedang sakit, maka
sada kemungkinan nilai tesnya jelek pula.
b) Evaluai harus dilakukan secara komprehensif (menyeluruh) yang
dimaksud dengan evaluasi yang komprehensif disini adalah atas
berbagai segi peninjauan yaitu:
(1) Mencakup keseluruhan materi.
(2) Mencakup berbagai aspek berfikir (ingatan, pemahaman
aplikasi dan sebagainya)
(3) Melalui berbagai cara aitu tes tertulis, tes lisan tes pembuatan
pengamatan insidental dan sebagainya.
d. Praktikabilitas
Sebuah tes dikatakan meiliki praktikabilitas yaitu tinggi apabila tes
tersebut bersifat praktis, mudah pengadministrasiannya.
Tes yang praktis adalah tes yang:
1) Mudah dilaknakanak misalnya tidak menuntut peralatan yang banyak
dan memberi kebebasan kepada siswa untuk mengerjakan terlebih
dahulu bagian yang dianggap mudah oleh siswa.
2) Mudah pemeriksaanya, artinya bahwa tes itu dilengkapi dengan kunci
jawaban maupun pedoman skoringnya. Untuk soal bentuk objektif.
Pemeriksaan akan lebih mudah dilakukan jika dikerjakan oleh siswa
dalam lembar jawaban.
3) Dilengkapi dengan petunjuk-petunjuk yang jelas sehingga dapat
diberikan/diawali oleh orang lain.
e. Ekonomis.
Yang dimaksud dengan ekonomis disini ialah bahwa pelaksanaan tes
tersebut tidak membutuhkan ongkos/biaya yang mahal, tenaga yang
banyak dan waktu yang lama.
BAB 5
VALIDITAS
Seperti sudah disinggung di depan bahwa ketentuan penting dalam evaluasi adalah
bahwa hasilnya harus sesuai dengan keadaan yang dievaluasi. Mengevaluasi dapat
diumpamakan sebagai pekerjaan memotret. Gambar potret atau foto dikatakan
baik apabila sesuai dengan aslinya (bukan lebih baik dari aslinya seperti dikatakan
oleh iklan foto). Gambar pemotretan hasil evalauasi tersebut di dalam kegiatan
evaluasi dikenal dengan data evaluasi. Data evaluasi yang baik sesuai dengan
kenyataan disebut data valid. Agar dapat diperoleh data yang valid, instrumen atau
alat untuk mengevaluasinya harus valid. Jika pernyataan tesebut dibalik.
Instrumen evaluasi dituntut untuk valid karena diinginkan dapat diperoleh data
yang valid. Dengan kata lain, instrumen evaluasi dipersyarakan valid agar hasil
yang diperoleh dari kegiatan evaluasi valid.
Dalam pembicaraaan ini akan dikemukakan adanya dua jenis validitas. Validitas
pertama menyangkut soal cara keseluruhan yang akan di bahas pada bagian awala
bab ini. Sesudah selesai, disusul pembahasan validitas kedua. Yaktni validitas
menyangkut butir soal atau item dan validitas faktor yang menyangkut bagian
materi.
1. Macam-Macam Validitas
Di dalam buku Encyclopedia Of Educational Evaluation, yang ditulis oleh
Scarvia B. Anderson dan kawan-kawan disebutkan:
A test is valid if it measures what it purpose to measure. Atau jika
diartikan lebih kurang demikian: sebuah tes dikatakan valid apabila tes
tersebut mengukur apa yang hendak diukur. Dalam bahasa indonesia “Valid”
disebut sebagai istilah “Sahih”
Sebenarnya pembicaraan validitas ini bukan ditekankan pada tes itu
sendiri tetapi pada hasil pengetesan skornya.
Contoh:
Skor yang diperoleh dari hasil mengukur kemampuan mekanik akan
menunjukkan kemampuan seseorang dalam memegang dan memperbaiki
mobil, bukan pengetahuan tersebut dalam hal yang berkaitan dengan mobil.
Tes yang mengukur pengetahuan tentang mobiil bukanlah tes yang sahih
untuk mekanik.
Validitas sebuah tes dapat diketahui dari hasil pemikiran dan dari hasil
pengalaman, hal yang pertama dakan diperoleh validitas logis (logical
validity) dan hal yang kedua diperoleh validitas empiris (empirical validity)
dua hal inilah yang dijadikan dasar pengelompokan validitas tes
Secara gari besar ada dua macam validitas, yaitu validitas logis dan
validitas empiris
a. Validitas Logis
Istiliah validitas logis mengandung kata logis yang berasal dari kata
logika yang berarti penalaran. Dengan makna demikian maka validitas
logis untuk sebuah instrumen evaluasi menunjuk pada kondisi bagi
sebuah instrumen yang memenuhi persyaratan valid berdasarkan hasil
penalaran. Kondisi valid tersebut dipandang terpenuhi karena instrumen
yang bersangkutan sudah dirancang secara baik. Mengikuti teori dan
ketentuan yang ada. Sebagaimana pelaksanaan tugas lain misalnya
membuat sebuah karangan. Jika penulis mengikuti aturan mengarang.
Tentu secara logis karanganya sudah baik. Berdasarkan penjelasan
tersebut maka instrumen yang sudah disusun berdasarkan teori
penyusunan instrumen, secara logis sudah valid, dari penjelasan tersebut
kita dapat memahami bahwa validitas logis dapat dicapai apabila
isntrumen disusun mengikuti ketentuan yang ada, dengan demikian
disimpulkan bahwa validitas logis tidak perlu diuji kondisinya. Tetapi
langsung diperoleh sesudah instrumen tersebut selesai disusun.
Ada dua macam validitas logis yang dapat dicapai oleh sebuah
instrumen yaitu validitas isi dan validitas konstrak (Construct Validity).
Validitas isi bagi sebuah instrumen menunjuk suatu kondisi sebuah
instrumen yang disusun berdasarkan isi materi pelajran yang dievaluasi.
Selanjutnya validitas konstrak sebuah instrumen menunjuk suatu kondisi
sebuah instrumen yang disusun berdasarkan konstrak askpek-aspek
kejiawaan yang seharunya dievaluasi. Penjelasan lebih jauh tentang kedua
jenis validitas logis ini akan diberikan berturut-turut dalam membahas
jenis validitas instrumen nanti
b. Validitias Empiris
Istilah validitas empiris menurut kata empiris yang artinya pengalaman.
Sebuah instrumen dapat dikatakan memiliki validitas empiris apabila
sudah diuji dari pengalaman. Sebagai contoh sehari-hari, sehorang dapat
diakui jujur oleh masyarakat apabila dalam pengalaman membuktikan
bahwa orang tersebut memang jujur. Contoh lain, seorang dapat dikatakan
keratif apabila dari pengalaman dibuktikan bahwa orang tesebut sudah
banyak menghasilkan ide-ide baru yang diakui berbeda dari hal-hal yang
sudah ada. Dari penjelasan dan contoh tersebut diketahui bahwa validitas
empiris tidak dapat diperoleh hanya dengan menyusun instrumen
berdasarkan ketentuan seperti halnya validitas logis, tetapi harus
dibuktikan melalui pengalaman.
Ada dua macamvaliditas empiris, yakni ada dua cara yang dapat
dilakukan untuk menguji bahwa sebuah instrumen memang valid.
Pengujian tersebut dilakukan dengan membandingkan kondisi instumen
yang bersangkutan dengan kriterium atau sebuah ukuran. Kriteria yang
digunakan sebagai skor pembanding kondisi instrumen. Dimaksud ada
dua yaitu yang sudah tersedia dan yang belum tersedia tetapi akan terjadi
diwaktu yang akan datang. Bagi instrumen yang kondisinya sesuai dengan
kriterium yang sudah tersedia, yang sudah ada, disebut memiliki validitas
“ada sekarang” yang dalam istilah bahasa inggris disebut memiliki
concurrent validity. Selanjutnya instumen yang kondisinya sesuai dengan
kriterium yang diramalkan akan terjadi, disebut memili validitas ramalan
atau validitas prediksi. Yang dalam istilah bahasa inggris disebut memiliki
predictive validity.
Dari uraian ada dua jenis validitas logis yang ada dua macam dan
validitas empiris juga, yang juga ada dua macama, maka secara
keseluruhan kita mengenal adanyaempat validitas yaitu 1) validitas isi 2)
validitas konstrak, 3) validitas “ada sekarang” dan 4)validitas predictive.
Dua yang pertama yakni (1) dan (2) dicapai melalui penyusunan
berdasarkan ketentuan atau teori, sedangkan teori berikutnya yakni (3)
dan (4) dicapai atau diketahui sesudah dibuktikan melalui pengalaman.
Adapun penjelasan masing-masing validita adalah sebagai berikut:
1) Validitas isi (content validity)
Sebuah tes dikatakan memiliki validitas isi apabila mengukur tujuan
khusus tertentu yang sejajar dengan materi atau isi pelajaran yang
diberikan. Oleh karena materi yang diajarkan tertera dalam kurikulum
maka validitas isi ini sering juga disebut validitas kurikuler.
Validitas isi dapat diusahakan tercapainya sejak saat penyusunnan
dengan cara memerinci materi kurikulum atau meter, buku pelajaran
bagaimana cara merinci materi untuk kepentingan diperlukan validitas
isi sebuah tes akan dibicarakan secara lebih mendalam pada waktu
menjelaskan cara penyusunan tes.
2) Validitas konstruksi (contruct validity)
Sebuah tes dikatakan memiliki validitas konstruksi apabila butir-butir
soal yang membangun tes tersebut mengukur setiap aspek berpikir
seperti yang disebutkan dalam tujuan instruktusional khusus. Dengan
kata lain jika butir-butir soal mengukur aspek berpikir tersebut sudah
sesuai dengan aspek berpikir yang menjadi tujuan instruksional.
Sebagai contoh jika rumusan tujuan instruksional khusus (TIK)
psikologis maka butir soal pada tes merupakan perintah agar siswa
membedakan antara dua efek tersebut, sekarang TIK dikenal dengan
indikator.
“konstruksi” dalam pengertian ini bukanlah susunan seperti yang
sering dijumpai dalam teknik. Tetapi merupakan rekaan psikologis,
yaitu suatu rekaan yang dibuat oleh para ahli ilmu jiwa yang dengan
suatu cara tertentu merinci isi jiwa atas bebrapa aspek seperti: ingatan,
pemahaman, aplikasi dan seterusnya. Dalam hal ini mereka
menganggap seolah-olah jiwa dapat dibagi-bagi, tetapi sebenarnya
tidak demikian. Pembagian ini hanya merupakan tindakan sementara
untuk mempermudah mempelajari.
Seperti halnya validitas isi. Validitas konstruksi dapat diketahu dengan
cara memerinci dan memasangkan setiap butir soal dengan setiap
aspek dalam TIK. Pekerjaan dilakukan berdasarkan logika, bukan
pengalaman. Dalam pembicaraan mengenai penyusunan tes hal ini
akan disinggung lagi.
3) Validitas “ada sekarang” (concurrent validity)
Validitas ini lebih umum dikienal dengan validitas empiris, sebuah tes
dikatakan memiliki validitas empiris jika hasilnya sesuai dengan
pengalaman. Jika ada istilah sesuai tentu ada dua hal yang
dipasangkan. Dalam hal ini hasil tes dipasangkan dengan hasil
pengalaman. Pengalaman selalu mengenai hal yang telah lampau
sehingga data pengalaman tersebut sekarang sudah ada (ada sekarang
concurrent)
Misalnya seorang guru ingin mengetahu apakah tes yang disusun
sudah valid atau belum. Untuk diperlukan sebuah kriterium masa lalu
yang sekarang datanya dimiliki. Misalnya nilai ulangan harian atau
nilai ulangan sumatif yang lalu.
4) Validitas preksi (Predictive validity)
Memprekdiksi artinya meramal, dengan meramal selalu mengenal hal
yang akan datang jadi sekarang belum terjadi, sebuah tes dikatakan
memiliki validitas prediksi atau validitas ramalan. Apabila
mempunyai kemampuan untuk meramalkan apa yang akan terjadi
pada masa saya yang akan datang
Sebagai alat pembanding validitas prediksi adalah nilai-nilai yang
diperoleh setelah tes mengikuti pelajaran di perguruan tinggi. Jika
ternya siapa yang memiliki nilai tes lebih tinggi gagal dalam ujiam
semester 1 dibandingkan dengan yang dahulu nilai tesnya muda maka
tes masuk yang dimaksud memiliki nilai tes lebih tinggi gagal dalam
ujian smester 1 dibandingkan dengan dahulu nilai tesnya lebih rencah,
maka tes masuk yang dimaksud tidak memiliki validitas prediksi.
2. Cara Mengetahui Validitas Alat Ukur
Sekali lagi diulang bahwa sebuah tes dikatakan memiliki validitas jika
hasilnya sesuai dengan kriterium, dalam arti memiliki kesejajaran antra hasil
tes tersebut dengan kriterium. Teknik yang digunakan untuk mengetahui
kesejajaran adalah teknik korelasi product moment yang dikemukakan oleh
pearson.
Rumus korelasi product ada 2(dua) macam yaitu
a. Korelasi product moment dengan simpangan dan
b. Korelasi product moment dengan angka kasar.
Rumus korelasi product moment dengan simpangan:
Dimana:
rxy = koefisien korelasi antra variabel X dan variabel Y, dua variabel
yang dikorelasikan (x = X –X dan y=Y – Y)
xy = jumlah perkalian x dengan y
x 2
= kuadrat dari x
x2 = kuadrat dari y
Contoh perhitungan:
r =❑xy
xy
√
22
()()
❑❑
xy
2,65
X= = √3,5 x 3,59 =
X-Y
=Y-
2,65
√12,565
2,65
=3,545
Indeks korelasi antara X dan Y inilah indeks validitas soal yang dicari.
Rumus korelasi product moment dengan angka kasar:
r xy N XY −( X )( Y )
=
√ { N X ( X )2 }{ N Y
2 2
−( Y )2 }
Dimana:
rxy = koefisien korelasi antara variabel X dan variabel Y, dan variabel yang
dikorelasikan
dengan menggunakan data hasil tes prestasi matematika di atas kini
dihitung dengan rumus korelasi product moment dengan angka kasar yang
tabel persiapannya sebagai berikut:
No Nama X Y x2 y2 XY
42,2 39,6 40,9
1 Nadia 6,2 6,3 5 9 5
46,2
2 Susi 7 6,8 49 4 47,6
56,2 51,8
3 Cecep 7,5 7,2 54
5 4
46,2
4 Erna 7 6,8 49 4 47,6
5 Dian 6 7 36 49 42
38,4
6 Asmara 6 6,2 36 37,2
4
30,2 26,0 28,0
7 Siswoyo 5,5 5,1 5 1 5
42,2
8 Jihad 6,5 6 5 45,5 39
9 Yana 7 6,5 49 36 45,5
34,8
10 Lina 6 5,9 36 1 35,4
63, 410, 417,
Jumlah 65 8 426 5 3
4173−4147
¿
√(4260−4225 )( 410,2−4070,44 )
26 26
¿ √35 x 34,76
= √1216,6
26
¿ =0745
34,8797
Jika dibandingkan dengan validitas soal yang dihitung dengan rumus
simpangan, ternyata terdapat perbedaan sebesar 0,003 lebih besar yang
dihitung dengan rumus simpanganan. Hal ini wajar karena dalam
mengerjakan perkalian atau penjumlahan jika diperoleh 3 atau angka di
belakang koma dilakukan pembulatan keatas. Perbedaan ini sangat kecil
sehingga dapat diabaikan.
Untuk memperjelas pengertian tersebut dapat disampaikan keterangan
sebagai berikut.
- Korelasi fositif menunjukan adanya hubungan sejajar antara dua hal
misalnya hal pertama nilanya naik, hal kedua ikut naik sebaliknya jika
hal pertama turun, yang kedua ikut turun.
Contoh korelasi positif antara nilai IPA dan Matematika
IPA : 2, 3, 5, 7, 4, 3, 2
Matematika : 4, 5, 6, 8, 5, 4, 2
Kondisi nilai matematika sejajar dengan IPA karena naik dan turunnya
nilai matematika mengikuti naik dan turunnya nilai IPA, Coba
Perhatikan!
- Korelasi negatif menunjukan adanya hubungan kebalikan antara dua hal.
Misalnya, hal pertama nilai naik, justru yang kedua turun sebaliknya jika
yang pertama turun yang kedua naik.
Contoh korelasi negatif antara nilai bahasa indonesia dengan matematika
Bahasa Indonesia : 5, 6, 8, 4, 3, 2,
Matematika : 8, 7, 5, 1, 2, 3
Keadaan hubungan antara dua hal yang kita jumpai dalam
kehidupan sehari-hari tidak selalu hanya positif atau negatif saja, tetapi
mungkin 0. Biasanya korelasi pun tidak menentu. Coba cermatilah
bagaimana hubungan antara dua nilai mata pelajaran A dan B berikut ini.
Contoh korelasi tidak tertentu.
Nilai A : 5, 6, 4, 7, 3, 8, 7
Nilai B : 4, 4, 3, 7, 4, 9, 4
Koefisien korelasi terdapat antara -1,00 samapai +1,00 namun
karena dalam menghitung sering dilakukan pembulatan angka=angka
sangat mungkin diperoleh koefisien lebih dari 1,00 koefisien negatif.
Menununjukan adanya kesejajaran untuk mengadakan interprestasi
mengenai besarnya koefisien korelasi adalah sebagai berikut:
- Antara 0,800 sampai dengan 1,00 : sangat tinggi
- Antara 0,600 sampai dengan 0,800 : tinggi
- Antara 0,400 sampai dengan 0,600 : cukup
- Antara 0,200 sampai dengan 0,400 : rendah
- Antara 0,000 sampai dengan 0,200 : sangat rendah
Penafsiran harga koefisien korelasi ada 2 (dua) cara yaitu:
1. Dengan melihat harga r dan diinterprestasikan misalnya korelasi
tinggi, cukup dan sebagainya.
2. Dengan berkonsultasi ke tabel harga kritik product moment sehingga
dapat diketahui signifikan tidak korelasi tersebut. Jika harga r lebih
kecil dari harga kritik dalam tabel. Maka korelasi tersebut tidak
signifikan begitu juga arti sebaliknya.
Ketrangan:
X = skor item nomor 6
Y = Skor total
Dari perhitungan kalkulator diperoleh data sebagai berikut:
X =6
y=46
XY =37
x2, Y2, dan XY
Xt = 5,57 X
Y = 6,17 Y
Sesudah diketahui X, tinggal memasukan
bilangan-bilangan tersebut ke dalam rumus korelasi product moment dengan
rumus angka kasar.
Data diatas dimasukan ke dalam rumus korelasi product moment
dengan angka kasar
r xy N XY −( X )(Y )
=
√ {N X −( X) } {N Y
2 2 2
−(Y )2 }
r xy = 8 x 37−6 x 46
√( 8 x 6−6 ) ( 8 x 288−46 )
2 2
296−276
¿
√(48−36 ) x (2304−2116 )
20 20
¿√12 x 188= √2256
20
¿ =0,421
47,497
M p −M
√
p
S 1 pq
y =
Keterangan:
ypbi = koefisien korelasi biserial
Mp = rata skor subjek yang menjawab betul bagi item yang dicari
validitasnya
Mt = rerata skor
St = standar deviasi dari skor total proporsi
p = proporsi siswa yang menjawab benar
banyaknyasiswa yang benar
p= jumlah seluruh siswa
8 + 5 + 3 + 5 + 6 + 4 + 7 + 8 46
Mt= =8 =5,75
2. Mencari 8
M p −M
√
qp
p
y = S t
1
√
6,17 =5,75 00,
,75
¿ 1,71
0,42
¿ =1,7321
1,7139
¿ 0,4244
Contoh perhitungan:
Tebel Persiapan Perhitungan Validitas Tes Matematika
Dengan Kriterium Tes Terstandar Matematika
No Nama X Y x2 y2 XY keterangan
1 Nining 5 7 25 49 35
2 Maruti 6 6 36 36 36 X = hasil tes
matematika yang
3 Bambang 5 6 25 36 30 dicari validtasnya
4 Seno 6 7 36 49 42
5 Hartini 7 7 49 49 49 Y= hasil tes
standar
6 Heru 6 5 36 25 30
Jika dari tes terstandar diketahui bahwa validitas 0,89 naja bukagab
0,108 ini belum merupakan validitas soal matematika yang dicar. Validitas
tersebut harus dikalikan dengan 0,89 yang hasilnya 0,108 x 0,89=0,096
5. Validitas Faktor
Selain validtitas soal secara keseluruhan dan validitas buti yang masih ada
lagi yang perlu diketahui validitasnya. Yaitu faktor-faktor atau bagian
keseluruhan materi. Setiap keseluruhan materi pelajaran terdiri dari pokok-
pokok bahasan atau mungkin sekelompok bahasan yang merupakan satu
kesatuan
Contoh:
guru akan mengevaluasi penguasaan siswa untuk tiga pokok bahan yaitu:
bunyi, cahaya, dan listrik untuk keperluan ini guru tersebut membuat 30 butir
soal, untuk bunyi 8 butir, untuk 12 butir dan untuk listrik 10 butir.
Apabila guru ingin mengetahi validitas faktor, maka ada 3 faktor
dalam soal ini. Seperti halnya pengertian validtias butir, pengertian validtias
faktor adalah sebagai berikut: butir-butir soal dalam faktor dikatakan valid
apabila mempunyai dukungan yang besar terhadap soal secara keseluruhan.
Sebagai tanda bahwa butir-butir faktor tersebut mempunyai dukungan yang
besar terhadap seluruh soal, yakni apabila jumlah skor untuk butir-butir faktor
tersebut jumlah skor untuk butir-butir faktor tesebut menunjukan adanya
kesejajaran dengan skor total. Agar uraian ini lebih jelas, pada halaman
selanjutnya disajikan contoh tabel analisis butirnya.
CONTOH TABEL ANALISIS BUTIR UNTUK MENGHITUNG VALIDITTAS BUTIR DAN
VALIDITAS FAKTOR
Dimana:
rnm
: besarnya koefisien, reliabilitas sesudah tes tersebut ditambah butir
soal baru
n : berapa kali butir-butir soal itu ditambah
r : besarnya koefisien reliabilitas sebelum butir-butir soalnya di
tambah
contoh:
suatu tes terdiri atas 40 butir soal, mempunyai koefisien reliabiltias 0,70.
Kemudian butir-butir soal itu ditambah menjadi 60 butir soal.
Maka koefisien reliabilitas baru adalah:
rnm nr
= 1+( n−1)r
1,5 x 0,70
¿ 1+(1,5−1) x
0,70
1,05
¿ 1,35
= 0,79
Demikian maka penambahan sebanyak 20 butir soal dari 40 butir
memperbesarkan koefisien reliabilitas sebesar 0,09. Akan tetapi
penambahan butir-butir soal tes adalakanya tidak berarti. Bahkan
merugikan. Hal ini disebabkan karena:
1) Sampai pada suatu batas tertentu, penambahan banyaknya butir soal
sudah menambah tinggi reliabiltas tes.
Ramers dan Gage menggambarkan hbungunan antra penambahan butir
soal reliabiltiias sebagai berikut:
Banyak pemakai metode ini salah memelah hasil tes pada waktu
menganalisis. Yang mereka lakukan adalah mengelompokan hasil
kelompok ini dikorelasikan. Yang benar adalah membelah item atau butir
soal. Tidak akan keliru kiranya bagi pemakai metode ini harus ingat bahwa
banyaknya butir soal harus genap agar dapat dibelah.
Ada dua cara membelah butir soal ini, yaitu:
1) Membelah atas item-item genap dan item-item ganjil yang selanjutnya
disebut belahan ganjil-genap.
2) Membelah atas item-item awal dan ite-item akhir separo jumlah pada
nomor-nomor awal dan separo pada nomor-nomor akhir yang
selanjutnya disebut belahan awal-akhir.
Contoh perhitungan reliabilitas dengan metode belah dua
Langkah pertama yang harus dilakukan adalah mengadakan butir soal
yang lebih terkenal dengan nama analisis item. Item yang dijawab dengan
benar diberi skor dan bagi yang salah diberi skor 0. Skor-skor untuk
seluruh subjek dan seluruh ini diterakan dalam tabel analisis sebagai
berikut:
Tabel Analisis Item Tes Matematika
2 x−0,3786
¿ 1+(−0,3786)
−0,7572
¿ =−0,5493
1,3786
*) pengurangan merupakan bilangan dengan harga mutlak, jadi tidak mengenal negatif.
2) Pembelahan awal akhir
Dengan data yang tertera pada tabel analisis item tes matematika diketahui
jumlah sekor belahan awal-akhir sebagai berikut:
Item Item
Ganjil Genap
No Nama
(1,3,5,7, (2,4,6,8,
9) (X) 10) (Y)
1 Hartati 3 5
2 Yoyok 2 3
3 Oktaf 1 3
4 Wendi 3 2
5 Diana 5 1
6 Paul 3 1
7 Susana 5 2
8 Helen 3 5
Seperti halnya pad wakhtu menghitung dengan belahan ganjil genap maka
kelanjutannya adalah menghitung dengan rumus korelasi product moment.
Dengan menggunakan kalkulator diketahui
X=25 X2 = 91
Y=22 Y2 = 78
XY=63
Setelah dimasukan ke dalam rumus korelasi product momen dengan angka
r 11
kasar diperoleh 2 2
=−0,3831
demgam rumus spearman-brown diperoleh
r11=0,5538
.
Selain menggunakan rumus korelasi product momen, dua orang ahli
mengajukan rumus lain. Seorang bernama Flanagan menemukan rumus
yang perhitunganya menggunakan belah dua ganjil-genap, dan seoarang
benama rulon yang dumusnya diterapkan pad data belahan awal-akhir.
3) Penggunaan rumus Flanagan
Rumus
( )
S 2 +S 2
1
r11=2 1− s
2
t
Dimana :
r11
= Reliabiiltas
2
S 1= vairans belahan pertama (1) yang dalam hal ini varian skor item
ganjil
2
S 2= varian belahan kedua (2) yaitu varians skor item genap
2
S t=varians total yaitu varians skor total
N
S−
N
Standar devviasi (SD) dapat dengan istilah simbpangan baku (SB) namun
husuf S (B bear) juga dapat dikatakan sudah menyebut standar deviasi
dalam kalkulator dengan simbol bagi yang berminat mencari S untuk
mencari varian, dapat menggunakan rumus S.
√ X2
S=
N
Dimana
S = standart deviasi
X = Simpangan X dan x yang dicari dari x – Y
S2 = barian 2 subjek pengikut tes,
Berdasarlam dat atabe; be;ajam gamko; genap perhitungannya esebagi
berikut:
252
93−
1 8
S2
8
78,125
¿ 93− =1.859
8
76− 222
28
S1
8
76−
60,5
= 8 =1,937
472
295−
8
S2=
2 8
2−1,1,609
= −2 ¿
=-1,218
N
S=
2
d
N
2
3
43−
8 43−1,125
¿ =
8 8
41,875
¿ 8 =5,234
r11
5,234
=1− 2,36
=1-2,218
=1,218
Dari perhitungan degnan rumus flanagan maupun rulon ternya hasilnya
sama, keudanya lebih besar dari 1,00. Secara eoeretik koefisien ini salah
karena pembulatan dalam perhitungan, seperti didepan. Hasil seperti ini
dapat saja terjadi
Untuk mengatasi kesulitan memenuhi persyaratan ini maka reliabilitas
dapat dicari dengan rumus ketemukan oleh karer dan Richardson. Kedua
orang ahli menentukan banak-rumus yang diberi nomor. Rumus yang
digunakan mencari reliabilitas adan banyak digunakan orang ada rumus,
yaitu rumus J-4,20 dan rumus K-R 21
5) Penggunaan rumus K-R 20
Rumus
( S2− pq
n
r 11 = n
( )
S
2
)dimana
r1 = reliabititas tes secara keseluruhan
p - proposi subjek yang menjawab item dengan benar
q =proporsi subjek yang menjawab item dengan salah (q=1-p)
n = Banyaknya item
S = Standar deviasi dari tes (standar deviasi adlah akar varians)
)
Penggunaan hrufk ini uga berlaku bagi rumah-rumah dalam tes, misalnya
K-R 21 dan rumus alpha. Untuk memberikan contoh perhitungan mencari
reliabilitas yang menggunakan rumus K-R 20. Ini akan dibuatkan tabel
analisis item lain.
Tabel Perhitungan Mencari Reabilitas Tes dengan rumus KR 21
Nomor item
No Nama skor total
1 2 3 4 5 6 7
1 wardoyo 1 0 1 1 1 1 0 5
2 benny 0 1 1 0 1 1 1 5
3 Hanafi 0 0 0 0 1 0 1 2
4 Rahmad 0 1 1 1 1 1 1 6
5 Tanti 1 0 0 0 1 0 0 2
6 Nadia 0 1 1 1 1 0 0 4
7 Tini 0 0 0 1 1 1 0 3
8 Budi 0 1 0 1 1 0 0 3
9 Daron 0 1 0 1 1 0 0 3
10 Yakob 0 0 0 1 1 0 0 2
NP 2 5 4 7 10 4 3 35
p 0,2 0,5 0,4 0,7 1 0,4 0,3
q 0,8 0,5 0,6 0,3 0 0,5 0,7
pq 1,31(åpq)
7
¿ 1,362−1,31
x 1,36
6
S=1,56 (dicari dengan kalkulator)
1,85=1,31
¿ 1,17 x S dapat dicari dengan menarik akar varians
1,85
1,85−1,31
¿ 1,17 x S=1,36(dicari dengan kalkulator)
1,85
=1,17 x0,29 = 0,3415 dibulatkan 0,342
(
Keterangan:
M=Mean atau rerata skor total
3,5− (7 − 3,5 )
)( )
7
r 11 = 7
( 1− 7x
(
3,5 x 3,5
1,17 x 1− 12,95
12,25
(
1,17 x 1−
12,95
1,17 x ( 1−0,946 )
1,17 x 0,0541
2. Taksonomi Bloom
Bloom dan Krathwohl telah memberikan banyak inspirasi kepada orang
yang melahirkan taksonomi lain. Prinsip-prinsip dasdar yang digunakan
oleh 2 orang ini ada 4 buah, yaitu:
a. Prinsip metodologis
Perbedaan yang besar telah merefleksi kepada cara-cara guru dalam
mengajar
b. Prinsip psikologis
Taksonomi hendaknya konsisten dengan fenomena kejiaan yang ada
sekarang.
c. Prinsip logis
Taksonomi hendaknya dikembangkan secara logis dan konsisten
d. Prinsip tujuan
Tingaktan-tingaktan tujuan tidak selaras dengan tingkatan-tingakatan
nilai-nilai. Tiap-tiap jenis tujuan pendidikan hendaknya
menggambarkan corak yang netral.
Atas dasar prinsip ini maka taksonomi disusun menjadi uatu
tingkatan yang menunjukan tingkat kesulitan sebagai contoh, menginat
fakta lebih mudah dari pada menarik kesimpulan. Atau menghafal, lebih
mudah daripada memberikan pertimbangan. Tingaktan kesulitan ini juga
merefleksi kepada kesulitan dalam proses belajar dan mengajar.
Sudah banyak diketahui bahwa mula-mula taksonomi bloom terdiri
dari dua bagian yaitu kognitif domain dan afektif domain (cognitive
domain and affective domain). Pencipta dar kedua taksonomi ini merasa
tidak tertarik pada psikomotor domain karena melihat hanya ada sedikit
kegunaannya di sekolah menengah atau universitas ( Bloom, 1956),
akhirnya simpson melengkapi dua domain yang ada dengan psikomotor
domain (1966). Namun sebenarnya pemisahan antara ketiga domain ini
merupakan pemisahan yang dibuat-buat, karena manusia merupakan suatu
kebetulan yang tidak dapat dipec-pecah sehingga tindakanya merupakan
suatu kebetulan.
Saat ini sudah banyak diketahui oleh umum bahwa apa yang
dikenal sebagai taksonomi bloom (1956) sebenarnya merupakan hasil
kelompok penilai di universitas yang terdiri dari B.S Bloom Editor MD
Engelhart, E Furs, W.H dan D.R Krathwohl yang kemudian didukung pula
oleh Ralp W. Tyler.
Secara garis besar, blooom bersama kawan-kawan merumuskan
tujuan-tujuan pendidikan pada 3(tiga) tingkatan:
a. Kategori tingkah laku yang masih verbal
b. Perluasan kategori menjadi sederatan tujuan
c. Tingkah laku konkret yang terdiri dari tugas-tugas (task) dalam
pertnyataan-penyataan sebagai ujian dan butir-butir soal
Ada 3 (tiga) ranah domain besar, yang terletak pada tingkatan ke -2
yang selanjutnya disebut taksonomi yaitu:
a. Ranah kognitif (cognitive domain)
1) Mengenal (recognition)
Dalam pengenalan siswa diminta untuk memilih satu dari
dua atau lebih jawaban
Contoh:
Hasil bumu yang terkenal dari daerah temanggung adalah:
a) Padi
b) Tebu
c) Tembakau
Mengungkap / mengingat kembali (recall)
Berbeda dengan mengenal maka dalam mengingat kembali
ini siswa diminta mengingat kembali satu atau lebih fakta-
fakta yang lebih sederhana.
Contoh:
Tempat keluarnya air dari dalam tanah disebut//
Mengenal dan mengungkap kembali, pada umumnya
dikategoraikan menjadi satu jenis, yakni ingatan. Kategori
ini merupakan yang paling rendah tingkatanya karena tidak
terlalu banyak meminta energi.
2) Pemahaman (comprehension)
Dengan pemahaman, siswa diminta untuk membuktikan
bahwa meamhami hubungan yang sederhana di antara
fakta-fakta atau konsep
Contoh:
Diantara gambar-gambar di bawah ini yang dapat disebut
sebagai segitiga siku-siku adalah:
a) .
b) .
c) .
3. Lain-Lain Taksonomi
Banyak kritik telah dilemparkan kepada Bloom Cs, tentang pembagian
taksonomi ini, sehingga timbul teori-teori sebagai adaptasi modifikasi atau
kategori baru.
a. McGuire (1963), Klicman (1963) telah menyusun taksnonomi untuk
bidang biologi,wood (1968) untuk matematika, Leuis (1965) untuk
Ilmu pengetahuan alam. Sebagai contoh, dihasilkan oleh The National
Longitudinal Study of Mathematical Ablities (NLSMA)
1) Knowledge of facts
2) Coputation
3) Compreension
4) Application
5) Analysis
Alasanya adalah:
1) Computation (komputasi, perhitungan) merupakan satu
ketrampilan khusus yang tidak mempunyai tempat dalam
taksonomi Bloom. Padahal aspek ini perlu dinilai pula
2) Syntehsis an evaluation (sintesis dan evaluasi) hanya sedikit
mempunyai peranan di dalam kurikulum matematika.
b. Guilford telah menciptkan pola yang menggambarkan struktur intelek
dalam bentuk kubus.
Operation/proscess
(bidang mendatar)
Product
(bidang belakang)
Penyusunan;
Uji coba;
Analisa;
Revisi;
Edit.
Selanjutnya baik tes standar dan tes buatan guru dianjurkan dipakai
jika hasilnya akan digunakan untuk:
a. Mengadakan diagnosis terhadap ketidakmampuan siswa.
b. Menentukan tempat siswa dalam suatu kelas atau kelompok.
c. Memberikan bimbingan kepada siswa dalam pendidikan dan pemilihan
jurusan.
d. Memilih siswa untuk program-program khusus.
1. Fungsi Tes
Setiap kai akan memberikan tes, kebanyakan guru selalu bertanya kepada
dirinya sendiri
“Pertanyaan apakah yang akan saya berikan?”
“Jawaban apakah yang saya perlukan dan jawaban manakah tidak saya
perlukan?”
“berapa butir soal akan sa buat?”
“Bagaimanakah bentuk kunci jawabanya?”
b. komprehensip
sebuah tes bebaliknya menckup suatu kebetulan, artinya meliputi
berbagai aspek yang dapat menggambarkan keaad siswa secara
keseluruhan (kecerdasan, sikap, pribadi perasaan sosial dan sebagainya)
hal ini dapat dicapai apabila tes itu merupkan rangkaian tes, misalnya
dari kelas 1 samapi dengan kelas 6.
c. Kontinuitas
Berhubungan dengan prinsip komprehensif maka prinsip kontinuitas
mempunyai persamaan tujuan. Sebaiknya tes disusun sedemikian rupa
sehingga menggambarkan kelanjutan dari awal anak memasuki satu
sekalh sampai dengan kelas terakhir. Dengan demikian akan diketahi
anak tiu tdak dengan terputus.
1. Bentuk-bentuk tes
a) Tes subyektif.
Secara umum soal subyektif adalah pertanyaan yang menuntut peserta
didik menjawab dalam bentuk menguraikan, menjelaskan, mendiskusikan,
membandingkan, memberikan alasan, dan bentuk lain yang sejenis sesuai
dengan tuntutan pertanyaan dengan menggunakan kata-kata dan bahasa
sendiri. Jumlah soal-soal bentuk subyektif biasanya tidak banyak, hanya
sekitar 5-10 buah soal dalam waktu kurang lebih 90-120 menit. Soal-soal
bentuk ini menuntut kemampuan peserta didik untuk dapat mengorganisir,
menginterpretasi, dan menghubungkan pengertian-pengertian yang telah
dimiliki.
1) Kebaikan-kebaikannya
a. Mudah diapkan dan disusun
b. Tidak memberi banyak kesempatan untuk spekulasi atau untung-
untungan
c. Mendorong siswa untuk berani mengemukakan pendapat serta
menyusun dalam bentuk kalimat
d. Memberi kesempartan kepada siswa untuk meengutrakan
maskusnya dengan gaya bahasa dan caranya sendiri
e. Dapat diketahui sejauh mana siswa mendalami sesuat masalah
yang diteskan.
1) Keburukan-keburukannya
a. Kadar validitas dan relibitias rendah karena sukr diketahui segi-
segi mana dari pengetahuan siswa yang betul-betul telah dikuassai
b. Kurang repersentatif dalam hal mewakili seluruh scope bahan
pelajaran yang akan dites karena soalnya hanya beberapa saja
(terbatas)
c. Cara memeriksanya banyak dipengaruhi oelh unsur-unsur
subjektif
d. Pemeriksaanya lebih sulit sebab membutuhakn pertimbangan
individual lebih banyak dari penilai
e. Waktu untuk koreksinya llama dan tidak dapat diwakilkan kepada
orang lain.
2) Petunjuk penyusunan
a. Hendaknya soal-soal tes dapat meliputi ide-ide pokok dari bahan
yang diteskan dan kalu mungkin disusun soal yang sifatnya
komprehensif.
b. Hendaknya soal tidka megambil kalimat-kalimat yangdisalin
langsung dari buku atau catatan.
c. Pada waktu menyusun soal-soal itu sudah dilengkapi dengan
kunci jawaban serta pedoman penilaiannya.
d. Hendaknya diusahakan agar pertanyaanya bervariasi antara
jelaskan mengapa bagaimana seberapa jauh agar diketahui lebih
jau penguasaan siswa tehadap bahan.
e. Hendakjnya rumusan soal dibuat sedemikan rupa sehingga mudah
dipahami oleh tercoba.
f. Hendaknya ditegakn model jawaban apa yang dikehendaki oleh
penyusun tes, untuk ini pertanyaan tidak boleh terlalu umu tetapi
harus spesifik
b) Tes objektif.
Tes objektif adalah tes yang dalam pemeriksaannya dapat
dilakukan secara objektif (Arikunto, 1995 : 165). Karena sifatnya
yang objektif maka penskorannya dapat dilakukan dengan bantuan
mesin. Soal ini tidak memberi peluang untuk memberikan penilaian
yang bergradasi karena dia hanya mengenal benar dan salah. Apabila
respons siswa sesuai dengan jawaban yang dikehendaki maka
respons tersebut benar dan biasa diberi skor 1. Apabila kondisi yang
terjadi sebaliknya, maka respons siswa salah dan biasa diberi skor 0.
Jawaban siswa bersifat mengarah kepada satu jawaban yang benar
(convergence).
Merujuk kepada berbagai pendapat tentang tes objektif dapat
diambil kesimpulan bahwa tes objektif adalah tes yang semua
informasi yang diperlukan peserta tes untuk memberikan respon
telah disediakan oleh penyusun tes, sehingga peserta tes tinggal
memilihnya. Jawaban yang berupa pilihan bersifat deterministik,
sehingga hanya ada dua kemungkinan kebenaran jawaban – benar
atau salah
1) Kebaikan kebaikannya
a) Mengandung lebih banyak segi-segi yang positif mislnya
lebih representative meweakili isi dan luas bahan, lebih
objektif dpat dihindari campur tangannya unsur subjektif
baidari segi siswa maupun guru yang memriksa.
b) Lebih mudah dan cepat cara memriksanya karena
menggunkan kunci tes bahkan alat-alat hasil kemajuan
teknologi
c) Pemeriksaanya dapat disehkan ke oranglain
d) Dalam pemerisaan tidak ada unsur subjetif yang
memengaruhi
2) Kelemahan-kelemahanya
a) Persipan untuk menyusun jeuh lebih sulit dari pada tes esai
karena soelnya banyak dan harus teliti untuk menghindari
kelemahan-kelemahan yang lain.
b) Soalya cenderung untuk menggunkapkan ingatan dan daya
pengenalan kembali saja, dan sukar untuk mengukur proses
mental yang tinggi
c) Banyak kesempatan untuk main untung-untungan
3) Cara mengatasi kelemahan
Bab 12 TABEL SPESIFIKASI
1. Fungsi Tabel Spesifikasi
Fungsi dari tabel spesifikasi ialah untuk menjaga agar tes yang kita
susun tidak menyimpang dari bahan (materi) serta aspek kejiwaan (tingkah
laku) yang akan dicakup dalam tes.
Contoh table spesifikasi:
2. Langkah-Langkah Pembuatan
a. Untuk materi yang seragam
Yang dimaksud “seragam” disini adalah bahwa antara
pokok materi yang satu dengan pokok materi yang lain mempunyai
kesamaan dalam imbangan aspek tingkah laku. Misalnya 50%
untuk ingatan, 30% untuk pemahaman, dan 20% untuk aplikasi.
Selanjutnya banyaknya butir soal untuk setiap sel (kotak kecil)
diperoleh dengan cara menghitung persentase dari banyaknya soal
bagi tiap pokok materi yang sudah tertulis di kolom paling
kanan.Contoh:
Tabel Spesifikasi Penyusunan Tes Tarikh Kelas XI
Jumlah 50
Jumlah (100%) 50
Staines Interpretasi
d. Fungsi administratif:
Memberikan beasiswa
b. Usaha (effort)
b. Nilai akhir diperoleh dari nilai tugas, nilai ulangan harian, dan
nilai ulangan umum dengan bobot 2,3,dan 5.
1. Pentingnya laporan
Pentingnya Laporan
Hamper semua guru tidak menyenangi tugas memriksa pekerjaan
(koreksi) dan membuat catatan tentang hasil atau prestasi siswa pekerjaan
itu membutuhkan ketekunan dan ketelitian yang luar biasa dan menuntut
banyak energi. Jika disuruh memilih kebanyakan guru akan lebih
menyenangi mengajar disbanding dengan memeriksa dan mencataat hasil
ulangan.
Akan tetai dengan kesaran akan pentingnya kegiatan-kegian
tersebut akhirnya guru pun akan melakukan dengan senang hati apalagi bila
telah dijumpai dalam mengajar guru lalu ingin tahu apa sebabnya kesulitan
itu terjadi. Dan hanya dapat ditemukan jika guru sudah memeriksa hasil
ulangan,
Pada waktu mengajar tentu guru sudah berkali-kali membri
kesempatan kepada siswa untuk menanyakan hal yang belum diketahui.
Akan tetapi pada umumnya mereka itu diam, siswa-siwa tersebut sudah
tahu. Walupun sebenarnya guru itu terkecoh. Problemnya baru terbuka
setelah guru memeriksa hasil ulangan. Dari hasil terseut guru mengetahui
bagian-bagian mana dari tujuan pelajaran yang diberikan di kelas belum
tercapai.
Secara sistematis dapat dikemukakan disini bahwa laporan tentang
siswa bermanfaat bagi beberapa pihak yaitu sebagai berikut:
a) Siswa sendiri,
1. secara alamiah setiap orang selalu ingin tahu akibat dari apa yang
telah mereka lakukan,
2. dengan mengetahui hasil yang positif dari perbuatannya, maka
pengetahuan yang diperoleh akan dikuatkan dan
3. jika siswa mendapat informasi bahwa jawwabannya salah, maka
lain kali ia tidak akan menjawab seperti itu lagi.
Jadi dengan singkat dapat dikatan bahwa dengan jawaban yang
diberikan oleh siswa, akibatnya aka nada:
1. konfirmasi- penguatan
2. refisi-penyempurnaan
Semua uraian yang telah disajikan pada bab-bab seblum ini berkenaan dengan
evaluasi hasil belajar. Buku ini berjudul “Dasar-dasar Evaluasi Pendidikan”
sebetulnya secara garis besar terdapat dua kegiatan evaluasi yaitu evaluasi
terhadap hasil belajar siswa dan juga proses pengajarannya. Jadi, apabila
pembicaan dalam buku ini hanya mengenai evaluasi hasil belajar saja, tampak
kurang komprehensif. Bab ini akan menjelaskan evaluasi yang kedua yaitu
evaluasi program.
1. Apakah Evaluasi Program Itu?
Evaluasi merupakan suatu kegiatan yang bertujuan untuk menentukan
apakah target progam yang disusun sudah tercapai dengan begitu maka akan
diketahui bagaimana kualitas mengajar seorang guru apakah sudah efektif
atau belum berdasarkan tingkat pencapaian yang sudah dicapai.
a. Program adalah rencana
b. Program adalah kegiatan yang direncakan dengan seksama. Dalam
pembicaran ini yang dimaksudkan adalah pengertian
Dari sedikit uraian tersebut dapat ditangkap bahwa sesuatu kegian
yang peru direncanakan apabila kegiatan yang bersangkutan memang
dipandang penting sehingga apabila tidak direncanakan secara masak-masak
boleh jadi akan menjumpai kesulitan atau hambatan. Seperti sebuah keluarga
yang akan mengadakan peralatan pernikahan. Tentu tidak lancer. Sesudah
selesai pelaksanaan biasnya juga mengadakan evaluasi. Mungkin evaluasi
tersebut tidak melalui prosedur yang sistematis dan mungkin juga tidak
seketika barangkali pada waktu penyelenggaraan peralatan pernikahan lagi
baru mengingat-ingat dahulu pada waktu pelaksanaan dulu kurangnya apa.
c. Guru.
guru merupakan komponen penting dalam kegiatan belajar-mengajar kepad
guru diserahkan untuk digarap suatu masukan bahan mentah berupa siswa
yang mengingnkan pengetahuan keterampilan dan sikap sikap yang baik yang
akan digunakan oleh mereka untuk menghadapi masa depan dalam
kehidupannya
guru adalah orang yang diberi kepercayaan untuk menciptakan
suasana kelas seperti telah diceritakan diatas. Behasil? Belum tentu mengapa?
Karena guru adalah manusia apakah usaha guru selalu mempunyai kelemahan
bersumber dari fisik dan mental. Hal-hal yang berhubungan denganfisik juga
siswa, antara lain kesehatan, kekebalan dan kerentatan. Hal-hal yang
berhubungan dengan mental antra lain kepandaian, kesabaran tangung jawab
keramah tamahan dan sebagainya.
Apakah dapat dilakukan oleh pengelola dalam memberikan pelayanan
administrative kepada guru? Banyak jika dapat diketahui kebiasan guru dalam
bekerja misalnya dalam mengajar suka OHP, mengajak mengamati barang-
barang yang ada di luar kelas (sekolah), atau suka bekerja tanpa gangguna di
ruang kelas dan lain sebagainya. Maka pengelola berusaha melengkapi sarana
pendudkunya, pemenuhan terhadap kebutuhan psikologis guru berupa antra
lain menyediakantempat bekerja yang nyaman sehingga mereka dapat bekerja
dengan tenang. Akibat selanjutnya mengena pada prestasi belajar siswa yang
optimal
d. Metode atau pendekatan dalam mengajar.
Berbeda denga evaluasi terhadap kurikulum, evaluasi terhadap metode
mengajar merupakan kegiatan guru untuk meninjau kembali tentang metode
mengajar, pendekatan atau strategi pembelajaran yang digunakan oleh guru di
dalam menyampaikan materi kurikulum kepada siswa. Dari perkuliahan lain
kita tahu bahwa yang dimaksud dengan metode mengajar adalah cara-cara
atau teknik yang digunakan dalam mengajar, misalnya ceramah, Tanya jawab
diskusi sosiodrama, demonstrasi eksperimen dan sebagainya. Strategii
pembelajaran menunjuk kepada bagaimana guru mengatur keseluruhan proses
belajar mengajar, meliputi, mengatur waktu, pemenggalan penyajian,
pemilihan metode, pemilihan pendekatan, dan sebagainya. Dengan pengertian
ini maka di dalam memikirkan strategi, sekaligus guru memikirkan metode
dan pendekatan juga.
Di dalam melaksanakan pengajaran, tidak mustahil bahwa guru
menjumpai kesulitan di tengah-tengah waktu mengajar, disebabkan karena
ketidak tepatan dalam memilih metode atau pendekatan yang dimaksud
dengan metode mengajar adalah cara-cara untuk menyampaikan materi
kepada siswa. Sebagai contoh metode adalah ceramah, diskusi Tanya jawab
dan penugasan. Pendekatan lebih banyak menunjuk pada strategi guru untuk
mengatur jalanna proses pembelajaran, misalnya pendekatan individual,
kelompok kecil atau klasikal. Termasuk dalam pemikiran pendekatan adalah
penggaalnan waktu di dalam penyampaian materi pelajaran.
Telah disebutkan bahwa di dalam melaksanakan kegiatan belajar
mengajar ungkin saja guru menjumpai kesulitan, sehubungan dengan keadaan
siswa. Dalam rencana, guru memilih metode tugas karena dipandang paling
tepat. Siswa diatur agar bekerja dalam kelompok. Namun di tengah-tengah
kesibukan, terasa oleh guru bahwa pemilihan metode dan pendekatan tersebut
ternyata kurang tepat. Apa sebab guru tidak disadari sebetulnya guru sudah
melakukan evaluasi tehadap kegiatnya. Evaluasi program dapat dilakukan
selam dansesuddah program berlangsung. Agar dapat melakukan selama dan
sesudah program berlangsung. Agar pekerjaan guru dari tahun ke tahun
bertambah baik, maka mereka harus dapat memanfaatkan dat yang mereka
peroleh. Disarankan kepada para guru agar tidak henti-hentinya membuat
catatan-catatan kecil pada GBPP tentang metode apa. Pendekatan danstrategi
yang bagaiman yang cocok untuk digunakan dalam penyampaian pokok
bahasan yang bersangkutan.