PENYUSUN :
1. Aidah
2. Alia Rosna Arlaeli
3. Dewi Purnama Sari
4. Dewi Maharani
5. Lilis Lisnawati
6. Santi Susanti
Tahun 2015
BAB I PENDAHULUAN
Memang tidak semua orang menyadari bahwa setiap saat kita selalu
melakukan pekerjaan evaluasi. Dalam beberapa kegiatan sehari-hari, kita
jelas-jelas mengadakan pengukuran dan penilaian.
Dari dua kalimat diatas kita sudah menemui tiga buah istilah, yaitu
evaluasi, pengukuran, dan penilaian. Sementara orang memang lebih
cenderung mengartikan ketiga kata tersebut sebagai suatu pengertian yang
sama sehingga dalam penggunaannya hanya tergantung dari kata mana
yang siap untuk diucapkan dan sementara orang yang lainnya
membedakan ketiga istilah tersebut. Dan untuk memahami apa persamaan,
perbedaan ataupun hubungan antara ketiganya, dapat dipahami melalui
contoh-contoh di bawah ini :
a. Apabila ada orang yang akan memberi sebatang pensil kepada kita
dan kita disuruh memilih antara dua pensil yang tidak sama
panjangnya maka tentu saja kita akan memilih yang “panjang” kita
tidak akan memilih yang “pendek” kecuali ada alasan yang sangat
khusus.
b. Pasar merupakan suatu tempat bertemunya orang-orang yang akan
menjual dan membeli. Sebelum menentukan barang yang akan
dibeli. Seorang pembeli akan memilih dahulu mana barang yang
lebih “baik” menurut ukurannya. Apabila ia ingin membeli jeruk,
dipilihnya jeruk yang besar, kuning dan kulitnya halus. Semuanya
itu dipertimbangkan karena menurut pengalaman sebelumnya, jenis
jeruk-jeruk yang demikian ini rasanya akan manis, sedangkan jeruk
yang masih kecil, hijau dan kulitnya agak kasar, biasanya masam
rasanya.
Dari contoh-contoh diatas ini dapat kita simpulkan bahwa sebelum
menentukan pilihan, kita melakukan penilaian terhadap benda-benda yang
akan kita pilih. Pada contoh pertama kita memilih nama pensil yang lebih
panjang, sedangkan contoh kedua kita menentukan dengan pikiran kita
atas jeruk yang baik, yaitu rasanya yang manis.
Untuk dapat mengadakan penilaian, kita melakukan pengukuran
terlebih dahulu. Jika ada penggaris, maka sebelum menentukan mana
pensil yang lebih panjang, kita ukur dahulu kedua pensil tersebut, dan
setelah mengetahui berapa panjang masing-masing pensil itu, kita
melakukan penilaian dengan melihat bandingan panjang antara kedua
pensil tersebut. Dapatkah kita menyatakan “ini pensil panjang, dan ini
pensil “pendek”. Maka pensil yang panjang itulah yang kita ambil.
Untuk menentukan penilaian mana jeruk yang manis, kita tiidak
menggunakan “ukuran manis”, tetapi menggunakan ukuran besar, kuning
dan halus kulitnya. Ukuran ini tidak mempunya wujud seperti kayu
penggaris yang sudah ditera, tetapi diperoleh berdasarkan pengalaman.
Sebenarnya kita juga mengukur, yakni membandingkan jeruk-jeruk
yang ada dengan ukuran tertentu. Setelah itu kita menilai dan menentukan
pilihan, mana jeruk yang paling memenuhi ukuran itulah yang kita ambil.
Dengan demikian kita mengenal dua macam ukuran, yakni ukuran
yang terstandar (meter, kilogram, takaran dan sebagainya) dan ukuran
tidak standar (depa, jengkal, langkah dan sebaginya), dan ukuran perkiraan
berdasarkan hasil pengalaman (jeruk manis adalah yang kuning, besar dan
halus kulitnya)
Dua langkah kegiatan yang dilalui sebelum mengambil barang
untuk kita ituah yang disebut mengadakan evaluasi, yakni mengukur dan
menilai. Kita dapa mengadakan penilaian sebelum kita mengadakan
pengukuran.
Mengukur adalah membandingkan sesuatu dengan satu ukuran.
Pengukuran bersifat kuantitatif
Menilai adalah mengambil suatu keputusun terhadap suatu dengan
ukuran baik buruk. Penilaian bersifat kualitatif.
Mengadakan evaluasi meliputi kedua langkah diatas, yakni
mengukur dan menilai.
Di dalam istilah asingnya, pengukuran adalah measurement,
sedangkan penilaian adalah evaluation. Dari kata evaluation inilah
diperoleh kata indonesia evaluasi yang berarti menilai (tetapi dilakukan
dengan mengukur terlebih dahulu). Dibuku ini ketiga istilah tersebut
digunakan bergantian tanpa mengubah makna.
2. Penilaian Pendidikan
Meskipun kini memiliki makna yang lebih luas, namun pada awalnya
pengertian evaluasi pendidikan selalu dikaitkan dengan prestasi belajar
siswa. Definisi yang pertama dikembangkan oleh Ralph Tyler (1950).
Ahli ini mengatakan bahwa evaluasi merupakan sebuah proses
pengumpulan data untuk menentukan sejauh mana, dalam hal apa, dan
bagian mana tujuan pendidikan sudah tercapai, jika belum, bagaimana
yang belum dan apa sebabnya. Definisi yang lebih luas dikemukakan oleh
dua orang ahli lain yakni Cronbach dan Stufflebeam. Tambahan definisi
tersebut adalah bahwa proses evaluasi bukan sekedar mengukur sejauh
mana tujuan tercapai, tetapi digunakan untuk membuat keputusan.
Input
Input adalah bahan mentah yang dimasukan ke dalam transformasi.
Dalam dunia sekolah maka yang dimaksud dengan bahan mentah
adalah calon siswa yang baru akan memasuki sekolah. Sebelum
memasuki suati tingkat sekolah (institusi), calon siswa itu dinilai
dahulu kemampuannya. Dengan penilaian itu ingin diketahui
apakah kelak ia akan mampu mengikuti pelajaran dan
melaksanakan tugas-tugas yang akan diberikan kepadanya.
Output
Yang dimaksud sebagai output atau keluaran adalah bahan jadi
yang dihasilkan oleh transformasi. Yang dimaksud dalam
pembicaraan ini adalah siswa lulusan sekolah yang bersangkutan.
Untuk dapat menentukan apakah seoarang siswa berhak lulus atau
tidak, perlu diadakan kegiatan penilaian, sebagai alat penyaring
kualitas.
Umpan Balik
Transformasi
Transformasi dapat diibaratkan sebagai sebuah mesin yang
berproses mengubah bahan mentah menjadi susuatu agar berada
dalam keadaan matang. Menurut kamus inggir-indonesia, kata
transform terdiri dari dua kata, trans (terjemahan-perubahan) dan
form (bentuk). Jadi trasformasi dalam pembelajaran diartikan
sebagai proses pergantian atau perubahan bentuk atau pengolahan
sesuatu agar berubah menjadi bentuk lain. Transformasi yang
sedang kita bicarakan ini adalah transformasi dalam arti umum
sebagaimana yang dipahami oleh umum yaitu pergantian bentuk
antara sebelum dan sesudah mengikuti kegiatan di sebuah lembaga
pendidikan. Siswa yang sedang belajar diumpamakan sesuatu yang
dimasukan ke dalam pemrosesan untuk diubah dari “belum tahu
atau belum dapat” agar menjadi”sudah tahu atau sudah dapat”.
Ketika siswa pertama masuk sekolah, keadaanya masih
“mentah” yang diubah atau diproses agar menjadi matang. Dalam
istilah transformasi bahan mentah yang akan diolah tersebut
dikenal sebagai “masukan” yang dalam bahasa inggrisnya disubut
input. Oleh karena keadaanya masih mentah, disebut “masukan
mentah” bahasa inggrisnya raw input. Sesudah diolah dan berubah
bentuk menjadi matang, lalu dikeluarkan dari alat transformasi,
disebut keluaran dalam bahasa inggris adalah output. Dalam
keseluruhan transformasi sebetulnya output saja belum
mencerminkan keluaran yang sesungguhnya. Ibarat dalam
kelulusan, nilai siswa baik semua, bahkan mungkin cumlaude
(lulus dengan pujian), tetapi masih diragukan, apakah nilai yang
bagus tersebut sudah mencerminkan kinerja yang bagus di
masyarakat atau tidak. Untuk contoh, nilai siswa lulusan sekolah
menengah kejuruan teknik otomotif semua 8 bahkan 9, tetapi
ketika diserahi sepeda motor rusak, tidak dapat menemukan apa
penyebabnya. Siswa ini outputnya baik, tetapi tidak dapat
menunjukan kemampuannya dalam praktek. Kemampuan
melaksanakan tugas di lapangan ini disebut keluaran nyata atau
outcome. Jadi harapan lembaga pendidikan, siswa bukan hanya
mempunyai output baik, tatapi outcomenya harus baik.
Proses
3. Mengapa Menilai
Jika seblum membeli jeruk kita tidak memilih dahulu mana jeruk yang
baik dibandingkan dengan yang kurang baik, maka akan memperoleh
jeruk seadanya.
Mungkin baik, tetapi juga kemungkinan tidak baik. Yang jelas kita
belum tentu memperoleh jeruk yang berkualitas baik jika tidak didahului
dengan kegiatan menilai.
1. Subjek Evaluasi
Yang dimaksud dengan subjek evaluasi adalah orang yang melakukan
pekerjaan evaluasi. Siapa yang dapat disebut sebagai subjek evaluasi untuk
setiap tes, ditentukan oleh suatu antara pembagian tugas atau ketentuan yang
berlaku.
Contoh:
a. Untuk melaksanakan evaluasi tentang prestasi belajar atau pencapaian
maka sebagai subjek evaluasi adalah guru.
b. Untuk melaksanakan evaluasi sikap yang menggunakan sebuah skala maka
sebagai subjeknya dapat meminta petugas yang ditunjuk, dengan didahului
oleh suatu latiahan melaksanakan evaluasi tersebut.
c. Untuk melaksanakan evaluasi serhadap kepribadian dimana menggunakan
sebuah alat ukur yang sudah distandarisasikan maka subjeknya adalah ahli-
ahli psikologi. Disamping alatnya yang harus bersifat rahasia, maka subjek
evaluasi haruslah seorang yang betul-betul ahli karena jawaban dan tingkah
laku orang yang dites harus diiterprestasikan dengan cara tertentu.
Tidak setiap orang dapat menafsirkan jawaban tes kepribadian ini,
sehingga hanya orang yang telah mempelajari tes secara mendalam yang dapat
melakukannya. Demikian juga dengan tes intelegensi, subjek pelakunya harus
seorang ahli.
Dalam keterangan ini, penulis mengkategorikan pelaksanaan evaluasi
sebagai subjek evaluasi, ada pandangan lain yang disebut subjek evaluasi
adalah siswa, yakni orang dievaluasi. Dalam hal ini yang dipandang sebagai
objek misalnya : prestasi matematika, kemampuan membaca, kecepatan lari,
dan sebagainya. Pandangan lain lagi mengklasifikasikan siswa sebagai objek
evaluasi dan guru sebagai subjeknya.
2. Objek Evaluasi
Yang dimaksud dengan objek atau sasaran evaluasi adalah hal-hal yang
menjadi pusat perhatian untuk dievaluasi. Apapun yang ditentukan oleh
evaluator atau penilai untuk dievaluasi, itulah yang disebut dengan objek
evaluasi. Pada waktu evaluator ingin menilai berat badan siswa, naja yang
menjadi objek evaluasi adalah berat badan siswa, sedang angka yang
menunnjukan beberapa berat badan siswa dimaksud, misalnya 34 kilogram, 40
kilogram dan sebagainya adalah hasil evaluasi. Jika evaluastor ingin menilai
keterampilan siswa dalam menggunakan termometer, maka yang menjadi
objek evaluasi adalah benar tidaknya gerakan tangan siswa ketika memegang
alat, kemampuan siswa untuk menentukan berapa lama termometer diletakan
di bagian badann, kemudian juga kemampuan siswa dalam membaca skala
yang ada pada termometer. Gambaran tentang benar salanya menggunakan
termometer adalah hasil evaluasi.
Dengan masih menggunakan diagram tentang transformasi yang ada di bab 1,
maka yang menjadi objek evaluasi adalah semua unsur atau komponen yang
ada dalam transformasi tersebut. Agar diperoleh gambaran yang menyeluruh
tentang mutu dan kebenaran kinerja transformasi, maka yang dijadikan objek
evaluasi adalah semua aspek yang terkait dengan kinerja transformasi, yaitu
(1) masukan mentah, (2) masukan instrumental, (3) masukan lingkungan (4)
proses transformasi itu sendiri dan (5) keluaran, yaitu hasil dari transformasi.
Masukan mentah sebagai objek evaluasi
Dalam transformasi pembelajaran, siswa berstatus sebagai objek didik. Ahli-
ahli pendidikan angkatan lama berpendapat bahwa siswa adalah objek
pendidikan, kini pendapat seperti itu ditentang oleh ahli-ahli pembaharuan.
Dalam kegiatan pendidikan siswa adalah subjek yang aktif, bukan sekedar
objek pasif yang dapat diperlakukan dan diarahkan menurut kehendak. Dalam
berbicara tentang objek evaluasi ini mungkin ada pembaca yang terkacaukan
pengertiannya. Siswa yang dalam proses pembelajaran berstatus sebagai
subjek, dalam evaluasi dia merupakan objek evalausi, karena dicermati untuk
diketahui kinerjanya ketika mengikuti pembelajaran. Sekali lagi jangan keliru.
Dalam proses pendidikan, siswa berstatus sebagai subjek didik-siswa
aktif belajar
Dalam evaluasi, kinerja berstatus sebagai objek evaluasi-kinerja
siswa dicermati dan diperhatikan oleh evaluator.
Aspek-aspek yang menjadi objek evaluasi berkenaan dengan siswa sebagai
masukan mentah, masukan instrumental, dan masukan lingkungan dapat
dikembangkan dari apa yang sudah disampaiakn di bab1, apabila evaluatpr
merasa kurang tepat atau masing menginginkan hal-hal yang dievaluasi,
silahkan mendaftar lagi hal-hal lain menurut kebutuhan, beberapa hal yang
perlu dibicarakan dalam objek evaluasi adalah :a) Penilaian dalam KBK (b)
penilaian tiga ranah psikologis.
3. Sasaran Evaluasi
Apabila kita kembali kepada diagram di bab 1, kita akan ingat kembali apa
yang menjadi sasaran dari penilaian. Objek atau sasaran penilaian adalah
segala sesuatu yang menjadi titik pusat pengamatan karena penilaian
menginginkan informasi tentang sesuatu tersebut.
Dengan masih menggunakan diagram tentang transformasi maka sasaran
penilaian untuk unsur-unsurnya meliputi, input, transformasi dan output
a. Input
Calon siswa sebagai pribadi yang utuh dapat ditinjau dari beberapa segi
menghasilkan bermacam-macam bentuk tes yang digunakan sebagai alat
untuk mengugkur. Aspek yang bersifat rohani setidaknya mencakup
4(empat) hal.
1) Kemampuan
Untuk dapat mengikuti program dalam suatu lembaga/sekolah institusi
maka calon siswa harus memiliki kemampuan yang sepadan. Alat ukur
yang digunakan untuk mengukur kemampuan ini disebut tes
kemampuan atau attitude test.
2) Kepribadian
Kepribadian adalah suatu yang terdapat pada diri manusia dan
menampakan bentuknya dalam tingkah laku. Dalam hal-hal tertentu.
Informasi tentang kepribadian sangat diperlukan. Alat untuk
mengetahui kepribadian seseorang disebut tes kepribadian atau
personality test.
3) Sikap-sikap
Sebenarnya sikap ini merupakan bagian dari tingkah laku manusia
sebagai gejala atau gambaran kepribadian yang memancar keluar.
Namun, karena sikap ini merupakan suatu yang paling menonjol dan
sangan dibutuhkan dalam pergaulan maka banyak orang yang
menginginkan informasi khusus tentangnya. Alat untuk mengetahui
keadaan sikap seseorang dinamakan tes sikap atau attitude tes. Oleh
karen tes ini berupa skala. Maka disebut sikap attitude scale.
4) Intelegensi
Untuk mengetahui tingkat intelegensi ini diguanakan tes intelegensi
yang sudah banyak diciptakan oleh para ahli. Dalam hal ini yang
terkenal adalah tes buatan binet dan simo yang dikenal dengan tes
Binet-Simon. Selain itu adalagi tes-tes lain misalnya SPM, Tintum, dan
sebagainya. Dari hasil tes akan diketahui IQ orang tersebut. IQ
bukanlan intelegensi. IQ berbeda dengan intelegensi karena IQ
hanyalah angka yang memberikan petunjuk tinggi rendahnya
intelegensi seseorang. Dengan pengertian ini maka kurang benarlah
jika ada orang mengatakan “IQ jongkok” karena IQ adalah berupa
angka. Mestinya IQ rendah diartikan bahwa angkanya rendah.
Berkenaan dengan hubungan antara sikap dan kepribadian,
A.N. Oppenheim dalam bukunya Questionnnaire Design and Attitude
Measurement mengahukan gambar seperti tertera pada halaman
selanjutnya. Dari gambar ini jelas bahwa kepribadian merupakan
sesuatu yang ada dalam diri manusia dan sangat dalam letaknya
sehingga sangat susah dilihat.
b. Transformasi
telah dijelaskan bahwa banyak unsur yang terdapat dalam transformasi
yang semuanya dapat menjadi sasaran atau objek penilaian demi
diperolehnya hasil pendidikan yang diharapkan. Unsur-unsur dalam
transformasi yang menjadi objek penilaian antara lain :
a) Kurikulum/materi
b) Metode dan cara penilaian
c) Sarana pendidikan
d) Sistem administrasi
e) Guru dan personal lainnya.
c. Output
Penilaian terhadap lulusan suatu sekolah dilakukan untuk mengetahui
seberapa jauh tingkap pencapaian/prestasi belajar mereka selama
mengikuti program. Alat yang digunakan untuk mengukur pencapai ini
disebut tes pencapaian atau achievement test.
Kecenderungan yang ada sampai saat ini di sekolah adalah bahwa
guru hanya menilai prestasi belajar aspek kognitif atau kecerdasan saja.
Alatnya adalah tes tertulis. Aspek psikomotorik, apalagi efektif, sangat
langka dijamah oleh guru. Akibatnya, dapat kita saksikan, yakni para
lulusannya hanya menguasai teori tetapi tidak terampil melakukan
pekerjaan keterampialan. Juga tidak mampu mengaplikasikan pengetahuan
yang sudah mereka kuasai. Lemahnya pembelajaran dan evaluasi terhadap
aspek afektif ini, jika kita mau instrospeksi, telah berakitab merosotnya
ahklak para lulusan. Yang selanjutnya berdampak luas pada merosotnya
akhlah bangsa.
Evaluasi Bab 2
1. Prinsip Evaluasi
Ada satu prinsip umum dan penting dalam kegiatan evaluasi, yaitu adanaya
triangulasi atau hubungan erat tiga komponen, yaitu:
a. Tujuan pembelajaran
b. Kegiatan pembelajaran atau KBM, dan
c. Evaluasi.
Triangulasi tersebut dapat digambarkan dalam bagan sebagai berikut:
Tujuan
KBM Evaluasi
4 5 6 7 8
Biasanya angka-angka yang digunakan direapkan pada skala dengan
jarak yang sama. Meletakannya secara bertingkat dari yang rendah
ke yang tinggi. Dengan demikian, skala ini dinamakan skala
bertingkat. Kita dapat menilai hampir segala sesuatu dengan skala.
Dengan maksud agar pencatatannya dapat objektif, maka penilaian
terhadap penampilan atau penggambaran kepribadian seseorang
disajikan dalam bentuk skala.
Contoh:
1 2 3 4 8
Sangat Tidak Biasa Suka Sangat
tidak suka suka suka
Perguruan Tinggi
Input Output
Tes diagnostik ke1 dilakukan terhadap calon siswa sebagai input,
untuk mengetahui apakah calon siswa sudah menguasai
pengetahuan yang merupakan dasar untuk menerima pengetahuan di
sekolah. Dalam pembicaraan tes secara umum, tes ini disebut tes
penjajakan masuk yang dalam istilah inggris disebut entering
behaviur test. Dalam penggalan kecil, tes diagnostik ke-1 dilakukan
untuk mengukur tingkat penguasaan pengetahuan dasar untuk dapat
menerima pengetahuan lanjutannya. Pengetahuan dasar ini biasa
disebut dengan pengetahuan bahan prasyarat (preruqisite) oleh
karena itu tes ini disebut juga tes prasayarat atau prereuisite test.
Test diagnostik ke-2 dilakukan terhadap calon siswa yang akan
mulai mengikuti program. Apabila cukup banyak calon siswa yang
diterima sehingga diperlukan lebih dari satu kelas, maka untuk
pembagian kelas diperlukan suatu pertimbangan khusus. Apakah
anak yang baik akan disatukan di satu kelas atau semua kelas akan
diisi dengan campuran anak baik, sedang atau semua kelas akan
diisi dengan campuran anak baik, sedan atau kurang. Ini semua
memerlukan informasi yang dapat diperoleh dengan cara
mengadakan tes diagnostik. Dengan demikian, tes diagnostik telah
berfungsi sebagai tes penempatan (placement Test).
Test diagnostik ke-3 dilakukan terhadap siswa yang sedang belajar
tidak semua siswa dapat menerima pelajaran yang diberikan oleh
guru dengan lancar. Sebagai guru yang bijaksana, sebaiknya
sesekali melakukan tes diagnostik. Untuk mengetahui bagian mana
dari materi pelajaran yang diberikan belum dikuasai oleh siswa
Test diagnostik ke-4 diadakan pada waktu siswa mengakhiri
pelajaran. Dengan tes ini guru akan dapat mengetahui tingkat
penguasaan siswa terhadap bahan yang ia berikan.
2) Tes formatif
Dari kata form yang merupakan dasar dari istilah formati, maka
evaluasi formatif dimaksudkan untuk mengetahui sejauh mana
siswa telah terbentuk setelah mengikuti program tertenu. Dalam hal
ini, tes formatif dapat juga dipandadang sebagai tes diagnostik pada
akhir pelajaran.
Evaluasi formatif atau tes formatif diberikan pada akhir setiap
program. Tes ini merupakan post-test atau tes akhir proses.
3) Tes sumatif
Evaluasi sumatf atau tes sumatif dilaksanakan setelah berakhirnya
pemberian sekelompok atau sebuah program yang lebih besar.
Dalam pengalaman di sekolah tes formatif dapat disamakan dengan
ulangan harian, dengakan tes sumatif ini dapat disamakan dengan
ulangan umum yang biasanya dialakanakan pada tiap hari smester,
secara diagramis maka hubungan antara tes formatif dengan tes
sumatif ini tergambar sebagai berikut:
F F F F F
Keterangan :
F = tes formatif
S = tes sumatif
Sub-
Sub
sub
pok S S S
pok
ok P P P = = = = = =
ok
baha B B B
baha
san
san
F F F F F F F F F F F
SS SS SS
Unit
Keterangan
SS = sub sumatif
SPB = sub pokok bahsan
PB = pokok bahsan
F = tes formatif
1. Pengertian
Istilah tes diambil dair kata testum, suatu pengertian dalam bahasa prancis
kuno yang berarti piring untuk menyisihkan logam-logam mulia. Ada pula
yang mengartikan sebagai sebuah piring yang dibuat dari tanah.
Seoarang ahli bernama James MC. Cattel, pada tahun 1890 telah
memperkenalkan pengertian tes ini kepada masyarakat melalui buku yang
berjudul Mental Test and Measurement. Selanjutnya, di Amerika Serikat tes
berkembang dengan cepat sehingga dalam tempo yang tidak begitu lama
masyarakat mulai menggunakannya.
Banyak ahi yang mulai mengembangkan tes ini untuk berbagai
bidang, namun yang terkenal adalah sebuah tes intelegensi yang disusunn
oleh seoarang prancis bernama Binet, yang kemudan dibantu tes BinetSimon
(1904). Dengan alat ini Binet dan Simon berusaha untuk membeda-bedakan
anak menurut tingkat intelegensinya. Dan pekerjaan Binet dan Simon inilah
kemudian kita kenal istilah-istilah umur kecerdasan (mental age), umur
kalender (chronological age) dan indeks kecerdasan, intelegensi kuesioner
atau inteligence quotient (IQ).
Sebagai perkembangannya, Yarkes di Amerika Serikat menyusun tes
kelompok (group test) yang digunakan untuk menyeleksi calon militer
sebanyak-banyaknya dalam waktu yang singkat. Diperlukan pada waktu
perang dunia 1, tes ini dikenal denga nama Army Alpha dan Army Betha.
Didorong oleh munculnya statistik dalam penganalisaan data dan
informasi, maka akhirnya tes ini digunakan dalam berbagai bidang seperti tes
kemampuan dasar, tes kesalahan perhatian, tes ingatan, tes minat, tes sikap.
Dan sebagainya. Yang dikenal penggunanya di sekolah hanyalah tes prestasi
belajar.
Sebelum sampai kepada uraian lebih jauh. Maka akan diterakan
dahulu arti dari beberapa istilah-istilah yang berhubungan dengan tes ini.
- Tes
(sebelum adanya ejaan yang disempurnakan dalam bahasa indonesia
ditulis dengan test) adalah merupakan alat atau prosedur yang digunakan
untuk mengetahui atau mengukur suatu dalam suasana dengan cara dan
aturan-atuaran yang sudah ditentukan. Untuk mengerjakan tes ini
tergantung dari petunjuk yang diberikan. Misalnya, melingkari salah satu
huruf di depan pilihan jawaban, menerangkan, mencoret jawaban salahm
melakukan tugas atau suruhan, menajawab secara lisan dan sebagainya
- Testing
Testing merupakan saat pada waktu tes itu dilaksnakan. Dapat juga
dikatakan testing adalah saat pengambilan tes.
- Testee
(dalam istilah bahasa indonesia tercoba) adalah responden yang sedang
mengerjakan tes. Orang-orang inilah yang akan dinilai atau diukur, baik
mengenai kemampuan, minat, bakat, pencpaian, dan sebagainya.
- Tester
(dalam istilah indonesia:pencoba), adalah orang yang diserahi untuk
melaksnakan pengambilan tes terhadap para responden.
Dengan kata lain, tester adalah subjek evaluasi (tetapi adakalany hanya
orang yang ditunjuk oleh subjek evaluasi untuk melaksnakan tugasna)
tugas tester antara lain:
a. Mempersiapkan ruangan dan perlengkapan yang diperlukan
b. Membagikan lembaran tes dan alat-alat lain untuk mengerjakan
c. Menerangkan cara mengerjakan tes
d. Mengawasi responden mengerjakan tes
e. Memberikan tanda-tanda waktu
f. Mengumpulkan pekerjaan responden
g. Mengisi berita acara atau laporan yang diperlukan ( jika ada)
2. Persyaratan Tes
pada bagian permulaan buku ini telah disinggung bahwa mengukur
panjang sisi mena dengan menggunakan karet ember yang diulur-ulur
sama halnya dengan tidak mengukur. Hasil ukurannya tidak akan
dipercapa. Akan tetapi bila keadaanya memang terpaksam yaitu apabila
kita harus melakukan pengukuran padahal yang ada distu hanyalah sehelai
tali karet ember. Maka dapat menggunkan tali itu asal menggunakannya
mengikuti aturan tertenu, yakni tidak ditarik-tarik.
Apbaila situasi ini kita pindahkan kepada pelaksanaan evaluai tes. Maka
dapat disajikan dalam situasi berikut ini:
a. Seorang guru yang belum berpengalaman menyusun tes, mengadakan
tes bahasa indonsesia. Kepada siswa diberikan sebuah bacaan panjang
dan beberapa pertanyaan yang dimaksudkan untuk mengukur
kemampuan siswa menangkap isi bacaan tersebut, tetapi hanya
meliputi sebagian awal dari bacaan saja. Di samping itu, siswa diminta
untuk mengambil beberapa kata sukar dari bacaan itu dan
menerangkan artinya. Pada waktu tes berlangsung. Guru mengguinya
dengan teliti dan tidak memberi kesempatan kepada siswa untuk saling
bekerja sama. Ter berjalan tertib.
b. Seorang guru yang sudah berpengalaman. Menyusum sebuah tes
dengan baik. Kebetulan guru ini juga mengajar Bahasa Indonesia.
Seperti hal nya guru pertama, ia memberikan sebuah bacaan dan
diikuti dengan pertanyaan-pertanyaan tentang isi bacaan. Setelah itu
diikuti oleh deretan kata-kata sukar yang harus diterangkan oleh siswa.
Pada waktu pelaksanaan tes, guru ini mendadak sakit dak pengawasan
terhadap pelaksanaan tes diserahkan kepada kawannya
Dari gambaran dua buah situasi tes di atas dapat dengan cepat
diambil kesimpulan bahwa keduanya merupakan dua contoh pelaksanaan
tes yang tidak diharapkan. Keduanya tidak akan menghasilkan informasi
yang baik tentang siswa.
Dari contoh pertama. Yang kurang baik adalah tesnya.
Pertanyaannya disusun dengan kurang cermat. Para siswa dibebaskan
untuk memilih kata-kata yang sukar dan menerangkannya. Dengan
demikian akan terdapat banyak sekali variasi jawaban. Sehingga guru akan
menjumpai kesulitan pada waktu menilai. Guru tidak dapat memperoleh
gambaran tentang tingkat kemampuan siswanya. Nilai yang diperoleh
tidak dpat dimanfaatkan untuk mendiagnosis maupun untuk mengisi rapor.
Dari contoh kedua, tes yang disusun oleh guru sudah baik. Dengan
pengarahan dari guru. Yakni memberikan kata-kata sukar yang harus
diterangkan oleh siswa. Guru dapat memperoleh informasi siswa mana
yang sudah menguasai bahan dan siswa mana yang belum. Akan tetapi
kesalahannya terletak pada pelaksanaan/administrasi tes. Oleh karena
situasi memberikan peluang kepada siswa untuk saling menyeragamkan
jawaban. Maka guru tidak dapat memperoleh gambaran siapa sebenarnya
siswa yang sudah menguasai bahan pelajaran sehingga dapat menjadi
sumber informasi dan menjadi jasa kepada kawan-kawaannya.
Dari contoh dan keterangan ini semua dengan singkat dapat
dikatakan bahwa sumber persyaratan tes didasarkan atas dua hal:
Pertama : menyangkut mutu tes
Kedua : menyangkut pengadministrasian dalam pelaksanaan.
Walaupun dalam melaksanakan tes sudah diusahakan mengikuti
aturan tentang suasana. Cara dan prosedur yang telah ditentukan tes itu
mengandung kelemahan. Gilber Sax (1980,31-42) menyebutkan beberapa
kelemahan sebagai berikut:
1) Adakalanya tes (secara psikologis terpaksa) menyinggung pribadi
seseorang. (walaupun tidak disengaja demikian), misalnya dalam
rumusan soal, pelaksanaan. Maupun pengumuman hasi. Dalam
kompetisi tersebut merebut suatu kesempatan yang pemilihannya
melalui tes. Mau tidak mau tentu ada pihak-pihak yang dikalahkan dan
itu tentu merasa tersinggung pribadinya.
2) Tes menimbulkan kecemasan sehingga memengaruhi hasil belajar
yang murni. Tidak dapat dipungkiri bahwa tes akan menimpulkan
suasana khusus yang mengakibatkan hal-hal yang tidak sama antara
orang yang satu denga yang lain. Di dalam penelitiannya, Kirkland
(1971) menyimpulkan bahwa
a) Besar kecilnya kecemasan mempengaruhi murni dan tidaknya hasil
belajar
b) Murid yang kurang pandai mempunyai kecemasan yang lebih besar
dibandingkan dengan anak yang berkemampuan tinggi.
c) Kebiasaan terhadap tipe tes dan pengadministrasian mengurangi
timbilnya kecemasan dalam tes.
d) Dalam kecemasan yang tinggi, murid akan mencapai hasil baik jika
soalnya bersifat ingatan, tetapi hasilnya tidak baik jika soalnya
pikiran.
e) Timbulnya kecemasan sejalan dengan tingkatan kelas
f) Meskipun pada tingkat sekolah dasar tidak terdapat perbedaaan
kecemasan. Anatara anak laki-laki dengan anak perempuan, tetapi
di tingkat sekolah menengah anak perempuan cenderung
mempunyai kecemasan yang lebih tinggi dibandingkan anak laki-
laki.
Banyak penelitian telah dilakukan oleh para ahli, tentan gkecemasan
ini. Secara umum dapat disimpulkan bahwa bagaimana pun bebasnya
suasana tes. Namun tampak bahwa penampilan testee akan berbeda
dengan jika pertanyaaan dilakukan bukan dalam suasana atau mengusir
kecemasan dengan cara menggigir tkuku, mengetuk meja, dan
sebagainya. Mengingat bahwa hasil tes dipergunakan untuk
menentukan nasib seseorang maka guru harus sangat berhati-hati dalam
memberikan pertimbangan.
b. Reliabilitas
Kata reabilitas dalam bahasa indonesia diambil dari kata reliability dalam
bahasa inggris, berasal dari kata reliable yang artinya dapat dipercaya.
Seperti halnya islilah validitas dan valid, kekacauan dalam penggunaan
istilah “reliabilitas” sering dikacaukan dengan istilah “reliable”. reliabel.
Reliabilitas merupakan kata benda sedangakan reliabilitas merupakan
kata sifat atau kata keadaaan.
Seoang dikatakan dapat dipercaya jika orang tersebut selalu bicara
ajeg. Tidak berubah-ubah pembicaraannya dari waktu ke waktu.
Contoh:
TABEL NILAI TES PERTAMA DAN TES KEDUA
Waktu Tes
Nama Siswa
Pengetesan Pertama Pengetesan Kedua
Amin 6 7
Badu 5,5 6,6
Cahyani 8 9
Didit 5 6
Elvi 6 7
Parida 7 8
Demikian pula halnya sebuah tes. Tes tersebut dikatakan dapat
dipercaya jika memberikan hasil yang tepat apabila diteskan berkali-kali.
Sebuah teas dikatakan reliabel apabila hasil-hasil tes tersebut menjukan
ketetapan. Dengan kata lain, kjika kepada para siswa diberikan tes yang
sama pada waktu yang berlainan, maka setiap siswa akan berada dalam
urutan (rangking) yang sama dalam kelompok.
Walaupn tampaknya hasi tes pada pengetesan kedua lebih baik
akan tetapi karena kenaikannya dialami oleh semua siswa, maka tes yang
digunakan dpat dikatakan memiliki reliabilitas yang tinggi. Kenaikan
hasil tes kedua barangkali disebabkan oleh adanya “pengalaman” yang
diperoleh pada waktu mengerjakan tes pertama. Dalam keaan seperti ini
dikatakan bahwa ada carry-over effect atau practice-effect, yaitu
penjelasan tentang reliabitias secara lebih terperinci.
Jika dihubungkan dengan validitas maka:
a. Validitas adalah ketepatan
b. Reliabiltias adalah keteptapan.
c. Objektivitas
Dalam pengertian sehari-hari dengan cepat diketahui bahwa objektif
berarti tidak adanya unsur pribadi yang mempengaruhi. Lawan dari
objektif adalah subjektif, artinya terdapat unsur pribadi yang masuk
memengaruhi. Sebuah tes dikatakan memiliki objektivitas apabila dalam
melaksanakan tes itu tidak ada faktor subjektif yang memengaruhi. Hal
ini terutama terjadi pada sistem skoringnya.
Apabila dikaitkan dengan reliabilitas maka objektivitas menekankan
ketetapan (consistency) pada sistem skoring, sedangkan reliabilitas
menekankan ketetapan dalam hasil tes.
Ada 2 (dua) faktor yang memengaruhi subjektivitas dari suatu tes, yaitu
bentuk tes dan penilai.
1) Bentuk tes
Tes yang berbentuk uraian, akan memberi banyak kemungkinan
kepada si penilai untuk memberikan penilaian menrut caranya sendiri.
Dengan demikian maka hasil dari seoarang siswa yang mengerjakan
soal-soal dari sebuah tes akan dapat berbeda apabila dinilai oleh dua
orang penilai. Itulah sebabnya pada waktu ini ada kecenderungan
penggunaan tes objektif di berbagai bidang. Untuk menghindari
masuknya unsur subjektivitas dari penilai. Maka sistem skoringnya
dapat dilakukkan dengan cara sebaik-baiknya, antara lain dengan
membuat pedoman skoring terlebih dahulu.
2) Penilai
Subjektivias dari penilai akan dapat masuk secara agak leluasa.
Terutama dalam tes bentuk uraian. Faktor-faktor yang memengaruhi
subjektifitas. Anatara lain. Kesan penilai terhadap siswa. Tulisan
bahasa. Waktu mengadakan penilaian, kelelahan dan sebagainya.
Untuk menghindari atau mengurangi masuknya unsur subjektifitas
dalam pekerjaan penilaian, maka penilaian atau evaluasi ini harus
dilaksanakan dengan mengingat pedoman. Pedoman yang dimaksud
terutama menyangkut masalah pengadministrasian, yaitu kontinuitas
dan komprehensivitas
a) Evaluasi harus dilakukan secara kontinu (terus –menerus), dengan
evaluasi yang berkali-kali dilakukan maka guru akan memperoleh
gambaran yang lebih jelas tentang keadaan siswa. Tes yang
diadakan secara on the spot dan hanya satu atau dua kali. Tidak
akan dpat memberikan hasil yang objektif tentang keadaan
seorang siswa. Faktor kebetulan. Akan sangat mengganggu
hasilnya. Kalau misalnya ada orang anak yang sebetulnya pandai,
tetapi pada waktu mengadakan tes dia sedang dalam kondisi yang
jelek karena semalaman merawat ibunya yang sedang sakit, maka
sada kemungkinan nilai tesnya jelek pula.
b) Evaluai harus dilakukan secara komprehensif (menyeluruh) yang
dimaksud dengan evaluasi yang komprehensif disini adalah atas
berbagai segi peninjauan yaitu:
(1) Mencakup keseluruhan materi.
(2) Mencakup berbagai aspek berfikir (ingatan, pemahaman
aplikasi dan sebagainya)
(3) Melalui berbagai cara aitu tes tertulis, tes lisan tes pembuatan
pengamatan insidental dan sebagainya.
d. Praktikabilitas
Sebuah tes dikatakan meiliki praktikabilitas yaitu tinggi apabila tes
tersebut bersifat praktis, mudah pengadministrasiannya.
Tes yang praktis adalah tes yang:
1) Mudah dilaknakanak misalnya tidak menuntut peralatan yang banyak
dan memberi kebebasan kepada siswa untuk mengerjakan terlebih
dahulu bagian yang dianggap mudah oleh siswa.
2) Mudah pemeriksaanya, artinya bahwa tes itu dilengkapi dengan kunci
jawaban maupun pedoman skoringnya. Untuk soal bentuk objektif.
Pemeriksaan akan lebih mudah dilakukan jika dikerjakan oleh siswa
dalam lembar jawaban.
3) Dilengkapi dengan petunjuk-petunjuk yang jelas sehingga dapat
diberikan/diawali oleh orang lain.
e. Ekonomis.
Yang dimaksud dengan ekonomis disini ialah bahwa pelaksanaan tes
tersebut tidak membutuhkan ongkos/biaya yang mahal, tenaga yang
banyak dan waktu yang lama.
BAB 5
VALIDITAS
Dimana:
rxy = koefisien korelasi antra variabel X dan variabel Y, dua variabel
yang dikorelasikan (x = X –X dan y=Y – Y)
xy = jumlah perkalian x dengan y
x2 = kuadrat dari x
x2 = kuadrat dari y
Contoh perhitungan:
No Nama X Y x y x2 y2 XY
1 Nadia 6,5 6,3 0 - 0,1 0 0,01 0
2 Susi 7 6,8 + 0,5 + 0,4 0,25 0,16 + 0,2
3 Cecep 7,5 7,2 + 1,0 + 0,8 1 0,64 + 0,8
4 Erna 7 6,8 + 0,5 + 0,4 0,25 0,16 + 0,2
5 Dian 6 7 - 0,5 + 0,6 0,25 0,36 - 0,3
6 Asmara 6 6,2 - 0,6 - 0,2 0,25 0,04 + 0,1
7 Siswoyo 5,5 5,1 - 0,7 - 1,3 1 1,69 + 1,3
8 Jihad 6,5 6 0 - 0,4 0 0,16 0,0
9 Yana 7 6,5 + 0,5 + 0,1 0,25 0,01 + 0,05
10 Lina 6 5,9 - 0,5 - 0,6 0,25 0,36 + 0,3
Jumlah 65 63 3,5 3,59 2,65
X=X- X
Y=Y- Y
Dimasukan ke rumus
𝑥𝑦
𝑟𝑥𝑦 =
√(2𝑥 )(2𝑦 )
2,65 2,65
= =
√ 3,5𝑥3,59 √12,565
2,65
= 3,545
Indeks korelasi antara X dan Y inilah indeks validitas soal yang dicari.
Rumus korelasi product moment dengan angka kasar:
𝑵 𝑿𝒀 − (𝑿)(𝒀)
𝒓𝒙𝒚 =
√{𝑵𝑿𝟐 (𝑿)𝟐 }{𝑵𝒀𝟐 − (𝒀)𝟐 }
Dimana:
rxy = koefisien korelasi antara variabel X dan variabel Y, dan variabel yang
dikorelasikan
dengan menggunakan data hasil tes prestasi matematika di atas kini
dihitung dengan rumus korelasi product moment dengan angka kasar yang
tabel persiapannya sebagai berikut:
No Nama X Y x2 y2 XY
1 Nadia 6,2 6,3 42,25 39,69 40,95
2 Susi 7 6,8 49 46,24 47,6
3 Cecep 7,5 7,2 56,25 51,84 54
4 Erna 7 6,8 49 46,24 47,6
5 Dian 6 7 36 49 42
6 Asmara 6 6,2 36 38,44 37,2
7 Siswoyo 5,5 5,1 30,25 26,01 28,05
8 Jihad 6,5 6 42,25 45,5 39
9 Yana 7 6,5 49 36 45,5
10 Lina 6 5,9 36 34,81 35,4
Jumlah 65 63,8 426 410,5 417,3
10𝑥417,2 = (65𝑥63,8)
𝑟𝑥𝑦 =
√(10𝑥426 − 4225)(10𝑥410,52 − 4070,44)
4173 − 4147
=
√(4260 − 4225)(410,2 − 4070,44)
26 26
= =
√35𝑥34,76 √1216,6
26
= = 0745
34,8797
Jika dibandingkan dengan validitas soal yang dihitung dengan rumus
simpangan, ternyata terdapat perbedaan sebesar 0,003 lebih besar yang
dihitung dengan rumus simpanganan. Hal ini wajar karena dalam
mengerjakan perkalian atau penjumlahan jika diperoleh 3 atau angka di
belakang koma dilakukan pembulatan keatas. Perbedaan ini sangat kecil
sehingga dapat diabaikan.
Untuk memperjelas pengertian tersebut dapat disampaikan keterangan
sebagai berikut.
- Korelasi fositif menunjukan adanya hubungan sejajar antara dua hal
misalnya hal pertama nilanya naik, hal kedua ikut naik sebaliknya jika
hal pertama turun, yang kedua ikut turun.
Contoh korelasi positif antara nilai IPA dan Matematika
IPA : 2, 3, 5, 7, 4, 3, 2
Matematika : 4, 5, 6, 8, 5, 4, 2
Kondisi nilai matematika sejajar dengan IPA karena naik dan turunnya
nilai matematika mengikuti naik dan turunnya nilai IPA, Coba
Perhatikan!
- Korelasi negatif menunjukan adanya hubungan kebalikan antara dua hal.
Misalnya, hal pertama nilai naik, justru yang kedua turun sebaliknya jika
yang pertama turun yang kedua naik.
Contoh korelasi negatif antara nilai bahasa indonesia dengan matematika
Bahasa Indonesia : 5, 6, 8, 4, 3, 2,
Matematika : 8, 7, 5, 1, 2, 3
Keadaan hubungan antara dua hal yang kita jumpai dalam
kehidupan sehari-hari tidak selalu hanya positif atau negatif saja, tetapi
mungkin 0. Biasanya korelasi pun tidak menentu. Coba cermatilah
bagaimana hubungan antara dua nilai mata pelajaran A dan B berikut ini.
Contoh korelasi tidak tertentu.
Nilai A : 5, 6, 4, 7, 3, 8, 7
Nilai B : 4, 4, 3, 7, 4, 9, 4
Koefisien korelasi terdapat antara -1,00 samapai +1,00 namun
karena dalam menghitung sering dilakukan pembulatan angka=angka
sangat mungkin diperoleh koefisien lebih dari 1,00 koefisien negatif.
Menununjukan adanya kesejajaran untuk mengadakan interprestasi
mengenai besarnya koefisien korelasi adalah sebagai berikut:
- Antara 0,800 sampai dengan 1,00 : sangat tinggi
- Antara 0,600 sampai dengan 0,800 : tinggi
- Antara 0,400 sampai dengan 0,600 : cukup
- Antara 0,200 sampai dengan 0,400 : rendah
- Antara 0,000 sampai dengan 0,200 : sangat rendah
Penafsiran harga koefisien korelasi ada 2 (dua) cara yaitu:
1. Dengan melihat harga r dan diinterprestasikan misalnya korelasi
tinggi, cukup dan sebagainya.
2. Dengan berkonsultasi ke tabel harga kritik product moment sehingga
dapat diketahui signifikan tidak korelasi tersebut. Jika harga r lebih
kecil dari harga kritik dalam tabel. Maka korelasi tersebut tidak
signifikan begitu juga arti sebaliknya.
Ketrangan:
X = skor item nomor 6
Y = Skor total
Dari perhitungan kalkulator diperoleh data sebagai berikut:
𝑋 = 6
𝑦 = 46
𝑋𝑌 = 37
Xt = 5,57 X
Y = 6,17 Y
Sesudah diketahui X, x2, Y2, dan XY tinggal memasukan
bilangan-bilangan tersebut ke dalam rumus korelasi product moment dengan
rumus angka kasar.
Data diatas dimasukan ke dalam rumus korelasi product moment
dengan angka kasar
𝑁XY − (X)(Y)
𝑟𝑥𝑦 =
√{𝑁X 2 − (X)2 }{𝑁Y 2 − (Y)2 }
8𝑥37 − 6𝑥46
𝑟𝑥𝑦 =
√(8𝑥6 − 62 )(8𝑥288 − 462 )
296 − 276
=
√(48 − 36)𝑥(2304 − 2116)
20 20
= =
√12𝑥188 √2256
20
= = 0,421
47,497
𝑀𝑝 − 𝑀1 𝑝
𝑦𝑝𝑏𝑙 = √
𝑆𝑡 𝑞
Keterangan:
ypbi = koefisien korelasi biserial
Mp = rata skor subjek yang menjawab betul bagi item yang dicari
validitasnya
Mt = rerata skor
St = standar deviasi dari skor total proporsi
p = proporsi siswa yang menjawab benar
𝑏𝑎𝑛𝑦𝑎𝑘𝑛𝑦𝑎 𝑠𝑖𝑠𝑤𝑎 𝑦𝑎𝑛𝑔 𝑏𝑒𝑛𝑎𝑟
𝑝=
𝑗𝑢𝑚𝑙𝑎ℎ 𝑠𝑒𝑙𝑢𝑟𝑢ℎ 𝑠𝑖𝑠𝑤𝑎
q = proporsi siswa yang menjawab salah (q=1 - p)
𝑴𝒑 − 𝑴𝒕 𝒑
𝒚𝒑𝒃𝒊 = √
𝑺𝟏 𝒒
𝟔, 𝟏𝟕 = 𝟓, 𝟕𝟓 𝟎, 𝟕𝟓
= √
𝟏, 𝟕𝟏𝟑𝟗 𝟎, 𝟐𝟓
𝟎, 𝟒𝟐
= = 𝟏, 𝟕𝟑𝟐𝟏
𝟏, 𝟕𝟏𝟑𝟗
= 𝟎, 𝟒𝟐𝟒𝟒
No Nama X Y x2 y2 XY keterangan
1 Nining 5 7 25 49 35
2 Maruti 6 6 36 36 36 X = hasil tes matematika
3 Bambang 5 6 25 36 30 yang dicari validtasnya
4 Seno 6 7 36 49 42
5 Hartini 7 7 49 49 49 Y= hasil tes standar
6 Heru 6 5 36 25 30
Jika dari tes terstandar diketahui bahwa validitas 0,89 naja bukagab 0,108
ini belum merupakan validitas soal matematika yang dicar. Validitas tersebut
harus dikalikan dengan 0,89 yang hasilnya 0,108 x 0,89=0,096
5. Validitas Faktor
Selain validtitas soal secara keseluruhan dan validitas buti yang masih ada
lagi yang perlu diketahui validitasnya. Yaitu faktor-faktor atau bagian
keseluruhan materi. Setiap keseluruhan materi pelajaran terdiri dari pokok-
pokok bahasan atau mungkin sekelompok bahasan yang merupakan satu
kesatuan
Contoh:
guru akan mengevaluasi penguasaan siswa untuk tiga pokok bahan yaitu:
bunyi, cahaya, dan listrik untuk keperluan ini guru tersebut membuat 30 butir
soal, untuk bunyi 8 butir, untuk 12 butir dan untuk listrik 10 butir.
Apabila guru ingin mengetahi validitas faktor, maka ada 3 faktor
dalam soal ini. Seperti halnya pengertian validtias butir, pengertian validtias
faktor adalah sebagai berikut: butir-butir soal dalam faktor dikatakan valid
apabila mempunyai dukungan yang besar terhadap soal secara keseluruhan.
Sebagai tanda bahwa butir-butir faktor tersebut mempunyai dukungan yang
besar terhadap seluruh soal, yakni apabila jumlah skor untuk butir-butir faktor
tersebut jumlah skor untuk butir-butir faktor tesebut menunjukan adanya
kesejajaran dengan skor total. Agar uraian ini lebih jelas, pada halaman
selanjutnya disajikan contoh tabel analisis butirnya.
CONTOH TABEL ANALISIS BUTIR UNTUK MENGHITUNG VALIDITTAS BUTIR DAN
VALIDITAS FAKTOR
Dimana:
𝑟𝑛𝑚 : besarnya koefisien, reliabilitas sesudah tes tersebut ditambah butir
soal baru
n : berapa kali butir-butir soal itu ditambah
r : besarnya koefisien reliabilitas sebelum butir-butir soalnya di
tambah
contoh:
suatu tes terdiri atas 40 butir soal, mempunyai koefisien reliabiltias 0,70.
Kemudian butir-butir soal itu ditambah menjadi 60 butir soal.
Maka koefisien reliabilitas baru adalah:
𝑛𝑟
𝑟𝑛𝑚 =
1 + (𝑛 − 1)𝑟
1,5𝑥0,70
=
1 + (1,5 − 1)𝑥0,70
1,05
=
1,35
= 0,79
Demikian maka penambahan sebanyak 20 butir soal dari 40 butir
memperbesarkan koefisien reliabilitas sebesar 0,09. Akan tetapi
penambahan butir-butir soal tes adalakanya tidak berarti. Bahkan
merugikan. Hal ini disebabkan karena:
1) Sampai pada suatu batas tertentu, penambahan banyaknya butir soal
sudah menambah tinggi reliabiltas tes.
Ramers dan Gage menggambarkan hbungunan antra penambahan butir
soal reliabiltiias sebagai berikut:
Seperti halnya pad wakhtu menghitung dengan belahan ganjil genap maka
kelanjutannya adalah menghitung dengan rumus korelasi product moment.
Dengan menggunakan kalkulator diketahui
X=25 X2 = 91
Y=22 Y2 = 78
XY=63
Setelah dimasukan ke dalam rumus korelasi product momen dengan angka
kasar diperoleh 𝑟1⁄ 1 demgam rumus spearman-brown diperoleh
2 ⁄2 =−0,3831
𝑟11 = 0,5538.
Selain menggunakan rumus korelasi product momen, dua orang ahli
mengajukan rumus lain. Seorang bernama Flanagan menemukan rumus
yang perhitunganya menggunakan belah dua ganjil-genap, dan seoarang
benama rulon yang dumusnya diterapkan pad data belahan awal-akhir.
3) Penggunaan rumus Flanagan
Rumus
𝑆12 + 𝑆22
𝑟11 = 2 (1 − )
𝑠𝑡2
Dimana :
𝑟11= Reliabiiltas
𝑆12 = vairans belahan pertama (1) yang dalam hal ini varian skor item ganjil
𝑆22 = varian belahan kedua (2) yaitu varians skor item genap
𝑆𝑡2 =varians total yaitu varians skor total
472
295 − 8
𝑆22 =
8
276,13
= 295 − =2,36
8
Keterangan :
r11 = Reliabilitas seluruh soal
Vr = Varians Responden
Vs = Varians Sisa
Untuk mencari reliabilitas suatu soal dilakukan dengan langkah-langkah
sebagai berikut:
Langkah 1. Mencari jumlah kuadrat responden dengan rumus
𝐵 2 (𝑋𝑡 )2
𝑗𝑘𝑖 =
𝑁 𝐾𝑥𝑁
Keterangan:
Jk(r) = jumlah kuadrat responden
Xt = skor total tiap responden
K = Banyaknya item
N = banyaknya responden atau subjek
Langkah 2. Mencari jumlah kuadrat item dengan rumus;
2. Taksonomi Bloom
Bloom dan Krathwohl telah memberikan banyak inspirasi kepada orang
yang melahirkan taksonomi lain. Prinsip-prinsip dasdar yang digunakan
oleh 2 orang ini ada 4 buah, yaitu:
a. Prinsip metodologis
Perbedaan yang besar telah merefleksi kepada cara-cara guru dalam
mengajar
b. Prinsip psikologis
Taksonomi hendaknya konsisten dengan fenomena kejiaan yang ada
sekarang.
c. Prinsip logis
Taksonomi hendaknya dikembangkan secara logis dan konsisten
d. Prinsip tujuan
Tingaktan-tingaktan tujuan tidak selaras dengan tingkatan-tingakatan
nilai-nilai. Tiap-tiap jenis tujuan pendidikan hendaknya
menggambarkan corak yang netral.
Atas dasar prinsip ini maka taksonomi disusun menjadi uatu
tingkatan yang menunjukan tingkat kesulitan sebagai contoh, menginat
fakta lebih mudah dari pada menarik kesimpulan. Atau menghafal, lebih
mudah daripada memberikan pertimbangan. Tingaktan kesulitan ini juga
merefleksi kepada kesulitan dalam proses belajar dan mengajar.
Sudah banyak diketahui bahwa mula-mula taksonomi bloom terdiri
dari dua bagian yaitu kognitif domain dan afektif domain (cognitive
domain and affective domain). Pencipta dar kedua taksonomi ini merasa
tidak tertarik pada psikomotor domain karena melihat hanya ada sedikit
kegunaannya di sekolah menengah atau universitas ( Bloom, 1956),
akhirnya simpson melengkapi dua domain yang ada dengan psikomotor
domain (1966). Namun sebenarnya pemisahan antara ketiga domain ini
merupakan pemisahan yang dibuat-buat, karena manusia merupakan suatu
kebetulan yang tidak dapat dipec-pecah sehingga tindakanya merupakan
suatu kebetulan.
Saat ini sudah banyak diketahui oleh umum bahwa apa yang
dikenal sebagai taksonomi bloom (1956) sebenarnya merupakan hasil
kelompok penilai di universitas yang terdiri dari B.S Bloom Editor MD
Engelhart, E Furs, W.H dan D.R Krathwohl yang kemudian didukung pula
oleh Ralp W. Tyler.
Secara garis besar, blooom bersama kawan-kawan merumuskan
tujuan-tujuan pendidikan pada 3(tiga) tingkatan:
a. Kategori tingkah laku yang masih verbal
b. Perluasan kategori menjadi sederatan tujuan
c. Tingkah laku konkret yang terdiri dari tugas-tugas (task) dalam
pertnyataan-penyataan sebagai ujian dan butir-butir soal
Ada 3 (tiga) ranah domain besar, yang terletak pada tingkatan ke -2
yang selanjutnya disebut taksonomi yaitu:
a. Ranah kognitif (cognitive domain)
1) Mengenal (recognition)
Dalam pengenalan siswa diminta untuk memilih satu dari
dua atau lebih jawaban
Contoh:
Hasil bumu yang terkenal dari daerah temanggung adalah:
a) Padi
b) Tebu
c) Tembakau
Mengungkap / mengingat kembali (recall)
Berbeda dengan mengenal maka dalam mengingat kembali
ini siswa diminta mengingat kembali satu atau lebih fakta-
fakta yang lebih sederhana.
Contoh:
Tempat keluarnya air dari dalam tanah disebut//
Mengenal dan mengungkap kembali, pada umumnya
dikategoraikan menjadi satu jenis, yakni ingatan. Kategori
ini merupakan yang paling rendah tingkatanya karena tidak
terlalu banyak meminta energi.
2) Pemahaman (comprehension)
Dengan pemahaman, siswa diminta untuk membuktikan
bahwa meamhami hubungan yang sederhana di antara
fakta-fakta atau konsep
Contoh:
Diantara gambar-gambar di bawah ini yang dapat disebut
sebagai segitiga siku-siku adalah:
a) .
b) .
c) .
Analisis
Aplikasi Aplikasi
Pemahaman Pemahaman
Ingatan Ingatan
3. Lain-Lain Taksonomi
Banyak kritik telah dilemparkan kepada Bloom Cs, tentang pembagian
taksonomi ini, sehingga timbul teori-teori sebagai adaptasi modifikasi atau
kategori baru.
a. McGuire (1963), Klicman (1963) telah menyusun taksnonomi untuk
bidang biologi,wood (1968) untuk matematika, Leuis (1965) untuk
Ilmu pengetahuan alam. Sebagai contoh, dihasilkan oleh The National
Longitudinal Study of Mathematical Ablities (NLSMA)
1) Knowledge of facts
2) Coputation
3) Compreension
4) Application
5) Analysis
Alasanya adalah:
1) Computation (komputasi, perhitungan) merupakan satu
ketrampilan khusus yang tidak mempunyai tempat dalam
taksonomi Bloom. Padahal aspek ini perlu dinilai pula
2) Syntehsis an evaluation (sintesis dan evaluasi) hanya sedikit
mempunyai peranan di dalam kurikulum matematika.
b. Guilford telah menciptkan pola yang menggambarkan struktur intelek
dalam bentuk kubus.
Operation/proscess
(bidang mendatar)
Product
(bidang belakang)
Content
(bidang tegak)
Pend.
Pend. Bahasa Ilm ilmu
Pend. Moral Matem Bahasa
TI Olah Indone peng, Peng. dst
Agama Pancas atika Inggris
raga sia alam Sosial
ila
Pend.
Pend. Bahasa Ilm ilmu
Pend. Moral Matem Bahasa
TI Olah Indone peng, Peng. dst
Agama Pancas atika Inggris
raga sia alam Sosial
ila
Pend.
Pend. Bahasa Ilm ilmu
Pend. Moral Matem Bahasa
TI Olah Indone peng, Peng. dst
Agama Pancas atika Inggris
raga sia alam Sosial
ila
Pend.
Pend. Bahasa Ilm ilmu
Pend. Moral Matem Bahasa
TI Olah Indone peng, Peng. dst
Agama Pancas atika Inggris
raga sia alam Sosial
ila
Tkur. Tkur. Tkur. Tkur. Tkur. Tkur. Tkur. Tkur. Tkur.
TI = Tujuan Institusional
Tkur. = Tujuan Kurikuler
isi (pokok
2) siswa dapat Tingkah laku melalui PKP
bahasan)
isi (pokok
3) siswa mampu gabungan PKP dan tingkah laku
bahasan)
1
a. Didasarkan atas bahan dan tujuan
a. Didasarkan atas bahan dan tujuan
umum dari sekolah-sekolah di
khusus yang dirumuskan oleh
seluruh Negara.
guru untuk kelasnya sendiri.
2
Mencakup aspek yang luas dan
b. Dapat terjadi hanya mencakup
pengetahuan atau keterampilan
pengetahuan atau keterampilan
dengan hanya sedikit butir tes untuk
yang sempit.
setiap keterampilan atau topik.
c. Biasanya disusun sendiri oleh guru
c. Disusun dengan kelengkapan staf
3 dengan sedikit atau tanpa bantuan
profesor, pembahas, dan editor butir
orang lain/tenaga ahli.
tes.
d. Jarang menggunakan butir tes
d. Menggunakan butir tes yang sudah
4 yang sudah diujicobakan,
diujicobakan (try out), dianalisis
dianalisis dan direvisi.
dan direvisi sebelum menjadi
sebuah tes.
e. Mempunyai reliabilitas sedang
5 atau rendah.
e. Mempunyai reliabilitas yang tinggi.
6 f. Norma kelompok terbatas kelas
f. Dimungkinkan menggunakan norma
tertentu.
untuk seluruh Negara.
Penyusunan;
Uji coba;
Analisa;
Revisi;
Edit.
Selanjutnya baik tes standar dan tes buatan guru dianjurkan dipakai
jika hasilnya akan digunakan untuk:
a. Mengadakan diagnosis terhadap ketidakmampuan siswa.
b. Menentukan tempat siswa dalam suatu kelas atau kelompok.
c. Memberikan bimbingan kepada siswa dalam pendidikan dan pemilihan
jurusan.
d. Memilih siswa untuk program-program khusus.
1. Fungsi Tes
Setiap kai akan memberikan tes, kebanyakan guru selalu bertanya kepada
dirinya sendiri
“Pertanyaan apakah yang akan saya berikan?”
“Jawaban apakah yang saya perlukan dan jawaban manakah tidak saya
perlukan?”
“berapa butir soal akan sa buat?”
“Bagaimanakah bentuk kunci jawabanya?”
b. komprehensip
sebuah tes bebaliknya menckup suatu kebetulan, artinya meliputi
berbagai aspek yang dapat menggambarkan keaad siswa secara
keseluruhan (kecerdasan, sikap, pribadi perasaan sosial dan sebagainya)
hal ini dapat dicapai apabila tes itu merupkan rangkaian tes, misalnya
dari kelas 1 samapi dengan kelas 6.
c. Kontinuitas
Berhubungan dengan prinsip komprehensif maka prinsip kontinuitas
mempunyai persamaan tujuan. Sebaiknya tes disusun sedemikian rupa
sehingga menggambarkan kelanjutan dari awal anak memasuki satu
sekalh sampai dengan kelas terakhir. Dengan demikian akan diketahi
anak tiu tdak dengan terputus.
2. Langkah-langkah dalam penyusunan tes
Tentu saja setiap guru akan dengan mudah mengatakan bagian pelajaran
mana yang akandicakup dalam sebuah tes jika sudah diketahui tujuannya.
Urutan langkah yang dilakukan adalah sebagai berikut:
a. Menentukan tujuan mengadakan tes
b. Mengadakan pembatasan terhadap bahan yang akan diteskan.
c. Merumuskan Tujuan Instruksional Khusus (TIK) dari tiap bagian bahan.
d. Menderetkan semua TIK dalam tabel persiapan yang memuat pula aspek
tingkah laku dalam terkandung TIK itu, tabel digunakan untuk
identifikasi terhadap tingkah laku yang dikehendaki, agar tidak terlewati.
Contoh:
Tabel TIK dan Aspek tingkah laku yang dicakup
Indikator Aspek Ingatan Pemahaman Aplikasi Keterangan
tingkah laku
1. Siswa dapat
menjumlahkan 2
bilangan bersusun
2. Siswa dapat
menerangkan
hukum komulatif
dan seterusnya
1. Bentuk-bentuk tes
a) Tes subyektif.
Secara umum soal subyektif adalah pertanyaan yang menuntut peserta
didik menjawab dalam bentuk menguraikan, menjelaskan, mendiskusikan,
membandingkan, memberikan alasan, dan bentuk lain yang sejenis sesuai
dengan tuntutan pertanyaan dengan menggunakan kata-kata dan bahasa
sendiri. Jumlah soal-soal bentuk subyektif biasanya tidak banyak, hanya
sekitar 5-10 buah soal dalam waktu kurang lebih 90-120 menit. Soal-soal
bentuk ini menuntut kemampuan peserta didik untuk dapat mengorganisir,
menginterpretasi, dan menghubungkan pengertian-pengertian yang telah
dimiliki.
1) Kebaikan-kebaikannya
a. Mudah diapkan dan disusun
b. Tidak memberi banyak kesempatan untuk spekulasi atau untung-
untungan
c. Mendorong siswa untuk berani mengemukakan pendapat serta
menyusun dalam bentuk kalimat
d. Memberi kesempartan kepada siswa untuk meengutrakan
maskusnya dengan gaya bahasa dan caranya sendiri
e. Dapat diketahui sejauh mana siswa mendalami sesuat masalah
yang diteskan.
1) Keburukan-keburukannya
a. Kadar validitas dan relibitias rendah karena sukr diketahui segi-
segi mana dari pengetahuan siswa yang betul-betul telah dikuassai
b. Kurang repersentatif dalam hal mewakili seluruh scope bahan
pelajaran yang akan dites karena soalnya hanya beberapa saja
(terbatas)
c. Cara memeriksanya banyak dipengaruhi oelh unsur-unsur
subjektif
d. Pemeriksaanya lebih sulit sebab membutuhakn pertimbangan
individual lebih banyak dari penilai
e. Waktu untuk koreksinya llama dan tidak dapat diwakilkan kepada
orang lain.
2) Petunjuk penyusunan
a. Hendaknya soal-soal tes dapat meliputi ide-ide pokok dari bahan
yang diteskan dan kalu mungkin disusun soal yang sifatnya
komprehensif.
b. Hendaknya soal tidka megambil kalimat-kalimat yangdisalin
langsung dari buku atau catatan.
c. Pada waktu menyusun soal-soal itu sudah dilengkapi dengan
kunci jawaban serta pedoman penilaiannya.
d. Hendaknya diusahakan agar pertanyaanya bervariasi antara
jelaskan mengapa bagaimana seberapa jauh agar diketahui lebih
jau penguasaan siswa tehadap bahan.
e. Hendakjnya rumusan soal dibuat sedemikan rupa sehingga mudah
dipahami oleh tercoba.
f. Hendaknya ditegakn model jawaban apa yang dikehendaki oleh
penyusun tes, untuk ini pertanyaan tidak boleh terlalu umu tetapi
harus spesifik
b) Tes objektif.
Tes objektif adalah tes yang dalam pemeriksaannya dapat
dilakukan secara objektif (Arikunto, 1995 : 165). Karena sifatnya
yang objektif maka penskorannya dapat dilakukan dengan bantuan
mesin. Soal ini tidak memberi peluang untuk memberikan penilaian
yang bergradasi karena dia hanya mengenal benar dan salah. Apabila
respons siswa sesuai dengan jawaban yang dikehendaki maka
respons tersebut benar dan biasa diberi skor 1. Apabila kondisi yang
terjadi sebaliknya, maka respons siswa salah dan biasa diberi skor 0.
Jawaban siswa bersifat mengarah kepada satu jawaban yang benar
(convergence).
Merujuk kepada berbagai pendapat tentang tes objektif dapat
diambil kesimpulan bahwa tes objektif adalah tes yang semua
informasi yang diperlukan peserta tes untuk memberikan respon
telah disediakan oleh penyusun tes, sehingga peserta tes tinggal
memilihnya. Jawaban yang berupa pilihan bersifat deterministik,
sehingga hanya ada dua kemungkinan kebenaran jawaban – benar
atau salah
1) Kebaikan kebaikannya
a) Mengandung lebih banyak segi-segi yang positif mislnya
lebih representative meweakili isi dan luas bahan, lebih
objektif dpat dihindari campur tangannya unsur subjektif
baidari segi siswa maupun guru yang memriksa.
b) Lebih mudah dan cepat cara memriksanya karena
menggunkan kunci tes bahkan alat-alat hasil kemajuan
teknologi
c) Pemeriksaanya dapat disehkan ke oranglain
d) Dalam pemerisaan tidak ada unsur subjetif yang
memengaruhi
2) Kelemahan-kelemahanya
a) Persipan untuk menyusun jeuh lebih sulit dari pada tes esai
karena soelnya banyak dan harus teliti untuk menghindari
kelemahan-kelemahan yang lain.
b) Soalya cenderung untuk menggunkapkan ingatan dan daya
pengenalan kembali saja, dan sukar untuk mengukur proses
mental yang tinggi
c) Banyak kesempatan untuk main untung-untungan
3) Cara mengatasi kelemahan
Bab 12 TABEL SPESIFIKASI
Fungsi dari tabel spesifikasi ialah untuk menjaga agar tes yang kita susun
tidak menyimpang dari bahan (materi) serta aspek kejiwaan (tingkah laku) yang
akan dicakup dalam tes.
2. Langkah-Langkah Pembuatan
Untuk memgisi sel-sel yang lain, dilakukan dengan cara yang sama
seperti hal nya mengisi sel A, B, dan C.
Untuk Bab II, ingatan 20%, pemahaman 50%, aplikasi 30%, maka:
Terdapat dua langkah lagi sebagai tindak lanjut sesudah penyususnan tabel
spesifikasi untuk memperoleh seperangkat soal tes yaitu:
(3) Apakah soal yang kita susun tidak merupakan pertanyaan yang
membingungkan (dapat disalah tafsirkan)?
(5) Apakah soal itu dapat dikerjakan oleh sebagian besar siswa ?
b. Mengadakan analisis soal (item analysis). Analisis soal adalah suatu
prosedur Yang sistematis, yang akan memberikan informasi-informasi
yang sangat khusus terhadap butir tes yang kita susun. Faedah
mengadakan analisis soal:
Analisis butir soal yang dalam bahasa inggris disebut item analiysis
dilakukan terhadap empirik.Maksudnya, analisis itu baru dapat dilakukan apabila
suatu tes telah dilaksanakan dan hasil jawaban terhadap butir-butir soal telah kita
peroleh.
Untuk mengetahui kapan soal dikatakan baik, kurang baik, dan soal yang
jelek sangat berhubungan dengan analisis soal, yaitu taraf kesukaran, daya
pembeda, dan pola jawaban soal.
a) Taraf Kesukaran
Soal yang baik adalah soal yang tidak terlalu mudah atau tidak
terlalu sukar. Soal yang terlalu mudah tidak merangsang siswa untuk
mempertinggi usaha memecahkannya. Sebaliknya soal yang terlalu
sukar akan menyebabkan siswa menjadi putus asa dan tidak
mempunyai semangat untuk mencoba lagi karena di luar
jangkauannya.
P=B
JS
Dimana :
P= indeks kesukaran
b) Daya Pembeda.
Bagi suatu soal yang dapat dijawab benar oleh siswa pandai maupun
siswa bodoh, maka soal itu tidak baik, demikian pula jika semua
siswa, baik pandai maupun bodoh tidak dapat menjawab dengan
benar, soal tersebut tidak baik karena keduanya tidak mempunyai
daya pembeda. Soal yang baik adalah soal yang dapat dijawab oleh
siswa pandai saja.
D = BA/JA – BB/JB = PA – PB
Dimana :
1. Menskor
Apa yang terjadi selama ini, banyak di antara para guru sendiri yang masih
mencampuradukkan antara dua pengertian yaitu skor dan nilai.Skor : adalah hasil
pekerjaan menskor yang diperoleh dengan menjumlahkan angka-angka bagi setiap
soal tes yang dijawab betul oleh siswa.Nilai : adalah angka ubahan dari skor
dengan menggunakan acuan tertentu, yakni acuan normal atau acuan
standar.Secara rinci skor dapat dibedakan atas tiga macam, yaitu skor yang
diperoleh (obtained score), skor sebenarnya (true score), dan skor kesalahan
(error score).
Score yang diperoleh adalah sejumlah biji yang dimiliki oleh testee
sebagai hasil mengerjakan tes. Kelemaham-kelemahan butir tes, situasi yang tidak
mendukung, kecemasan dan lain-lain factor dapat berakibat terhadap skor yang
diperoleh ini. Apabila factor yang berpengaruh ini muncul, baik sebagian
atauppun menyeluruh, penilai tidak dapat mengira-ngira seberapa cermat skor
yang diperoleh siswa ini mampu mencerminkan pengetahuan dan keterampilan
siswa yang sesungguhnya.
Skor sebenarnya (true score) sering kali juga disebut dengan istilah skor
univers = skor alam (universe score), adalah nilai hipotesis yang sangat
tergantung dari perbedaan individu berkenaan dengan pengetahuan yang dimiliki
secara tetap.
(2) Nilai diperoleh dengan mencari skor rata-rata langsung dari skor
asal (skor mentah). Contoh :
a. Skala Bebas
Skala bebas yaitu skala yang tidak tetap, ada kalanya skor tertinggi
20, lain kali lagi 50. Ini semua tergantung dari banyak dan bentuk
soal. Jadi, angka tertinggi dari skala yang di gunakan tidak selalu
sama.
b. Skala 1-10
c. Skala 1-100
d. Skala huruf
3. Standar Nilai
a. Nilai standar berskala Sembilan (stannine), yaitu rentangan atau skala
nilai yang bergerak mulai dari 1 sampai dengan 9,[7] seperti berikut
ini:
Staines Interpretasi
9 (4%) Tinggi (4%)
8 (7%) Diatas rata-rata (19%)
7 (12%)
6 (17%) Rata-rata (54%)
5 (20%)
4 (17%)
3 (12%) Dibawah rata-rata (19%)
2 (7%)
1 (4%) Rendah (4%)
1. Pengertian
d. Fungsi administratif:
Memberikan beasiswa
b. Usaha (effort)
b. Nilai akhir diperoleh dari nilai tugas, nilai ulangan harian, dan
nilai ulangan umum dengan bobot 2,3,dan 5.
1. Pentingnya laporan
Pentingnya Laporan
Semua uraian yang telah disajikan pada bab-bab seblum ini berkenaan dengan
evaluasi hasil belajar. Buku ini berjudul “Dasar-dasar Evaluasi Pendidikan”
sebetulnya secara garis besar terdapat dua kegiatan evaluasi yaitu evaluasi
terhadap hasil belajar siswa dan juga proses pengajarannya. Jadi, apabila
pembicaan dalam buku ini hanya mengenai evaluasi hasil belajar saja, tampak
kurang komprehensif. Bab ini akan menjelaskan evaluasi yang kedua yaitu
evaluasi program.
1. Apakah Evaluasi Program Itu?
Evaluasi merupakan suatu kegiatan yang bertujuan untuk menentukan
apakah target progam yang disusun sudah tercapai dengan begitu maka akan
diketahui bagaimana kualitas mengajar seorang guru apakah sudah efektif
atau belum berdasarkan tingkat pencapaian yang sudah dicapai.
a. Program adalah rencana
b. Program adalah kegiatan yang direncakan dengan seksama. Dalam
pembicaran ini yang dimaksudkan adalah pengertian
Dari sedikit uraian tersebut dapat ditangkap bahwa sesuatu kegian
yang peru direncanakan apabila kegiatan yang bersangkutan memang
dipandang penting sehingga apabila tidak direncanakan secara masak-masak
boleh jadi akan menjumpai kesulitan atau hambatan. Seperti sebuah keluarga
yang akan mengadakan peralatan pernikahan. Tentu tidak lancer. Sesudah
selesai pelaksanaan biasnya juga mengadakan evaluasi. Mungkin evaluasi
tersebut tidak melalui prosedur yang sistematis dan mungkin juga tidak
seketika barangkali pada waktu penyelenggaraan peralatan pernikahan lagi
baru mengingat-ingat dahulu pada waktu pelaksanaan dulu kurangnya apa.
Evaluasi progam merupakan suatu rangkaian kegiatan yang dilakukan
dengan sengaja untuk melihat tingkat keberhasilan progam. Untuk
menentukan seberapa jauh target progam sudah tercapai, yang dijadikan tolak
ukur adalah tujuan yang sudah dirumuskan dalam tahap perencanaan
kegiatan.
Pentingnya evaluasi progam yaitu agar guru mengetahui betul apa
yang terjadi di dalam proses belajar-mengajar, guru berkepentingan atas
kualitas pengajaran. Untuk memperbaiki proses pengajaran yang akan
dilaksanakan lain waktu, guru perlu mengetahui seberapa tinggi tingkat
pencapaian dari tugas yang telah dikerjakan selama kurun waktu tertentu.
Ada emppat macam kebijaksanan lanjutan yang mungkin diambil
setelah evaluasi program dilakukan yaitu:
a. kegiatan tersebut dilanjutkan karena dari data yang terkumpul diketahui
bahwa program ini sangat bermanfaat dan dpat dilaksanakan denan
lancer tanpa hambatan sehingga kualitas pencapaian tujuannya tinggi
b. kegiatan tersebut dilanjukan, dengan penyempurnaan karena dari data
yang terkumpul diketahui bahwa hasil program sangat bermanfaat tetapi
pelaksanaannya kurang, lancer atau kualitas pencapaian tujuan kurang
tinggi
c. kegiatan tersebut dimodifikasi karena dari data yang terkumpul dapat
dikeahui kemampafaatan hasil program kurang tinggi sehingga perlu
disusun lagi perencanaan secara lebih baik. Dalam hal ini mungkin
tujuannya yang perlu diubah.
d. Kegiatan tersebut tidak dapat dilanjutkan (dengan kata lain dihentikan)
karena dari data terkumpul diketahui bwhwa hasil program kurang
bermanfaat ditambah lagi di dalam pelaksanaan sangat banyak hambatan.
2. Mengapa guru perlu melakukan evaluasi program
Guru adalah orang yang penting statusnya di dalam kegiatan belajar-mengajar
karena guru memegan tugs yang amat penting yaitu mengatur dan
mengemudikan bahtera kehidupan kelas. Bagaimana suasana kelas
berlangsung merupakan hasil dari kerja guru. Suasana kelas dapat hidup siswa
belajar tekun tetapi tidak merasa terkekakng atu sebaliknya suasana kelas
suram siswa belajar krang atau sebaliknya suasana suram siswa belajar kurang
semangat dan diliputi rasa tahut, itu semua sebagai akibat dari hasil pemikiran
mereka dan upaya guru..
Di dalam melaksanakan tugs yang penting “menciptakan suasana
kelas” tersebut berupaya sekuat tenaga agar keidupan kelas dapat berjalan
mulus. Siswa dapat belajar tanpa hambatan dan dapat menguasai
Untuk menjawab apa sebag guru melakukan evaluasi program terlebih
dahulu kita tahu tentang siapa saja yang dapat melakukan kegiatan evaluasi
program tersebut. Di dalam buku-buku yang membicarakan (evaluator) dalam
kegiatan program dapat orang-orang dari dalam (orang yangikut terlibat di
dalam kegiatan) dan dapat pula orang dari luar (orang yang tidak ikut terlibat
dalam kegiatan program)
Masing-masing jenis evaluator program, mengandung kelemaham
a. Evaluator dalam (interal evaluator) sangat memahami seluk beluk kegiatan
tetapi ada kemungkinan dapat dipengaruhi oelh keingin untuk dapat
dikatakan bahwa programnya berhasil. Dengan kata lain. Evaluator dalam
dapat diganggu oelh unsur subjektivitas jika hal itu terjadi, data yang
tekumpul kurang benar dan kurang akuran meskipun barangkali cukup
lengkap
b. Evaluator luar (external evaluator) mungkin menjumpai kesulitan dalam
memperoloeh data yang lengkap karena da hal-hal yang disembunyak oleh
para pleksna program. Namun karena evaluator tidak berkepentingan akan
nama baik program. Maka data yang terkumpul lebih objektif.
Berdasarkan atas klasifikasi evaluator tersebut. Maka di dalam
kegiatan belajar-mengajar guru dikategorikan sebagai evaluator dalam, guru
adalah pelaksanana sehingga mereka mengetahi beatul apa yang terjadi di
dalam proses belajr-mengajar. Guru berkepentingan atas kualitas pengajaran.
Untuk memperbaiki proses pengajaran yang akan dilaksanakan lain waktu.
Guru perlu megnetahui seberapa tinggi tingkat pencapaian dari tugas yang
telah dikerjakan selama kurun waktu tertentu.
3. Objek atau sasaran evaluasi progam.
Dalam melakukan evalusi program, apanya dari program yang dievaluasi?
Dengan kata lain, apakah sasaran evalusai progam> untuk dapat mengenal
sasaaran evalusi secara cermat, kita perlu memusatkan perhatian kita pada
aspek-aspek yang bersangkut paut dengan keseluruhan kegiatan belajar-
mengejar. Untuk itu ada baiknya kita mengenal kembali model transformasi
proses pendidikan formal di sekoplah. Di dalam proses transformasi, siswa
yang baru masuk mengikuti proses pendidikan dipandang sebagai bahawn
mentah yang akan diolah (ditransformasikan diubah dari bahan mentah jadi
bahan jadi) melalui proses pengajaran. Siswa yang baru masuk (input)) ini
memiliki karakteristik atau kekhususan sendiri-sendiri yang banyak
mempengaruhi dalam keberhaslilan siswa , yaitu masukan lain yang juga
berpengaruh dalam keberhasilan belajar siswa yaitu masukan instrumental dan
masukan lingkungan. Yang dapat dimasukan sebagai masukan instrumental
adlaah materi/kurikulum guru metode mengajar dan sranana pendidikan
Pada gambar berikut ini disajikan sebuah bagan yang menunjukan hubungan
antara komponmen masukan mentah, saran pemroses dan keluaran yang sudah
selesai di proses.
Gambar proses transformasi belajar mengajar
Setelah digambarkan dalam bentuk bagan seperti disajikandiatas tampak jelas dan
rinci apa-apa yang mungkin mempengaruhi tingakt hsil belajar siswa. Marilah kita
teliti satu persatu.
a. Input(masukan)
Siswa adalah subjek yang meneima pelajaran. Ada siswa pandai, kurang
pandai, dan tidak pandai. Setiap siswa mempunyai bakat intelektual
emosional social dan lain-lain yang sifatnya khussu. Guru harus mammpu
mengenal kekhususan siswanya agar mampu memberikan pelayanan.
Pendidikan dan administrative secara tepat. Pelayanan pendidikan berupa
pemberian remedial dan sebagainya. Pelayanan administrasi juga harus
disesuaikan dengan jenis kemampunaya. Kepada siswa yang hanya
mempunya kemampuan intelektual rendah, disediakn perlekapann sarana
belajar yang dapat mendukung penginkatan prestasi. Sbaliknya siswa
mempunyai pembawewan menonjol juga sediakan sarana caranggih agar
bakat yang dimiliiki tersebut dapat berkembang secar maksimal.
Aspek-aspek yang ada pada siswa tersebut perlu dipertimbangka
oleh pengelola sekolah baik secar garis besar hal hal yang ada pada siswa
dan berpengaruh terhadap keberhalislan belajar dapat dilihat dari segi fisik
dan mental.
b. Materi atau kurikulum.
Di Indonesia kurikulum berlaku secara nasional karena kita menganut system
sentralisasi. Di Negara lain seperti amerika serikat. Kurikulum sekolah
disusun sendiri oleh dan berlaku untuk sesuatu Negara bagian yang
bersangkutan karena mereka menganut system disentralisasi. Seperti yang
tertulis di dalam administrasi kurikulum. Di Indonesia ini kurulum disusun
bersama oleh direktorat yang mengeloa jenjang dan jenis suatu sekolah
bersama dengan pusat pengembangan kurikulum dan sarana pendidikan
Apa sebab pusbangkurrandik mengkoordinasikan menyusun dan
mengembangkan kurikulum semua jenjang dan jenis sekolah? Jika kita ingat
bahwa tugas balitbang sebagai lembaga adalah melakukan penelitian dan
pengembangan hal hal yang berkaitan dengan pendidikan di seluurh Negara,
melakukan evalusi program terhadap semua pelakasaan pendidikan. Jika
lingkup dan wilayah yang dievaluasi sendiri. Maka lingkup dan wilayah yang
dievalusi oelh balitbang dikbud meliputi berbagai jenis kegiatan pendidikan
di Departemen Pendidikan dan Kebudayaan. Dari kegiatan evaluasi inilah
balitbang mempunyai data yang lengkap tentang tingkat keberhasilan tiap
kegiatan pendidikan
Meskipun penyusunan dan pengembangan kurikulum sekolah sudah
dilakukan secara cermat dan melibatkan banyak pihak, namun tidak mustahil
bahwa di lapangan masih juga dijumpai kelemaan dan hambatan. Wilayah
Indonesia yang sedemikian luas mengandung keragaman yang tida seditik.
Itulah sebabnya guru perlu dibekaili dengan kemampuan untuk melakukan
evaluasi program, termasuk mengevaluasi materi kurikulum. Sasaran yang
perlu dievaluasi dari komponen kurikulum HIT. Antara lain. Keelasan
pedoman untuk dipahami, kejelasan materi yang tercantum di dalam GBPP.
Urutan materi, kesesuaian antra sumber yang disarankan dengan materi
kurikulum dan sebaginya.
Apabila guru tidak tanggap terhadap kelemahan yanga dal dalam kurikulum
dan guru tak mau mengutarakan apa yang mereka jumpai bagaiman balitbang
dan ditdikdas tahu bahwa kurikulum yang dikeluarkan tidak lancer
dilaksanakandi sekolah? Nah itulah tambahan alasan mengapa evaluasi
lingkup sempit terhadap kurikulum yang dilaksanakan.
c. Guru.
guru merupakan komponen penting dalam kegiatan belajar-mengajar kepad
guru diserahkan untuk digarap suatu masukan bahan mentah berupa siswa
yang mengingnkan pengetahuan keterampilan dan sikap sikap yang baik yang
akan digunakan oleh mereka untuk menghadapi masa depan dalam
kehidupannya
guru adalah orang yang diberi kepercayaan untuk menciptakan
suasana kelas seperti telah diceritakan diatas. Behasil? Belum tentu mengapa?
Karena guru adalah manusia apakah usaha guru selalu mempunyai kelemahan
bersumber dari fisik dan mental. Hal-hal yang berhubungan denganfisik juga
siswa, antara lain kesehatan, kekebalan dan kerentatan. Hal-hal yang
berhubungan dengan mental antra lain kepandaian, kesabaran tangung jawab
keramah tamahan dan sebagainya.
Apakah dapat dilakukan oleh pengelola dalam memberikan pelayanan
administrative kepada guru? Banyak jika dapat diketahui kebiasan guru dalam
bekerja misalnya dalam mengajar suka OHP, mengajak mengamati barang-
barang yang ada di luar kelas (sekolah), atau suka bekerja tanpa gangguna di
ruang kelas dan lain sebagainya. Maka pengelola berusaha melengkapi sarana
pendudkunya, pemenuhan terhadap kebutuhan psikologis guru berupa antra
lain menyediakantempat bekerja yang nyaman sehingga mereka dapat bekerja
dengan tenang. Akibat selanjutnya mengena pada prestasi belajar siswa yang
optimal
d. Metode atau pendekatan dalam mengajar.
Berbeda denga evaluasi terhadap kurikulum, evaluasi terhadap metode
mengajar merupakan kegiatan guru untuk meninjau kembali tentang metode
mengajar, pendekatan atau strategi pembelajaran yang digunakan oleh guru di
dalam menyampaikan materi kurikulum kepada siswa. Dari perkuliahan lain
kita tahu bahwa yang dimaksud dengan metode mengajar adalah cara-cara
atau teknik yang digunakan dalam mengajar, misalnya ceramah, Tanya jawab
diskusi sosiodrama, demonstrasi eksperimen dan sebagainya. Strategii
pembelajaran menunjuk kepada bagaimana guru mengatur keseluruhan proses
belajar mengajar, meliputi, mengatur waktu, pemenggalan penyajian,
pemilihan metode, pemilihan pendekatan, dan sebagainya. Dengan pengertian
ini maka di dalam memikirkan strategi, sekaligus guru memikirkan metode
dan pendekatan juga.
Di dalam melaksanakan pengajaran, tidak mustahil bahwa guru
menjumpai kesulitan di tengah-tengah waktu mengajar, disebabkan karena
ketidak tepatan dalam memilih metode atau pendekatan yang dimaksud
dengan metode mengajar adalah cara-cara untuk menyampaikan materi
kepada siswa. Sebagai contoh metode adalah ceramah, diskusi Tanya jawab
dan penugasan. Pendekatan lebih banyak menunjuk pada strategi guru untuk
mengatur jalanna proses pembelajaran, misalnya pendekatan individual,
kelompok kecil atau klasikal. Termasuk dalam pemikiran pendekatan adalah
penggaalnan waktu di dalam penyampaian materi pelajaran.
Telah disebutkan bahwa di dalam melaksanakan kegiatan belajar
mengajar ungkin saja guru menjumpai kesulitan, sehubungan dengan keadaan
siswa. Dalam rencana, guru memilih metode tugas karena dipandang paling
tepat. Siswa diatur agar bekerja dalam kelompok. Namun di tengah-tengah
kesibukan, terasa oleh guru bahwa pemilihan metode dan pendekatan tersebut
ternyata kurang tepat. Apa sebab guru tidak disadari sebetulnya guru sudah
melakukan evaluasi tehadap kegiatnya. Evaluasi program dapat dilakukan
selam dansesuddah program berlangsung. Agar dapat melakukan selama dan
sesudah program berlangsung. Agar pekerjaan guru dari tahun ke tahun
bertambah baik, maka mereka harus dapat memanfaatkan dat yang mereka
peroleh. Disarankan kepada para guru agar tidak henti-hentinya membuat
catatan-catatan kecil pada GBPP tentang metode apa. Pendekatan danstrategi
yang bagaiman yang cocok untuk digunakan dalam penyampaian pokok
bahasan yang bersangkutan.