Anda di halaman 1dari 180

TUGAS

DASAR-DASAR EVALUASI PENDIDIKAN

Dosen Pembimbing : Mastur Toyib, Drs, MM.MPd

PENYUSUN :

1. Aidah
2. Alia Rosna Arlaeli
3. Dewi Purnama Sari
4. Dewi Maharani
5. Lilis Lisnawati
6. Santi Susanti

DIV Kebidanan Bhakti Pertiwi Indonesia

Tahun 2015
BAB I PENDAHULUAN

1. Pengertian Pengukuran, Penilaian dan Evaluasi

Memang tidak semua orang menyadari bahwa setiap saat kita selalu
melakukan pekerjaan evaluasi. Dalam beberapa kegiatan sehari-hari, kita
jelas-jelas mengadakan pengukuran dan penilaian.
Dari dua kalimat diatas kita sudah menemui tiga buah istilah, yaitu
evaluasi, pengukuran, dan penilaian. Sementara orang memang lebih
cenderung mengartikan ketiga kata tersebut sebagai suatu pengertian yang
sama sehingga dalam penggunaannya hanya tergantung dari kata mana
yang siap untuk diucapkan dan sementara orang yang lainnya
membedakan ketiga istilah tersebut. Dan untuk memahami apa persamaan,
perbedaan ataupun hubungan antara ketiganya, dapat dipahami melalui
contoh-contoh di bawah ini :
a. Apabila ada orang yang akan memberi sebatang pensil kepada kita
dan kita disuruh memilih antara dua pensil yang tidak sama
panjangnya maka tentu saja kita akan memilih yang “panjang” kita
tidak akan memilih yang “pendek” kecuali ada alasan yang sangat
khusus.
b. Pasar merupakan suatu tempat bertemunya orang-orang yang akan
menjual dan membeli. Sebelum menentukan barang yang akan
dibeli. Seorang pembeli akan memilih dahulu mana barang yang
lebih “baik” menurut ukurannya. Apabila ia ingin membeli jeruk,
dipilihnya jeruk yang besar, kuning dan kulitnya halus. Semuanya
itu dipertimbangkan karena menurut pengalaman sebelumnya, jenis
jeruk-jeruk yang demikian ini rasanya akan manis, sedangkan jeruk
yang masih kecil, hijau dan kulitnya agak kasar, biasanya masam
rasanya.
Dari contoh-contoh diatas ini dapat kita simpulkan bahwa sebelum
menentukan pilihan, kita melakukan penilaian terhadap benda-benda yang
akan kita pilih. Pada contoh pertama kita memilih nama pensil yang lebih
panjang, sedangkan contoh kedua kita menentukan dengan pikiran kita
atas jeruk yang baik, yaitu rasanya yang manis.
Untuk dapat mengadakan penilaian, kita melakukan pengukuran
terlebih dahulu. Jika ada penggaris, maka sebelum menentukan mana
pensil yang lebih panjang, kita ukur dahulu kedua pensil tersebut, dan
setelah mengetahui berapa panjang masing-masing pensil itu, kita
melakukan penilaian dengan melihat bandingan panjang antara kedua
pensil tersebut. Dapatkah kita menyatakan “ini pensil panjang, dan ini
pensil “pendek”. Maka pensil yang panjang itulah yang kita ambil.
Untuk menentukan penilaian mana jeruk yang manis, kita tiidak
menggunakan “ukuran manis”, tetapi menggunakan ukuran besar, kuning
dan halus kulitnya. Ukuran ini tidak mempunya wujud seperti kayu
penggaris yang sudah ditera, tetapi diperoleh berdasarkan pengalaman.
Sebenarnya kita juga mengukur, yakni membandingkan jeruk-jeruk
yang ada dengan ukuran tertentu. Setelah itu kita menilai dan menentukan
pilihan, mana jeruk yang paling memenuhi ukuran itulah yang kita ambil.
Dengan demikian kita mengenal dua macam ukuran, yakni ukuran
yang terstandar (meter, kilogram, takaran dan sebagainya) dan ukuran
tidak standar (depa, jengkal, langkah dan sebaginya), dan ukuran perkiraan
berdasarkan hasil pengalaman (jeruk manis adalah yang kuning, besar dan
halus kulitnya)
Dua langkah kegiatan yang dilalui sebelum mengambil barang
untuk kita ituah yang disebut mengadakan evaluasi, yakni mengukur dan
menilai. Kita dapa mengadakan penilaian sebelum kita mengadakan
pengukuran.
 Mengukur adalah membandingkan sesuatu dengan satu ukuran.
Pengukuran bersifat kuantitatif
 Menilai adalah mengambil suatu keputusun terhadap suatu dengan
ukuran baik buruk. Penilaian bersifat kualitatif.
 Mengadakan evaluasi meliputi kedua langkah diatas, yakni
mengukur dan menilai.
Di dalam istilah asingnya, pengukuran adalah measurement,
sedangkan penilaian adalah evaluation. Dari kata evaluation inilah
diperoleh kata indonesia evaluasi yang berarti menilai (tetapi dilakukan
dengan mengukur terlebih dahulu). Dibuku ini ketiga istilah tersebut
digunakan bergantian tanpa mengubah makna.

2. Penilaian Pendidikan

Meskipun kini memiliki makna yang lebih luas, namun pada awalnya
pengertian evaluasi pendidikan selalu dikaitkan dengan prestasi belajar
siswa. Definisi yang pertama dikembangkan oleh Ralph Tyler (1950).
Ahli ini mengatakan bahwa evaluasi merupakan sebuah proses
pengumpulan data untuk menentukan sejauh mana, dalam hal apa, dan
bagian mana tujuan pendidikan sudah tercapai, jika belum, bagaimana
yang belum dan apa sebabnya. Definisi yang lebih luas dikemukakan oleh
dua orang ahli lain yakni Cronbach dan Stufflebeam. Tambahan definisi
tersebut adalah bahwa proses evaluasi bukan sekedar mengukur sejauh
mana tujuan tercapai, tetapi digunakan untuk membuat keputusan.

Yang dibahas dalam buku ini terutama adalah evaluasi pendidikan


dalam institusi pendidikan, tetapi mengkhususkan evaluasi hasil belajar.
Apabila disinggung sedikit tentang evaluasi hal-hal lain, tentu terkait
dengan prestasi atau hasil belajar, baik langsung maupun tidak.
Pembicaraan tentang evaluasi dalam lingkup yang lebih luas, disajikan
dalam buku lain, yaitu Evaluasi Program. Dalam buku tersebut dibahas
secara panjang lebar bagaimana gutu menelusuri terjadinya prestasi belajar
siswa melalui latar belakang serta faktor-faktor lain yang mungkin
memengaruhinya.

Dalam pembelajaran yang terjadi di sekolah atau khususnya di


kelas, guru adalah pihak yang paling bertanggung jawab atas hasilnya.
Dengan demikian guru patut dibekali dengan evaluasi sebagai ilmu yang
mendukung tugasnya, yakni mengevaluasi hasil belajar siswa. Dalam hal
ini guru bertugas mengukur apakah siswa sudah menguasai ilmu yang
dipelajari oleh siswa atas bimbingan guru sesuai dengan tujuan yang
dirumuskan.

Menurut pengertian lama, pencapaian tujuan pembelajaran yang


berupa prestasi belajar, merupakan hasil dari kegiatan belajar-mengajar
semata. Dengan kata lain, kualitas kegiatan belajar-mengajar adalah satu-
satunya faktor penentu bagi hasilnya. Pendapat seperti itu kini sudah tidak
berlaku lagi. Pembelajaran bukanlah satu-satunya faktor yang menentukan
prestasi belajar. Karena prestasi merupakan hasil kerja (ibarat sebuah
mesin) yang keadaanya sangat kompleks.

Apabila sekolah diumpamakan sebagai tempat mengolah sesuatu


dan calon siswa diumpamakan sebagai bahan mentah maka lulusan dari
sekolah itu dapat disamakan dengan hasil olahan yang sudah siap
digunakan. Dalam istilah inovasi yang menggunakan teknologi maka
tempat pengolah ini disebut transformasi.

Jika digambarkan dalam bentuk diagram akan dilihat sebagai


berikut :

 Input
Input adalah bahan mentah yang dimasukan ke dalam transformasi.
Dalam dunia sekolah maka yang dimaksud dengan bahan mentah
adalah calon siswa yang baru akan memasuki sekolah. Sebelum
memasuki suati tingkat sekolah (institusi), calon siswa itu dinilai
dahulu kemampuannya. Dengan penilaian itu ingin diketahui
apakah kelak ia akan mampu mengikuti pelajaran dan
melaksanakan tugas-tugas yang akan diberikan kepadanya.
 Output
Yang dimaksud sebagai output atau keluaran adalah bahan jadi
yang dihasilkan oleh transformasi. Yang dimaksud dalam
pembicaraan ini adalah siswa lulusan sekolah yang bersangkutan.
Untuk dapat menentukan apakah seoarang siswa berhak lulus atau
tidak, perlu diadakan kegiatan penilaian, sebagai alat penyaring
kualitas.

Input Transformasi Output

Umpan Balik

 Transformasi
Transformasi dapat diibaratkan sebagai sebuah mesin yang
berproses mengubah bahan mentah menjadi susuatu agar berada
dalam keadaan matang. Menurut kamus inggir-indonesia, kata
transform terdiri dari dua kata, trans (terjemahan-perubahan) dan
form (bentuk). Jadi trasformasi dalam pembelajaran diartikan
sebagai proses pergantian atau perubahan bentuk atau pengolahan
sesuatu agar berubah menjadi bentuk lain. Transformasi yang
sedang kita bicarakan ini adalah transformasi dalam arti umum
sebagaimana yang dipahami oleh umum yaitu pergantian bentuk
antara sebelum dan sesudah mengikuti kegiatan di sebuah lembaga
pendidikan. Siswa yang sedang belajar diumpamakan sesuatu yang
dimasukan ke dalam pemrosesan untuk diubah dari “belum tahu
atau belum dapat” agar menjadi”sudah tahu atau sudah dapat”.
Ketika siswa pertama masuk sekolah, keadaanya masih
“mentah” yang diubah atau diproses agar menjadi matang. Dalam
istilah transformasi bahan mentah yang akan diolah tersebut
dikenal sebagai “masukan” yang dalam bahasa inggrisnya disubut
input. Oleh karena keadaanya masih mentah, disebut “masukan
mentah” bahasa inggrisnya raw input. Sesudah diolah dan berubah
bentuk menjadi matang, lalu dikeluarkan dari alat transformasi,
disebut keluaran dalam bahasa inggris adalah output. Dalam
keseluruhan transformasi sebetulnya output saja belum
mencerminkan keluaran yang sesungguhnya. Ibarat dalam
kelulusan, nilai siswa baik semua, bahkan mungkin cumlaude
(lulus dengan pujian), tetapi masih diragukan, apakah nilai yang
bagus tersebut sudah mencerminkan kinerja yang bagus di
masyarakat atau tidak. Untuk contoh, nilai siswa lulusan sekolah
menengah kejuruan teknik otomotif semua 8 bahkan 9, tetapi
ketika diserahi sepeda motor rusak, tidak dapat menemukan apa
penyebabnya. Siswa ini outputnya baik, tetapi tidak dapat
menunjukan kemampuannya dalam praktek. Kemampuan
melaksanakan tugas di lapangan ini disebut keluaran nyata atau
outcome. Jadi harapan lembaga pendidikan, siswa bukan hanya
mempunyai output baik, tatapi outcomenya harus baik.

Dalam proses transformasi, selain siswa sebagai bahan yang


diolah, masih ada 2 (dua) masukan lain. Yang pertama berfungsi
membantu atau memperlancar terjadinya proses, sedangkan yang
kedua berupa lingkungan yang berpengaruh terhadap terjadinya
proses. Masukan-masukan lain tersebut juga disebut input, tetapi
berbeda peran,. Agar tidak kacau dalam mengartikan, karena
statusnya berbeda, namanya pun berbeda.

a. Siswa yang akan diubah dalam proses, yang akan diubah


dari mentah menjadi matang disebut “masukan mentah”
yang dalam bahasa inggris disebut “raw input”
b. Masukan pendukung terjadinya proses ini disebut masukan
instrumental. Faktor-faktor yang masuk dalam masukan
instrumental ada 4 (emapat) yaitu (1)guru, (2)materi,
(3)sarana pendidikan dan (4)pengelolaan manajemen atau
pengaturan. Keempat masukan tersebut karena fungsinya
membantu atau sebagai alat, disebutk” masukan
instrumental” atau masukan pembantu dalam bahasa inggris
disebut Instrumental input.
c. Masukan lain lagi adalah lingkungan, baik berupa benda,
alam, maupun manusia. Masukan lingkungan ini dalam
bahasa inggris disebut Environmental input.

Program Pemrosesan Pembelajaran

Guru Materi Sarana Pengelolaan

Siswa Proses Hasil

Proses

Pengertian riil dari transformasi sebenarnya bukan hanya


“pengolahan” peserta didik dari masuk sampai lulus, tetapi
meliputi semua bentuk proses, mulai dari proses yang paling
sempit dan singkat, yaitu proses pembelajaran di kelas, di
laboratorium atau di tempat praktik selama satu penggalan jam
pelajaran atau penggalan waktu tertentu. Di dalam proses
pembelajaran di kelas atau di tempat lain, guru, instruktur atau
apapun namanya. Bertugas membimbing peserta didik yang sedang
belajar. Mereka melakukan usaha mengubah bentuk subjek yang di
bimbing agar menjadi sebagaimana diinginkan, yaitu mencapai
tujuan pembelajaran. Setiap guru atau instruktur harus memahami
peranyang penting tersebut. Jika ilmu pengetahuan atau
kemampuan peserta didik sesudah keluar dari kelas attau
laboratorium masih sama dengan ketika masuk (sebelum memulai
kegiatan) ini artinya mutu peserta didik masih sama dengan
semula, tidak mengalami perubahan. Guru kelas atau guru
pembimbing laboratorium harus merasa bersalah jika peserta didik
tidak mengalami perubahan, bahkan harus merasa berdosa karena
sudah menahan peserta didik berlama-lama di kelas atau di
laboratorium tetapi kemampuannya sama dengan ketika masuk.
Ketika lulus dari sekolah, siswa dipandang sudah “matang”
karena sudah memiliki pengetahuan, keterampilan dan sikap-sikap
tertentu yang diperoleh ketika mengikuti pelajaran di sekolah.
Dengan mengingat bahwa yang terlibat dalam proses transformasi,
yaitu pengubahan bentuk dari mentah menjadi matang, terdapat
banyak faktor yang mengetahui, maka mutu atau tingkat
kematangan aspek-aspek yang digarap dalam transformasi sangat
tergantung dari kinerja setiap faktor yang memengaruhi tersebut.
Sebagai pemikiran logis dari uraian tersebut, maka dalam
mengadakan penilaian terhadap tingkat keberhasilan pembelajaran,
guru atau instruktur harus selalu menyadari dan bermaksud
mencapai tujuan pembelajaran, yaitu mengubah mutu peserta didik
seperti yang diharapkan, mestinya, guru yang menyaksikan ketika
siswa keluar dari kelas tidak terjadi perubahan dibandingkan ketika
masuk merasa sedih, karena tidak berhasil mengubah masukan
mentah menjadi matang. Setiap guru yang sedang dan sudah
terlibat dalam proses transformasi harus menyadari, jika mutu
transformasi dalam satu pertemuan itu baik, ramgkaian proses
transformasi tentu juga baik, kemudian pada akhir pendidikan akan
terkumpul proses transformasi yang baik.
Untuk lebih jelasnya, perlu kita sepakati pengertian
penilaian pendidikan yaitu suatu upaya untuk mengetahui seberapa
tinggi tingkat keberhasilan kegiatan pendidikan, dengan maksud
untuk mengetahui peran masing-masing input. Oleh karena
masing-masing sudah ditentukan bagaimana kondisi harapanya,
maka dalam mengevaluasi diharapkan agar evaluasi dapat berperan
aktif memperbaiki mutu pendidikan, marilah kita cermati masing-
masing.
a. Masukan Mentah (Raw Input)
Meskipun masukan instrumental penting sekali kedudukannya
sebagai penentu mutu keberhasilan keluaran, aka tetapi
masukan mentah itu sendiri berperan sangat penting dan
menentukan. Dalam kegiatan kegiatan penilaian ingin
mengetahui aoakah ketika mengikuti proses transformasi
mereka bersungguh-sungguh dan aktif berfikir sehingga setelah
selesai mengikuti proses transformasi, masukan tersebut sudah
berubah menjadi keluaran yang berbeda dari semula, dalam arti
kondisinya lebih baik dan sesuai dengan tujuan yang ditetakan.
b. Masukan instrumental (instrumental Input)
Dalam penilaian, penilaian ingin mengetahui apakah unsur-
unsur yang ada dalam masukan tersebut sudah berfungsi
sebagaimana yang seharusnya oleh karena ada beberapa unsur
dalam masukan instrumental, yaitu guru, meteri kurikulum,
sarana pendidikan, dan pengelolaan, maka dalam penilaian
perlu dicermati kinerja masing-masing unsur tersebut. Penilaian
harus dilakukanterhadap masing-masing faktor tersebut secara
rinci. Hasil dari penilaian rinci tersebut didasarkan atas kondisi
yang diharapkan, artinya yang baik untuk masing-masing
bagian dari faktor faktor itu. Untuk kondisi guru yang
diharapakan, sudah ada pedoman dari kementrian pendidikan
nasional yang dikenal dengan persyaratan guru profesional.
Ada sepuluh persyaratan guru profesional yaitu : (1) menguasai
materi yang diajarkan, (2) menguasai teori pendidikan, (3)
dapat menguasai pengelolaan kelas, (4) menguasai interaksi
belajar mengajar, (5) mampu memilih dan menggunakan
metode mengajar, (6) mampu memilih dan menggunakan alat
pelajaran, media pembelajaran, dan alat peraga. (7) mampu
melaksanakan evaluasi hasil belajar, (8) mampu melaksanakan
bimbingan dan konseling, no 9 dan 10 belum ada.
1. Masukan Guru
Penilaian terhadap masukan guru dilakukan untuk
mengetahui apakah kinerja guru ketika menyajikan materi
di kelas atau di laboratorium sudah baik, artinya
menggunakan metode yang tepat, penjelasan yang diberikan
kepada siswa. Apakah guru dapat menguasai kelas dengan
baik, artinya, mana siswa yang memperhatikan dan mana
yang tidak, apakakah guru memberikan bimbingan ulang
kepada siswa yang belum mengerti, dan sebagainya.
Dengan kata lain. Dalam menilai masukan guru, penilai
ingin mengetahui apakah guru tersebut sudah berperan
dengan benar dalam membantu siswa yang sedang belajar,
yaitu mengubah dirinya dari masukan mentah menjadi suatu
yang sedang mengarah pada terjadinya keluaran yang
bermutu.
2. Masukan Materi Kurikulum
Dalam menilai masukan materi kurikulum, penilai
bermaksud mengetahui apakah materi kurikulum yang
diberikan kepada siswa cukup lengkap, sesuai dengan
tingkat kematangan siswa dan kebutuhan peserta didik
ketika hidup di masyarakat, apakah urutan materi kurikulum
sudah baik sehingga tidak loncat-loncat ketika disajikan dan
sebagainya.
3. Masukan Sarana dan Prasarana
Dalam menilai masukan sarana dan prasarana, penilai
bermaksud mengetahui apakah sarana dan prasarana yang
memang dibutuhkan untuk mendukung terselenggaranya
proses pembelajaran sudah tersedia dengan lengkap dan
sudah siap digunakan, apakah mutu atau kualitas sarana
atau peralatan yang ada cukup memadai, dalam arti
meningkatkan mutu pembelajaran jika dibandingkan
dengan tanpa peralatan, apakah sarana atau peralatan yang
tersedia sudah dapat dimanfaatkan dengan baik, melibatkan
siswa sehingga siswa menjadi aktif, dan pertanyaan yang
relevan lainnya.
4. Masukan Pengelolaan
Dalam menilai masukan pengelolaan, penilai bermaksud
mengetahui apakah pengelolaan yang mendukung
pembelajaran sudah baik, misalnya jadwal pelajaran yang
disusun oleh pengelola sudah tepat, penugasan atau
penunnjukan guru yang bertugas sudah sesuai dengan
keahlian atau latar belakang pendidikan personil yang
bersangkutan dan sebagainya.

c. Masukan Lingkungan (Environmental Input)


Dalam kegiatan penilaian, penilai ingin mengetahui apakah hal-
hal yang merupakan unsur dalam lingkungan yang berpengaruh
terhadap proses pembelajaran sudah berfungsi dengan baik atau
belum. Berbicara tentang lingkungan yang berpengaruh
terhadap pembelajaran, kita dapat memisahkan atas tiga lingkup
lingkungan yang langsung mengarah pada siswa. Tiga lingkup
dimaksud dapat dipisahkan menjadi lingkungan fisik (non
manusia) dan beberapa manusia adalah sebagai berikut.
1) Lingkungan di dalam keluarga
Dalam melakukan penilaian, penilai bermaksud mengetahi
apakah siswa di rumah disediakan tempat belajar yang
nyaman, dengan keluasan ruang, penerangan dan ventilasi
yang cukup, apakah waktu belajar tidak terganggu dengan
kegiatan lain di rumah, apakah buku-buku yang diperlukan
oleh siswa disediakan oleh orang tua dan lain sebagainya.
Yang berupa manusia, apakah ada ayah, ibu, kakak, paman
atau saudara yang dapat memberikan bantuan kepada siswa
ketika sedang belajar? Apakah lingkungan keluarga cukup
nyaman, keadaan tentram sehingga memungkinkan siswa
dapat belajar dengan tenang dan tenteram.
2) Lingkungan di sekolah
Dalam melakukan penilaian, penilai bermaksud mengetahui
apakah ruang-ruang kelas yang ada di sekolah tersedia
dengan baik untuk kepentingan belajar siswa, dalam arti
kondisi ruangan nyaman, tenang, bersih sehingga
memberikan suasana belajar yang menyenangkan. Yang
berbentuk manusia, apakah guru kelas (guru mata
pelajaran), atau guru lain, serta kepala sekolah, dapat
memberikan bantuan kepada siswa ketika mereka memang
memerlukan ? ketika siswa menjumpai kesulitan, apakah
ada orang membantu?
3) Lingkungan bermain dan bergaul di masyarakat
dalam melakukan penilaian, penilai bermaksud untuk
mengetahui apakah di sekitar rumah siswa, di tempat
bermainm di tempat bergaul dengan teman, atau di tempat
yang sering dikunjungi ada sarana yang dapat mendukung
keberhasilan belajar, misalnya air terjun, gunung gamping,
kebun bibit, jembatan timbang, jembatan baley, hutan, dan
lain-lain, baik bersifat alami maupun buatan manusia, yang
dapat membantu menambah wawasan siswa dalam belajar.
Disamping benda-benda atau alam yang mendukung
keberhasilan belajar, lingkungan di luar sekolah dan rumah
diharapkan ada juga lingkungan manusiam antara lain
pejabat setempat, teman belajar kelompok, teman aktif di
masjid atau gereja, teman kelompok seni, olahraga dan lain-
lain kegiatan.
Apabila guru sudah selesai melakukan penilaian atau
evaluasi terhadap transformasi, dan memperoleh data yang
lengkap dari berbagai masukan, secara tidak langsung guru
yang bersangkutan tahu unsur mana dari masukan-masukan,
secara tidak langsung guru yang bersangkutan tahu unsur
mana dari masukan-masukan tersebut, yang belum
berfungsi sebagaimana yang telah direncanakan semula.
Harapannya, sesudah semua unsur dalam masukan
direncana dengan baik dan berjalan sesuai dengan rencana,
pasti proses pembelajaran dapat berjalan dengan baik, pasti
hasil belajar siswa pun akan baik. Dalam proses
transformasi, data yang terkumpul dari kegiatan evaluasi
atau penilaian tersebut dikenal dengan nama yang lebih
umum, yaitu balikan atau umpan balik. Yaitu suatu yang
berfungsi memberikan gambaran tentang hal-hal yang
sudah dan sedang dikerjakan. Dengan adanya balikan maka
guru dapat mengetahui dengan pasti, apa kelemahan dari
kegiatan yang telah dilakukan.
Cara-cara yang digunakan oleh guru dapat bermacam-
macam, antara lain yang sudah banyak diperoleh dari
pengalaman adalah melalui tes tertulis atau lisan. Dengan
hadirnya kebijakan kurikulum berbasis kompetensi (KBK)
yang mengarahkan pembelajaran pada kepemilikan
kompetensi yang lengkap pada diri siswa, maka guru dapat
melakukan bermacam-macam cara penilaian, karena
sasaran atau objek yang dinilai juga bemacam-macam.
Penjelasan lebih lanjut tentang hal ini disampaikan pada
bab-bab lain.
 Umpan balik (feedback)
Yang dimaksud sebagai umpan balik atau balikan adalah
segala informasi baik yang menyangkut output maupun
transformasi. Umpan balik ini diperlukan sekalu untuk
memperbaiki input maupun transformasi. Lulusan yang
kurang bermutu atau yang belum memenuhi harapan, akan
menggugah semua pihak untuk mengambil tindakan yang
berhubungan dengan penyebab kurang bermutunya
lulusan.
Penyebab-penyebab tersebut antara lain :
a. Input yang kurang baik kualitasnya
b. Guru dan personal yang kurang tepat
c. Materi tidak atau kurang cocok
d. Metode mengajar dan sistem evaluasi yang kurang
memadai
e. Kurangnya sarana penunnjang
f. Sistem administrasi yang kurang tepat.
Oleh karena itu, penilaian di sekolah meliputi
banyak segi, yang secara garis besar dilihat dari calon
siswa, lulusan dan proses pendidikan secara menyeluruh.

3. Mengapa Menilai

Jika seblum membeli jeruk kita tidak memilih dahulu mana jeruk yang
baik dibandingkan dengan yang kurang baik, maka akan memperoleh
jeruk seadanya.
Mungkin baik, tetapi juga kemungkinan tidak baik. Yang jelas kita
belum tentu memperoleh jeruk yang berkualitas baik jika tidak didahului
dengan kegiatan menilai.

Dalam dunia pendidikan, khususnya dunia persekolahan, penilaian


mempunya makna ditinjau dari berbagai segi.

a. Makna bagi Siswa


Dengan diadakanya penilaian, maka siswa dapat mengetahui sejauh
mana telah berhasil mengikuti pelajaran yang diberikan oleh guru.
Hasil yang diperoleh siswa dari pekerjaan menilai ini ada 2 (dua)
kemungkinan.
1) Memuaskan
Jika siswa memperoleh hasil yang memuaskan dan hal itu
menyenangkan, tentu kepuasan itu ingin diperolehnya lagi pada
kesempatan lain waktu. Akibatnya, siswa akan mempunyai
motivasi yang cukup besar untuk belajar lebih giat, agar lain
kali mendapat hasil yang lebih memuaskan lagi. Keadaan
sebaliknya dapat terjadi, yakni siswa sudah merasa puas dengan
hasil yang diperoleh dan usahanya kurang gigih untuk lain kali.
2) Tidak Memuaskan
Jika siswa puas dengan hasil yang diperoleh, ia akan berusaha
agar lain kali keadaan itu tidak terulang lagi. Maka ia akan
belajar lebih giat. Namun demikian, keadaan sebaliknya dapat
terjadi. Ada beberapa siswa yang lemah kemauannya, akan
menjadi putus asa dengan hasil kurang memuaskan yang
diterimanya.
b. Makna bagi guru
1) Dengan hasil penilaian yang diperoleh, guru akan dapat
mengetahui siswa mana yang bisa melanjutkan pelajarannya
karena sudah berhasil menguasai materi, maupun siswa-siswa
yang belum berhasil menguasai mater. Dengan petunjuk ini
guru dapat lebih memusatkan perhatiannya kepada siswa-siswa
yang belum berhasil. Apalagi jika guru tahu akan sebab-
sebabnya, ia akan memberikan perhatian yang memusat dan
memberikan perlakuan yang lebih teliti sehingga keberhasilan
selanjutnya dapat diharapkan.
2) Guru akan mengetahui apakah materi yang diajarkan sudah
tepat bagi siswa sehingga untuk memberikan pelajaran di waktu
yang akan datang tidak perlu diadakan perubahan.
3) Guru akan mengetahui apakah metode yang digunakan sudah
tepat atau belum. Jia sebaian besar dari siswa memperoleh nilai
jelek pada penilaian yang diadakan, mungkin hal ini disebabkan
oleh pendekatan atau metode yang kurang tepat. Apabila
demikian halnya, maka guru harus mawas diri dan mencoba
mencari metode lain dalam belajar.
c. Makna bagi sekolah
1) Apabila guru-guru mengadakan penilaian dan diketahui
bagaimana hasil belajar siswa-siswanya, dapat diketahui pula
apakah kondisi belajr yang diciptakan oleh sekolah sudah
sesuai dengan harapan atau belum. Hasil belajar merupakan
cermin kualitas suatu sekolah.
2) Informasi dari guru tentang tepat tidaknya kurikulum untuk
sekolah itu dapat menjadi bahan pertimbangan bagi
perencanaan sekolah untuk masa-masa yang akan datang.
3) Informasi hasil penilaian yang diperoleh dari tahun ke tahun,
dapat digunakan sebagai pedoman bagi sekolah. Apakah yang
dilakukan oleh sekolah sudah memenuhi standar atau belum.
Pemenuhan standar akan terlihat dari bagusnya angka-angka
yang diperoleh siswa.
Secara rinci dan sesuai dengan urutan kejadiannya, dalam proses
transformasi ini penilaian dibedakan atas tiga jenis, yakni sebelum, selama,
dan sesudah terjadi proses dalam kegiatan sekolah. Dalam hal ini para
pelaksana pendidikan selalu berorientasi pada tujuan yang akan dicapai
dan tujuannya selalu diarahkan pada siswa secara perseorangan
(individual) maupun secara kelompok (perkelas atau per angkatan).
Sehubungan dengan perincian ini, yang bisa dilakukan oleh
pendidik adalah mengajukan pertanyaan-pertanyaan sebagai satu ungkapan
penilaian yang akan dicari jawabannya.

Sebelum Kegiatan Belajar


Sebelum guru memulai dengan memberikan pelajaran di awal tahun,
pertanyaan yang dilontarkan adalah :
1. “apakah yang akan dicapai oleh siswa, melalui pelajaran saya ini”
2. “Untuk mengarah ke pencapaian tujuan, apakah siswa sudah
mempunya bekal berupa kemampuan ataupun sebagian dari yang akan
dicapai sehingga guru tidak perlu memberikan bahan seluruhnya?”
a. “Bagaimana kemampuan siswa secara individual dan siapa saja
yang sudah menguasai sebagian tujuan, serta seberapa?”
b. “Bagaiman kemampuan kelompok siswa yang diajar secara
umum?”(tinjauan kelompok).
Selama Kegiatan Belajar
yang dimaksud dengan “selama kegiatan belajar” adalah satu jarak waktu
mulai pengajaran berlangsung hingga saat berakhirnya pemberian
pengajaran oleh guru. Jarak waktu dapat dilihat dalam satu satuan waktu
pendek, yakni satu pertemuan atau satu satuan waktu panjang, seperti satu
smester. Selama satu penggalan waktu tersebut guru harus secara terus-
menerus mengajukan beberapa pertanyaan :
1. “Apakah yang dicapai oleh siswa melalui pelajaran saya ini?”
(pertanyaan ini selalu harus diingat agar menjiwai setiap langkah
kegiatannya)
2. “Apakah langkah yang saya ambil sudah benar, tidak salah langkah?”
menyangkut semua orang (kelompok) atau hanya beberapa individu
saja?”
Sesudah Kegiatan Belajar
Jika guru sudah selesai memberikan pelajaran (satu pertemuan atau satu
smester) ia mengajukan pertanyaan-pertanyaan sebagai berikut :
1. “dengan selesainya pelajaran saya ini, apakah tujuan yang dicapai oleh
siswa sudah tercapai?”
a. “Seberapa jauh pencapaian tiap siswa?”
b. “Berapa orang kah yang sudah mencapai?”
2. “Seandainya belum tercapai, bagian yang mana saja yang belum
tercapai?? (baik oleh individu maupun oleh kelompok).
3. “Seandainya belum tercapai, faktor-faktor apakah yang menyebabkan
?” (penghambat bagi individu maupun kelompok).
4. Tujuan dan Fungsi Penilai
Dengan mengetahi makna penilaian ditinjau dari berbagai segi dalam
sistem pendidikan. Maka dari itu beberapa tujuan atau fungsi penilaian,
yaitu :
a. Penilaian Berfungsi Selektif
1) Untuk memilih siswa yang dapat diterima di sekolah tertentu.
2) Untuk memilih siswa yang dapat naik kelas atau tingkat berikutnya.
3) Untuk memilih siswa yang seharusnya mendapat beasiswa.
4) Untuk memilih siswa yang sudah berhak meninggalkan sekolah,
dan sebagainya.
b. Penilaian Berfungsi Diagnostik
Apabila alat yang digunakan dalam penilaian cuckup memenuhi
persyaratan, maka dengan melihat hasilnya, guru akan mengetahui
kelemahan siswa. Di samping itu, diketahui pula penyebabnya. Jadi
dengan mengadakan penilaian, sebenarnya guru melakukan diagnosis
kepada siswa tentang kebaikan dan kelemahannya. Dengan
diketahuinya sebab-sebab kelemahan ini, akan lebih mudah mencari
cara untuk mengatasinya.
c. Penilaian Berfungsi sebagai Penempatan
Sistem baru yang kini banyak dipopulerkan di negara barat. Adalah
sistem belajar sendiri. Belajar sendiri dapat dilakukan dengan cara
mempelajari sebuah paket belajar, baik itu berbentuk modul maupun
paket belajar yang lain. Sebagai alasan dari timbulnya sistem ini
adalah adanya pengakuan yang besar terhadap kemampuan individual.
Setiap siswa sejak lahirnya telah membawa bakat sendiri-sendiri
sehingga pelajaran akan lebih efektif apabila disesuaikan dengan
pembawaan yang ada. Akan tetapi disebabkan karena keterbatasan
sarana dan tenaga, pendidikan yang bersifat individual kadang-kadang
sukar sekali dilaksanakan. Pendekatan yang lebih bersifat melayani
perbedaan kemampuan, adalah pengajaran secara kelompok. Untuk
dapat menentukan dengan pasti di kelompok mana seorang siswa harus
ditempatkan, digunakan satu penilaian. Sekelompok siswa yang
mempunyai hasil penilaian yang sama, akan berbeda dalam kelompok
yang sama dalam belajar.
d. Penilaian/Berfungsi sebagai pengukur keberhasilan
Fungsi keempat dari penilaian ini dimaksudkan untuk mengetahui
sejauh mana satu program berhasil diterapkan. Telah disinggung pada
bagian sebelum ini, keberhasilan program ditentukan oleh beberapa
faktor, yaitu faktor guru, metode mengajar, kurikulum, sarana, dan
sistem administrasi.
5. Ciri-Ciri Penilaian dalam Pendidikan
Apakah sebenarnya kepandaian itu? Seorang siswa yang pandai
matematika, tidak dapat dengan mudah dibedakan dari siswa lainnya,
hanya dengan melihat anak tersebut. Kita tidak dapat melihat siswa pandai
atau siswa bodoh. Kepandaian itu tidak dapat disaksikan dari luar.
Untuk dapat menentukan siswa mana yang lebih pandai dari yang
lain, maka bukan kepandaiannya yang diukur. Kita dapat mengukur
kepandaian dengan gejala yang tampak atau memancar dari kepandaianya,
salah satu contoh adalah bahwa anak yang pandai biasanya dapat
menyelesaikan soal-soal yang diberikan oleh guru.
Ciri-ciri penilaian dalam pendidikan, antara lain adalah sebagai
berikut.
a. Ciri Pertama dari penilaian dalam pendidikan, yaitu bahwa
penilaian dilakukan secara tidak langsung. Dalam contoh ini, akan
mengukur kepandaian melalui ukuran kemampuan menyelesaikan
soal-soal.
Sehubungan dengan tanda-tanda anak pandai atau intelegen,
seoarah ahli ilmu jiwa pendidikan bernama Carl Witherington,
mengememukakan pendapatnya sebagai berikut.
1) Kemapuan untuk bekerja dengan bilangan.
2) Kemampuan untuk mengunakan bahsa dengan baik.
3) Kemampuan untuk menangkap sesuatu yang baru (cepat
mengikuti pembicaraan orang lain)
4) Kemampuan untuk mengingat-ingat.
5) Kemampuan untuk memahami hubungan (termasuk menangkap
kelucuan)
6) Kemampuan untuk berfantasi
Dalam kenyataannya ada orang yang memiliki kemampuan umum
rata-rata tinggi, rata-rata rendah, dan ada yang memiliki
kemampuan khusus tinggi. Misalnya, kemampuan rata-rata rendah
tetapi kemampuan berfantasi tinggi dan menjadi seniman ulung.
Meskipun aspek-aspek intelegensi yang dikembangkan oleh carl
witherington tersebut masih berlaku, dalam arti masih ada yang
mengakui kebenarannya, namun ada penemuan yang lebih mutahir
yang dikemukan oleh David Lazear dalam bukunya Seven Ways
Of Teaching tentang aspek-aspek yang menunjukan tingkat
kecerdasan seseoarang. Memang ketika kita memahami teori yang
dikemukakan oleh Whiterington, kita merasakan kurang
lengkapnya bukti bahwa seseoarang menunnjukan kelebihan dalam
kecerdasan.
Menurut David Lazear 7 (tujuh) indikator atau aspek yang
dikategorikan sebagai petunjuk tentang tinggi-rendahnya
intelegensi seseoarang, yaitu :
1. Kemampuan Verbal
2. Kemampuan mengamati dan rasa ruang
3. Kemampuan gerak kinetis-fisik
4. Kemampuan logika/matematika
5. Kemampuan dalam hubungan intra-personal
6. Kemampuan dalam hubungan inter-personal, dan
7. Kemampuan dalam musik/irama
Mengingat bahwa aspek-aspek tersebut perlu dikenal oleh semua
guru yang harus berperan mengembangkan pribadi siswa melalui
rincian aspek-aspek indikator tersebut dan sekaligus mengevaluasi.
Penulis berpendapat bahwa teori baru tersebut perlu juga diketahui
dan dipelajari oleh para guru sehingga disajikan dalam buku ini.
Adapun rincian dari aspek-aspek atau indikator intelegensi
dimaksud adalah sebagai berikut.
1) Kemampuan verbal (verbal linguistic), meliputi :
a) Analisis lingusistik
b) Mengenal kembali dan mengingat
c) Memahami dan menciptakan kelucuan atau humor
d) Menjelaskan sesuatu dalam proses belajar-mengajar
e) Meyakinkan sesorang agar bersedia melakukan sesuatu
f) Memahami perintah dengan tepat
2) Kemampuan mengamati
a) Khayalan
b) Menyusun kerangka pikir
c) Menemukan jalam dalam konsep ruang
d) Memanipulasi imajinasi
e) Meninterprestasikan grafik/bagian/model
f) Mengenal hubungan objek dalam ruang
g) Memiliki persepsi yang cermat melalui bebagai sudut
pandangan
3) Kemampuan gerak kinetis fisik, melipui :
a) Mengatur/mengelola gerak refleks
b) Mengatur/mengelola gerak terencana
c) Memperluas kesadaran melalui tubuh
d) Peduli hubungan antar bagian
e) Meningkatkan fungsi tubuh
4) Kemampuan logika/matematika, meliputi:
a) Mengenali pola-pola abstraksi
b) Pertimbangan induktif
c) Pertimbangan deduktif
d) Cerdas dalam menangkap hubungan dan kaitan
e) Menyelesaikan kalkulasi kompleks
f) Pertimbangan ilmiah
5) Kemampuan dalam hubunganintra-personal, meliputi:
a) Konstrentasi dalam berfikir
b) Keberhati-hatian
c) Melakukan metakognisi
d) Kesadaran dan ekspresi berbagai perasaan
e) Kesadaran atas dirinya
f) Tingkat pemikiran-pnalaran
6) Kemampuan dalam hubungan inter-personal, meliputi :
a) Mencipta dan mengelola sinergi
b) Daya melampaui perspektif orang lain
c) Bekerja sama dalam kelompok
d) Mengenal dan membuat sesuatu yang berbeda dengan
lainnya
e) Komunikasi verbal dan nonverbal
7) Kemampuan dalam musik/irama, meliputi :
a) Struktur musik
b) Skematis dan mendengarkan musik
c) Sensitif terhadap suara
d) Kreatif dalam melodi dan irama
e) Sensitif dalam nada
Selanjutnya tentang macam tingkat intelegnsi dibandingka dengan
kelompok besar umat manusia digambarkan sebagai berikut :
 1% luar biasa, mempunyai IQ antara 30 hingga 70
 5% dungu, mempunyai IQ antara 70 hingga 80
 14% bodoh, mempunyai IQ antara 80 hingga 90
 60% normal, mempunyai IQ antara 90 hingga 110
 14% pandai, mempunyai IQ antara 110 hingga 120
 5% sangat pandai, mempunyai IQ antara 120 hingga 130
 1% genius, mempunyai IQ lebih dari 130
Yang dikatakan 1% luar biasa masih terbagi atas :
 Idiot yang mempunyai IQ antara 0 sampai 25
 Imbesil yang mempunyai IQ antara 26 sampai 50
 Debil yang mempunyai IQ antara 51 sampai 70
Apabila digambarkan dengan kurva, maka akan tampak lebih jelas
seperti berikut :
b. Ciri Kedua dari penilaian pendidikan, yaitu penggunaan ukuran
kuantitatif. Penilaian pendidikan bersifat kuantitaf artinya
menggunakan simbol bilangan sebagai hasil pertama pengukuran
setelah itu diiterprestasikan ke bentuk kualitatif.
Contoh :
Dari hasil pengukuran, Tiko mempunyai IQ 125, sedangkan Tini
105. Dengan demikian. Maka tiko digolongkan sebagai anak sangat
pandai sedangkan tini sebagai anak normal.
c. Ciri Ketiga dari penilaian pendidikan, yaitu bahwa penilaian
pendidikan menggunakan, unit-unit atau satuan-satuan yang tetap
karena IQ 105 termasuk anak normal. Anak lain yang hasil
pengukuran IQ-nya 80, menurut unit pengukurannya termasuk anak
dungu.
d. Ciri Keempat dari penilaian pendidikan adalah bersifat relatif,
artinya tidak sama atau tidak selalu tetap dari satu waktu ke waktu
lain.
Contoh:
Hasil ulangan matematika yang diperoleh miranti hari senin adalah
80. Hasil hari selasa 90. Tetapi hasil ulangan hari sabtu hanya 50.
Ketidak tepatan hasil penilaian miranti disebabkan karena banyak
faktor. Mungkin pada hari sabtu miranti sedang risau hatinya
menghadapi malam minggu.
e. Ciri Kelima dalam penilaian pendidikan adalah bahwa dalam
penilaian pendidikan itu sering terjadi kesalahan-kesalahan.
Adapun sumber kesalahan dapat ditinjau dari berbagai faktor,
yaitu:
1) Terletak pada alat ukurnya
Alat yang digunakan untuk mengukur haruslah baik. Sebagai
contoh, kita akan mengukur panjang meja tetapi menggunakan
pita ukuran yang terbuat dari bahan elastis, dan cara
mengukurnya ditarik-tarik. Tentu saka pita ukuran itu tidak
dapat kita golongkan sebagai alat ukur yang baik karena
gambaran tentang panjangnya meja tidak dapat diketahui
dengan pasti. Tentang bagaiman syarat-syarat alat ukur yang
digunakan dalam pendidikan, akan dibicarakan di bagian lain
secara lebih lengkap.
2) Terletak pada orang yang melakukan penilaian
Hal ini dapat berupa:
a) Kesalahan pada waktu melakukan penilaian karena faktor
subjektif penilai telah memengaruhi hasil pengukuran
tulisan yang jelek dan tidak jelas, mau tidak mau sering
memengaruhi subjektivitas penilai. Jika pada waktu
mengerjakan koreksi, penilai sendiri sedang risau. Itulah
sebabnya pendidik harus sejauh mungkin dari hal ini.
b) Kecenderungan dari penilai untuk memberikan nilai secara
“murah” atau “mahal”. Ada guru yang memberikan nilai 2
(dua) untuk siswa yang menjawab salah dengan alasan
untuk menulis upah menulis. Tetapi ada yang memberikan
0 (nol) untuk jawaban serupa.
c) Adanya hallo-effect yakni adanya kesan penilai terhadap
siswa. Kesan-kesan itu dapat berasalah dari guru lain
maupun dari guru itu sendiri pada kesempatan memegang
mata pelajaran lain
d) Adanya pengaruh hasil yang telah diperooleh terdahulu.
Seorang siswa pada ulangan pertama mendapat angka 10
sebanyak 2 kali. Untuk ulangan ketiga dan seterusnya, guru
sudah terkena pengaruh ingin memberi angka lebih banyak
dair yang sebenarnya. Walaupun seandainya pada waktu
ulangan tersebut ia sedang mengalami nasib sial, yakni
salah mengerjakan.
e) Kesalahan yang disebabkan oleh kekeliruan menjumlah
angka-angka hasil penilaian.
3) Terletak pada anak yang dinilai
a) Siswa adalah manusia yang berperasaan dan bersuasana
hati. Suasana hati seseoarang akan sangat berpengaruh
terhadap hasil penilaian. Misalnya, suasana hati yang kalut,
sedih atau tertekan akan memberika hasil kurang
memuaskan, sedang suasana hati gembira dan cerah, akan
memberikan hasil baik.
b) Keadaan fisik ketika siswa sedang dinilai. Kepala pusing,
perut mulas atau pipi sedang membengkak karena sakit
gigi, tentu saja memengaruhi cara siswa memecahkan
persoalan. Pikirannya sangat sukar untuk berkonsentrasi.
c) Nasib siswa kadang-kadang mempunyai peranan terhadap
hasil penilaian. Tanpa adanya suatu sebab fisik maupun
psikis, adakalanya seperti ada “gangguan” terhadap
kelancaran mengerjakan soal-soal.
4) Terletak pada situasi dimana penilaian berlangsung
a) Suasana yang gaduh, baik di dalam maupun di luar ruangan,
akan mengganggu konsentrasi siswa. Demikian pula
tingkah laku kawan-kawannya yang sedang mengerjakan
soal, apakah mereka bekerja dengan cukup serius atau
tampak seperti hanya main-main akan memengaruhi diri
siswa dalam mengerjakan soal.
b) Pengawasan dalam penilaian. Tidak menjadi rahasia lagi
bahwa pengawasan yang terlalu ketat tidak akan disenangi
oleh siswa yang suka melihat ke kanan dan ke kiri. Namun
adakalanya, keadaan sebaliknya. Yaitu pengawasan yang
longgar justru membuat jengkel bagi siswa yang mau
disiplin dan percaya pada diri sendiri.
Evaluasi Bab 1

1. Seorang guru mengadakan ulangan harian kepada siswa-siswanya. Setelah


beberapa kali ulangan diperoleh nilai rapor. Apada waktu kenaikan kelas,
kepada siswa-siswa “pandai” diberi hadiah secara bertingkat menurut
urutan prestasinya sedangakan kepada siswa-siswa yang “tidak naik”
diberi nasihat.
a. Coba pisahkan, manakah pekerjaan mengukur dan manakan pekerjaan
menilai
b. Dapatkah kita mengategorikan anak yang “tidak naik” ini sebagai anak
“bodoh”? beri alasan!
2. Apabila masukan siswa yang diterima dalam suatu sekolah tergolong baik
karena dari tes intelegensi diketahui, dapatkah siswa tersebut pada akhir
tahun tidak naik kelas? Coba terangkan!
3. Berdasarkan makna penilaian ditinjau dari segi siswa, guru, dan sekolah,
baikkah kiranya jika guru memberikan ulangan tiap hari? Coba tinjaulah
dari berbagai segi tersebut, apa keuntungan dan kerugiannya!
4. Bandingkan antara aspek-aspek intelegensi menurut Witherington dengan
David Lazear!
5. Cobalah mengenali lingkungan anda untuk mendaftar orang-orang yang
memiliki intelegensi tinggi secara umum dan beberapa orang yang hanya
menonjol di aspek-aspek tertentu!
BAB 2
SUBJEK DAN SASARAN EVALUASI

1. Subjek Evaluasi
Yang dimaksud dengan subjek evaluasi adalah orang yang melakukan
pekerjaan evaluasi. Siapa yang dapat disebut sebagai subjek evaluasi untuk
setiap tes, ditentukan oleh suatu antara pembagian tugas atau ketentuan yang
berlaku.
Contoh:
a. Untuk melaksanakan evaluasi tentang prestasi belajar atau pencapaian
maka sebagai subjek evaluasi adalah guru.
b. Untuk melaksanakan evaluasi sikap yang menggunakan sebuah skala maka
sebagai subjeknya dapat meminta petugas yang ditunjuk, dengan didahului
oleh suatu latiahan melaksanakan evaluasi tersebut.
c. Untuk melaksanakan evaluasi serhadap kepribadian dimana menggunakan
sebuah alat ukur yang sudah distandarisasikan maka subjeknya adalah ahli-
ahli psikologi. Disamping alatnya yang harus bersifat rahasia, maka subjek
evaluasi haruslah seorang yang betul-betul ahli karena jawaban dan tingkah
laku orang yang dites harus diiterprestasikan dengan cara tertentu.
Tidak setiap orang dapat menafsirkan jawaban tes kepribadian ini,
sehingga hanya orang yang telah mempelajari tes secara mendalam yang dapat
melakukannya. Demikian juga dengan tes intelegensi, subjek pelakunya harus
seorang ahli.
Dalam keterangan ini, penulis mengkategorikan pelaksanaan evaluasi
sebagai subjek evaluasi, ada pandangan lain yang disebut subjek evaluasi
adalah siswa, yakni orang dievaluasi. Dalam hal ini yang dipandang sebagai
objek misalnya : prestasi matematika, kemampuan membaca, kecepatan lari,
dan sebagainya. Pandangan lain lagi mengklasifikasikan siswa sebagai objek
evaluasi dan guru sebagai subjeknya.
2. Objek Evaluasi
Yang dimaksud dengan objek atau sasaran evaluasi adalah hal-hal yang
menjadi pusat perhatian untuk dievaluasi. Apapun yang ditentukan oleh
evaluator atau penilai untuk dievaluasi, itulah yang disebut dengan objek
evaluasi. Pada waktu evaluator ingin menilai berat badan siswa, naja yang
menjadi objek evaluasi adalah berat badan siswa, sedang angka yang
menunnjukan beberapa berat badan siswa dimaksud, misalnya 34 kilogram, 40
kilogram dan sebagainya adalah hasil evaluasi. Jika evaluastor ingin menilai
keterampilan siswa dalam menggunakan termometer, maka yang menjadi
objek evaluasi adalah benar tidaknya gerakan tangan siswa ketika memegang
alat, kemampuan siswa untuk menentukan berapa lama termometer diletakan
di bagian badann, kemudian juga kemampuan siswa dalam membaca skala
yang ada pada termometer. Gambaran tentang benar salanya menggunakan
termometer adalah hasil evaluasi.
Dengan masih menggunakan diagram tentang transformasi yang ada di bab 1,
maka yang menjadi objek evaluasi adalah semua unsur atau komponen yang
ada dalam transformasi tersebut. Agar diperoleh gambaran yang menyeluruh
tentang mutu dan kebenaran kinerja transformasi, maka yang dijadikan objek
evaluasi adalah semua aspek yang terkait dengan kinerja transformasi, yaitu
(1) masukan mentah, (2) masukan instrumental, (3) masukan lingkungan (4)
proses transformasi itu sendiri dan (5) keluaran, yaitu hasil dari transformasi.
Masukan mentah sebagai objek evaluasi
Dalam transformasi pembelajaran, siswa berstatus sebagai objek didik. Ahli-
ahli pendidikan angkatan lama berpendapat bahwa siswa adalah objek
pendidikan, kini pendapat seperti itu ditentang oleh ahli-ahli pembaharuan.
Dalam kegiatan pendidikan siswa adalah subjek yang aktif, bukan sekedar
objek pasif yang dapat diperlakukan dan diarahkan menurut kehendak. Dalam
berbicara tentang objek evaluasi ini mungkin ada pembaca yang terkacaukan
pengertiannya. Siswa yang dalam proses pembelajaran berstatus sebagai
subjek, dalam evaluasi dia merupakan objek evalausi, karena dicermati untuk
diketahui kinerjanya ketika mengikuti pembelajaran. Sekali lagi jangan keliru.
Dalam proses pendidikan, siswa berstatus sebagai subjek didik-siswa
aktif belajar
Dalam evaluasi, kinerja berstatus sebagai objek evaluasi-kinerja
siswa dicermati dan diperhatikan oleh evaluator.
Aspek-aspek yang menjadi objek evaluasi berkenaan dengan siswa sebagai
masukan mentah, masukan instrumental, dan masukan lingkungan dapat
dikembangkan dari apa yang sudah disampaiakn di bab1, apabila evaluatpr
merasa kurang tepat atau masing menginginkan hal-hal yang dievaluasi,
silahkan mendaftar lagi hal-hal lain menurut kebutuhan, beberapa hal yang
perlu dibicarakan dalam objek evaluasi adalah :a) Penilaian dalam KBK (b)
penilaian tiga ranah psikologis.

3. Sasaran Evaluasi
Apabila kita kembali kepada diagram di bab 1, kita akan ingat kembali apa
yang menjadi sasaran dari penilaian. Objek atau sasaran penilaian adalah
segala sesuatu yang menjadi titik pusat pengamatan karena penilaian
menginginkan informasi tentang sesuatu tersebut.
Dengan masih menggunakan diagram tentang transformasi maka sasaran
penilaian untuk unsur-unsurnya meliputi, input, transformasi dan output
a. Input
Calon siswa sebagai pribadi yang utuh dapat ditinjau dari beberapa segi
menghasilkan bermacam-macam bentuk tes yang digunakan sebagai alat
untuk mengugkur. Aspek yang bersifat rohani setidaknya mencakup
4(empat) hal.
1) Kemampuan
Untuk dapat mengikuti program dalam suatu lembaga/sekolah institusi
maka calon siswa harus memiliki kemampuan yang sepadan. Alat ukur
yang digunakan untuk mengukur kemampuan ini disebut tes
kemampuan atau attitude test.
2) Kepribadian
Kepribadian adalah suatu yang terdapat pada diri manusia dan
menampakan bentuknya dalam tingkah laku. Dalam hal-hal tertentu.
Informasi tentang kepribadian sangat diperlukan. Alat untuk
mengetahui kepribadian seseorang disebut tes kepribadian atau
personality test.
3) Sikap-sikap
Sebenarnya sikap ini merupakan bagian dari tingkah laku manusia
sebagai gejala atau gambaran kepribadian yang memancar keluar.
Namun, karena sikap ini merupakan suatu yang paling menonjol dan
sangan dibutuhkan dalam pergaulan maka banyak orang yang
menginginkan informasi khusus tentangnya. Alat untuk mengetahui
keadaan sikap seseorang dinamakan tes sikap atau attitude tes. Oleh
karen tes ini berupa skala. Maka disebut sikap attitude scale.
4) Intelegensi
Untuk mengetahui tingkat intelegensi ini diguanakan tes intelegensi
yang sudah banyak diciptakan oleh para ahli. Dalam hal ini yang
terkenal adalah tes buatan binet dan simo yang dikenal dengan tes
Binet-Simon. Selain itu adalagi tes-tes lain misalnya SPM, Tintum, dan
sebagainya. Dari hasil tes akan diketahui IQ orang tersebut. IQ
bukanlan intelegensi. IQ berbeda dengan intelegensi karena IQ
hanyalah angka yang memberikan petunjuk tinggi rendahnya
intelegensi seseorang. Dengan pengertian ini maka kurang benarlah
jika ada orang mengatakan “IQ jongkok” karena IQ adalah berupa
angka. Mestinya IQ rendah diartikan bahwa angkanya rendah.
Berkenaan dengan hubungan antara sikap dan kepribadian,
A.N. Oppenheim dalam bukunya Questionnnaire Design and Attitude
Measurement mengahukan gambar seperti tertera pada halaman
selanjutnya. Dari gambar ini jelas bahwa kepribadian merupakan
sesuatu yang ada dalam diri manusia dan sangat dalam letaknya
sehingga sangat susah dilihat.
b. Transformasi
telah dijelaskan bahwa banyak unsur yang terdapat dalam transformasi
yang semuanya dapat menjadi sasaran atau objek penilaian demi
diperolehnya hasil pendidikan yang diharapkan. Unsur-unsur dalam
transformasi yang menjadi objek penilaian antara lain :
a) Kurikulum/materi
b) Metode dan cara penilaian
c) Sarana pendidikan
d) Sistem administrasi
e) Guru dan personal lainnya.
c. Output
Penilaian terhadap lulusan suatu sekolah dilakukan untuk mengetahui
seberapa jauh tingkap pencapaian/prestasi belajar mereka selama
mengikuti program. Alat yang digunakan untuk mengukur pencapai ini
disebut tes pencapaian atau achievement test.
Kecenderungan yang ada sampai saat ini di sekolah adalah bahwa
guru hanya menilai prestasi belajar aspek kognitif atau kecerdasan saja.
Alatnya adalah tes tertulis. Aspek psikomotorik, apalagi efektif, sangat
langka dijamah oleh guru. Akibatnya, dapat kita saksikan, yakni para
lulusannya hanya menguasai teori tetapi tidak terampil melakukan
pekerjaan keterampialan. Juga tidak mampu mengaplikasikan pengetahuan
yang sudah mereka kuasai. Lemahnya pembelajaran dan evaluasi terhadap
aspek afektif ini, jika kita mau instrospeksi, telah berakitab merosotnya
ahklak para lulusan. Yang selanjutnya berdampak luas pada merosotnya
akhlah bangsa.
Evaluasi Bab 2

1. Dari objek-objek evaluasi yang telah disebutkan, jenis tes manakah


ayang bisal dilakukan di sekolah? Bilamanakah jenis-jenis tes yang
lain dilaksanakan
2. Seorang gru telah menyerahkan soal tes dan diperbanyak oleh bagian
pengajaran, pada waktu pelaksanaan tes tersebut tidak sempat
menunggu, tetapi ditunggu oleh staf tata usaha.
Dalam keadaan demikian ini, siapakah yang disebut subjek evaluasi?
Jelaskan jawaban anda.
3. Bagaimanakah cara guru mengetahui dari tujuan yang belum dicapai
oleh siswa secara individual
4. Sebelum, selama dan setelah pengajaran selesai, guru selalu
mengajukan pertanyaan. “apakah yang akan dicapai oleh siswa melalui
pelajaran saya ini”? dalam pertanyaan tersebut, apakah tujuan yang
ingindicapai siswa itu sama? Jelaskan jawan anda!
BAB 3
PRINSIP DAN ALAT EVALUASI

1. Prinsip Evaluasi
Ada satu prinsip umum dan penting dalam kegiatan evaluasi, yaitu adanaya
triangulasi atau hubungan erat tiga komponen, yaitu:
a. Tujuan pembelajaran
b. Kegiatan pembelajaran atau KBM, dan
c. Evaluasi.
Triangulasi tersebut dapat digambarkan dalam bagan sebagai berikut:

Tujuan

KBM Evaluasi

Penjelasan dari bagan triangulasi adalah demikian.


a. Hubungan antara tujuan dengan KBM
Kegiatan belajar mengajar yang dirancang dalam bentuk rencana mengajar
disusun oleh guru dengan mengacu pada tujuan yang hendak dicapai.
Dengan demikian anak panah yang menunnjukan hubungan antara
keduanya mengarah pada tujuan dengan makna bahwa kbm mengacu pada
tujuan, tetapi juga mengarah dari tujuan ke KBM menunjukan langkah dari
tujuan dilanjutkan pemikirannya ke KBM.
b. Hubungan antara tujuan dengan evaluasi
Evaluasi adalah pengumpulan data untuk mengukur mana tujuan sudah
tercapai. Dengan makna demikian maka anak panah berasal dari evaluasi
menuju ke tujuan. Dilain sisi, jika dilihat dari langkah dalam menyusun alat
evaluasi ia mengacu pada tujuan yang sudah dirumuskan.
c. Hubungan antara KBM dengan evaluasi
Seperti yang sudah disebutkan dalam nomor 1, KBM dirancang dan
disusun dengan mengacu pada tujuan yang telah dirumuskan. Telah
disebutkan pula dalam nomor 2 bahwa alat evaluasi juga disusun dengan
mengacu pada tujuan. Selain mengacu pada tujuan, evaluasi juga mengacu
atau disesuaikan dengan KBM yang dilaksanakan. sebagai misal, jika
kegiatan belajar-mengajar dilakukan oleh guru dengan menitik beratkan
pada keterampilan, evaluasinya juga harus mengukur tingkat keterampilan
siswa. Bukannya aspek pengetahuan.
Kecenderungan yang terdapat dalam praktek sekarang ini adalah
bahwa hasil belajar hanya dilakukan dengan tes tertulis. Menekankan aspek
pengetahuan saja, hal-hal yang berkaitan dengan aspek-aspek lain, kurang
mendapatkan perhatian dalam evaluasi.
Secara garis besar, maka alat evaluasi yang digunakan dapat
digolongkan menjadi 2 (dua) macam, yaitu tes dan bukan tes (non tes).
Selanjutnya tes dan non tes ini juga disebut sebagai teknik evaluasi
berhubung oleh penjelasan-penjelasan yang lebih mendalam tentang tes itu
sendiri, maka disi akan diterangkan masalah nontes terlebih dahulu.
2. Alat Evaluasi
Dalam pengertian umum, alat adalah suatu yang dapat digunakan untuk
mempermudah seseoarang dalam melaksanakan tugas atau mencapai tujuan
serta lebih efektif dan efisien. Kata “alat” biasa disebut juga dengan istilah
“instrumen” dengan demikian alat evaluasi juga dikenal denga instrumen
evaluasi.
Untuk memperjelas pengertian alat atau instrumen, terapkan pada dua cara
mengupas kelapa, yangsatu menggunakan pisau parang, yang satunya lagi
tidak. Tentu saja dengan pisau parang hasilnya akan lebih baik dan lebih cepat
dilakukan dibandingkan dengan cara yang pertama. Dalam kegiatan evaluasi,
fungsi alat juga untuk memperoleh hasil yang lebih baik, sesuai dengan
kenyataan yang dievaluasi.
Contoh pertama:
Jika yang dievaluasi suatu keterampilan siswa dalam membaca, maka hasil
evaluasinya berupa gambaran tentang tingkat keterampilan siswa dalam
membaca.
Dengan pengertian tersebut, alat evaluasi dikatakan baik apabila
mampu mengevaluasi sesuatu dengan hasil seperti keadaan yang dievaluasi.
Dalam menggukan alat tersebut evaluator menggukan cara atau teknik, maka
dikenal dengan teknik evaluasi. Seperti disebutkan diatas, ada dua teknik
evaluasi, yaitu teknik nontes dan teknik tes.
a. Teknik Nontes
Yang tergolong teknik nontes adalah
1) Skala bertingkat (rating scale);
2) Kuesioner (quisionair)
3) Daftar cocok (check list)
4) Wawancara (interview)
5) Pengamatan (observation)
6) Riwayat hidup

1) Skala bertingkat (rating scale);


Skala menggambarkan suatu nilai yang berbentuk angka terhadap
sesuatu hasil pertimbangan. Seperti Oppenheim mengatakan: Rating
gives a numerical value to some kind of judgement, maka suatu
skala selalu disajikan dalam bentuk angka.
Sebagai contoh, skor atau biji yang diberikan oleh guru di sekolah
untuk menggambarkan tingkat prestasi belajar siswa. Siswa yang
mendapat skor 8 digambarkan di tempat yang lebih kanan dalam
skala, dibandingkan penggambaran skor 5.

4 5 6 7 8
Biasanya angka-angka yang digunakan direapkan pada skala dengan
jarak yang sama. Meletakannya secara bertingkat dari yang rendah
ke yang tinggi. Dengan demikian, skala ini dinamakan skala
bertingkat. Kita dapat menilai hampir segala sesuatu dengan skala.
Dengan maksud agar pencatatannya dapat objektif, maka penilaian
terhadap penampilan atau penggambaran kepribadian seseorang
disajikan dalam bentuk skala.
Contoh:

1 2 3 4 8
Sangat Tidak Biasa Suka Sangat
tidak suka suka suka

Skala sikap yang pernah disinggung di bagian terdahulum pada


umumnya disajikan dalam bentuk bertingkat seperti dicontohkan di
atas.
2) Kuesioner (quisionair)
Kuesioner (quisionair) juga sering dikenal sebagai angket, pada
dasarnya kuesioner adalah sebuah daftar pertanyaan yang harus diisi
oleh orang yang akan diukur (responden). Dengan kuesioner ini
orang dapat diketahui tentang keadaan/data diri. Pengalaman,
pengetahuan sikap atau pendapatnya dan lain-lain.
Tentang macam kuesioner, dapat ditinjau dari beberapa segi.
a) Ditinjau dari segi siapa yang menjawabm maka ada:
(1) Kuesioner langsung adalah kuesioner yang dikirmkan dan
diisi langsung oleh responden
(2) Kuesioner tidak langsung adalah kuesioner yang dikirim dan
diisi bukan oleh responden. Kuesioner tidak langsung
biasaya digunakan untuk mencari informasi tentang
bawahan, anak, saudara, dan sebagainya.
b) Ditinjau dari segi cara menjawab, maka ada:
(1) Kuesioner tertutup adalah kuesioner yang disusun dengan
menyediakan pilihan jawaban lengkap sehingga responden
hanya tinggal memberi tanda pada jawaban yang dipilih.
Contoh:
Tingkat pendidikan yang sekarang anada ikuti adalah :
SD SLTP SLTA

Perguruan Tinggi

(2) Kuesioner terbuka adalah kuesioner yang disusun


sedemikian rupa sehingga responden bebas mengemukakan
pendapatnya. Kuesioner terbuka disusun apabila jenis
jawaban akan beraneka ragam, misalnya, keterangan alamat
responden, tidak mungkin diberikan dengan cara memilih
pilihan jawaban yang disediakan. Kuesioner terbuka juga
digunakan meminta pendapat seseorang.
Contoh:
Untuk membimbing mahasiswa ke arah terbiasa membaca
buku-buku asing, maka sebaiknya setiap dosen menunjuk
buku asing sebagai salah satu buku wajib. Bagaimana
pendapat saudara? Jawab!

3) Daftar cocok (check list)


Yang dimaksud dengan daftar cocok (check list) adalah deretan
pernyataan (yang biasanya singkat-singkat) dimana responden yang
dievaluasi tinggal membubuhkan tanda cocok () di tempat yang
sudah disediakan.
Contoh:
Berilah tanda () pada kolom yang sesuai dengan pendapat saudara.
Tidak
No Pernyataan Penting Biasa
Penting
1 Melihat pemandangan indah
2 Olahraga tiap hari
3 Melihat film
4 Belajar menari
5 Tulisan bagus
Ada pendapat yang mengatakan bahwa sebenarnya skala bertingkat
dapat digolongkan ke dalam daftar cocok karena dalam skala
bertingkatm responden juga diminta untuk memberikan tanda cocok
pada pilihan yang tepat.
4) Wawancara (interview)
Wawancara atau interview adalah suatu metode atau cara yang
digunakan untuk mendapatkan jawaban dari responden dengan
tanya-jawab sepihak. Dikatakan sepihak karena dalam wawacara ini
responden tidak diberi kesembapan sama sekali untuk mengajukan
pertanyaan. Pertanyaan hanya diajukan oleh suubjek evaluasi.
Wawancara dapat dilakukan dengan 2 (dua) cara, yaitu:
a) Wawancara bebas, dimana responden mempunyai kebebasan
untuk mengutarakan pendapatnya tanpa dibatasi oelh patokan
yang telah dibuat oleh subjek evaluasi
b) Wawancara terpimpin, yaitu wawancara yang dilakukan oleh
subjek evaluasi dengan cara mengajukan pertanyaan pertanyaan
yang sudah disusun terlebih dahulu. Dalam hal ini, responden
tinggal memilih jawaban yang sudah dipersiapkan oleh penanya.
Jawaban itu kadang-kadang bersifat memimpin dan
mengarahkan, dan jawaban sudah dipimpin oleh sebuah daftar
cocok.
5) Pengamatan (observation)
Pengamatan atau observasi adalah suatu teknik yang dilakukan
dengan cara mengadakan pengamatan secara teliti srta pencatatan
secara sistematis.
Ada 3 macam observasi
a) Obeservasi partisipan, yaitu observasi yang dilakukan oleh
pengamat, dalam hal in pengamat memasuki dan mengikuti
kegiatan kelompok yang sedang diamati. Observasi partisipan
dilaksanakan sepenuhnya jika pengamat betul-betul mengikuti
kegiatan kelompok, bukan hanya pura-pura. Dengan demikian ia
dapat menghayati dan merasakan seperti apa yang diraskan
orang-orang dalam kelompok yang diamati.
Contoh:
Untuk mengamati kehidupan mahasiswa penyewa kamar,
pengamat menjadi mahasiswa dan menyewa kamar.
b) Observasi sistematik, yaitu observasi dimana faktor faktor yang
diamati sudah didaftar secara sistematis dan sudah diatur
menurut kategorinya. Berbeda dengan observasi partisipanm,
maka dalam observasi sistematik ini pengamat berada diluar
kelompok, dengan demikianm pengamat tidak dibingungkan
oleh situasi yang melingkungi dirinya.
c) Observasi eksperimental terjadi jika pengamat tidak
berpartisipasi dalam kelompok, dalam hal ini, ia dapat
mengendalikan unsur-unsur penting dalam situasi sedemikian
rupa sehingga situasi itu dapat diatur sesuai denangan tujuan
evaluasi.
6) Riwayat hidup
Riwayat hidup adalah gambaran tentang keadaan seseorang selama
masa kehidupannya. Dengan mempelajari riwayat hidup. Maka
subjek evaluasi akan dapat menarik suatu kesimpulan tentang
kepribadian, kebiasaan, dan sikap dari objek yang dinilai.
b. Teknik Tes
Apakah sebenarnya tes itu? Ada bermacam-macam rumusan tentang
tes. Didalam bukunya yang berjudul evaluasi pendidikan, Amir Daien
Indrakusuma mengatakan demikian:
”tes adalah suatu alat atau prosedur yang sistematis dan objektif
untuk memperoleh data-data atau keterangan-keterangan yang
diinginkan tentang seseoarang, dengan cara yang boleh dikatakan
tepat dan cepat”
Selanjutnya, di dalam buku teknik-teknik evaluasi Muchtar Bukhori
mengatakan:
“Tes ialah suatu percobaan yang diadakan untuk mengetahui ada
atau tidaknya hasil-hasil pelajaran tertentu pada seorang murid
atau kelompok murid.”
Definisi terakhir yang dikemukakan disini adalah definisi yang dikutif
Webster’s Collegiate.
“Test=any series of questions or exercieses or other means of
measurng the skill, knowledge, intelegence, capacities of aptitudes
or an individual or group”
Yang lebih kurang artinya:
“Tes adalah serentetan pertanyaan atau latihan atau alat lain yang
digunakan untuk mengukur keterampilan, pengetahuan,
intelegensi,kemampuan atau bakat yang dimiliki oleh individu atau
kelompok”
Kutipan ini disajikan dalam buku Encyclopedia of Educational
Evaluation. Yang di dalam buku tersebut diterangkan pula bahwa
pengertiannya dipersempit dengan menyederhanakan definisi menjadi
demikian:
“Tes is comprehensive assesment of an individual or to an entire
program evaluation effort”
Artinya:
“Tes adalah penilaian yang komprehensif terhadap seorang
individu atau keseluruhan usaha evaluasu program”
Dari beberapa kutipan dan uraian diatas, dapat disimpulkan bahwa tes
merupakan suatu alat pengumpul informasi, tetapi jika dibandingkan
dengan alat-alat yang lain. Tes bersifat lebih resmi karena penuh
dengan batasan-batasan. Mengingat betapa pentingnya tes ini, maka
uraian yang lebih terperinci akan disampaikan secara terpisah pada bab-
bab lain.
Apabila rumusan yang telah disebutkan di atas dikaitkan dengan
evaluasi yang dilakukan di sekolah, khususnya di suatu kelas, maka tes
mempunyai fungsi ganda, yaitu untuk mengukur siswa dan untuk
mengukur keberhasilan program pengajaran, dalam bagian ini hanya
akan dibicarakan tes untuk mengukur keberhasilan siswa.
Ditinjau dari segi kegunaan untuk mengukur siswa, tes dibagi menjadi 3
yaitu”
1) tes diagnostik
2) tes formatif, dan
3) tes sumatif
keterangan masing-masing tes adalah sebagai berikut.
1) Tes diagnostik
Seorang guru yang baik, tentu akan merasa bahagia apabila dapat
membantu siswanya dapat mencapai kemajuan secara maksimal
sesuai dengan kemampuan yang dimiliki.
Untuk mengetahui apakah bantuan yang diberikan sudah memadai,
maka diadakan suatu penilaian. Namun, informasi hasil penilaian
ini tidak akan ada gunanya seandainya tidak digunakan untuk bahan
pertimbangan bagi tindakan selanjutnya
Seperti halnya seoarng dokter, sebelum menentukan obat apa yang
akan diberikan kepada pasien, dokter melakukan pemeriksaan
secara teliti dahulu. Misalnya, memeriksa denyut nadi, suara nafas,
reaksi lutut, urine, darah, dan sebagainya. Demikian juga seorang
guru terhadap siswa, guru harus mengadakan tes yang maksudnya
untuk mendiagnosis. Tes ini disebus tes diagnostik.
Tes diagnostik adalah tes yang digunkan untuk mengetahui
kelemahan-kelemahan siswa sehingga berdasarkan hal tersebut
dapat dilakaukan penganganan yang tepat. Dengan mengingat
bahwa sekolah sebagai sebuah transformasi, maka letak tes
diagnostik dapat dilihat pada gambar di bawah ini:

   
Input Output
Tes diagnostik ke1 dilakukan terhadap calon siswa sebagai input,
untuk mengetahui apakah calon siswa sudah menguasai
pengetahuan yang merupakan dasar untuk menerima pengetahuan di
sekolah. Dalam pembicaraan tes secara umum, tes ini disebut tes
penjajakan masuk yang dalam istilah inggris disebut entering
behaviur test. Dalam penggalan kecil, tes diagnostik ke-1 dilakukan
untuk mengukur tingkat penguasaan pengetahuan dasar untuk dapat
menerima pengetahuan lanjutannya. Pengetahuan dasar ini biasa
disebut dengan pengetahuan bahan prasyarat (preruqisite) oleh
karena itu tes ini disebut juga tes prasayarat atau prereuisite test.
Test diagnostik ke-2 dilakukan terhadap calon siswa yang akan
mulai mengikuti program. Apabila cukup banyak calon siswa yang
diterima sehingga diperlukan lebih dari satu kelas, maka untuk
pembagian kelas diperlukan suatu pertimbangan khusus. Apakah
anak yang baik akan disatukan di satu kelas atau semua kelas akan
diisi dengan campuran anak baik, sedang atau semua kelas akan
diisi dengan campuran anak baik, sedan atau kurang. Ini semua
memerlukan informasi yang dapat diperoleh dengan cara
mengadakan tes diagnostik. Dengan demikian, tes diagnostik telah
berfungsi sebagai tes penempatan (placement Test).
Test diagnostik ke-3 dilakukan terhadap siswa yang sedang belajar
tidak semua siswa dapat menerima pelajaran yang diberikan oleh
guru dengan lancar. Sebagai guru yang bijaksana, sebaiknya
sesekali melakukan tes diagnostik. Untuk mengetahui bagian mana
dari materi pelajaran yang diberikan belum dikuasai oleh siswa
Test diagnostik ke-4 diadakan pada waktu siswa mengakhiri
pelajaran. Dengan tes ini guru akan dapat mengetahui tingkat
penguasaan siswa terhadap bahan yang ia berikan.
2) Tes formatif
Dari kata form yang merupakan dasar dari istilah formati, maka
evaluasi formatif dimaksudkan untuk mengetahui sejauh mana
siswa telah terbentuk setelah mengikuti program tertenu. Dalam hal
ini, tes formatif dapat juga dipandadang sebagai tes diagnostik pada
akhir pelajaran.
Evaluasi formatif atau tes formatif diberikan pada akhir setiap
program. Tes ini merupakan post-test atau tes akhir proses.

Evaluasi formatif mempunyai manfaat bai bagi siswa, guru mapun


program itu sendiri:
a) Manfaat bagi siswa
 Digunakan untuk mengetahui apakah siswa sudah menguasai
materi program secara menyeluruh
 Merupakan penguatan (reinforcement) bagi siswa. Dengan
mengetahi bahwa tes yang dikerjakan sudah menghasilkan
skor tinggi sesuai yang diharapkan, maka siswa merasa
mendapat “anggukan kepala” dari guru, dan ini merupakan
suatu tanda bahwa apa yang sudah dimiliki merupakan
pengetahuan yang sudah benar. Dengan demikian, maka
pengetahuan itu akan bertambah membekas diingatan.
Disamping itu, tanda keberhasilan suatu pelajaran akan
memperbesar motivasi siswa untuk belajar giat, agar
mempertahankan atau memperoleh nilai yang lebih baik.
 Usaha perbaiakanm dengan umpan balik (feed back) yang
diperoleh setelah melakukan tesm siswa mengetahui
kelemahan-kelemahanya. Bahkan dengan teliti siswa
mengetahui bab atau bagian mana yang belum dikuasainya.
Dengan demikian siswa akan termotivasi untuk
meningkatkan penguasaan materi.
 Sebagai diagnosis. Bahan pelajaran yang sedang dipelajari
oleh siswa merupakan serangkaian pengetahuan.
Keterampilan, atau konsep. Dengan mengetahui hasil tes
formatif, siswa dengan jelas dapat mengetahui bagian mana
dari materi pelajaran yang masih dirasakan sulit.
b) Manfaat bagi guru
Dengan telah mengetahui hasil tes formatif yang diadakan,
maka guru:
 Mengetahui sampai sejauh mana materi yang diajarkan sudah
dapat diterima oleh siswa. Hal ini juga akan menentukan
apakah guru perlu mengganti metode pengajaran (strategi)
yang lama.
 Mengetahui bagian-bagian mana dari materi pelajaran yang
belum dikuasai siswa. Apabila bagian yang belum dikuasai
merupakan materi dasar bagi pelajaran yang lain, maka
bagian itu harus diterangkan lagi dan barangkali memerlukan
cara atau media lain untuk memperjelas apabila tidak
diulangi, maka akan mengganggu kelancaran pemberian
materi pelajaran selanjutnya dan siswa akan semakin tidak
menguasainya.
Contoh:

 Dapat meramalkan sukses dan tidaknya seluruh program


yang akan diberikan.
c) Manfaat bagi program
Setelah diadakan tes formatif maka diperoleh hasil. Dari hasil
tersebut dapat diketahui:
 Apakah program yang telah diberikan merupakan program
yang tepat, dalam arti sesuai dengan kecakapan anak.
 Apakah program tersebut membutuhkan pengetahuan-
pengetahuan prasyarat yang belum diperhitungkan.
 Apakah diperlukan alat, sarana dan prasarana untuk
mempertingggi hasil yang akan dicapai.
 Apakah metode, pendekatan, dan alat evaluasi yang
digunakan sudah tepat.

3) Tes sumatif
Evaluasi sumatf atau tes sumatif dilaksanakan setelah berakhirnya
pemberian sekelompok atau sebuah program yang lebih besar.
Dalam pengalaman di sekolah tes formatif dapat disamakan dengan
ulangan harian, dengakan tes sumatif ini dapat disamakan dengan
ulangan umum yang biasanya dialakanakan pada tiap hari smester,
secara diagramis maka hubungan antara tes formatif dengan tes
sumatif ini tergambar sebagai berikut:

Program Program Program Program Program

F F F F F

Keterangan :
F = tes formatif
S = tes sumatif

Apabila dilihat dalam kaitannya dengan kurikulum tahun 1975 (baik


untuk SD, SMP maupun SMA) maka tes formatif adalah tes yang
dilaksanakan sesudah berakhirnya proses belajar-mengajar tiap-tiap
sub pokok bahasan, sedangkan tes sumatif diadan pada :
- Akhir caturwulan : untuk SD
- Akhir smester : untuk SMP dan SMA
*) sekarang semua jenjang SD,SMP dan SMA tidak sama, yaitu
menggunakan jenjang smester.
Manfaat tes sumatif
Ada beberapa manfaat tes sumatif, dan 3 diantaranya yang terpenting
adalah :
a) Untuk menentukan nilai, apabila tes formatif digunakan terutama
untuk memberikan informasi demi perbaikan penyampaian dan
tidak untuk memberikan nilai atau penentuan kedudukan
seoarang anak di anatara teman-temannya (grading), maka nilai
dari tes sumatif ini digunakan untuk menentukan kedudukan
anak, dalam penentuan nilai ini setiap anak dibandingkan dengan
anak lain, asumsi yang mendasari pandangan ini adalah bahwa
prestasi belajar siswa-siswa dalam sebuah kelas akan tergambar
dalam sebuah kurva normal.
Sebagian besar dari anak-anak di kelas itu akan terletak di
tengah-tengah daerah kurva. Yaitu di daerah “sedang”.
Sebagaian kecil terletak di daerah “atas” dan sebagian lainnya
akan terletak di daerah “bawah”.

Kurva prestasi belajar kelompok siswa dalam satu kelas.


- Dari -3 SD sampai -1 SD adalah daerah “bawah” atau dengan
prestasi rendah
- Dari -1 SD samai +1 SD adalah daerah “sedang” atau siswa
dengan prestasi cukup.
- Dari +1 SD samapi +3 SD adalah daerah “atas” atau siswa
dengan prestasi tinggi.
Catatan:
Daerah kurva yang diperhitungkan hanya sampai batas -3 SD dan
+3 SD walaupun masing-masing ekor dapat diperpanjang sampai
tidak terhingga.
b) Untuk menentukan seorang anak dapat atau tidaknya mengikuti
kelompok dalam menerima program berikutnya. Dalam hal ini,
tes sumatif berfungsi sebagai tes prediksi.
Contoh :
Pada saat kenaikan kelas, guru mempertimbangkan siapa saja
yang kira-kira mampu mengikuti program di kelas berikutnya.
Sebagai bahan pertimbangan adalah nilai-nilai yang diperoleh,
terutama dari tes sumatif. Siswa yang sekiranya tidak mampu
mengikuti program di kelas berikutnya dipersilahkan tinggal
kelas.
c) Untuk mengisi catatan kemajuan belajar siswa yang akan
berguna bagi:
1. Orang tua siswa
2. Pihak bimbingan dan penyuluhan di sekolah
3. Pihak-pihak lain apabila siswa tersebut akan pindah ke
sekolah lain, melanjutkan sekolah, atau memasuki lapangan
kerja.
Catatan:
Kemajuan belajar ini dikenal dengan nama rapor dan ijazah
(surat tanda tamat belajar, STTB). Tentang bagaimana bentuk
dan pengisiannya akan di bicarakan di bab lain.
4) Tes Formatf dan tes sumatif dalam praktek
Dalam pelaksanaanya di sekolah, tes formatif ini merupakan
ulangan harian, sedangkan tes sumatif biasa kita kenal sebagai
ulangan umum yang diadakan pada akhir caturwulan atau akhir
smester.
Dalam buku seri III dari kurikulum 1975 tentang pedoman penilaian
dijelaskan bahwa tes formatif harus dilaksanakan oleh guru setiap
akhir satu sub pokok bahasan. Sedangkan tes sumatif dilaksanakan
setiap mengakhiri satu pokok bahsan (jadi dalam program yang
lebih besar).
Apabila pengertian ini dihubungkan dengan apa yang baru saja
dibicarakan beberapa halaman sebelumnya bahwa tes sumatif
dilaksanakan sebagai ulangan umum, maka tes yang dilaksanakan di
akhir pokok bahasan ini dapat dipandang sebagai tes sub sumatif
atau tes unit, sedangkan ulangan umum itulah yang disebut tes
sumatif. Dengan demikian maka keseluruhan rangkaian tes akan
terlihat dalam diagram berikut:
PB.I PB. II PB. II

Sub-
Sub
sub
pok S S S
pok
ok P P P = = = = = =
ok
baha B B B
baha
san
san
F F F F F F F F F F F
SS SS SS

Unit
Keterangan
SS = sub sumatif
SPB = sub pokok bahsan
PB = pokok bahsan
F = tes formatif

Dalam kurikulum baru, pokokbahsan dan sub pokok bahsan tidak


muncul lagi. Tetapi dengan istilah lain yang langsung menunnjuk ke
output siswa, yaitu standar kompetensi (SK) dan Kompetensi Dasar
(KD)
Memang pendapat tiap-tiap orang berbeda-beda tergantung dari luas
sempitnya pandangan. Sebagai contoh adalah keterangan di atas.
Tes pada akhir pokok bahasan dapat dipandang sebagai tes sumatif
jika pada tiap sub pokok bahsan sudah diberikan tes formatif. Akan
tetapi, tes pada akhir pokok bahasan ini merupakan ter formatif jika
dibandingkan dengan tes akhir dari beberapa pokok bahsan (yaitu
pada akhir unit smester). Tugasnya, tes sub sumatif dapat dipandang
sebagai tes formatif maupun sumatif.
Apabila dilanjutkan lap menelusirinya. Maka tes akhri unit smester
ini merupakan tes formatif atau sumatif jika yang dianggap tes
sumatif adalah EBTA. Walupun ada kesimpang siuran mengenai
istilah ini. Namun yang diketahui oleh umum tes sumatif adalah tes
akhir caturwulan (SD) atau tes akhir smester (SMP dan SMA).
Dalam pelaksanaan tes sumatif di sekolah-sekolah ada yang
disamakan antara satu daerah atau wilayah administratif dan dikenal
sebagai THB (Tes Hasil Belajar), TPB (Tes Prestasi Belajar) atau
istilah lain lagi.
Atas dihapuskannya ujian negara menjadi ujian sekolah, maka tes
sumatif bersama (THB atau TPB) ini mempunyai kebaikan dan
kelebihan.
Kebaikan THB bersama:
a) Pihak atasan atau pengelola sekolah-sekolah (IPDA, Dinas P dan
K atau P dan K) yang dapat membandingkan kemajuan sekolah-
sekolah yang ada di wilayahnya.
b) Karena dibandingkan antara sekolah yang satu denga sekolah
yang lain, maka akan timbul persaingan sehat antara sekolah.
c) Standar pelajaran akan terpelihara dengan baik karena soal tes
yang diberikan disusun Dinas Pendidikan Atau Kanwil P dan K.
Keburukan THB bersama:
a) Ada kemungkinan akan terjadi pemberian pelajaran yang hanya
berorientasi pada “ujian” dengan cara memberikan latihan
mengerjakan soal yang sebanyak-banyaknya
b) Tidak menghiraukan jika terjadi beberapa bentuk kecurangan
karena sekolah (sekolah-sekolah) yang ingin mendapat nama
baik.
Berhubungan dengan adanya bermacam-maam tes, dengan
sendirinya cara memberikan nilai dan perhitungannya sebagai
informasi prestasi siswa juga berbeda-beda. Tentang mengadakan
penilaian dan penggunaannya, akan dijelaskan di bab lain.
5) Perbandingan antara tes diagnostik, tes formatif dan tes sumatif
Untuk memperoleh gambaran mengenai tes diagnostik, tes formaif
dan tes sumatif secara lebih mendalam, berikut ini akan disajikan
perbandingan antra ketiganya, agar dapat diketahui persamaan dan
perbedaanya. Dalam membandingkan, akan ditinjau dari 9 aspek,
yaitu : fungsi, waktu, titik berat atau tekanannya, alat evaluasi, cara
memilih tujuan yang dievaluasi, tingkat kesulitan soal-soal tes, cara
menyekor tingkat pencapaian dan metode menuliskan hasil tes.
a) Ditinjau dari fungsinya
(1) Tes diagnostik
- Menentukan apakah bahan prasyarat telah dikuasai atau
belum
- Menentukan tingkat penguasaan siswa terhadap bahan
yang dikuasai.
- Memisah-misahkan (mengelompokan) siswa
berdasarkan kemampuan dalam menerima pelajaran
yang akan dipelajarai
- Menentukan kesulitan-kesulitan belajar yang dialami
untuk menentukan cara yang khusus untuk mengatasi
atau memberikan bimbingan.
(2) Tes formatif
Sebagai umpan balik bagi siswa, guru, maupun program
untuk menilai pelaksanaan satu unit program.
(3) Tes sumatif
Untuk memberikan tanda kepada siswa bahwa telah
mengikuti satu program, serta menentukan posisi
kemampuan siswa dibandingkan dengan kawannya dalam
kelompok.
b) Ditinjau dari wa ktu
(1) Tes diagnostik
- Pada saat penyaringan calon siswa
- Pada saat pembagian kelas atau awal pemberian
pelajaran
- Selama pelajaran berlangsung bila guru akan
memberikan bantuan kepada siswa.
(2) Tes formatif
Selama pelajaran berlangsung untuk mengetahui
kekuarangan agar pelajaran dapat berlangsung sebaik-
baiknya.
(3) Tes sumatif
Pada akhir unit catur wulan, semester akhir tahun, atau
akhir pendidikan
c) Ditinjau dari titik berat penilaian
(1) Tes diagnostik
- Tingkah laku kognitif, afektif, dan psikomotor
- Faktor fisik, psikologis, dan lingkungan
(2) Tes Formatif
Menekankan pada tingkah laku kognitif
(3) Tes Sumatif
Pada umumnya menekankan pada tingkah laku kognitif
tetapi ada kalanya pada tingkah laku psikomotor dan
kadang-kadang pada afektif, akan tetapi walaupun
menekankan pada tingkah laku kognitif, yang diukur adalah
tingkatan yang lebih tinggi (bukan sekedar kegiatan atau
hafalan saja)
d) Ditinjau dari alat evaluasi
(1) Tes diagnostik
- Tes prestasi belajar yang sudah distandarisasikan
- Tes diagnostik yang sudah distandarisasikan
- Tes buatan guru
- Pengamatan dan daftar cocok (check list)
(2) Tes Formatif
Tes prestasi belajar yang tersusun secara acak
(3) Tes Sumatif
Tes ujian akhir
e) Ditinjau dari cara memilih tujuan yang dievaluasi
(1) Tes diagnostik
- Memilih tiap-tiap keterampilan prasyarat.
- Memilih tujuan tiap program pelajaran secara
berimbang
- Memilih yang berhubungan dengan tingkah laku fisik,
mental dan perasaan.
(2) Tes Formatif
Mengukur semua tujuan instruksional khusus
(3) Tes Sumatif
Mengukur tujuan instruksional umum
f) Ditinjau dari tingkat kesulitan tes
(1) Tes diagnostik
Untuk mengukur keterampilan dasar, diambil soal tes yang
mudah, yang tingkat kesulitannya (indeks kesukaran) 0,65
atau lebih
(2) Tes Formatif
Belum dapat ditentukan
(3) Tes Sumatif
Rata-rata mempunyai tingkata kesulitan (indeks kesukaran)
antara 0,35 hingga 0,70 ditambah beberapa soal yang sangat
mudah dan beberapa lagi yang sangat sukar.
g) Tinjau dari skoring (cara menyekor)
(1) Tes diagnostik
Menggunakan standar mutlak dan standar relatif (criterion
referenced dan norm referenced)
(2) Tes Formatif
Menggunakan standar mutlak (criterion reverenced)
(3) Tes Sumatif
Kebanyakan menggunakan standar relatif (norm referenced)
tetapi dapat pula dipakai standar mutlak (criterion
referenced)
h) Ditinjau dari tingkat pencapaian
Yang dimaksud dengan tingkat pencapaian adalah skor yang
harus dicapai siswa dalam setiap tes. Tingkat pencapaian ini
tidak lah sama. Tinggi rendahnya tuntutan terhadap tingkat
pencapaian tergantung dari funsi dan tujuan masing-masing.
(1) Tes diagnostik
Berhubung ada bermacam-macam tes diagnostik maka
tingkat pencapaian yang dituntut juga tidak sama. Untuk tes
diagnostik yang sifatnya memonitor kemajuan, tingkat
pencapaian yang diperoleh siswa merupakan informasi
tentang keberhhasilannya. Tindakan guru selanjutnya adalah
menyesuaikan dengan hasil tes diagnostik
Tes prasyaratnya adalah tes diagnostik yang sifatnya khusus.
Fungsinya adalah untuk mengetahui penguasaan bahan
prasyarat yang sangat penting untuk kelanjutan studi bahan
pelajaran berikutnya. Untuk itu, tingkat penguasaan dituntut
100%.
(2) Tes Formatif
Ditinjau dari tujuanm tes formatif digunakan untuk
mengetahui apakah siswa sudah mencpai tujuan
instruksional umum yang diuraikan menjadi tujuan
instruksional khusus.
Dalam sistem pendidikan yang lama, tidak ada
tuntutan tehadap pencapaian TIK namun dalam tahun 1975,
dengan keluarnya kurikulum tahun 1975 dan modul, tingkat
pencapaian untuk tes formatif adalah 75% dari skor yang
diharapakan. Diwajibkan menempuh kegiatan perbaikan
(remedial program) hingga siswa yang bersangkutan lulus
dalam tes. Yang artinya siwa tersebut telah mencapai skor
75% dari skor maksimal yang diharapkan.
(3) Tes Sumatif
Sesuai dengan fungsi tes sumatif, yaitu memberikan tanda
kepada siswa bahwa mereka telah mengikuti suatu program
dan untuk menentukan posisi kemampuan siswa
dibandingkan dengan kawan dalam kelompoknya, maka
tidak diperlukan suatu tuntutan harus berapa tingkat
penguasaan yang dicapai. Namun demikian tidak berarti
bahwa tes sumatif tidak penting. Perlu diingat bahwa tes
sumatif ini dilaksanakan pada akhir program, berarti nilainya
digunakan untuk menentukan kenaikan kelas atau kelulusan.
Secara terpisah tidak ditentukan tingkat pencapaiannya,
tetapi secara keseluruhan akan dikenakan suatu norma
tertentu yaitu nora kenaikan kelas atau norma kelulusan.
i) Ditinjau dari cara pencatatan hasil
(1) Tes diagnostik
Dicatat dan dilaporkan dalam bentuk profil
(2) Tes formatif
Prestasi tiap siswa dilaporkan dalam bentuk catatan berhasil
atau gagal menguasai sesuatu tugas
(3) Tes sumatif
Keseluruahan skor atau sebagian skor dari tujuan-tujuan
yang dicapai.
Scawia B Anderson membedakan tes menurut dimensi-
dimensi seperti tersebut di bawah ini.
1. Tes ditinja dari unsur suatu kegiatan dapat dibedakan atas tes
pengukur proses dan tes pengukur hasil
2. Tes ditinjau dari tujuan penggunaan hasil. Dibedakan ata tes
formatif tes sub sumatif dan tes sumatif (keterangan lebih
rinci terdapat di bagian lain).
3. Tes ditinjau dari konstruksi yang diukur, dibedakan atas tes
kepribadian, tes bakat, tes kemampuan tes minat, perhatian
dan sikap
4. Tes ditinjau dari isi atau bidang studi dibedakan atas: tes
matematika, sejarah IPA, olahraga, keterampilan dan
sebagainya
5. Tes ditinjau dari lingkup materi yang diungkap dibedakan
atas tes pencapaian dan tes penelusuran. Tes hasil belajar
mengungkap materi yang luas. Sedangkan tes penelusuran
dikenakan pada sebagian kecil bhan agar tester, dapat lebih
cermat mengamati sesuatu.
6. Tes ditinjau keragaman butri atau tugas dibedaka atas tes
homogen dan heterogen. Tes yang digunakan untuk
mengukur sesuai aspek misalnya faktor minat, maka tesnya
terdiri dai butir-butir yang seragam (homogen tester standar
biasnya terdiri dari butir-burit yang heterogen
7. Tes ditinjau dari cara tester memberikan respon, dibedakan
atas tes tertulis, tes lisan,tes keterampilan, tes pengenalan
8. Tes ditinjau dari cara skoring, dibedakan atas tes objektif
(dikenai dengan check point) dan tes subjektif (tes yang
memerlukan pertimbangan subjektivitas penilai).
9. Tes ditinjau dari standar dalam menentukan jawaban, yakni
tes yang menentukan adanya kebenaran mutlak (mengan
benar-salah) dan tes yang dimaksudkanuntuk sekedar
mengetahui keaadaan seseorang, misalnya, tes untuk sikap
atau pendapat seseorang.
10. Tes ditinjau dari cara penadministrasian dibedan atas pre-test
(tes awal) yang dilakukan sebelum diberikannya perlakuan.
Dan post test (test akhir) yang dilakukan sesudah adanya
perlakuan.
11. Tes ditinjau dari tekanan aspek yang diukur, dibedakan atas
speed test, yang ni tes yang digunakan untuk mengukur
kecepatan testee bekerja dan power test, yakni tes yang
digunakan untuk mengukur kemampuan testee. Pembedaan
atas tesberdasarkan aspek ini dijumpai pada tes psikologi
seperti halnya mengukur tes kemampuan umum (TKU).
12. Tes ditinjau dari banyaknya testee yang di tes, dibedakan atas
individual dan tes kelompok. Tes pengukuran intelegensi
yang sifatnya klinis. Merupakan contoh tes individual
sedangkan tes-tes yang berhubungan dengan pencapaian di
lapangan pendidikan industri dan militer pada umumnya tes
kelompok
13. Tes ditinjau dari penyusunannya, dibedakan atas tes buatan
guru dan tes yang diperdagangkan, yang dikenal denga tes
terstandar.
BAB 4
MASALAH TES

1. Pengertian
Istilah tes diambil dair kata testum, suatu pengertian dalam bahasa prancis
kuno yang berarti piring untuk menyisihkan logam-logam mulia. Ada pula
yang mengartikan sebagai sebuah piring yang dibuat dari tanah.
Seoarang ahli bernama James MC. Cattel, pada tahun 1890 telah
memperkenalkan pengertian tes ini kepada masyarakat melalui buku yang
berjudul Mental Test and Measurement. Selanjutnya, di Amerika Serikat tes
berkembang dengan cepat sehingga dalam tempo yang tidak begitu lama
masyarakat mulai menggunakannya.
Banyak ahi yang mulai mengembangkan tes ini untuk berbagai
bidang, namun yang terkenal adalah sebuah tes intelegensi yang disusunn
oleh seoarang prancis bernama Binet, yang kemudan dibantu tes BinetSimon
(1904). Dengan alat ini Binet dan Simon berusaha untuk membeda-bedakan
anak menurut tingkat intelegensinya. Dan pekerjaan Binet dan Simon inilah
kemudian kita kenal istilah-istilah umur kecerdasan (mental age), umur
kalender (chronological age) dan indeks kecerdasan, intelegensi kuesioner
atau inteligence quotient (IQ).
Sebagai perkembangannya, Yarkes di Amerika Serikat menyusun tes
kelompok (group test) yang digunakan untuk menyeleksi calon militer
sebanyak-banyaknya dalam waktu yang singkat. Diperlukan pada waktu
perang dunia 1, tes ini dikenal denga nama Army Alpha dan Army Betha.
Didorong oleh munculnya statistik dalam penganalisaan data dan
informasi, maka akhirnya tes ini digunakan dalam berbagai bidang seperti tes
kemampuan dasar, tes kesalahan perhatian, tes ingatan, tes minat, tes sikap.
Dan sebagainya. Yang dikenal penggunanya di sekolah hanyalah tes prestasi
belajar.
Sebelum sampai kepada uraian lebih jauh. Maka akan diterakan
dahulu arti dari beberapa istilah-istilah yang berhubungan dengan tes ini.
- Tes
(sebelum adanya ejaan yang disempurnakan dalam bahasa indonesia
ditulis dengan test) adalah merupakan alat atau prosedur yang digunakan
untuk mengetahui atau mengukur suatu dalam suasana dengan cara dan
aturan-atuaran yang sudah ditentukan. Untuk mengerjakan tes ini
tergantung dari petunjuk yang diberikan. Misalnya, melingkari salah satu
huruf di depan pilihan jawaban, menerangkan, mencoret jawaban salahm
melakukan tugas atau suruhan, menajawab secara lisan dan sebagainya
- Testing
Testing merupakan saat pada waktu tes itu dilaksnakan. Dapat juga
dikatakan testing adalah saat pengambilan tes.
- Testee
(dalam istilah bahasa indonesia tercoba) adalah responden yang sedang
mengerjakan tes. Orang-orang inilah yang akan dinilai atau diukur, baik
mengenai kemampuan, minat, bakat, pencpaian, dan sebagainya.
- Tester
(dalam istilah indonesia:pencoba), adalah orang yang diserahi untuk
melaksnakan pengambilan tes terhadap para responden.
Dengan kata lain, tester adalah subjek evaluasi (tetapi adakalany hanya
orang yang ditunjuk oleh subjek evaluasi untuk melaksnakan tugasna)
tugas tester antara lain:
a. Mempersiapkan ruangan dan perlengkapan yang diperlukan
b. Membagikan lembaran tes dan alat-alat lain untuk mengerjakan
c. Menerangkan cara mengerjakan tes
d. Mengawasi responden mengerjakan tes
e. Memberikan tanda-tanda waktu
f. Mengumpulkan pekerjaan responden
g. Mengisi berita acara atau laporan yang diperlukan ( jika ada)

2. Persyaratan Tes
pada bagian permulaan buku ini telah disinggung bahwa mengukur
panjang sisi mena dengan menggunakan karet ember yang diulur-ulur
sama halnya dengan tidak mengukur. Hasil ukurannya tidak akan
dipercapa. Akan tetapi bila keadaanya memang terpaksam yaitu apabila
kita harus melakukan pengukuran padahal yang ada distu hanyalah sehelai
tali karet ember. Maka dapat menggunkan tali itu asal menggunakannya
mengikuti aturan tertenu, yakni tidak ditarik-tarik.
Apbaila situasi ini kita pindahkan kepada pelaksanaan evaluai tes. Maka
dapat disajikan dalam situasi berikut ini:
a. Seorang guru yang belum berpengalaman menyusun tes, mengadakan
tes bahasa indonsesia. Kepada siswa diberikan sebuah bacaan panjang
dan beberapa pertanyaan yang dimaksudkan untuk mengukur
kemampuan siswa menangkap isi bacaan tersebut, tetapi hanya
meliputi sebagian awal dari bacaan saja. Di samping itu, siswa diminta
untuk mengambil beberapa kata sukar dari bacaan itu dan
menerangkan artinya. Pada waktu tes berlangsung. Guru mengguinya
dengan teliti dan tidak memberi kesempatan kepada siswa untuk saling
bekerja sama. Ter berjalan tertib.
b. Seorang guru yang sudah berpengalaman. Menyusum sebuah tes
dengan baik. Kebetulan guru ini juga mengajar Bahasa Indonesia.
Seperti hal nya guru pertama, ia memberikan sebuah bacaan dan
diikuti dengan pertanyaan-pertanyaan tentang isi bacaan. Setelah itu
diikuti oleh deretan kata-kata sukar yang harus diterangkan oleh siswa.
Pada waktu pelaksanaan tes, guru ini mendadak sakit dak pengawasan
terhadap pelaksanaan tes diserahkan kepada kawannya
Dari gambaran dua buah situasi tes di atas dapat dengan cepat
diambil kesimpulan bahwa keduanya merupakan dua contoh pelaksanaan
tes yang tidak diharapkan. Keduanya tidak akan menghasilkan informasi
yang baik tentang siswa.
Dari contoh pertama. Yang kurang baik adalah tesnya.
Pertanyaannya disusun dengan kurang cermat. Para siswa dibebaskan
untuk memilih kata-kata yang sukar dan menerangkannya. Dengan
demikian akan terdapat banyak sekali variasi jawaban. Sehingga guru akan
menjumpai kesulitan pada waktu menilai. Guru tidak dapat memperoleh
gambaran tentang tingkat kemampuan siswanya. Nilai yang diperoleh
tidak dpat dimanfaatkan untuk mendiagnosis maupun untuk mengisi rapor.
Dari contoh kedua, tes yang disusun oleh guru sudah baik. Dengan
pengarahan dari guru. Yakni memberikan kata-kata sukar yang harus
diterangkan oleh siswa. Guru dapat memperoleh informasi siswa mana
yang sudah menguasai bahan dan siswa mana yang belum. Akan tetapi
kesalahannya terletak pada pelaksanaan/administrasi tes. Oleh karena
situasi memberikan peluang kepada siswa untuk saling menyeragamkan
jawaban. Maka guru tidak dapat memperoleh gambaran siapa sebenarnya
siswa yang sudah menguasai bahan pelajaran sehingga dapat menjadi
sumber informasi dan menjadi jasa kepada kawan-kawaannya.
Dari contoh dan keterangan ini semua dengan singkat dapat
dikatakan bahwa sumber persyaratan tes didasarkan atas dua hal:
Pertama : menyangkut mutu tes
Kedua : menyangkut pengadministrasian dalam pelaksanaan.
Walaupun dalam melaksanakan tes sudah diusahakan mengikuti
aturan tentang suasana. Cara dan prosedur yang telah ditentukan tes itu
mengandung kelemahan. Gilber Sax (1980,31-42) menyebutkan beberapa
kelemahan sebagai berikut:
1) Adakalanya tes (secara psikologis terpaksa) menyinggung pribadi
seseorang. (walaupun tidak disengaja demikian), misalnya dalam
rumusan soal, pelaksanaan. Maupun pengumuman hasi. Dalam
kompetisi tersebut merebut suatu kesempatan yang pemilihannya
melalui tes. Mau tidak mau tentu ada pihak-pihak yang dikalahkan dan
itu tentu merasa tersinggung pribadinya.
2) Tes menimbulkan kecemasan sehingga memengaruhi hasil belajar
yang murni. Tidak dapat dipungkiri bahwa tes akan menimpulkan
suasana khusus yang mengakibatkan hal-hal yang tidak sama antara
orang yang satu denga yang lain. Di dalam penelitiannya, Kirkland
(1971) menyimpulkan bahwa
a) Besar kecilnya kecemasan mempengaruhi murni dan tidaknya hasil
belajar
b) Murid yang kurang pandai mempunyai kecemasan yang lebih besar
dibandingkan dengan anak yang berkemampuan tinggi.
c) Kebiasaan terhadap tipe tes dan pengadministrasian mengurangi
timbilnya kecemasan dalam tes.
d) Dalam kecemasan yang tinggi, murid akan mencapai hasil baik jika
soalnya bersifat ingatan, tetapi hasilnya tidak baik jika soalnya
pikiran.
e) Timbulnya kecemasan sejalan dengan tingkatan kelas
f) Meskipun pada tingkat sekolah dasar tidak terdapat perbedaaan
kecemasan. Anatara anak laki-laki dengan anak perempuan, tetapi
di tingkat sekolah menengah anak perempuan cenderung
mempunyai kecemasan yang lebih tinggi dibandingkan anak laki-
laki.
Banyak penelitian telah dilakukan oleh para ahli, tentan gkecemasan
ini. Secara umum dapat disimpulkan bahwa bagaimana pun bebasnya
suasana tes. Namun tampak bahwa penampilan testee akan berbeda
dengan jika pertanyaaan dilakukan bukan dalam suasana atau mengusir
kecemasan dengan cara menggigir tkuku, mengetuk meja, dan
sebagainya. Mengingat bahwa hasil tes dipergunakan untuk
menentukan nasib seseorang maka guru harus sangat berhati-hati dalam
memberikan pertimbangan.

3) Tes mengategorikan siswa secara tetap


Dengan mengikuti hasil tes pertama kadang-kadang orang lalu
membedakan cap kepada siswa menurut kelompok atau kategorinya,
misalnya A termasuk pandai, sedang atau kurang. Sangat sukar bagi
tester untuk mengubah predikat tersebut jika memang tidak sangat
menyolok hasil dari tes berikutnya.
4) Tes tidak mendukung kecemerlangan dan daya kreasi siwsa
Dengan rumusan soal tes yang kompleks kadang-kadang siswa yang
kurang pandai hanya melihat pada kalimat secara sepintas. Cara seperti
ini boleh jadi menguntungkan karena waktu yang disediakan tidak
banyak habis terbuang. Siswa-siswa yang pandai, karena terlalu hati-
hati mempertimbangkan susunan kalimat. Dapat terjebak pada suatu
butiran tes dan mereka akan kehabisan waktu.
5) Tes hanya mengukur aspek tingkah laku yang sangat terbatas
Manusia mempunyai seperangkat sifat (traits) yang tidak semuanya
diukur melalui tes. Tingkah laku sebagai cermin dari sifat manusia
adakalanya lebih cocok diketahi pengalaman secara cermat. Beberapa
sifat yang lain mungkin perlu diukur dengan berbagai instrumen yang
bukan tes.

3. Ciri-ciri tes yang baik


Sebuah tes yang dapat dikatakan baik jika alat pengukur, harus memenuhi
persyaratan tes, yaitu memiliki:
a. Validitas
Sebelum mulai dengan penjelasan perlu kiranya dipahami terlebih dahulu
perbedaan arti istilah “validitas” dengan “valid”, validitas merupakan
sebuah kata benda, sedangkan valid merupakan kata sifat; dari
pengalaman sehari-hari tidak sedikit siswa atau guru mengatakan “Tes ini
baik karena sudah validitas” jelas kalimat tersebut tidak tepat, yang benar
adalah “tes ini sudah baik karena sudah valid atau tes ini baik karena
memiliki validitas tinggi.
Dalam pembicaraan evaluasi pada umumnya orang hanya menenal
istilah “valid” untuk alat evaluasi atau instrumen evaluasi, hingga saat ini
belum banyak buku yang menerapkan istilah valid untuk data. Dalam
buku ini dicoba menjelaskan asal kata pengertian valid untuk instrumen
dimulai dari pengartian valid untuk data.
Sebuah data atau informasi dapat dikatakan valid apabila sesuai
dengan keadaan senyatanaya. Jika data yang dihasilkan dari sebuah
instrumen valid, maka dapat dikatakan bahwa instrumen tersebut valid.
Karena dapat memberikan gambaran tentang data secara benar sesuai
dengan kenyataan atau keadaan sesungguhnya. Dari sedikit uraian dan
contoh dapat disimpulkan bahwa.
Jika data yang dihasilkan oleh instrumen benar dan valid sesuai
kenyataan, maka instrumen yang digunakan tersebut juga valid.
Sebuah tes disebut valid apabila tes itu dapat mengukur apa yang
hendak diukur istilah “valid”, sangat sukar digantinya, ada istilah baru
yang mulai diperkenalkan yaitu sahih sehingga validitas diganti menjadi
kesahihan. Walaupun istilah tepat belum dapat mencakuup semua arti
yang tersirat dalam kata valid, dana kata tepat kadang-kadang digunakan
dalam koteks yang lain. Akan tetapi tambhan kata tepat dalam
menerangkan kata valid dapt memperjelas apa yang dimaksud.
Contoh:
Untuk mengukur besarnya partisipasi siswa dalam proses belajar-
mengajar, bukan diukur melalu nilai yang diperoleh pada waktu ulangan.
Tetapi dilihat melalui:
- Kehadiran
- Terpusatnya perhatian pada pelajaran
- Ketepatan menjawab pertanyaan-pertanyaaan yang diajukan oleh
guru dalam arti relevan pada permasalahannya
Nilai yang diperoleh pada waktu ulangan, bukan menggambarkan
partisipasi, tetapi menggambarkan prestasi belajar, ada beberapa macam
validitas, yaitu validitas logis (logical validity) validias ramalan (predicty
validity) dan validitas kesejajaran (concurrent validity) uraian secara
terperinci akan dibicarakan pada bab lain.

b. Reliabilitas
Kata reabilitas dalam bahasa indonesia diambil dari kata reliability dalam
bahasa inggris, berasal dari kata reliable yang artinya dapat dipercaya.
Seperti halnya islilah validitas dan valid, kekacauan dalam penggunaan
istilah “reliabilitas” sering dikacaukan dengan istilah “reliable”. reliabel.
Reliabilitas merupakan kata benda sedangakan reliabilitas merupakan
kata sifat atau kata keadaaan.
Seoang dikatakan dapat dipercaya jika orang tersebut selalu bicara
ajeg. Tidak berubah-ubah pembicaraannya dari waktu ke waktu.
Contoh:
TABEL NILAI TES PERTAMA DAN TES KEDUA

Waktu Tes
Nama Siswa
Pengetesan Pertama Pengetesan Kedua
Amin 6 7
Badu 5,5 6,6
Cahyani 8 9
Didit 5 6
Elvi 6 7
Parida 7 8
Demikian pula halnya sebuah tes. Tes tersebut dikatakan dapat
dipercaya jika memberikan hasil yang tepat apabila diteskan berkali-kali.
Sebuah teas dikatakan reliabel apabila hasil-hasil tes tersebut menjukan
ketetapan. Dengan kata lain, kjika kepada para siswa diberikan tes yang
sama pada waktu yang berlainan, maka setiap siswa akan berada dalam
urutan (rangking) yang sama dalam kelompok.
Walaupn tampaknya hasi tes pada pengetesan kedua lebih baik
akan tetapi karena kenaikannya dialami oleh semua siswa, maka tes yang
digunakan dpat dikatakan memiliki reliabilitas yang tinggi. Kenaikan
hasil tes kedua barangkali disebabkan oleh adanya “pengalaman” yang
diperoleh pada waktu mengerjakan tes pertama. Dalam keaan seperti ini
dikatakan bahwa ada carry-over effect atau practice-effect, yaitu
penjelasan tentang reliabitias secara lebih terperinci.
Jika dihubungkan dengan validitas maka:
a. Validitas adalah ketepatan
b. Reliabiltias adalah keteptapan.
c. Objektivitas
Dalam pengertian sehari-hari dengan cepat diketahui bahwa objektif
berarti tidak adanya unsur pribadi yang mempengaruhi. Lawan dari
objektif adalah subjektif, artinya terdapat unsur pribadi yang masuk
memengaruhi. Sebuah tes dikatakan memiliki objektivitas apabila dalam
melaksanakan tes itu tidak ada faktor subjektif yang memengaruhi. Hal
ini terutama terjadi pada sistem skoringnya.
Apabila dikaitkan dengan reliabilitas maka objektivitas menekankan
ketetapan (consistency) pada sistem skoring, sedangkan reliabilitas
menekankan ketetapan dalam hasil tes.
Ada 2 (dua) faktor yang memengaruhi subjektivitas dari suatu tes, yaitu
bentuk tes dan penilai.
1) Bentuk tes
Tes yang berbentuk uraian, akan memberi banyak kemungkinan
kepada si penilai untuk memberikan penilaian menrut caranya sendiri.
Dengan demikian maka hasil dari seoarang siswa yang mengerjakan
soal-soal dari sebuah tes akan dapat berbeda apabila dinilai oleh dua
orang penilai. Itulah sebabnya pada waktu ini ada kecenderungan
penggunaan tes objektif di berbagai bidang. Untuk menghindari
masuknya unsur subjektivitas dari penilai. Maka sistem skoringnya
dapat dilakukkan dengan cara sebaik-baiknya, antara lain dengan
membuat pedoman skoring terlebih dahulu.
2) Penilai
Subjektivias dari penilai akan dapat masuk secara agak leluasa.
Terutama dalam tes bentuk uraian. Faktor-faktor yang memengaruhi
subjektifitas. Anatara lain. Kesan penilai terhadap siswa. Tulisan
bahasa. Waktu mengadakan penilaian, kelelahan dan sebagainya.
Untuk menghindari atau mengurangi masuknya unsur subjektifitas
dalam pekerjaan penilaian, maka penilaian atau evaluasi ini harus
dilaksanakan dengan mengingat pedoman. Pedoman yang dimaksud
terutama menyangkut masalah pengadministrasian, yaitu kontinuitas
dan komprehensivitas
a) Evaluasi harus dilakukan secara kontinu (terus –menerus), dengan
evaluasi yang berkali-kali dilakukan maka guru akan memperoleh
gambaran yang lebih jelas tentang keadaan siswa. Tes yang
diadakan secara on the spot dan hanya satu atau dua kali. Tidak
akan dpat memberikan hasil yang objektif tentang keadaan
seorang siswa. Faktor kebetulan. Akan sangat mengganggu
hasilnya. Kalau misalnya ada orang anak yang sebetulnya pandai,
tetapi pada waktu mengadakan tes dia sedang dalam kondisi yang
jelek karena semalaman merawat ibunya yang sedang sakit, maka
sada kemungkinan nilai tesnya jelek pula.
b) Evaluai harus dilakukan secara komprehensif (menyeluruh) yang
dimaksud dengan evaluasi yang komprehensif disini adalah atas
berbagai segi peninjauan yaitu:
(1) Mencakup keseluruhan materi.
(2) Mencakup berbagai aspek berfikir (ingatan, pemahaman
aplikasi dan sebagainya)
(3) Melalui berbagai cara aitu tes tertulis, tes lisan tes pembuatan
pengamatan insidental dan sebagainya.

d. Praktikabilitas
Sebuah tes dikatakan meiliki praktikabilitas yaitu tinggi apabila tes
tersebut bersifat praktis, mudah pengadministrasiannya.
Tes yang praktis adalah tes yang:
1) Mudah dilaknakanak misalnya tidak menuntut peralatan yang banyak
dan memberi kebebasan kepada siswa untuk mengerjakan terlebih
dahulu bagian yang dianggap mudah oleh siswa.
2) Mudah pemeriksaanya, artinya bahwa tes itu dilengkapi dengan kunci
jawaban maupun pedoman skoringnya. Untuk soal bentuk objektif.
Pemeriksaan akan lebih mudah dilakukan jika dikerjakan oleh siswa
dalam lembar jawaban.
3) Dilengkapi dengan petunjuk-petunjuk yang jelas sehingga dapat
diberikan/diawali oleh orang lain.

e. Ekonomis.
Yang dimaksud dengan ekonomis disini ialah bahwa pelaksanaan tes
tersebut tidak membutuhkan ongkos/biaya yang mahal, tenaga yang
banyak dan waktu yang lama.
BAB 5
VALIDITAS

Seperti sudah disinggung di depan bahwa ketentuan penting dalam evaluasi


adalah bahwa hasilnya harus sesuai dengan keadaan yang dievaluasi.
Mengevaluasi dapat diumpamakan sebagai pekerjaan memotret. Gambar potret
atau foto dikatakan baik apabila sesuai dengan aslinya (bukan lebih baik dari
aslinya seperti dikatakan oleh iklan foto). Gambar pemotretan hasil evalauasi
tersebut di dalam kegiatan evaluasi dikenal dengan data evaluasi. Data evaluasi
yang baik sesuai dengan kenyataan disebut data valid. Agar dapat diperoleh data
yang valid, instrumen atau alat untuk mengevaluasinya harus valid. Jika
pernyataan tesebut dibalik. Instrumen evaluasi dituntut untuk valid karena
diinginkan dapat diperoleh data yang valid. Dengan kata lain, instrumen evaluasi
dipersyarakan valid agar hasil yang diperoleh dari kegiatan evaluasi valid.
Dalam pembicaraaan ini akan dikemukakan adanya dua jenis validitas. Validitas
pertama menyangkut soal cara keseluruhan yang akan di bahas pada bagian awala
bab ini. Sesudah selesai, disusul pembahasan validitas kedua. Yaktni validitas
menyangkut butir soal atau item dan validitas faktor yang menyangkut bagian
materi.
1. Macam-Macam Validitas
Di dalam buku Encyclopedia Of Educational Evaluation, yang ditulis oleh
Scarvia B. Anderson dan kawan-kawan disebutkan:
A test is valid if it measures what it purpose to measure. Atau jika
diartikan lebih kurang demikian: sebuah tes dikatakan valid apabila tes
tersebut mengukur apa yang hendak diukur. Dalam bahasa indonesia “Valid”
disebut sebagai istilah “Sahih”
Sebenarnya pembicaraan validitas ini bukan ditekankan pada tes itu
sendiri tetapi pada hasil pengetesan skornya.
Contoh:
Skor yang diperoleh dari hasil mengukur kemampuan mekanik akan
menunjukkan kemampuan seseorang dalam memegang dan memperbaiki
mobil, bukan pengetahuan tersebut dalam hal yang berkaitan dengan mobil.
Tes yang mengukur pengetahuan tentang mobiil bukanlah tes yang sahih
untuk mekanik.
Validitas sebuah tes dapat diketahui dari hasil pemikiran dan dari hasil
pengalaman, hal yang pertama dakan diperoleh validitas logis (logical
validity) dan hal yang kedua diperoleh validitas empiris (empirical validity)
dua hal inilah yang dijadikan dasar pengelompokan validitas tes
Secara gari besar ada dua macam validitas, yaitu validitas logis dan
validitas empiris
a. Validitas Logis
Istiliah validitas logis mengandung kata logis yang berasal dari kata
logika yang berarti penalaran. Dengan makna demikian maka validitas
logis untuk sebuah instrumen evaluasi menunjuk pada kondisi bagi
sebuah instrumen yang memenuhi persyaratan valid berdasarkan hasil
penalaran. Kondisi valid tersebut dipandang terpenuhi karena instrumen
yang bersangkutan sudah dirancang secara baik. Mengikuti teori dan
ketentuan yang ada. Sebagaimana pelaksanaan tugas lain misalnya
membuat sebuah karangan. Jika penulis mengikuti aturan mengarang.
Tentu secara logis karanganya sudah baik. Berdasarkan penjelasan
tersebut maka instrumen yang sudah disusun berdasarkan teori
penyusunan instrumen, secara logis sudah valid, dari penjelasan tersebut
kita dapat memahami bahwa validitas logis dapat dicapai apabila
isntrumen disusun mengikuti ketentuan yang ada, dengan demikian
disimpulkan bahwa validitas logis tidak perlu diuji kondisinya. Tetapi
langsung diperoleh sesudah instrumen tersebut selesai disusun.
Ada dua macam validitas logis yang dapat dicapai oleh sebuah
instrumen yaitu validitas isi dan validitas konstrak (Construct Validity).
Validitas isi bagi sebuah instrumen menunjuk suatu kondisi sebuah
instrumen yang disusun berdasarkan isi materi pelajran yang dievaluasi.
Selanjutnya validitas konstrak sebuah instrumen menunjuk suatu kondisi
sebuah instrumen yang disusun berdasarkan konstrak askpek-aspek
kejiawaan yang seharunya dievaluasi. Penjelasan lebih jauh tentang kedua
jenis validitas logis ini akan diberikan berturut-turut dalam membahas
jenis validitas instrumen nanti
b. Validitias Empiris
Istilah validitas empiris menurut kata empiris yang artinya pengalaman.
Sebuah instrumen dapat dikatakan memiliki validitas empiris apabila
sudah diuji dari pengalaman. Sebagai contoh sehari-hari, sehorang dapat
diakui jujur oleh masyarakat apabila dalam pengalaman membuktikan
bahwa orang tersebut memang jujur. Contoh lain, seorang dapat dikatakan
keratif apabila dari pengalaman dibuktikan bahwa orang tesebut sudah
banyak menghasilkan ide-ide baru yang diakui berbeda dari hal-hal yang
sudah ada. Dari penjelasan dan contoh tersebut diketahui bahwa validitas
empiris tidak dapat diperoleh hanya dengan menyusun instrumen
berdasarkan ketentuan seperti halnya validitas logis, tetapi harus
dibuktikan melalui pengalaman.
Ada dua macamvaliditas empiris, yakni ada dua cara yang dapat
dilakukan untuk menguji bahwa sebuah instrumen memang valid.
Pengujian tersebut dilakukan dengan membandingkan kondisi instumen
yang bersangkutan dengan kriterium atau sebuah ukuran. Kriteria yang
digunakan sebagai skor pembanding kondisi instrumen. Dimaksud ada
dua yaitu yang sudah tersedia dan yang belum tersedia tetapi akan terjadi
diwaktu yang akan datang. Bagi instrumen yang kondisinya sesuai dengan
kriterium yang sudah tersedia, yang sudah ada, disebut memiliki validitas
“ada sekarang” yang dalam istilah bahasa inggris disebut memiliki
concurrent validity. Selanjutnya instumen yang kondisinya sesuai dengan
kriterium yang diramalkan akan terjadi, disebut memili validitas ramalan
atau validitas prediksi. Yang dalam istilah bahasa inggris disebut
memiliki predictive validity.
Dari uraian ada dua jenis validitas logis yang ada dua macam dan
validitas empiris juga, yang juga ada dua macama, maka secara
keseluruhan kita mengenal adanyaempat validitas yaitu 1) validitas isi 2)
validitas konstrak, 3) validitas “ada sekarang” dan 4)validitas predictive.
Dua yang pertama yakni (1) dan (2) dicapai melalui penyusunan
berdasarkan ketentuan atau teori, sedangkan teori berikutnya yakni (3)
dan (4) dicapai atau diketahui sesudah dibuktikan melalui pengalaman.
Adapun penjelasan masing-masing validita adalah sebagai berikut:
1) Validitas isi (content validity)
Sebuah tes dikatakan memiliki validitas isi apabila mengukur tujuan
khusus tertentu yang sejajar dengan materi atau isi pelajaran yang
diberikan. Oleh karena materi yang diajarkan tertera dalam kurikulum
maka validitas isi ini sering juga disebut validitas kurikuler.
Validitas isi dapat diusahakan tercapainya sejak saat penyusunnan
dengan cara memerinci materi kurikulum atau meter, buku pelajaran
bagaimana cara merinci materi untuk kepentingan diperlukan validitas
isi sebuah tes akan dibicarakan secara lebih mendalam pada waktu
menjelaskan cara penyusunan tes.
2) Validitas konstruksi (contruct validity)
Sebuah tes dikatakan memiliki validitas konstruksi apabila butir-butir
soal yang membangun tes tersebut mengukur setiap aspek berpikir
seperti yang disebutkan dalam tujuan instruktusional khusus. Dengan
kata lain jika butir-butir soal mengukur aspek berpikir tersebut sudah
sesuai dengan aspek berpikir yang menjadi tujuan instruksional.
Sebagai contoh jika rumusan tujuan instruksional khusus (TIK)
psikologis maka butir soal pada tes merupakan perintah agar siswa
membedakan antara dua efek tersebut, sekarang TIK dikenal dengan
indikator.
“konstruksi” dalam pengertian ini bukanlah susunan seperti yang
sering dijumpai dalam teknik. Tetapi merupakan rekaan psikologis,
yaitu suatu rekaan yang dibuat oleh para ahli ilmu jiwa yang dengan
suatu cara tertentu merinci isi jiwa atas bebrapa aspek seperti: ingatan,
pemahaman, aplikasi dan seterusnya. Dalam hal ini mereka
menganggap seolah-olah jiwa dapat dibagi-bagi, tetapi sebenarnya
tidak demikian. Pembagian ini hanya merupakan tindakan sementara
untuk mempermudah mempelajari.
Seperti halnya validitas isi. Validitas konstruksi dapat diketahu
dengan cara memerinci dan memasangkan setiap butir soal dengan
setiap aspek dalam TIK. Pekerjaan dilakukan berdasarkan logika,
bukan pengalaman. Dalam pembicaraan mengenai penyusunan tes hal
ini akan disinggung lagi.
3) Validitas “ada sekarang” (concurrent validity)
Validitas ini lebih umum dikienal dengan validitas empiris, sebuah tes
dikatakan memiliki validitas empiris jika hasilnya sesuai dengan
pengalaman. Jika ada istilah sesuai tentu ada dua hal yang
dipasangkan. Dalam hal ini hasil tes dipasangkan dengan hasil
pengalaman. Pengalaman selalu mengenai hal yang telah lampau
sehingga data pengalaman tersebut sekarang sudah ada (ada sekarang
concurrent)
Misalnya seorang guru ingin mengetahu apakah tes yang disusun
sudah valid atau belum. Untuk diperlukan sebuah kriterium masa lalu
yang sekarang datanya dimiliki. Misalnya nilai ulangan harian atau
nilai ulangan sumatif yang lalu.
4) Validitas preksi (Predictive validity)
Memprekdiksi artinya meramal, dengan meramal selalu mengenal hal
yang akan datang jadi sekarang belum terjadi, sebuah tes dikatakan
memiliki validitas prediksi atau validitas ramalan. Apabila
mempunyai kemampuan untuk meramalkan apa yang akan terjadi
pada masa saya yang akan datang
Sebagai alat pembanding validitas prediksi adalah nilai-nilai yang
diperoleh setelah tes mengikuti pelajaran di perguruan tinggi. Jika
ternya siapa yang memiliki nilai tes lebih tinggi gagal dalam ujiam
semester 1 dibandingkan dengan yang dahulu nilai tesnya muda maka
tes masuk yang dimaksud memiliki nilai tes lebih tinggi gagal dalam
ujian smester 1 dibandingkan dengan dahulu nilai tesnya lebih rencah,
maka tes masuk yang dimaksud tidak memiliki validitas prediksi.
2. Cara Mengetahui Validitas Alat Ukur
Sekali lagi diulang bahwa sebuah tes dikatakan memiliki validitas jika
hasilnya sesuai dengan kriterium, dalam arti memiliki kesejajaran antra hasil
tes tersebut dengan kriterium. Teknik yang digunakan untuk mengetahui
kesejajaran adalah teknik korelasi product moment yang dikemukakan oleh
pearson.
Rumus korelasi product ada 2(dua) macam yaitu
a. Korelasi product moment dengan simpangan dan
b. Korelasi product moment dengan angka kasar.
Rumus korelasi product moment dengan simpangan:

Dimana:
rxy = koefisien korelasi antra variabel X dan variabel Y, dua variabel
yang dikorelasikan (x = X –X dan y=Y – Y)
xy = jumlah perkalian x dengan y
x2 = kuadrat dari x
x2 = kuadrat dari y

Contoh perhitungan:

Misal akan menghitung validitas tes prestasi belajar matematika, sebagai


kriterium diambil rata-rata ulangan yang akan dicari validitasnya diberi x dan
rata-rata nilai harian diberi kodeY. Kemudian dibuat tabel persiapan sebagai
berikut.
TABEL PERSIAPAN UNTUK MENCARI VALIDITAS TES PRESTASI
MATEMATIKA

No Nama X Y x y x2 y2 XY
1 Nadia 6,5 6,3 0 - 0,1 0 0,01 0
2 Susi 7 6,8 + 0,5 + 0,4 0,25 0,16 + 0,2
3 Cecep 7,5 7,2 + 1,0 + 0,8 1 0,64 + 0,8
4 Erna 7 6,8 + 0,5 + 0,4 0,25 0,16 + 0,2
5 Dian 6 7 - 0,5 + 0,6 0,25 0,36 - 0,3
6 Asmara 6 6,2 - 0,6 - 0,2 0,25 0,04 + 0,1
7 Siswoyo 5,5 5,1 - 0,7 - 1,3 1 1,69 + 1,3
8 Jihad 6,5 6 0 - 0,4 0 0,16 0,0
9 Yana 7 6,5 + 0,5 + 0,1 0,25 0,01 + 0,05
10 Lina 6 5,9 - 0,5 - 0,6 0,25 0,36 + 0,3
Jumlah 65 63 3,5 3,59 2,65

X=X- X
Y=Y- Y
Dimasukan ke rumus
𝑥𝑦
𝑟𝑥𝑦 =
√(2𝑥 )(2𝑦 )

2,65 2,65
= =
√ 3,5𝑥3,59 √12,565

2,65
= 3,545

Indeks korelasi antara X dan Y inilah indeks validitas soal yang dicari.
Rumus korelasi product moment dengan angka kasar:
𝑵  𝑿𝒀 − (𝑿)(𝒀)
𝒓𝒙𝒚 =
√{𝑵𝑿𝟐 (𝑿)𝟐 }{𝑵𝒀𝟐 − (𝒀)𝟐 }

Dimana:
rxy = koefisien korelasi antara variabel X dan variabel Y, dan variabel yang
dikorelasikan
dengan menggunakan data hasil tes prestasi matematika di atas kini
dihitung dengan rumus korelasi product moment dengan angka kasar yang
tabel persiapannya sebagai berikut:

No Nama X Y x2 y2 XY
1 Nadia 6,2 6,3 42,25 39,69 40,95
2 Susi 7 6,8 49 46,24 47,6
3 Cecep 7,5 7,2 56,25 51,84 54
4 Erna 7 6,8 49 46,24 47,6
5 Dian 6 7 36 49 42
6 Asmara 6 6,2 36 38,44 37,2
7 Siswoyo 5,5 5,1 30,25 26,01 28,05
8 Jihad 6,5 6 42,25 45,5 39
9 Yana 7 6,5 49 36 45,5
10 Lina 6 5,9 36 34,81 35,4
Jumlah 65 63,8 426 410,5 417,3

Dimasukan ke dalam rumus:


𝑵  𝑿𝒀 − (𝑿)(𝒀)
𝒓𝒙𝒚 =
√{𝑵𝑿𝟐 (𝑿)𝟐 }{𝑵𝒀𝟐 − (𝒀)𝟐 }

10𝑥417,2 = (65𝑥63,8)
𝑟𝑥𝑦 =
√(10𝑥426 − 4225)(10𝑥410,52 − 4070,44)
4173 − 4147
=
√(4260 − 4225)(410,2 − 4070,44)
26 26
= =
√35𝑥34,76 √1216,6
26
= = 0745
34,8797
Jika dibandingkan dengan validitas soal yang dihitung dengan rumus
simpangan, ternyata terdapat perbedaan sebesar 0,003 lebih besar yang
dihitung dengan rumus simpanganan. Hal ini wajar karena dalam
mengerjakan perkalian atau penjumlahan jika diperoleh 3 atau angka di
belakang koma dilakukan pembulatan keatas. Perbedaan ini sangat kecil
sehingga dapat diabaikan.
Untuk memperjelas pengertian tersebut dapat disampaikan keterangan
sebagai berikut.
- Korelasi fositif menunjukan adanya hubungan sejajar antara dua hal
misalnya hal pertama nilanya naik, hal kedua ikut naik sebaliknya jika
hal pertama turun, yang kedua ikut turun.
Contoh korelasi positif antara nilai IPA dan Matematika
IPA : 2, 3, 5, 7, 4, 3, 2
Matematika : 4, 5, 6, 8, 5, 4, 2
Kondisi nilai matematika sejajar dengan IPA karena naik dan turunnya
nilai matematika mengikuti naik dan turunnya nilai IPA, Coba
Perhatikan!
- Korelasi negatif menunjukan adanya hubungan kebalikan antara dua hal.
Misalnya, hal pertama nilai naik, justru yang kedua turun sebaliknya jika
yang pertama turun yang kedua naik.
Contoh korelasi negatif antara nilai bahasa indonesia dengan matematika
Bahasa Indonesia : 5, 6, 8, 4, 3, 2,
Matematika : 8, 7, 5, 1, 2, 3
Keadaan hubungan antara dua hal yang kita jumpai dalam
kehidupan sehari-hari tidak selalu hanya positif atau negatif saja, tetapi
mungkin 0. Biasanya korelasi pun tidak menentu. Coba cermatilah
bagaimana hubungan antara dua nilai mata pelajaran A dan B berikut ini.
Contoh korelasi tidak tertentu.
Nilai A : 5, 6, 4, 7, 3, 8, 7
Nilai B : 4, 4, 3, 7, 4, 9, 4
Koefisien korelasi terdapat antara -1,00 samapai +1,00 namun
karena dalam menghitung sering dilakukan pembulatan angka=angka
sangat mungkin diperoleh koefisien lebih dari 1,00 koefisien negatif.
Menununjukan adanya kesejajaran untuk mengadakan interprestasi
mengenai besarnya koefisien korelasi adalah sebagai berikut:
- Antara 0,800 sampai dengan 1,00 : sangat tinggi
- Antara 0,600 sampai dengan 0,800 : tinggi
- Antara 0,400 sampai dengan 0,600 : cukup
- Antara 0,200 sampai dengan 0,400 : rendah
- Antara 0,000 sampai dengan 0,200 : sangat rendah
Penafsiran harga koefisien korelasi ada 2 (dua) cara yaitu:
1. Dengan melihat harga r dan diinterprestasikan misalnya korelasi
tinggi, cukup dan sebagainya.
2. Dengan berkonsultasi ke tabel harga kritik product moment sehingga
dapat diketahui signifikan tidak korelasi tersebut. Jika harga r lebih
kecil dari harga kritik dalam tabel. Maka korelasi tersebut tidak
signifikan begitu juga arti sebaliknya.

3. Validitas butiran soal atau validitas item


Apa yang sudah dibicarakan di atas adalah validitas soal secara keseluruhan
tes. Disamping mencari validitas soal perlu juga dicari validitas item. Jika
seorang peneliti atau guru yang mengetahui bahwa validitas soal tes misalnya
terlalu rendah atau rendah saja, maka selanjutnya ingin mengetahi butir-butir
tes manakah yang menyebabkan soal secara keseluruhan tersebut jelek karena
memiliki validitas rendah untuk keperluan inilah dicari validitas butir soal.
Pengertian umum untuk validitas item adalah demikian sebuah item
dikatakan valid apabila mempunyai dukungan yang besar terhadap skor total.
Skor pada item menyebabkan skor total menjadi tinggi atau rendah. Dengan
kata lain dapat dikemukakan disini bahwa sebuah item memiliki validitas
yang tinggi jika skor pada item mempunyai kesejajaran dengan skor total.
Kesejajaran ini dapat diartikan dengan korelasi sehingga untuk mengetahui
validitas item digunakan rumus korelasi seperti sudah diterangkan di atas.
Untuk soal-soal bentuk objektif skor untuk item biasa diberikan
dengan 1 (bagi item yang di jawab benar) dan 0 (item yang di jawab salah)
sedangkan skor total selanjutnya merupakan jumlah dari skor untuk semua
item yang membangun soal tersebut.
Contoh perhitungan :
Tabel Analisis Item Untuk Perhitungan Validitas Item
Butir soal/Item skor
No Nama
1 2 3 4 5 6 7 8 9 10 total
1 Hartati 1 0 1 0 1 1 1 1 1 1 8
2 Yoyok 0 0 1 0 1 0 0 1 1 1 5
3 Oktaf 0 1 0 0 0 1 0 1 0 1 4
4 Wendi 1 1 0 0 1 1 0 0 1 0 5
5 Diana 1 1 1 1 1 1 0 0 0 0 6
6 Paul 1 0 1 0 1 0 1 0 0 0 4
7 Susana 1 1 1 1 1 1 1 0 0 0 7
8 Helen 0 1 0 1 1 1 1 1 1 1 8

Misalnya akan dihitung validatis item nomor 6, maka skor item


tesebyt variabel x dan skor total tersebut variabel y. Selanjutnya perhitungan
dilakukan dengan menggunakan rumus korelasi product moment. Baik
dengan rumus simpangan maupun rumus angka kasar.
Penggunaan kedua rumus tersebut masing-masing ada keuntungannya
menggunkan rumus simpangan angkanya kecil-kecil. Tetapi kadang-kadang
pecahanya cenderung banyak pecahan. Mengalikan pecahan persepuluhan
ditambah dengan tanda-tanda plus (+) dan minus (-) kadang-kadang bisa
menyesatkan. Penggunaan rumus angka kasar bilangannya besar-besar tetapi
bulat. Jika ada kalkulator statistik disarankan menggunakan rumus angka
kasar saja. Yang dibutuhkan hanya :X, Y, X2, Y2 dan XY, tidak
perlu membuat tabel seutuhnya.
Contoh perhitungan mencari validitas item
Untuk menghitung validitas item nomor 6, dibuat terlebih dahulu tabel
persiapannya sebagai berikut.
Tabel Persiapan Untuk menghitung Validitas
Item Nomor 6
No Nama X Y
1 Hartati 1 8
2 Yoyok 0 5
3 Oktaf 1 3
4 Wendi 1 5
5 Diana 1 6
6 Paul 0 4
7 Susana 1 7
8 Helen 1 8

Ketrangan:
X = skor item nomor 6
Y = Skor total
Dari perhitungan kalkulator diperoleh data sebagai berikut:
𝑋 = 6
𝑦 = 46
𝑋𝑌 = 37
Xt = 5,57 X
Y = 6,17 Y
Sesudah diketahui X, x2, Y2, dan XY tinggal memasukan
bilangan-bilangan tersebut ke dalam rumus korelasi product moment dengan
rumus angka kasar.
Data diatas dimasukan ke dalam rumus korelasi product moment
dengan angka kasar
𝑁XY − (X)(Y)
𝑟𝑥𝑦 =
√{𝑁X 2 − (X)2 }{𝑁Y 2 − (Y)2 }
8𝑥37 − 6𝑥46
𝑟𝑥𝑦 =
√(8𝑥6 − 62 )(8𝑥288 − 462 )
296 − 276
=
√(48 − 36)𝑥(2304 − 2116)
20 20
= =
√12𝑥188 √2256
20
= = 0,421
47,497

Koefisien validasi item nomor 6 adalah 0,421 dilihat sepintas bilangan


ini memang sesuai dengan kenyataannya. Hal ini dapat diketahui dari skor-
skor yang tertera baik pada item maupun skor total oktaf yang hanya
memiliki skor total 3 dapat memperoleh skor 1 pada item, sengakan yoyok
dan wendi yang mempunyai skor total sama, yaitu 5 skor pada item tidak
sama. Validitas item tersebut kurang meyakinkan tentu saja validitasnya tidak
tinggi.
Masih ada cara-cara lain untuk menghitung validitas item. Salah satu
car yang dikenal adalah menggunkan rumu ypbl; yang rumus lengkapnya
adalah sebagai berikut:

𝑀𝑝 − 𝑀1 𝑝
𝑦𝑝𝑏𝑙 = √
𝑆𝑡 𝑞

Keterangan:
ypbi = koefisien korelasi biserial
Mp = rata skor subjek yang menjawab betul bagi item yang dicari
validitasnya
Mt = rerata skor
St = standar deviasi dari skor total proporsi
p = proporsi siswa yang menjawab benar
𝑏𝑎𝑛𝑦𝑎𝑘𝑛𝑦𝑎 𝑠𝑖𝑠𝑤𝑎 𝑦𝑎𝑛𝑔 𝑏𝑒𝑛𝑎𝑟
𝑝=
𝑗𝑢𝑚𝑙𝑎ℎ 𝑠𝑒𝑙𝑢𝑟𝑢ℎ 𝑠𝑖𝑠𝑤𝑎
q = proporsi siswa yang menjawab salah (q=1 - p)

Apabila item 6 tersebut dicari validitasnya dengan rumus ini maka


perhitungannya melalui langkah sebagai berikut:
8+3+5+6+7+8 37
1. Mencari 𝑀𝑝 = = = 6,17
6 6
8+5+3+5+6+4+7+8 46
2. Mencari 𝑀𝑡 = = = 5,75
8 8
3. Dari kalkulator diperoleh harga standar deviasi, yaitu n =1,7139 atau
n-1 = 1,8323. Untk n kecil diambil standar deviasi yang n=1,7139
6
4. Menentukan harga 𝑝1 yaitu 8 = 0,17
2
5. Menentukan harga 𝑞1 yaitu 8 𝑎𝑡𝑎𝑢 1 − 0,75 = 0,25

6. Memasukan ke rumus 𝑦𝑝𝑏𝑖

𝑴𝒑 − 𝑴𝒕 𝒑
𝒚𝒑𝒃𝒊 = √
𝑺𝟏 𝒒

𝟔, 𝟏𝟕 = 𝟓, 𝟕𝟓 𝟎, 𝟕𝟓
= √
𝟏, 𝟕𝟏𝟑𝟗 𝟎, 𝟐𝟓

𝟎, 𝟒𝟐
= = 𝟏, 𝟕𝟑𝟐𝟏
𝟏, 𝟕𝟏𝟑𝟗
= 𝟎, 𝟒𝟐𝟒𝟒

Dari perhitungan validitas item 6 dengan dua cara ternyata hasilnya


berbeda tetapi sangat kecil yaitu 0,0034. Mungkin hal ini disebabkan karena
adanaya pembulatan angka.

4. Tes terstandar sebagai kriterium dalam menentukan validasi.


Tes terstamdar adalah tes yang telah dicobakan berkali-kali sehingga dapat
dijamin kebaikannya. Di negara-negara berkembang biasa tersedia tes
semacam ini. Dan dikenal nama standardized test. Sebuah tes terstandar
biasanya memiliki identitas antara lain, sudah dicobakan berapa kali dan
dimana berapa koefisien validitas, reliabilitas taraf kesukaran daya pembeda
dan lain-lain keterangan yang dianggap perlu. Cara menentukan validitas soal
yang menggunakan tes standar sebagai kriterium dilakukan dengan
mengalikan koefisien validitas yang diperoleh dengan koefisien tes terstandar
tersebut.
Contoh perhitungan:
Tebel Persiapan Perhitungan Validitas Tes Matematika
Dengan Kriterium Tes Terstandar Matematika

No Nama X Y x2 y2 XY keterangan
1 Nining 5 7 25 49 35
2 Maruti 6 6 36 36 36 X = hasil tes matematika
3 Bambang 5 6 25 36 30 yang dicari validtasnya
4 Seno 6 7 36 49 42
5 Hartini 7 7 49 49 49 Y= hasil tes standar
6 Heru 6 5 36 25 30

Dimasukan ke dalam rumus korelasi product moment dengan angka kasar


sebagai berikut:
𝑁𝑋𝑌 − (𝑋)(𝑌)
𝑟𝑥𝑦 =
√{𝑁𝑋 2 − (𝑋)2 }{𝑁𝑌 2 − (𝑌)2 }
6𝑥22 − 35𝑥38
𝑟𝑥𝑦 =
√(6𝑥207 − 352 (6𝑥244 − 382 )
1332 − 1330
=
√(1242 − 1225)(1464 − 1444)
2
= = 0,108
18,439

Jika dari tes terstandar diketahui bahwa validitas 0,89 naja bukagab 0,108
ini belum merupakan validitas soal matematika yang dicar. Validitas tersebut
harus dikalikan dengan 0,89 yang hasilnya 0,108 x 0,89=0,096
5. Validitas Faktor
Selain validtitas soal secara keseluruhan dan validitas buti yang masih ada
lagi yang perlu diketahui validitasnya. Yaitu faktor-faktor atau bagian
keseluruhan materi. Setiap keseluruhan materi pelajaran terdiri dari pokok-
pokok bahasan atau mungkin sekelompok bahasan yang merupakan satu
kesatuan
Contoh:
guru akan mengevaluasi penguasaan siswa untuk tiga pokok bahan yaitu:
bunyi, cahaya, dan listrik untuk keperluan ini guru tersebut membuat 30 butir
soal, untuk bunyi 8 butir, untuk 12 butir dan untuk listrik 10 butir.
Apabila guru ingin mengetahi validitas faktor, maka ada 3 faktor
dalam soal ini. Seperti halnya pengertian validtias butir, pengertian validtias
faktor adalah sebagai berikut: butir-butir soal dalam faktor dikatakan valid
apabila mempunyai dukungan yang besar terhadap soal secara keseluruhan.
Sebagai tanda bahwa butir-butir faktor tersebut mempunyai dukungan yang
besar terhadap seluruh soal, yakni apabila jumlah skor untuk butir-butir faktor
tersebut jumlah skor untuk butir-butir faktor tesebut menunjukan adanya
kesejajaran dengan skor total. Agar uraian ini lebih jelas, pada halaman
selanjutnya disajikan contoh tabel analisis butirnya.
CONTOH TABEL ANALISIS BUTIR UNTUK MENGHITUNG VALIDITTAS BUTIR DAN
VALIDITAS FAKTOR

Skor Skor Skor


Subjek
Butir
1 2 3 4 5 6 7 8 Faktor 9 10 11 12 13 14 15 16 17 18 19 20 Faktor 21 22 23 24 25 26 27 28 29 30 Faktor
1 2 3
Amir 1 0 1 1 1 1 0 1 6 1 0 1 0 1 0 1 0 1 0 1 0 6 1 0 1 1 1 0 1 1 1 0 7 19
Hasan 1 1 1 1 1 1 1 0 7 1 1 1 1 0 1 1 1 1 0 0 1 9 1 1 1 1 1 1 1 1 1 0 9 25
Ninda 1 0 1 0 1 0 1 0 4 1 1 0 0 0 0 1 1 0 1 1 0 6 1 0 1 1 0 1 1 0 1 1 7 17
Warih 0 1 1 0 0 0 0 1 3 0 0 0 1 1 0 1 0 1 0 0 0 4 1 0 0 0 1 0 0 1 1 1 5 12
Irzal 1 1 1 1 1 1 1 1 8 1 1 1 1 1 1 1 1 1 0 1 1 11 1 1 1 1 1 1 1 1 1 1 10 29
Gandi 1 1 0 1 1 0 1 1 6 1 0 1 1 1 1 1 1 0 1 1 0 9 1 1 1 1 1 0 0 1 1 1 8 23
Santo 1 0 1 0 1 1 0 1 5 1 0 0 0 1 1 1 0 1 1 1 0 7 1 1 1 1 0 0 0 1 1 1 7 19
Tini 1 1 1 1 1 0 1 1 7 1 1 1 1 1 0 0 1 1 1 0 1 9 1 1 1 1 1 1 1 1 1 0 9 25
Yanti 1 1 1 0 0 0 1 1 5 1 0 1 1 0 0 0 0 1 1 1 0 6 1 1 0 1 1 0 0 1 0 0 5 16
Hamid 1 0 1 0 1 0 1 0 4 1 0 0 0 0 0 0 1 1 1 0 1 5 1 1 0 1 1 0 0 0 1 1 6 15
Dedi 1 1 1 1 1 1 1 0 7 1 1 1 1 1 1 1 1 1 1 0 0 10 1 1 1 1 1 1 1 0 1 1 9 26
Desi 1 1 1 1 1 1 1 1 8 1 1 1 1 1 1 1 1 1 1 1 1 12 1 1 1 1 1 1 1 1 1 1 10 30
Wahyu 1 0 0 0 1 1 1 1 5 1 1 0 1 1 0 1 1 0 1 1 0 8 1 1 0 0 0 1 1 1 1 1 7 20
Sudah jelas bahwa butir-butir soal dikatakan apabila menunjukan
kesejajaran skor dengan skor total. Cara mengetahui kesejajaran tersebut
digunakan juga rumus korelasi product moment, misalnya kita akan mengetahui
validitas faktor 1, yakni soal-soal materi bunyi, kita membuat daftar
menyejajarkan kedua skor tersebut sebagai berikut:
Tabel untuk menghitung kesejajaran skor faktor 1
dengan skor total

Skor Faktor Skor Total


Nama Subjek X2 Y2 XY
1 (x) (y)

Amir 6 19 36 361 114


Hasan 7 25 49 625 175
Ninda 4 17 16 289 68
Warih 3 12 9 144 36
Irzal 8 29 64 841 232
Gandi 6 23 36 529 138
Santo 5 19 2 361 95
Tini 7 26 49 676 182
Yanti 5 16 25 256 80
Hamid 4 15 16 25 60
Dedi 7 26 49 676 182
Desi 8 30 64 900 240
Wahyu 5 20 25 400 100
Jumlah ..... ..... ..... ..... .....

Data yang tertera di dalam tabel tersebut diguanakan untuk menentukan


besarnya validitas faktor 1, langkah selanjutnya adalah menjumlakan setiap
kolom. Kemudian memasukan ke dalam rumus korelasi product moment. Harga r
yang diperoleh menunjukan indeks validitas faktor1. Untuk faktor 2 dan 3 caranya
sama, hanya faktornya saja yang diganti.
BAB 6
RALIABILITAS

1. Arti Reliabilitas Bagi Sebuah Tes


Sudah diterangkan dalam persyaratan tes, bahwa reliabilitas berhubungan
dengan masalah kepercayaan. Suatu tes dapat dikatakan mempunyai taraf
kepercayaan yang tinggi jika tes tersebut dapat memberikan hasil yang tetap.
Maka penertian reliabilitas tes, berhubungan dengan masalah ketetapan hasil
tes. Atau seandainya hasilnya berubah-ubah, perubahan yang terjadi dapat
dikatakan tidak berarti.
Konsep tentang reliabilitas ini tidak akan sulit dimengerti apabila
pembaca telah memahami konsep validitas. Tuntutan bahwa instrumen
evaluasi harus valid menyangkut harapan diperolehnya data yang valid sesuai
dengan kenyataan. Dalam hal reliabilitas ini tuntutannya tidak jauh berbeda.
Jika validitas terkait dengan ketepatan objek yang tidak lain adalah tidak
menyimpangnya data dari kenyataan, artinya bahwa data tersebut benar, maka
konsep reliabilitas terkait dengan pemotretan berkali-kali. Instrumen yang baik
adalah instumen yang dapat dengan ajeg memberikan data yang sesuai dengan
kenyataan.
Yang sering ditangkap kurang tepat bagi pembaca adalah pendapat
bahwa “ajeg” atau “tetap” diartikan sebagai “sama” dalam pembicaraan
evaluasi ini tidak demikian. Ajeg atau tetap tidak selalu harus sama. Tetapi
mengikuti perubahan secara ajeg. Jika keadaan si A mula-mula berada lebih
rendah dibandingkan dengan B, maka jika diadakan pengukuran ulang si A
juga berada lebih rendah dari B. Itulahh yang diakatakan ajeg atau tetap. Yaitu
sama dealam kedudukan siswa diantara anggota keloompok yang lain. Tentu
tidak dituntut semuanya tetap. Besarnya ketetapan itulah menunjukan tingginya
reliabilitas instrumen.
Sehubungan dengan reliabilitas ini, scarvia B anderson dan kawan-
kawan menyatakan bahwa persyaratan bagi tes, yaitu validitas dan reliabilitas
ini penting. Dalam hal ini, validitas lebih penting dan reliabilitas ini perlu,
karena menyokong terbentuknya validitas. Sebuah tes mungkin reliabel tetapi
tidak valid. Sebaliknya, sebuah tes yang valid biasanya reliabel.
A reliable measure in one that provide consistent and stable indication of
the characteristic being investigates.
Untuk dapat memperoleh gambaran yang ajegm memang sulit karena
unsur kejiaan manusia itu sendiri tidak aje. Misalnya, kemampuan, kecakapan,
sikap, dan sebagainya berubah-ubah dari waktu ke waktu.
Beberapa hal yang sedikit banyak memengaruhi hasil tes banyak sekali.
Namun secara garis besar dapat dikelompokan menjadi 3 (tiga) hal berikut.
a. Hal yang Berhubungan dengan Tes itu sendiri, yaitu panjang tes dan
kualitas Butir-Butir soalnya
Tes yang terdiri dari banyak butirm tentu saja lebih valid dibandingkan
dengan tes yang hanya terdi dari beberapa butir soal. Tinggi rendahnya
validitas menunjukkan tinggi rendanya reliabilitas tes. Dengan demikian
maka semakin panjang tes, maka reliabilitasnya semakin tinggi. Dalam
menghitung besarnya reliabilitas berhubung dengann penambahan
banyaknya butir soal dalam tes ini ada sebuah rumus yang diberikan oleh
Spearman dan Brown sehingga terkenal dengan rumus Spearman-Brown.
𝑟𝑛𝑚 𝑛𝑟
1+(𝑛−1)𝑟

Dimana:
𝑟𝑛𝑚 : besarnya koefisien, reliabilitas sesudah tes tersebut ditambah butir
soal baru
n : berapa kali butir-butir soal itu ditambah
r : besarnya koefisien reliabilitas sebelum butir-butir soalnya di
tambah
contoh:
suatu tes terdiri atas 40 butir soal, mempunyai koefisien reliabiltias 0,70.
Kemudian butir-butir soal itu ditambah menjadi 60 butir soal.
Maka koefisien reliabilitas baru adalah:
𝑛𝑟
𝑟𝑛𝑚 =
1 + (𝑛 − 1)𝑟
1,5𝑥0,70
=
1 + (1,5 − 1)𝑥0,70
1,05
=
1,35
= 0,79
Demikian maka penambahan sebanyak 20 butir soal dari 40 butir
memperbesarkan koefisien reliabilitas sebesar 0,09. Akan tetapi
penambahan butir-butir soal tes adalakanya tidak berarti. Bahkan
merugikan. Hal ini disebabkan karena:
1) Sampai pada suatu batas tertentu, penambahan banyaknya butir soal
sudah menambah tinggi reliabiltas tes.
Ramers dan Gage menggambarkan hbungunan antra penambahan butir
soal reliabiltiias sebagai berikut:

2) Penambahan tingginya reliabitias tes tidak sebanding nilai dengan


waktu, biaya dan tenaga yang dikeluarkan untuk itu. Misalnya guru
sudah cukup membuat 100 soal bentuk objektif dan 10 soal bentuk esai
sudah cukup mempunyai validitas isi dan tingkah laku 200 dan 20
dengan menambahkan soal-soal yang paralel. Tentu saja hal ini hanya
akan menambah waktu, biaya dan tenaga saja tanpa ada keuntungan
apa-apa. Kualitas butir-butir soal ditentukan oleh:
a) Jelas tidaknya rumusan soal
b) Baik-tidaknya pengarahan soal kepada jawaban sehingga tidak
menimbulkan salah jawab
c) Petunjuknya jelas sehingga mudah dan cepat dikerjakan

b. Hal yang behubungan dengan tercoba (testee)


Suatu tes yang dicobakan kepada kelompok yang terdiri dari banyak siswa
akan mencerminkan keragaman hasil yang menggambarkan besar-kecilnya
reliabilitas tes. Tes yang dicobakan kepa bukan kelompok terpilih akan
menunjukan reliabilitas yang lebih besar dair pda yang dicobakan pada
kelompok tertenu yang diambil secar terpilih.
c. Hal yang berhubungan dengan penyelenggaraan tes
Sudah sebutkan bahwa faktor penyelenggaraan tes yang bersifat
administratif, sangat menentukan hasil tes.
Contoh:
1) Petunjuk yang diberikan sebelum tes dimulai, akan memberi
ketenangan kepada tes-tes dalam mengerjakan tes, dan dalam
penyelenggaraan tidak akan banyak terdapat pertanyaan ketenganan ini
tentu saja akan berpengaruh terhadap hasil tes.
2) pengawas yang tertib akan mempengaruhi hasil yang diberikan oleh
siswa terhadap tes. Bagis siswa-siswa tertentu adanya pengawasan
yang terlalu ketat menyebabkan rasa jengkel dan tidak dapat dengan
leluasa mengerjakan tes.
3) Suasana lingkungan dan tempat tes (duduk tidak teratur, suasana di
sekeleingnya ramai dan sebagainya) akan memengaruhi hasil tes
Adanya hal-hal yang memengaruhi hasil tes ini semua, secara tidak
langsung akan memengaruhi reliabilitas soal tes.
2. Cara-cara mencari besarnya Reabilitas
Sekali lagi reliabilitas adalah ketetapan suatu tes apabila diteskan kepada
subjek yang sama. Untuk mengetahui ketetapan ini pada dsarnya dilihat
kesejajaran hasil. Seperti hal nya beberapa teknik juga menggunakan rumus
korelasi moment untuk mengetahui validitas, kesejajaran hasil dalam
reliabilitas tes.
Kriterium yang digunakan untuk mengetahui ketetapan ada yang berada
di luar tes (consistency external) dan pada tes itu sendiri (consitency internal)
a. Metode Bentuk Paralel (equivalent)
Tes paralel atau tes ekuivalen adalah dua buah tes yang mempunyai
kesamaan tujuan, tingkat kesukaran, dan susunan, tetapi butir-butir
soalnya berbeda. Dalam istilah bahasa inggris disebut alternate form
method (parallel forms).
Dengan metode bentuk parelel ini, dua buah tes yang paralel. Misalnya tes
matematika seri A yang akan dicari reliabilitasnya dan tes seri B diteskan
kepada sekelompok siswa yang sama, kemdian hasilnya dikoreksikan
koefisien korelasi dari kedua hasil tes inilah yang menunjukan koefisien
reliabilitas tes. Seri A. Jika koefisiennya tinggi maka tes tersebut sudah
reliabel dan dapat digunakan sebagai alat pengetes yang terandalkan.
Dalam menggunakan metode tes paralel ini pengetes harus menyiapkan
dua buah tes, dan masing-masing dicobakan pada kelompok siswa yang
sama. Oleh karena itu. Ada orang menyebutkan sebagai double tes-double
trial method. Penggunaan metode ini baik karena siswa dihadapkan kepada
dua macam tes sehingga tidak ada faktor “masih ingat soalnya” yang
dalam evaluasi disebut adanya pratice-effect dan carry over effect artinya
ada faktor yang dibawa oleh pengikut tes karena sudah mengerjakan soal
tersebut.
Kelemahan dari metode ini adalah bahwa pengetes pekerjaaanya berat
karena harus menyusun dua seri tes. Lagi pula harus tersedia waktu yang
lama untuk mencobakan dua kali tes.
b. Metode Tes Ulang (Test-Retest Method)
Metode tes ulang dilakukan orang untuk menhindari penyusunan dua seri
tes. Dalam menggunakan teknik atau metodi ini pengetes hanya memili
satu seri tes, tetapi dicobakan dua kali. Oleh karena tesnya hanya satu dan
dicobakan dua kali. Maka metode ini dapat disebut dengan singgle tes
double trial method. Kemudian hasilnya dari keduakali tes tersebut
dihitung korelasinya.
Untuk tes yang banyak mengungkap pengetahuan (ingatan) dan
pemahaman, cara ini kurang mengena tercoba akan masih ingat akan butir-
butir soalnya. Oleh karena itu. Tenggang waktu antara pemberian tes
pertama dengan kedua menjadi permasalahan tersendiri. Jika tenggang
waktu terlalu sempit, siswa masih banyak ingat materi. Sebaliknya kalu
tenggang waktu terlalu lama, maka faktor-faktor atau kondisi tes sudah
akan berbeda dan siswa sendiri barangkali sudah mempelajari sesuatu.
Tentu saja faktor-faktor ini akan mempengaruhi terhadap reliabilitas.
Pada umumnya hasil tes kedua cenderung lebih baik dari pada hasil tes
pertama. Hal ini tidak mengapa karena pengetes harus sada akan adanya
practice effect dan carry over effect. Yang penting adalah adanya
kesejajaran hasil atau ketetapan hasil yang ditunjukan oleh koefisien
korelasi yang tinggi.
Contoh:
Tes Pertama Tes Kedua
Siswa
Skor Ranking Skor Ranking
A 15 3 20 3
B 20 1 25 1
C 9 5 15 5
D 18 2 23 2
E 12 4 18 4

Walaupun tampak skornya naik, akan tetapi kenaikannya dialimi


oleh siswa
Metode ini juga disebut korelasi diri sendiri (self-correlation
method) larena mengkorelasikan hasil dari tes yang sama.
c. Metode belah dua atau split-half method
Kelemahan penggunaan metodedua tes dua kali percobaan dan satu –tes
duali percobaan diatasi dengan metode ketiga ini, yaitu metode belah dua.
Dalam menggunakan metode ini pengetes hanya menggunakan sebuah tes
dan dicobakan satu kali. Oleh karena itu, disebut juga singel test single
tiral method.
Berbeda dengan metode pertama dan kedua yang setelah
ditemukannya koefisien korelasi langsung ditafsikan itulah koefisien
reliabilitas. Maka dengan metode ketika ini tidak dapat demikian. Pada
waktu membelah dua dan mengkorelasikan dua belahan, baru diketahui
reliabilitas separo tes. Untuk mengetahui reliabiltias seluruh tes harus
digunakan rumus Spearman-brown sebagai berikut:
Banyak pemakai metode ini salah memelah hasil tes pada waktu
menganalisis. Yang mereka lakukan adalah mengelompokan hasil
kelompok ini dikorelasikan. Yang benar adalah membelah item atau butir
soal. Tidak akan keliru kiranya bagi pemakai metode ini harus ingat bahwa
banyaknya butir soal harus genap agar dapat dibelah.
Ada dua cara membelah butir soal ini, yaitu:
1) Membelah atas item-item genap dan item-item ganjil yang selanjutnya
disebut belahan ganjil-genap.
2) Membelah atas item-item awal dan ite-item akhir separo jumlah pada
nomor-nomor awal dan separo pada nomor-nomor akhir yang
selanjutnya disebut belahan awal-akhir.
Contoh perhitungan reliabilitas dengan metode belah dua
Langkah pertama yang harus dilakukan adalah mengadakan butir soal
yang lebih terkenal dengan nama analisis item. Item yang dijawab dengan
benar diberi skor dan bagi yang salah diberi skor 0. Skor-skor untuk
seluruh subjek dan seluruh ini diterakan dalam tabel analisis sebagai
berikut:
Tabel Analisis Item Tes Matematika
1,3,5, 2,4,6, 1,2,3, 6,7,8,
Nomor Item
No Nama Skor Total 7,9 8,10 4,5 9,10
1 2 3 4 5 6 7 8 9 10 Ganjil Genap Awal Akhir
1 Hartati 1 0 1 0 1 1 1 1 1 1 8 5 3 3 5
2 Yoyok 0 0 1 0 1 0 0 1 1 1 5 3 2 2 3
3 Oktaf 0 1 0 0 0 1 0 1 0 1 4 0 4 1 3
4 Wendi 1 1 0 0 1 1 0 0 1 0 5 3 2 3 2
5 Diana 1 1 1 1 1 1 0 0 0 0 6 3 3 5 1
6 Paul 1 0 1 0 1 0 1 0 0 0 4 4 0 3 1
7 Susana 1 1 1 1 1 1 1 0 0 0 7 4 3 5 2
8 Helen 0 1 0 1 1 1 1 1 1 1 8 3 5 3 5
kertas yang digunting bergigi seperti di
sebelah ini daoat digunakan sebagai alat bantu
dalam menentukan jumlah skor pada item ganjil
dan jumlah skor pada item genap. Bagian berlekuk
dapat dipaskan pada item-item genap ataupun
item-item ganjil. Jika sudah diketahui jumlah skor
pada item ganjil, otomatis diketahui jumlah skor
pada item genap karena skor nya sudah diketahui terlebih dahulu. Kertas bergigi
tempatkan tepat mulai skor siswa pertama. Kemudian diges ke bawah hingga
siswa terakhir.
Penyajian contoh membelah di atas berarti bahwa perhitungan reliabiilitas
dilakukan dengan membelah dengan dua cara. Pembelahannya hanya memilih
salah satu saja. Untuk selanjtnya dihitung dengan korelasi product moment.
1) Pembelahan ganjil-genap
Tabel persiapan perhitungan reliabilitas denagn belah dua ganjil-genap
sebagai berikut
Item Item
Ganjil Genap
No Nama
(1,3,5,7,9) (2,4,6,8,10)
(X) (Y)
1 Hartati 5 3
2 Yoyok 3 2
3 Oktaf 0 4
4 Wendi 3 2
5 Diana 3 3
6 Paul 4 0
7 Susana 4 3
8 Helen 3 5

Kelanjutan dari tabel ini adalah menghitung dengan rumus korelasi


product moment
Dengan menggunakan kalkulator diketahui bahwa:
X=25 X2 = 93
Y=22 Y2 = 76
XY=63
Setelah dihitung dengan rumus korelasi product moment dengan anka
kasar diketahui bahwa rxy = -0,3786. Harga tersebut baru menunjukan
reliabilitas separo tes. Oleh karena itu, rxy untuk belahan ini disebut istilah
r1/21/2 atau r99. Untuk mencari reliabilitas seluruh tes digunakan rumus
spearman-brown yang rumusnya telah dikemukakan didepan. Jika
koefisien reliabilitas separo tes ini dimasukan ke dalam rumus hitungannya
demkian.:
2𝑟1⁄ 1
2 ⁄2
𝑟11 =
(1 + 𝑟1⁄ 1 )
2 ⁄2
2𝑥 − 0,3786
=
1 + (−0,3786)
−0,7572
= = −0,5493
1,3786
*) pengurangan merupakan bilangan dengan harga mutlak, jadi tidak mengenal negatif.
2) Pembelahan awal akhir
Dengan data yang tertera pada tabel analisis item tes matematika diketahui
jumlah sekor belahan awal-akhir sebagai berikut:
Item Item
Ganjil Genap
No Nama
(1,3,5,7,9) (2,4,6,8,10)
(X) (Y)
1 Hartati 3 5
2 Yoyok 2 3
3 Oktaf 1 3
4 Wendi 3 2
5 Diana 5 1
6 Paul 3 1
7 Susana 5 2
8 Helen 3 5

Seperti halnya pad wakhtu menghitung dengan belahan ganjil genap maka
kelanjutannya adalah menghitung dengan rumus korelasi product moment.
Dengan menggunakan kalkulator diketahui
X=25 X2 = 91
Y=22 Y2 = 78
XY=63
Setelah dimasukan ke dalam rumus korelasi product momen dengan angka
kasar diperoleh 𝑟1⁄ 1 demgam rumus spearman-brown diperoleh
2 ⁄2 =−0,3831

𝑟11 = 0,5538.
Selain menggunakan rumus korelasi product momen, dua orang ahli
mengajukan rumus lain. Seorang bernama Flanagan menemukan rumus
yang perhitunganya menggunakan belah dua ganjil-genap, dan seoarang
benama rulon yang dumusnya diterapkan pad data belahan awal-akhir.
3) Penggunaan rumus Flanagan
Rumus
𝑆12 + 𝑆22
𝑟11 = 2 (1 − )
𝑠𝑡2
Dimana :
𝑟11= Reliabiiltas
𝑆12 = vairans belahan pertama (1) yang dalam hal ini varian skor item ganjil
𝑆22 = varian belahan kedua (2) yaitu varians skor item genap
𝑆𝑡2 =varians total yaitu varians skor total

Secara sederhana dapat dipahami bahwa varians adalah standar deviasi


kuadrat. Dengan demikian bagi peminat yang menghitung kalkulator
statistik varian ini diperoleh dengan menguadratkan standar deviasi. Untuk
mereka yang tidak menggunakan kalkulator statistik maka varians dapat
dicari denagn rumus sebagai berikut
(𝑋)2
𝑋 −
2
𝑁
𝑁
𝑆−
𝑁
Standar devviasi (SD) dapat dengan istilah simbpangan baku (SB) namun
husuf S (B bear) juga dapat dikatakan sudah menyebut standar deviasi
dalam kalkulator dengan simbol bagi yang berminat mencari S untuk
mencari varian, dapat menggunakan rumus S.
√𝑋 2
𝑆=
𝑁
Dimana
S = standart deviasi
X = Simpangan X dan x yang dicari dari x – Y
S2 = barian 2 subjek pengikut tes,
Berdasarlam dat atabe; be;ajam gamko; genap perhitungannya esebagi
berikut:
252
93 −
8
𝑆21 8
78,125
= 93 − = 1.859
8
222
76 −
8
𝑆12
8
60,5
=76 − =1,937
8

472
295 − 8
𝑆22 =
8
276,13
= 295 − =2,36
8

Dimasukan ke dalam rumus diperoleh demikian


1,859 + 4,937
𝑟11 = 2 (1 )
2,359
=−2(2 − 1,1,609
=-1,218
4) Penggunaan rumus Rulon
Rumus
𝑆𝑑2
𝑟11 =1− 2
𝑆𝑡
Dimana :
𝑆𝑑2 =varian bed (varian Diferent)
𝐷 =diferece adalah [ebedaan atara belahan jiwa (awal_dengan skor
belahan ke dua (akhir
Untuk memperjelas keterangan, maka tabel tahun awal-akhir
Dikutip disini lagi
No Nama Awal Akhir d
1 Hartati 3 5 -2
2 Yoyok 2 3 -1
3 Oktaf 1 3 -2
4 Wendi 3 2 1
5 Diana 5 1 4
6 Paul 3 1 2
7 Susana 5 2 3
8 Helen 3 5 -2

Dengan kalkulator atau hitungan biasa diketahui


d=3
d2=43
Dari perhitungana terdahulu diketahui varians total=2,75
(d)2
d2
𝑆𝑑2 = 𝑁
𝑁
32
43 − 8 43 − 1,125
= =
8 8
41,875
= = 5,234
8
Dimasukan ke dalam rumus rulon
5,234
𝑟11 = 1 −
2,36
=1-2,218
=1,218
Dari perhitungan degnan rumus flanagan maupun rulon ternya hasilnya
sama, keudanya lebih besar dari 1,00. Secara eoeretik koefisien ini salah
karena pembulatan dalam perhitungan, seperti didepan. Hasil seperti ini
dapat saja terjadi
Untuk mengatasi kesulitan memenuhi persyaratan ini maka reliabilitas
dapat dicari dengan rumus ketemukan oleh karer dan Richardson. Kedua
orang ahli menentukan banak-rumus yang diberi nomor. Rumus yang
digunakan mencari reliabilitas adan banyak digunakan orang ada rumus,
yaitu rumus J-4,20 dan rumus K-R 21
5) Penggunaan rumus K-R 20
Rumus
𝑛 (𝑆 2 − 𝑝𝑞)
𝑟11 = ( )
𝑛−1 𝑆2
𝑑𝑖𝑚𝑎𝑛𝑎
r1 = reliabititas tes secara keseluruhan
p - proposi subjek yang menjawab item dengan benar
q =proporsi subjek yang menjawab item dengan salah (q=1-p)
n = Banyaknya item
S = Standar deviasi dari tes (standar deviasi adlah akar varians)

Dalam buku-buku n(nilai kecil)ini sering diganti degnan huruf K (K Keci)


yang juga melambangkan banyaknya item. Demikian juga huruf S sebagai
lambang standar deviasi, ditliskan SB sebagai singkatan dari simpangan
baku maka rumus K-R 20 menjadi
𝑘 (𝑆𝐵 2 − 𝑝𝑞)
𝑟11 = ( )
𝑘−1 𝑆𝐵 2
Penggunaan hrufk ini uga berlaku bagi rumah-rumah dalam tes, misalnya
K-R 21 dan rumus alpha. Untuk memberikan contoh perhitungan mencari
reliabilitas yang menggunakan rumus K-R 20. Ini akan dibuatkan tabel
analisis item lain.
Tabel Perhitungan Mencari Reabilitas Tes dengan rumus KR 21
Nomor item
No Nama skor total
1 2 3 4 5 6 7
1 wardoyo 1 0 1 1 1 1 0 5
2 benny 0 1 1 0 1 1 1 5
3 Hanafi 0 0 0 0 1 0 1 2
4 Rahmad 0 1 1 1 1 1 1 6
5 Tanti 1 0 0 0 1 0 0 2
6 Nadia 0 1 1 1 1 0 0 4
7 Tini 0 0 0 1 1 1 0 3
8 Budi 0 1 0 1 1 0 0 3
9 Daron 0 1 0 1 1 0 0 3
10 Yakob 0 0 0 1 1 0 0 2
NP 2 5 4 7 10 4 3 35
p 0,2 0,5 0,4 0,7 1 0,4 0,3
q 0,8 0,5 0,6 0,3 0 0,5 0,7
pq 1,31(åpq)

Dimasukan ke dalam rumus K-R 20


𝑛 𝑆2 − 𝑝𝑞
𝑟11 = ( )( )
𝑛−1 𝑆2
7 1,362 − 1,31
= 𝑥
6 1,36
𝑆 = 1,56 (𝑑𝑖𝑐𝑎𝑟𝑖 𝑑𝑒𝑛𝑔𝑎𝑛 𝑘𝑎𝑙𝑘𝑢𝑙𝑎𝑡𝑜𝑟)
1,85 = 1,31
= 1,17𝑥 𝑆 𝑑𝑎𝑝𝑎𝑡 𝑑𝑖𝑐𝑎𝑟𝑖 𝑑𝑒𝑛𝑔𝑎𝑛 𝑚𝑒𝑛𝑎𝑟𝑖𝑘 𝑎𝑘𝑎𝑟 𝑣𝑎𝑟𝑖𝑎𝑛𝑠
1,85
1,85 − 1,31
= 1,17𝑥 𝑆 = 1,36 (𝑑𝑖𝑐𝑎𝑟𝑖 𝑑𝑒𝑛𝑔𝑎𝑛 𝑘𝑎𝑙𝑘𝑢𝑙𝑎𝑡𝑜𝑟)
1,85
=1,17 x0,29 = 0,3415 dibulatkan 0,342

6) Penggunaan rumus K-R 21


Rumus K-R 21:
𝑛 𝑚 − (𝑛 − 𝑀)
𝑟11 = ( ) (1 − )
𝑛−1 𝑛𝑆 2
Keterangan:
M=Mean atau rerata skor total
7 3,5 − (7 − 3,5)
𝑟11 = ( ) (1 − )
7−1 7𝑥1,85
3,5𝑥3,5
1,17𝑥 (1 − )
12,95
12,25
1,17𝑥 (1 − )
12,95
1,17𝑥(1 − 0,946)
1,17𝑥 0,0541
= 0,06329 dibulatkan 0,0633
Jika dibandingkan reliabilitas yang dihitung dengan K-R 20 dan K-R 21
lebih besar yang pertama. Memang menggunakan rumus K-R 20
cenderung memberikan hasil yang lebih tinggi, tetapi pekerjaanya lebih
rumit.
7) Penggunaan Rumus Hoyt
𝑉𝑠 𝑉𝑟−𝑉𝑟
Rumus : 𝑟11 = 1 − 𝑉𝑟 atau 𝑟11 = 𝑉𝑟

Keterangan :
r11 = Reliabilitas seluruh soal
Vr = Varians Responden
Vs = Varians Sisa
Untuk mencari reliabilitas suatu soal dilakukan dengan langkah-langkah
sebagai berikut:
Langkah 1. Mencari jumlah kuadrat responden dengan rumus
𝐵 2 (𝑋𝑡 )2
𝑗𝑘𝑖 =
𝑁 𝐾𝑥𝑁
Keterangan:
Jk(r) = jumlah kuadrat responden
Xt = skor total tiap responden
K = Banyaknya item
N = banyaknya responden atau subjek
Langkah 2. Mencari jumlah kuadrat item dengan rumus;

Langkah 3. Mencari jumlah kuadrat total dengan rumus;


BAB 7
TAKSONOMI

1. Arti dan letak Taksonomi dalam Pendidikan


Sejak lahirnya kurikulum PPSP (proyek perintis sekolah pmbangunan)
yang kemudian disusul oleh lahirnya kurikulum tahun 1975, telah dimulai
tertaman kesadaran pada para guru bahwa tujuan pelajaran harus
dirumuskan sebelum proses belajar-mengajar berlangsung. Tujuan
dirumuskan sebelum proses belajar-mengajar berlangsung. Tujuan tersebut
harus diberitahukan kepada para siswa. Jadi, tujuan tersebut bukanlah
sesuatu yang perlu dirahasiakan. Apabila dalam pengajaran tidak
disebutkan tujuannya, siswa tidak akan tahu mana pelajaran yang penting
dan mana yang tidak.
Kesadaran seperti diharapkan dapat mendarah daging. Seperti
halnya jika orang mau pergi ke suatu tempat sudah mempunyai bayangan
letak tempat tersebut sehingga dengan mudah menentukan jalan
perumusan tujuan ini maka mereka dapat mengusahakan kegiatan
mengajar secara efektif.
Kepentingan hubungan antara kegiatan belajar-mengajar dengan
tujuan, oleh seorang ahli bernama sriven (1967) dikemukakan bahwa harus
ada hubungan erat antara:
a. Tujuan kurikulum dengan bahan pelajaran
b. Bahan pelajaran dengan alat-alat evalusi
c. Tujuan kurikulum denan alat-alat evaluasi
Tujuan kurikulum yang dimaksud adalah tujuan yang dapat diukur
Ebel (1963) berpendapat bahwa jika hasil pendidikan merupakan sesuatu
yang penting tetapi tidak dapat diukur maka tujuan itu harus diubah. Jika
tujuan telah dirumuskan secara operasional maka hasilnya akan dapat
diukur. Suatu tanda bahwa seseoarang telah mencapai tujuannya, akan
terlihat pada perubahan tingkah lakunya.
Tujuan pendidikan dapat dirumuskan pada tiga tingkatan. Pertama
tujuan umum pendidikan. Tujuan ini memnentukan perlu dan tidaknya
sesuatu program diadakan. Di dalam praktek sehari-hari di sekolah.
Tujuan ini, banyak usaha telah dilakukan untuk mencari metode yang
dapat digunakan untuk menganalisis atau mengklasifikasikan sebuah
pandangan yang berhubungan dengan kegiatan pendidikan sehari-hari.
Yang dimaksud adalah berhasilnya pendidikan dalam bentuk tingkah laku.
Inilah yang dimaksud engan taksnomomi (taxonomy). Ada 3 macam
tingkah aku yang dikenal umum, yaitu kognitif, afektif, dan psikomotor
(yang dalam hal ini penulis gunakan istilah keterampilan) yang lebih jelas
yang dirumuskan secara operasional kaum behavior (kaum mengutamakan
tingkah laku) berpendapat bahwa taksonomi yang dikemukaakan oleh
bloom dan kawan-kawan adalah sangat bersifat mental. Mereka tidak
menjelaskan kepada para pendidik secara konkret dan dapat diamati.
Dalam pelaksanaan pendidikan di sekolah, ketiga tujuan ini harus
ada. Tetapi praktenya memang sulit karena dalam beberapa hal.
Penafsirannya lalu menjadi subjektif. Kesulitan lain adalah bahwa sulit
untuk menjabarkan tujuan umum ini menjadi tujuan lyang lebih penting
Beberapa ahli mencoba memberikan car bagaimana menyebut
tingkatan tujuan ini, yang akhrinya oleh Vivien de Landshere disimpulkan
bahwa ada 3 tingakt tujuan (termasuk taksonomi), yaitu:
a. Tujuan akhir atau tujuan umum pendidikan
b. Taksonomi
c. Tujuan yang operasional

2. Taksonomi Bloom
Bloom dan Krathwohl telah memberikan banyak inspirasi kepada orang
yang melahirkan taksonomi lain. Prinsip-prinsip dasdar yang digunakan
oleh 2 orang ini ada 4 buah, yaitu:
a. Prinsip metodologis
Perbedaan yang besar telah merefleksi kepada cara-cara guru dalam
mengajar
b. Prinsip psikologis
Taksonomi hendaknya konsisten dengan fenomena kejiaan yang ada
sekarang.
c. Prinsip logis
Taksonomi hendaknya dikembangkan secara logis dan konsisten
d. Prinsip tujuan
Tingaktan-tingaktan tujuan tidak selaras dengan tingkatan-tingakatan
nilai-nilai. Tiap-tiap jenis tujuan pendidikan hendaknya
menggambarkan corak yang netral.
Atas dasar prinsip ini maka taksonomi disusun menjadi uatu
tingkatan yang menunjukan tingkat kesulitan sebagai contoh, menginat
fakta lebih mudah dari pada menarik kesimpulan. Atau menghafal, lebih
mudah daripada memberikan pertimbangan. Tingaktan kesulitan ini juga
merefleksi kepada kesulitan dalam proses belajar dan mengajar.
Sudah banyak diketahui bahwa mula-mula taksonomi bloom terdiri
dari dua bagian yaitu kognitif domain dan afektif domain (cognitive
domain and affective domain). Pencipta dar kedua taksonomi ini merasa
tidak tertarik pada psikomotor domain karena melihat hanya ada sedikit
kegunaannya di sekolah menengah atau universitas ( Bloom, 1956),
akhirnya simpson melengkapi dua domain yang ada dengan psikomotor
domain (1966). Namun sebenarnya pemisahan antara ketiga domain ini
merupakan pemisahan yang dibuat-buat, karena manusia merupakan suatu
kebetulan yang tidak dapat dipec-pecah sehingga tindakanya merupakan
suatu kebetulan.
Saat ini sudah banyak diketahui oleh umum bahwa apa yang
dikenal sebagai taksonomi bloom (1956) sebenarnya merupakan hasil
kelompok penilai di universitas yang terdiri dari B.S Bloom Editor MD
Engelhart, E Furs, W.H dan D.R Krathwohl yang kemudian didukung pula
oleh Ralp W. Tyler.
Secara garis besar, blooom bersama kawan-kawan merumuskan
tujuan-tujuan pendidikan pada 3(tiga) tingkatan:
a. Kategori tingkah laku yang masih verbal
b. Perluasan kategori menjadi sederatan tujuan
c. Tingkah laku konkret yang terdiri dari tugas-tugas (task) dalam
pertnyataan-penyataan sebagai ujian dan butir-butir soal
Ada 3 (tiga) ranah domain besar, yang terletak pada tingkatan ke -2
yang selanjutnya disebut taksonomi yaitu:
a. Ranah kognitif (cognitive domain)
1) Mengenal (recognition)
Dalam pengenalan siswa diminta untuk memilih satu dari
dua atau lebih jawaban
Contoh:
Hasil bumu yang terkenal dari daerah temanggung adalah:
a) Padi
b) Tebu
c) Tembakau
Mengungkap / mengingat kembali (recall)
Berbeda dengan mengenal maka dalam mengingat kembali
ini siswa diminta mengingat kembali satu atau lebih fakta-
fakta yang lebih sederhana.
Contoh:
Tempat keluarnya air dari dalam tanah disebut//
Mengenal dan mengungkap kembali, pada umumnya
dikategoraikan menjadi satu jenis, yakni ingatan. Kategori
ini merupakan yang paling rendah tingkatanya karena tidak
terlalu banyak meminta energi.
2) Pemahaman (comprehension)
Dengan pemahaman, siswa diminta untuk membuktikan
bahwa meamhami hubungan yang sederhana di antara
fakta-fakta atau konsep
Contoh:
Diantara gambar-gambar di bawah ini yang dapat disebut
sebagai segitiga siku-siku adalah:

a) .

b) .

c) .

Untuk dapat menentukan gambar mana yang dapat


dinamaklan segitiga siku-siku maka ia harus
menghubungkan konsep segitiga dan konsep siku-siku.
3) Penerapan Aplikasi (aplication)
Untuk menerpkan aplikasi ini siswa dituntut memili
kemampuan untuk menyeleksi atau memilih suatu abstrasi
tertentu ( konsep, hukum, dalil, aturan, gagasan cara) secara
tepat untuk diterapkan dalam suatu situasi baru dan
menerapkannya secara benar.
Contoh:
Untuk menyelesaikan hitungan 51x40= n, maka paling
tepat kita gunakan
a. Hukum asosiatif
b. Hukum komutatif
c. Hukum distributif
4) Analisis (analysis)
Dalam tugas analisisini siswa diminta untuk menganalisis
suatu hubungan atau situasi yang kompleks atas konsep-
konsep dasar.
Contoh:
Siswa disuruh menerangkan apa sebab pada waktu
mendung dan ada angin kencang tidak segera turun hujan.
5) Sintesis (synthesis)
Apabila penyusun soal tes bermaksud meminta siswa
melakkan sintesis maka pertanyaan-pertanyaan disusum
sedemikian rupa sehingga meminta siswa. Untuk
menggabungkan atau menyusun kembali (reorganize) hal-
hal yang spesifik aga dapat dikatakan bahwa dengan soal
sintesis ini siswa diminta untuk melakukan generalisasi.
Contoh:
“dengan mengetahui situasi daerah dan milik dalam hal
kekayanan bahan mentah serta semangat penduduk di suatu
daerah yang kini dapat berkembang pesat menjadi kota
pelabuhan yang besar maka kota-kota kecil di tepi pantai
mana yang mempunyai potensi untuk menjadi sebuah kota
pelabuhan yang besar?
6) Evaluasi (evaluation)
Apabila menyusun soal bermaksud untuk mengetahui
sejauh mana siswa mampu menerangkan pengetahuan dan
kemampuan yang telah dimiliki untuk menilai sesuatu kasus
yang diajukan oleh penyusun soal.
Mengadakan evaluasi dalam mengukur aspef kognitif ini
tidak sama dengan mengevaluasi dalam mengukur aspek
afektif. Mengevaluasi dalam kognitif ini menyangkut
masalah “benar/salah” yang didasarkan atas dalil. Hukum
prinsip pengetahuan, sedangkan mengevaluasi dalam aspek
afektif menyangkut masalah “baik/buruk” berdasarkan niali
atau norma yang diakui oleh subjek yang bersangkutan.
Sejak tahun 1983 istilah “aspek” ini lebih populier dengan
istilah baru yakni “ranah” untuk ranah kognitif, bloom
menemukan adanya tingkatan-tingkatan ranah, tersusun
dalam urutan meningkat (hierarki) yang sifatnya linear.
Namun dan beberapa studi lanjutan yang dilakukan oleh
ahli-ahli lain antara lain Mardaus diketemukan bahwa
ranah-ranah tersebut tidak seluruhnya dalam urutan linear.
Untuk arah yang leibh tinggi, yakni analisis, sintesi dan
evaluasi teletak pada satu garis horizontal dan terlihat
sebagai cabang.
Apabila dibandingkan akan tergambar sebagai berikut ini:
Struktur Hipotesis Struktur yang ditemukan
oleh Bloom oleh Mardaus dkk.
Evaluasi Evaluasi

Sutesis Analisis Sintesis

Analisis

Aplikasi Aplikasi

Pemahaman Pemahaman

Ingatan Ingatan

Beberapa aspek kejiaan yang telah disebutkan, sebagian


hanya cocok diterapkan di Sekolah Dasar (Ingatan,
Pemahaman dan Aplikasi) sedangkan analisis dan sintesis
baru dapat dilatihkan di SLTP, SMU dan Perguruan Tinggi
secara bertahap. Dengan urutan yang ada, memang
menunjukan usaha yang semakin kebawah semakin berat.
Sebagai contoh, untuk mengilakukkan pemahaman, siswa
harus terlebih dahulu dapat mengingat atau mengenal
kembali. Dan untuk pemahaman, memang dibutuhkan unsur
mengenal atau mengingat kembali.
b. Ranah afektif (afective domain)
1) Pandangan atau pendapat (opinion)
Apabila guru mengukur aspek afektif yang berhubungan
dengan pandangan siswa maka pertanyaan yang disusun
menhendaki respons yang melibatkan ekspresi, perasaan
atau pendapat pribadi siswa terhadap hal-hal yang relatif
sederhana tetapi bukan fakta
Contoh:
“bagaimanakah pendapat anda tentang keputusan yang
diambil oleh bapak lurah dalam situasi diatas? Bamana
tindakan anda jika seandainya yang menjadi lurah itu anda?
2) Sikap atau nilai (attitude, value)
Dalam penilaian afektif tentang sikap ini, siswa ditanya
mengenai responsya yang melibatkan sikap atau nilai telah
mendalam di sanubarnya dan guru meninta dia untuk
mempertahankan pendapatnya
Contoh:
“bagaimankah pendapat anda seandainya semua penjahat
merugiakan masyarakat dan negara. Baik yang proletar
maupun yang elite diberi hukuman mai saja? Menga
pendapat anda demikian?
c. Ranah psikomotor (psychomotor domain)
Perkataan psikomotor berhubungan dengan kata “motor sensory
motor atau perceptual motor” jadi psikomotor behubungan erat
dengan kerja otot sehingga menyebbkan geraknya tubuh atau
bagian-bagiannya. Yang termasuk ke dalam klasifikasi gerak di
sini mulai dari suku cadang televisi serta komputer. Secara
mendasar perlu dibedakan antra dua hal. Yaitu keterampila
(skills) dan kemampuan (abilities)
Contoh:
“seberaoa teramil para siswa dalma menyiapkan alat-
alat””seberapa terampil para siswa mengunakan alat-alat”
Taksonomi untuk ranah psikomotorik antara lain
dikemukakan oleh Anita Harrow (1972). Menurut harrow
kebanyakan para guru tidak dapat menuntut pencapaian 100
dari tujuan yang dirumukan kesuali hanya berharap bahwa
keterampilan yang dicapai oleh siswa-siswanya akan sangat
mendudkung mempelajari keterampilan lanjutan atau gerakan-
gerakan yang lebih kompleks sifatnya. Selain yang telah
dikemukakan tersebut. Harrow juga memberikan saran
mengenai bagaiman melakukan pengukuran terhadap ranah
psikomotor ini. Menurutnya penentuan kriteria untuk mengukur
ketrampilan siswa dilaksanakan dalam jangka waktu sekurang-
kurangnya 30 menit. Kurang dari waktu tersebut diperkirakan
para penilai belum dapat menangkap gambaran tentang pola
keterampilan yang mencerminkan kemampuan siswa.
Gris besar taksno,o yang dikemukakan oleh Harrow
adalah sebagai berikut:
Tingkat Uraian dan contoh
1. Gerakan Refleks Respons grakan yang tidak
(reflex movement) disadari dimiliki sejak lahir

1.1. Segmental reflexes Kesemuanya berhubungan


1.2. Itersegmental reflexes dengan grakan-gerakan yang
1.3. Surasegmental reflexes dikoordinasikan oleh otak dan
baigan sum-sum tulang belakang
2 Dasar Gerakan-Gerakan Gerakan-gerakan, yang
(basic fundamental movement) menuntun kepada keterampilan
yang sifatnya kompleks

2.1. Locomotor movemen Gerakan-gerakan yang


mendahului kemampuan bejalan
(tengkurap, merangkak, tertatih-
tatih, berjalan, lari melompat,
menggelinding, memanjat)

2.2. Non locomotor movements Gerakan-gerakan yang dinamis


di dalam suatu ruangan yang
bertumpu pada sesuatu sumbu
tetentu
2.3. Manipulative movements Gerakan-gerakan yang
terkoornissaikan seperti dalam
kegiatan bermain piano,
menggambar, naik sepeda,
mengetik dan sebagainya

3. Perceptual abilites Kombinasi dari kemampuan


kognitif dan gerakan

3.1. Khinetic discrimination Menyadari akan gerak-grakan


tubuh seseorang
3.1.1. Body awarebess Menyadari gerakan pada dua sisi
tubuh pada satu sisi. Keberatan-
keberatan dan keseimbangan.
3.1.2. Body image Perasaan-perasaan tentang
adanya gerakan berhubungan
dengan badannya sendiri.
3.1.3. Body relationship to Konsep tentang arah dan
surrounding objet in kesadaran badan dalam
space hbubungan dengan lingkungan
ruang sekitar
3.2. Visual discrimination Visual acuity(kemampuan
membedakan bentuk dan
bagian). Visual tracking
(kemampuan mengikuti objek),
visual memori (mengingat
kembali pengalaman visual),
figure ground differentiation
(membedakan figure yang
dominan di antara latar belakang
yang kabur), dan consistency
(pengalaman konsep visual)
3.3. Auditory discrimination Meliputi auditory acuity,
auditory trancking, auditory
memory
3.4. Tactile discrimination Kemampuan untuk
3.5. Coordinated activites membedakan dengan sentuhan
Koordinasi antara mata dengan
tangan dan mata dengan kaki
4. Physical abilities Kemampuan yang dipeulkan
untuk mengembangkan gerakan-
gerakan keterampilan tingkat
tinggi.
4.1. Ketahanan (endurance) Kemampuan untuk melanjutkan
aktivitas, termasuk ketahanan
otot dan denyut jantung.
4.2. Kekuatan (strenght) Kemampuan menggunakan otot
untuk mengadakan perlawanan
4.3. Flexybility Rentangan gerakan dan sandi
4.4. Kecerdasan otak (agility) Kemampuan untuk bergerak
cepat termasuk kemapuan untuk
mengubah arah, memulai atu
berhenti, mengurangi waktu
tenggang antara reaksi dan
respons (tampak dalam
kecekatan) dan meningkatkan
dextery (meningkatkan
ketangkasan=deftnes)
5 Skiled movements Setiap gerkan yang memerlukan
belajar misal keterampilan
dalam menari, olah raga dan
reaksi.]
5.1. Simple adaptive skils Setiap adaptasi berhubungan
dengan dsar gerakan dasar
nomor 22
5.2. Compund adaptive skills Gerakan kombinasi untuk
menggunakan alat-alat seperti
raket, parang dan sebaginya
5.3. Complex adaptive skils Menguasai mekanisme seluruh
tubuh seperti dalam senam
(gymnastic)
6 Nondiscoursive communication Kemampuan untuk
berkomunikasi dengan
menggunakan gerakan misalnya
ekspresi wajah(mimik) postur,
dan sebagainya.
6.1. Expressibe movents Gerakan-gerakan yang
digunakan dalam kehidupan
sehari-hari seperti sikap dan
gerak tubuh, isyarat ekspresi
wajah.
6.2. Interpretive movements Gerak-gerakan sebagai bagian
dari bentuk seni ternasuk gerkan
estetism gerak-gerakan reatif
(improvisasi) dan sebagainya.

3. Lain-Lain Taksonomi
Banyak kritik telah dilemparkan kepada Bloom Cs, tentang pembagian
taksonomi ini, sehingga timbul teori-teori sebagai adaptasi modifikasi atau
kategori baru.
a. McGuire (1963), Klicman (1963) telah menyusun taksnonomi untuk
bidang biologi,wood (1968) untuk matematika, Leuis (1965) untuk
Ilmu pengetahuan alam. Sebagai contoh, dihasilkan oleh The National
Longitudinal Study of Mathematical Ablities (NLSMA)
1) Knowledge of facts
2) Coputation
3) Compreension
4) Application
5) Analysis
Alasanya adalah:
1) Computation (komputasi, perhitungan) merupakan satu
ketrampilan khusus yang tidak mempunyai tempat dalam
taksonomi Bloom. Padahal aspek ini perlu dinilai pula
2) Syntehsis an evaluation (sintesis dan evaluasi) hanya sedikit
mempunyai peranan di dalam kurikulum matematika.
b. Guilford telah menciptkan pola yang menggambarkan struktur intelek
dalam bentuk kubus.

Operation/proscess
(bidang mendatar)

Product
(bidang belakang)

Content
(bidang tegak)

c. Gagne dan Merreli juga mengemukakan taksonomi lain. Di dalam


bukunya The Conditions of Learning (1965) Gagne menyebutkan
adanya 8 buah kategori, yang oleh Merril (1971) ditambah 2 (dua)
kategori lagi.
1) Signal learning
2) Stimulus response learning
3) Chaining
4) Verbal associoation
5) Discrimination learning
6) Concept learnign.
7) Rule learning
8) Problem solving
d. Garlach dan sulivan beranggapan bahwa taksonomi Bloom
mempunyai kegunaan yang terbatas sebagai alat untuk perencanaan
dan pengembangan kurikulum. Mereka mencoba mengganti gambaran
tentang proses dalam rumusan yang umum menjadi tingkah laku siswa
yang dapat diamati.
Kategori yang diajukan adalah:
1) Identy
2) Name
3) Describe
4) Construct
5) Order
6) demonstrate
e. De Block mengatakan bahwa taksonomi Bloom diilhami oelh masalah
evaluasi. Jika Gagne dan Merril tolak pada kondisi belajar maka De
Block (1972) mengemukakan model yang didasarkan pada tujuan-
tujuan mengajar.
ia mengajukan 3 (tiga) arah dalam kegiatan mengajar.
1) From tartial to more integral learning
2) From limited to fundamental learning
3) From special to general learning.
BAB 8
TUJUAN INSTRUKSIONAL

1. Bermacam-macam Tujuan Pendidikan


Setiap negara tentu mempunayi cita-cita tentang warga negaranya
diarahkan. Cita-cita tersebut dimanisfestasikan dalam bentuk tujuan
pendidikannya. Sebagai contoh, negara sparta ingin mengarahkan warga
negaranya menjadi manusia yang sehat jasmani dan rohaninya maka
tujuan pendidikannya telah disejajarkan dengan cita-cita tersebut
Cita-cita bangsa Indonesia adalah terbentukna manusia Pancasila
bagi seluruh warga negaranya. Tujuan pendidikannya telah disejajarkan
dengan cita-cita tersebut. Semua institusi atau lembaga pendidikan harus
mengarakan segala kegiatan di sekolahnya bagi pencpaian tujuan itu.
Inilah yang disebut dengan tujuan umum pendidikan yang secara eksplisit
tertera di dalam Garis-garis Besar Haluan Negara.
Dengan demikian maka tujuan pendidikan nasional memiliki
sebagai frame of reference untuk selanjutnya dijabrkan menjadi tujuan
instruksional. Sebagai perdalaman berikut ini adalah kutipan rumusan
tujuan umum tersebut;
“pengembangan di bidang pendidikan didasarkan atas falsafah
negara Pancasila dan diarahkan untuk membentuk manusia-manusia
Indonesia yang sehat jasmani dan rohaninya memiliki pengetahuan dan
mengembangkan kecerdasan yang tinggi dan disertai budi pekerti yang
luhur. Mencintai bangsanya dan mencintai sesama manusia sesuai dengan
ketentuan termaktub dalam UUD 1945.
Kegiatan-kegiatan yang muncul dalam pola kesamaan pendidikan.
Didasarkan pada rumusan tujuan pendidikan nasional ini. Sedangkan
materinya perlu diisi dari hasil sturdi empiris tentang harpan-harapan
masyarakat mengenai kemampuan pengetahuan dan sikap yang harus
dimli oleh para lulusan.
Selanjutnya sebagai tindak lanjut dari penjabaran tujuan umum
menjadi tujuan institusional adalah perumusan lain telah disiapkan oleh
para ahli bidang strudi, sebgai penganggung jawab program kurikuler.
Untuk dapat memenuhi harapan dicapinya penguasaan terhadap
program kurikuler ini, dirumuskanlah suatu tujuan yang disebut tujuan
masing-masing bidang studi. Segitu jauh pembicaraan tentang tujuan ini,
apabila digambarkan dalam bentuk skema akan terlihat seperti berikut ini:
Tujuan Umum Pendidikan
Nasioal

Pend.
Pend. Bahasa Ilm ilmu
Pend. Moral Matem Bahasa
TI Olah Indone peng, Peng. dst
Agama Pancas atika Inggris
raga sia alam Sosial
ila

Pend.
Pend. Bahasa Ilm ilmu
Pend. Moral Matem Bahasa
TI Olah Indone peng, Peng. dst
Agama Pancas atika Inggris
raga sia alam Sosial
ila

Pend.
Pend. Bahasa Ilm ilmu
Pend. Moral Matem Bahasa
TI Olah Indone peng, Peng. dst
Agama Pancas atika Inggris
raga sia alam Sosial
ila

Pend.
Pend. Bahasa Ilm ilmu
Pend. Moral Matem Bahasa
TI Olah Indone peng, Peng. dst
Agama Pancas atika Inggris
raga sia alam Sosial
ila
Tkur. Tkur. Tkur. Tkur. Tkur. Tkur. Tkur. Tkur. Tkur.

TI = Tujuan Institusional
Tkur. = Tujuan Kurikuler

Dari skema tersebut akan mudah dipahami bahwa:


a. Tujuan institusional adala tujuan dari masing-masing institusi
lembaga misalnya.
1) Tujuan Sekolah Dasar
2) Tujuan Sekolah Mengengah Pertama
3) Tujuan Sekolah Pendidikan Guru, dan sebagainya yang
masing-masing dicanangkan sesuai dengan harapan lulusan
b. Tujuan kurikuler adalah tujuan dari masing-masing bidang
studi misalnya:
1) Tujuan pelajaran Pendidikan Agama
2) Tujuan Pelajaran Matematika
3) Tujuan Pelajaran Ilmu Pengetahuan Sosial
Dan sebagainya yang akan berbeda dari satu bidang studi ke
bidang studi lain dan juga dari tingkat institusi yang satu ke
tingakt institusi yang lain. Akan tetapi antrara tujuan kurikuler
sesuatu insttitusi ada hubungan dengan tujuan kurikuler
institusi yang lain.
c. Tiap-tiap tujuan baik institusional maupun tujuan kurikuler
selalu merupakan sumbangan bagi tercapainya tujuan umum,
yakni tujuan pendidikan nasional.

2. Tujuan Instruksional (instructional Objectives)


Materi sesuatu bidang studi tidak menjadi milik kita, tanpa dipelajari
telebih dahulu, baik dipelajari sendiri maupun diajarkan oleh guru. Proses
atau kegiatan mempelajari materi ini terjadi dalam saat terjadinya situasi
belajar –mengajar atau pengajaran (instruksional). Dari perkataan
pengajaran atau instruksional inilah maka timbul istilah tujuan
instruksional, yaitu tujuan yang menggambarkan pengetahuan,
kemampuan, keterampilan dan sikap yang harus dimiliki oleh siswa
sebagai akibat dari hasil pengajran yang dinyatakan dalam bentuk tingkah
laku (behavior) yang dapat diamati dan diukur.
Ada 2 (dua) macam tujuan instruksional yaitu:
a. Tujuan instruksional Umum (TIU)
b. Tujuan instruksional Khusu (TIK)
Pembedaan atas 2 (dua) macam ini didasarkan atas luasnya tujuan
yang akan dicapai sehingga apabila dibagankan akan terlihat seperti di
bawah ini:
Tujuan Instruksonal Umum
(TIU)

TIK TIK TIK TIK TIK TIK


1 2 3 4 5 6
Didalam merumuskan tujuan instruksional harus diusahakan agar
tampak bahwa setelah tercapainya tujuan itu, terjadi adanya perubahan
pada diri anak yang meliputi kemampuan intelektual, sikap/minat maupun
keterampilan oleh Bloom dan kawan-kawan dikenal sebagai aspek
kognitif, aspek afektif dan aspek psikomotor seperti telah diterangkan
terdahulu.
Apakah tujuan instruksional itu memang perlu?
Bekerja tanpa diketahui arahnya sama halnya dengan berlayar tanpa
diketahui mau ke pulai mana kapal akan dilarikan. Kapal itu akan
berputar-putar saja di tengah lautan luas, kadang-kadang menghadap ke
barat, kadang-kadang menghadap ke timur dan sebagainya dan akhirnya
tidak mengajar. Guru yang tidak mengetahui apa tujuan mengajarnya tidak
akan jelas setiap kegiatan yang dilakukan.
Dahulu ada kecenderungan bagi guru untuk menentukan tujuan
pelajarannyapada masalah penyelesaian bahan. Dalam satu jam mengajar
guru menargetkan berapa bab atau berapa bagian bahan akan diselesaikan
dalam jam pelajaran. Akibatnya guru tersebut akan terpaku pada bahan
dan apabila dilihat waktunya hampir habis, ia menerangkan dengan cepat
agar target yang telah ditetapkan tercapai, tanpa memperhatikan apakah
siswanaya dapat memahami pelajarannya atau tidak.
Dalam pembaruan sistem pendidikan yang berlaku di indonesia
sekarang ini, setiap guru dituntut untuk menyadari tujuan dari kegiatan
mengajarnya dengan titik tolak kebutuhan siswa. Oleh karena itu. Dalam
merancang sistem belajar yang akan dilakukannya, langkah pertama yang
ia lakuakan adalah membuat tujuan instruksional. Dengan tujuan
instruksional:
a. Guru mempunyai arah untuk
b. Siswa mengetahui arah belajarnya
c. Setiap guru mengetahui batas-batas tugas dan wewenangnya
mengajakn suatu materi sehingga diperkecil kemungkinan timbulnya
celah (gap) atau saling menutup (overlap) antara guru.
d. Guru mempunyai patokan dalam mengadakan penilaian kemajuan
belajar siswa
e. Guru sebagai pelaksana dan petugas-petugas pemegang kebijaksaan
(decision maker) mempunyai kriteria untuk mengevaluasi kualitas
maupun efisiensi pengajaran.
3. Merumuskan Tujuan Instruksional
Telah disebutkan bahwa tujuan instruksional adlah tujuan yang
menyatakan adanya suatu yang dapat dikerjakan atau dilakukan oleh siswa
setelah pengajaran. Jadi sebelum adanya pengajaran, siswa tidak
mempunyai kemampuan untuk mengerjakan ataupun melakukannya.
Contoh:
Sebelum ada pengajaran, siswa dapat membuat tabel spesifikasi sesudah
pengajaran diberikan siswa dapat membuat tabel spesifikasi.
Jadi dalam diri siswa terjadi perubahan tingkah laku selama
mengikuti program pengajaran. Atau dengan lain perkataan, perubahan
tingkah laku itu merupakan hasil dari adanya proses belajar mengajar.
Oleh karena baik guru maupun siswa perlu mengetahui perubahan apakah
yang telah terjadi pada waktu pengajaran maka perlu adanya perumusan
yang jelas bagi tujuan instruksional itu.
Sebaiman ketentuan dalam peraturan pemerintah nomor 19 tahun
2005 tebtabg standar pendidikan nasional. Kurikulum yang belaku di
indonesia adalah kurikulum tingkat satuan pendidikan (KTSP) dalam
menggunakan istilah-istilah lama seperti tujuan kurikuler (TK),tujuan
instruksional umum (TIU) dan untuk istilah tujuan yang ingin dicapai oleh
guru menjadi milik siswa dikenal dengan nama indikator istilah indikator
berasal dari bahasa inggris to indicate, berati menunjuikan.dalam hal ini
indikator menunjukan sesuatu sebagai bukti bahwa yang ingin dicapai
sudah dapat betul-betul dicapi. Proses dan langkah sebetulnya sama saja
dengan yang lama, tetapi hanya istilahnya saja yang berbeda berikut ini
disampaikan langkah untuk menentukan tujuan khusu dan dalam KTSP
disebut indikator. Yang digungakan dalam istilah tujuan pembelajaran.
4. Langkah-langkah yang dilakukan dalam merumuskan tujuan
instruksional khusus
a. Membuat sejumlah TIU (tujuan instruksional umum) untuk tiap mata
pelajaran/bidang strudi yang akan diajarkan. Di dalam kurikulum
tahun 1975 maupun 1984, TIU ini sudah asda tercantum dalam buku
Garis-Garis Besar Program Pembelajaran. Dalam merumuskan TIU
digunakan kata kerja yang sifatnya masih umum dan tidak dapat
diukur karena perubahan tingkah laku masih terjadi di dalam diri
manusia (intern)
b. Dan masing-masing TIU dijabarkan menjadi sejumlah TIK yang
rumusnya jelas, khusus dapat diamati terukur dan menunjukkan
perubahan tingkah laku.
Contoh-contoh rumusan untuk TIU:
- Memahami teori evaluasi
- Mengetahui perbedaan antara skor dan nilai
- Mengerti cara mencari validata
- Menghayati perlunya penilaian yang tepat
- Menyadari pentingnya mengikuti kuliah dengan terartur
- Menghargai kejujuran mahsiswa dalam mengerjakan tes
Dalam contoh-contoh ini digunakan kata-kata kerja, memahami,
mengetahui, mengerti menghayati, menyadari, menghargai dan masih
ada beberapa lagi yang sifatnya masih terlalu umum sehingga
penafsirannya dapat bereda antara orang yang satu dengan yang lain.
Contoh:
Mahasiswa mengeti cara mencari validitas suatu soal. Bagaimanakah
kita tahu bahwa ia mengerti? Apakah karena pada waktu diterangkan
dia tampak mengangguk-angguk kepala? Belh jadi dia mengangguk-
anggukan kepala hanya merupakan suatu usaha agar tidak dikatakan
mengantuk atau sedang melamunkan sesuatu. Tampaknya
menggangguk merekasi kuliah. Tetapi anganya melayang
Atas dasar semua keterangan ini maka agar dalam mengadakan
evaluasi terlihat hasilnya, TIU ini perlu diperinci lagi sehingga jelas
dan tidak dapat disalah tafsikan oelh beberapa orang.
Rumusan TIK yang lengkap memuat 3(tiga) komponen, yaitu:
1) Tingkah laku akhir (terminal behavior)
2) Kondisi demonstrasi (conditional of demonstration or test)
3) Standar keberhasilan (standard of performance)
5. Tingkah laku akhir
Tingkah lai akhir adalah tingkah laku yang diharapkan setelah seseorang
mengalami proses belajar. Disini tingah laku ini harus menampakan di
dalam suatu pembuatan yang dapat diamati dan diukur (observabke and
measurable)
Contoh:
- Menuliskan kalimat perintah
- Mengalikan pecahan persepuluhan
- Menggambarkan kurva normal
- Menyebutkan batas-batas daerah istimewa yogyakarta
- Menerjemakan bacaan bahasa inggris ke dalam bahasa indonesia
- Menceritakan kembali uraian guru
- Mendemonstrasikan cara mengukur susu
- Mengurakan pendapatnya mengenai sesuatu yang dikemukakan guru
- Menjelaskan hasil bacaan dengan kalimat sendiri. Dan lain-lain yang
berwujud kata kerja perbuatan.operasional (action verb) yang dapat
diamati dan diukur.
6. Kata-kata operasional
a. Cognitve domain; levels and coresponding action verbs
1) Pengetahuan (knowledge)
Mendefinisak, mendeskripsikan mengidentikasikan, mendaftarkan
menjodohkan, menyebutkan, menyatakan (states) mereproduksi.
2) Pemahaman (comprehension)
Mempertahankan, membedakan, menduga (estimates)
menerangkan, memperluas, menyimpulkan, mengeneralisasikan,
memberikan contoh, menuliskan kembali, memperkirakan.
3) Aplikasi
Mengubah, menghitung, mendemonstrasikan, menemukan,
memanipulasikan, memodifikasikan, mengoperasikan,
meramalkan, menyiapkan, menghasilkan, menghubungkan,
menunjukkan, memecahkan, menggunakan.
4) Analisis
Merinci, menyusun diagram, membedakan, mengidentifikasikan,
mengilustrasikan, menyimpulkan, menunnjukkan,
mengunbungkan, memilihm memisahkan, membagi (subdivides).
5) Sintesis
Mengategorikan mengombinasikan, mengarang, menciptakan,
membuat desain, menjelaskan, memmodifikasikan,
mengorganisasikan, menghubungkan, mereorganisasikan, merevisi,
menulikan kembali, menuliskan, menceritakan.
6) Evaluasi
Menilai, membandingkan, menyimpulkan, mempertentangkan,
mengkritikm mendeskripsikan, membedakan, menerangkan,
memutuskan, menafsikan, menghubungkan.
b. Affective domain; learning levels and corresponding action verbs
7. Kondisi demonstrasi
Kondisi demonstrasi adalah komponen TIK yang menyakatan suatu
kondisi atau situasi yang dikenakan kepada siswa pada saat ia
mendemonstrasikan tingkah laku akhir, misalnya:
 Dengan penulisan betul
 Urut dari yang paling tinggi
 Dengan bahasanya sendiri
Dengan demikian maka rangkaian kata-kata dalam rumusan TIK
menjadi:
 Siswa dapat menjumlahkan bilangan yang terdiri dari puluhan dan
satuan dengan penulisan yang betul
 Siswa dapat menunjukkan letak gunung-gunung yang ada di jawa
tengah, urut dari yang paling tinggi.
 Siswa dapat menceritakan kembali isi bacaan tentang kisah keluarga
dengan bahasa sendiri.
Kata-kata bercetak miring itulah yang menunjukan standar
keberhasilan.
Standar keberhasilan adalah komponen TIK yang menunjukkan
seberapa jauh tingkat keberhasilan yang ditutut oelh penilai bagi tingka
laku pelajar pad situasi akhir.
Tingkatan keberhasilan dapat dinyatakan dalam jumlah maupun
persentase misalnya:
 Dengan 75% betul
 Sekurang-kurangnya 5 dari 10
 Tanpa kesalahan
Dengan tambahan tingkat keberhasilan ini maka bunyi rumusan
TIK menjadi:
 Siswa dapat menumlahkan bilangan yang terdiri dari puluhan dan
satuan tanpa kesalahan
 Siswa dpat menyebutkan kembali kota-kota yang ada di jawa barat
urut dari yang paling berat, dengan hanya 25% kesalahan
Yang umum dikerjakan sampai saat ini hanya tingkah laku akhir
saja.
Setelah kurikulu tahun 1975 berjalan bebrapa tahun timbulah
berbagai ketidak puasan di kalang para pengembang kegiatan belajar-
mengajar. Dikatakan bahwa tujuan belajar yang dimaksud terlalu bersifat
behavioristik, yakni mementingkan tingkah laku. Di samping juga hanya
bersifat outpt oriented. Yakni terlalu mementingkan hasil.
Dengan tekanan pada hal-hal tersebut. Guru berusaha
memberikan sebanyak-banyaknya informasi, pengertian dan konsep-
konsep kepada siswa. Pengembangan kegiatan belajar-mengajar yang
mengarah pada proses, belum mendapatkan perhatian sepenuhnya.
Dalam pedoman pelaksanaan kurikulum dijelaskan bahwa dalam
kegiatan belajar mengajar guru diharuskan memerhatikan pula
keterampilan siswa dalam hal memperoleh hasil, yakni memeperoleh
keterampilan tentang prosesnya. Pendekatan ini disebut dengan istilah
pendekatan ketrampilan proses (PKP) ketrampilan yang dimaksud
meliputi ketrampilan dalam hal.
a. Mengamati
b. Menginterprestasikan (menafsirkan) hasil pengamatan
c. Meramalkan
d. Menerapkan konsep
e. Merencanakan penelitaian
f. Melaksanakan penelitian
g. Mengkomunikasikan hasil penemuan
Sesuai dengan tuntutan tersebut maka guru dalam merumuskan
tujuan instruksional khusus harus mengandung apa yang dilakukan
bagaimana menunnjukan kemampuan atau hasilnya (tingkah laku) dan
perolehanya. Untuk mempermudah tugas ini, dalam buku GBPP
kurikulum 1984, tujuan instruksional umum yang termuat sudah
dirumuskan dalam satu rumusan yang menjelaskan
a. Materi
b. Perilaku mengutarakan hasil
c. Proses mencapainya.

Diagram perumusan TIU dan TIK


isi (pokok
1) siswa mampu PKP untuk tingakah laku
bahasan)

isi (pokok
2) siswa dapat Tingkah laku melalui PKP
bahasan)

isi (pokok
3) siswa mampu gabungan PKP dan tingkah laku
bahasan)

PKP= Pendekatan ketrampilan proses


Contoh rumusan TIK
Model 1 Siswa mampu melakukan eksperimen untuk selanjutnya dapat
menerangkan kepada kawan-kawan sekelasnya tentang proses
osmose
Model 2 Siswa dapat menjelaskan perbedaan di sebagai kata depan dan di
sebagai awalan melalui pengatan, contoh-contoh yang diberikan
guru
Model 3 Siswa mampu menginterpretasi hasil pengamatan dan
menerangkan hubungan kata-kata dalam suatu kalimat.
BAB 9
TES STANDA DAN TES BUATAN GURU

1. Pengertian Tes Standar


Telah dibicarakan di depan bahwa tes kemampuan pada dasarnya terbagi
menjadi 2 macam yaitu:
a. Aptitude test (test bakat)
b. Achievement tes (tes prestasi)
Perbedaaan antara kedua tes ini sebenarnya tidak tegas, soal-soal
mengenai kedua tes tersebut sering sekali saling melingkupi (overlap) untuk
keua macam tes ini biasanaya menggunakan hitungan-hitungan dan
perbendaharaan kata-kata dan sekelompok tes dari kedua macam tes ini
biasanya juga menguji tentang keterampilan membaca, kesamaan yang lain
adalah bahwa keduanya telah digunakan untuk meramalakann hasil untuk masa
yang akan datang, walupun pada umunya jika kita menggunkanan tes prestasi
penilai melihat apa yang telah siswa (tercoba) itu diberi pelajaran.
Prosedur yang digunakan memnentukan isi dari tes prestasi juga sedikit
berbeda yang digunakan pada waktu penyusunan tes bakat. Di dalam tes
prestasi belajara usaha-usaha digunakan untuk menentukan pengetahuan dan
keterampilan yang sudah diajarkan jadi berbagai tingkat pendidikan dan butir-
butir tes diperuntukan bagi penilaian materi-materi ini,
2. Tes Prestasi standar
Diantara tes prestasi yang digunkan di sekolah ada yang dinamakan prestasi
standar. Dalam salah satu kamus. Arti kata standar adalah a degree og level of
requirement, excellenge, or attainment.
Standar untuk siswa dimaksudkan sebagai suratu tingkatan kemampuan yang
harus dimiliki bagi suatu program tertentu, mungkin standar bagi suatu kusus A
berbeda dengan kursus B, jadi standar ini dapat diubat kersa maupun lunak
tergantung mempunyai kebijaksanaan.
Suatu tes standar dengan demikian berbeda dengan prestasi biasa.
Prosedur yang digunakan menyusun tes standar tes prestasi melalui cara yang
ditumbuhkan dari tes yang digunakan di kelas. Sedangkan spesifikasi yang
digunakan untuk menentukan isi dalam tes bakat biasanya didasarkan atas
analisis job atau analisis tugas.
Istilah standar dalam tes dimaksudkan bahwa semua siswa menjawab
pertanyaan yang sama dari sejumlah besar pertanyaan dikerjakan dengan
mengikuti petunjuk yabng sama dan dalam batasan waktu yang sama pula.
Dengan demikian, seolah-oleh ada suatu standar atau ukuran sehingga
diperoleh satu penampilan (performance) dan penampilan kelompok lain
dibandingkan penampilan kelompok standar tersebut.
Istilah standar mengandung arti bahwa tes itu mengukur apa yang harus
dan dapat diajarkan suatu tingkat tertentu atau bahwa tes itu menuiapkan suatu
standar prestati dimana siswa dan dapat mencapai suatu tingkatan tertentu.
Sekali lagi tes standar ripolakan untuk penampilan prestasi sekarang(yang ada)
yang dilaksanakan secara seragam baik itu diberikan kepada siswa dalam
pelakasanaan maupun siswa sebagai anggota dari suatu kelompok
Penyusun tes standar selalu mengusahakan agar sistem skoringnya
sangat objektif sehinggga dapat diperoleh reliabilitas yang tinggi. Apabila
mungkin, dilakukan dengan mesin, hal ini tidak berarti bahwa berbentuk tes
standar harus selalu pilihan berganda. Tetapi untk skoringnya diusahakan agar
tidak kena bias faktor-faktor lain. Usaha lain adalah penggunaan skala skor dan
norma yang relevan. Skala skor digunakan untuk menyesuaikan antara bentuk
paralael dan bentuk aslinya. Di samping tui juga diperlukan penjelasan terinci
tentang tes itu.
3. Perbandingan antara te standar dengan tes buatan
Setelah mempelajari uraian tedahulu dapat disimpulkan bahwa tes standar
seenarnya bukanlah suatu yang istimewa dalam tes prestasi belajar. Tes ini
disusun dalam tipe-tipe soal yang sama dan meliputi bahan atau pengetahuan
yang sama banyak dengan bahan atau pengetahuan yang dicakup oleh tes
buatan guru. Lalu apakah perbedaan antara tes standar dengan tes buatan guru
atau apa keuntungan dan keburukan tes standar
Pertama marilah kita tinjau perbedaaan antara tes standar dengan tes buatan
guru. Perbedaannya adalah sebagai berikut:
No
Tes Standar Tes Buatan Guru

1
a. Didasarkan atas bahan dan tujuan
a. Didasarkan atas bahan dan tujuan
umum dari sekolah-sekolah di
khusus yang dirumuskan oleh
seluruh Negara.
guru untuk kelasnya sendiri.
2
Mencakup aspek yang luas dan
b. Dapat terjadi hanya mencakup
pengetahuan atau keterampilan
pengetahuan atau keterampilan
dengan hanya sedikit butir tes untuk
yang sempit.
setiap keterampilan atau topik.
c. Biasanya disusun sendiri oleh guru
c. Disusun dengan kelengkapan staf
3 dengan sedikit atau tanpa bantuan
profesor, pembahas, dan editor butir
orang lain/tenaga ahli.
tes.
d. Jarang menggunakan butir tes
d. Menggunakan butir tes yang sudah
4 yang sudah diujicobakan,
diujicobakan (try out), dianalisis
dianalisis dan direvisi.
dan direvisi sebelum menjadi
sebuah tes.
e. Mempunyai reliabilitas sedang
5 atau rendah.
e. Mempunyai reliabilitas yang tinggi.
6 f. Norma kelompok terbatas kelas
f. Dimungkinkan menggunakan norma
tertentu.
untuk seluruh Negara.

Kedua, untuk menyusun tes standar, diutuhkan waktu yang lama.


Seperti disebutkan ahwa untuk memperoleh sebuah tes standar melalui
prosedur:

 Penyusunan;

 Uji coba;

 Analisa;

 Revisi;

 Edit.

Kelima kegiatan ini membutuhkan waktu lama.


4. Kegunaan Tes Standar
a. Jika ingin membuat perbandingan
Ad. a Membuat perbandingan
Banyak situasi pendidikan dimana guru atau pemimpin terpaksa
mengadakan perbandingan. Hal ini dimaksd perbandingan antar siswa
untuk setiap bidang studi atau perbandingan tentang prestasi belajar
yang mendasarkan diri pada kemampuan dasar, atau perbandingan
prestasi setelah digunakan du metode yang berbeda. Nilai yang dibuat
guru yang berada di bidang yang berbeda dari kelompok siswa yang
berbeda dan situasi belajar yang, tidak dapat digunakan untuk alat
pembanding, akan tetapi tugas yang sifatnya umum, norma-norma, tes
yang mempunyai reliabilitas yang tinggi dan tes standar ada
kemungkinan boleh digunakan sebagai alat pembandin.
Ad.b Sebagai ilustrasi dapat dimisalkan sebuah sekolah menengah yang
meneroma 5 orang siswa dari sekolah-sekolah daar yang berbeda. Para
administrator di SLTP dihadapkan pada suatu masalah apabila harus
menentukan efektivitas belajar. Kelima anak ini datang dari SD telah
membawa nilai sendiri-sendiri dari guru yang berbeda sehingga
diiterperestakikan. Nilai yang diperoleh dan guru yang bebeda, tidak
diketahui dasr pertimbangan yang diambil untuk menentukannya.
Guru yang satu mungkin dipengaruhi oleh keterampilan bekerja
sedangkan guru lain didasarkan atas panjang pendeknya jawaban.
Walupun sangat luas, namun secara garis besar kegunaan tes standar
adalah :
 Membandingkan prestasi belajar dengan pembawaan individu atau
kelompok.
 Membandingkan tingkat prestasi siswa dalam keterampilan di berbagai
bidang studi untuk individu atau kelompok.
 Membandingkan prestasi siswa antara berbagai sekolah atau kelas.
 Mempelajari perkembangan siswa dalam suatu periode waktu tertentu.
5. Keguanaan Tes Buatan Guru
Kegunaan tes buatan guru adalah:
a. Untuk menentukan seberapa baik siswa telah menguasai bahan pelajaran
yang diberikan dalam waktu tertentu.
b. Untuk menentukan apakah sesuatu tujuan telah tercapai.
c. Untuk memperoleh suatu nilai.

Selanjutnya baik tes standar dan tes buatan guru dianjurkan dipakai
jika hasilnya akan digunakan untuk:
a. Mengadakan diagnosis terhadap ketidakmampuan siswa.
b. Menentukan tempat siswa dalam suatu kelas atau kelompok.
c. Memberikan bimbingan kepada siswa dalam pendidikan dan pemilihan
jurusan.
d. Memilih siswa untuk program-program khusus.

6. Kelengkapan Tes Standar


Sebuah tes yang sudah distandardisasikan dan sudah dapat disebut sebagai tes
standar, biasanya dilengkapi dengan sebuah manual. Manual ini memuat
keterangan-keterangan atau petunjuk-petunjuk yang perlu terutama yang
menjelaskan tentang pelaksanaan, menskor, dan mengadakan interpretasi.
Secara garis besar manual tes standar ini memuat:
a. Ciri-ciri mengenai tes,
misalnya menyebutkan tingkat validitas, tingkat reliabilitas dan
sebagainya.
b. Tujuan serta keuntungan-keuntungan dari tes.
Misalnya yang disebutkan untuk siapa tes tersebut diberikan dan untuk
tujuan apa.
c. Proses standardisasi tes.
Misalnya mengenai hal-hal yang berhubungan dengan sampel.
a. Besarnya sampel,
b. Teknik sampling,
c. Kelompok mana yang diambil sebagai sampel (sifat sampel).
Juga mengenai taraf kepercayaan yang diambil dan bagaimana kaitannya
dengan hasil tes.
d. Petunjuk-petunjuk tentang cara melaksanakan tes
Misalnya: dilaksanakan dengan lisan atau tertulis, waktu yang digunakan
untuk mengerjakan setiap bagian, boleh tidaknya tercoba keluar jika sudah
selesai mengerjakan soal itu dan sebagainya.
e. Petunjuk-petunjuk bagaimana cara menskor
Misalnya: untuk beberapa skor tiap-tiap soal/unit, menggunakan sistem
hukuman atau tidak, bagaimana cara menghitung nilai akhir dan
sebagainya.
f. Petunjuk-petunjuk untuk menginterpretasikan hasil
Misalnya:
1. Betul nomor sekian sampai sekian cocok untuk jabatan kepala seksi,
2. Betul nomor sekian saja, cocok untuk jabatan guru dan sebagainya.
g. Saran-saran lain
Misalnya: siapa harus menjadi pengawas, bagaimana seandainya tidak ada
calon yang mencapai skor tertentu dan sebagainya
BAB 10
PENYUSUNAN TES

1. Fungsi Tes
Setiap kai akan memberikan tes, kebanyakan guru selalu bertanya kepada
dirinya sendiri
 “Pertanyaan apakah yang akan saya berikan?”
 “Jawaban apakah yang saya perlukan dan jawaban manakah tidak saya
perlukan?”
 “berapa butir soal akan sa buat?”
 “Bagaimanakah bentuk kunci jawabanya?”

Untuk menjawab pertanyaan tesebut, guru harus selalu ingat akan


fungsi tes, sehubungan dengan hal-hal yang harus diingat pada waktu
penyusunan tes, maka fungsi tes dapat ditinjau dari 3 (tiga) hal:
a. Fungsi untuk kelas
b. fungsi untuk bimbingan.
c. fungsi untuk administrasi]
selain fungsi-fungsi tes ini, hal lainyang harus diingat adalah:
a. hubungan dengan penggunaan
b. komprehensip
c. kontinu

PERBANDINGAN FUNGSI TES


Fungsi untuk kelas Fungsi untuk Fungsi untuk
bimbingan administrasi
1. mengadakan 1. menentukan arah 1. memberi petunjuk
diagnosis terhadap pembicaraan dalam
kesulitan belajar dengan orang tua mengelompokkan
siswa tentang anak-anak siswa.
2. mengevaluasi celah mereka. 2. penempatan siswa
antara bakat dengan 2. membantu siswa baru
pencapaian dalam menentukan 3. membantu siswa
3. menaikkan tingkat pilihan. memilih kelompok
prestasi 3. membantu siswa 4. menilai kurikulum
4. mengelompokkan mencapai tujuan 5. memperluas
siswa dalam kelas pendidikan dan hubungan
pada waktu metode jurusan. masyarakat
kelompok 4. memberi 6. menyediakan
5. merencanakan kesempatan kepada informasi untuk
kegiatan proses pembimbing, guru, badan-badan lain
belajar mengajar dan orang tua di luar sekolah.
untuk siswa secara dalam memahami
perseorangan. kesulitan anak.
6. menentukan siswa
mana yang
memerlukan
bimbingan khusus
7. menentukan tingkat
pencapaian untuk
setiap anak.

a. hubungan dengan penggunaan


diatas telah disajikansederetan fungsi tes, waktu mensun tes dalam hati
harus selalu diingat, fungsi mana yang sama saat dipentingkat karena
fungsi yang berbeda akan menentukan bentuk/isi tes yang berbeda pula

b. komprehensip
sebuah tes bebaliknya menckup suatu kebetulan, artinya meliputi
berbagai aspek yang dapat menggambarkan keaad siswa secara
keseluruhan (kecerdasan, sikap, pribadi perasaan sosial dan sebagainya)
hal ini dapat dicapai apabila tes itu merupkan rangkaian tes, misalnya
dari kelas 1 samapi dengan kelas 6.
c. Kontinuitas
Berhubungan dengan prinsip komprehensif maka prinsip kontinuitas
mempunyai persamaan tujuan. Sebaiknya tes disusun sedemikian rupa
sehingga menggambarkan kelanjutan dari awal anak memasuki satu
sekalh sampai dengan kelas terakhir. Dengan demikian akan diketahi
anak tiu tdak dengan terputus.
2. Langkah-langkah dalam penyusunan tes
Tentu saja setiap guru akan dengan mudah mengatakan bagian pelajaran
mana yang akandicakup dalam sebuah tes jika sudah diketahui tujuannya.
Urutan langkah yang dilakukan adalah sebagai berikut:
a. Menentukan tujuan mengadakan tes
b. Mengadakan pembatasan terhadap bahan yang akan diteskan.
c. Merumuskan Tujuan Instruksional Khusus (TIK) dari tiap bagian bahan.
d. Menderetkan semua TIK dalam tabel persiapan yang memuat pula aspek
tingkah laku dalam terkandung TIK itu, tabel digunakan untuk
identifikasi terhadap tingkah laku yang dikehendaki, agar tidak terlewati.
Contoh:
Tabel TIK dan Aspek tingkah laku yang dicakup
Indikator Aspek Ingatan Pemahaman Aplikasi Keterangan
tingkah laku
1. Siswa dapat   
menjumlahkan 2   
bilangan bersusun  
 
2. Siswa dapat
 
menerangkan
hukum komulatif
dan seterusnya

e. Menyusun tabel spesifikasi yang memuat pokok materi, aspek berfikir


yang diukur beserta imbangan antara kedua hal tersebut. (Uraian
penjelasan tentang tabel spesifikasi i akan kami jelaskan di sub bab
berikutnya)
f. Menuliskan butir-butir soal, didasarkan atas TIK-TIK yang sudah
dituliskan pada tabel TIK dan aspek tingkah laku yang dicakup
Apabila indikator ditul sangat khsus. Maka saw indikator diukur oleh
saw butir soal. Akan tetapi, jika indikator itu merupakan esensial, maka satu
indikator dapat diukur dengan lebih dari satu evalusasi soal
Kecenderungan yang ada pada guru-guru beberapa waktu yang lalu
pengukuran ranah kognotof hanya ditekankan pada 3 aspe yang pertama,
uyaitu ingatan, pemahaman dan aplikasi akan tetapi dalam UAAS dan
SNMPTN aspek yang lain juga diukur sejalan dengan bentuk itemnya. Untuk
aspek lainya, walaupun dikehendaki dan diusahkan masuk ke dalam kategori
pemahaman dan aplikasi, setelah diperiksa kemungkinan besar jgua bersifat
ingatan.
a. Soal ingatan
Hampir tidak ada kesulitan bagi para guru untuk membuat item mengenai
ingatan, baik bagi soal bentuk uraian maupun objektif. Pertanyaan
ingatan adalah pertanaan yang jawabannya dapat dicari denagn mudah
pada catatan atu buku. Pertanyaan ingatan biasanya dimulai dengan kata,
kata : mendefinisikan, mendeskripsikan, mengidentifikasikan, mendaftar,
menjodohkan, menyebutkan, menyatakan, mereproduksikan
Pertanyaan ingatan biasa digunakan untuk mengukur penguasaan materi
yang berupa fakta, istilah definisi klasifikasi atau kategori, urutan
maupun kriteria
Contoh contoh pertanyaan ingatan
1) Apa sebab indonesia dapat mencapai kemerdekaan
2) Jelaskan bagaimana terlaksananya proklamasi kemerdeaan
3) Sebutkan satuan yang dipakai dalam sistem MKS untuk besaran:
panjang, masa, waktu kecepatan dan percepatan.
Pilihan ganda
1) Ketahanan nasional indonesia mencakup kebulatan aspek sosial dan
aspek alamiah
a) Dwi Gatra
b) Panca Gatra
c) Catur Gatra
d) Tri Gatra
2) Pertyataan hukum III newton adalah
a) Besar gaya berbanding lurus terhadap masa dan percepatan
b) Setiap aksi terdapat resaksi yang sama besar dan arah berlawanan
c) Setiap kaksi terdapat reaksi yang arah dan besarnya sama
d) Besar gaya yang menyebabkan saama dengan besar gaya yang
diakibatkan
b. Soal pemahaman
Apabila soal ingatan dapat dijawab dengan melihat buku atau catatan,
tidaklah demikian untuk soal pemahaman, untuk menjawanb pertanyaan
pemahaman siswa dituntut hafal sesuatu pengertian kemudian
menjelaskan dengan kalimat sendiri. Atau siswa memahami dua
pengertain atu lebih kemudian memahami dan menyebutkan
hubunganya, jadi dalam menjawab pemahaman siswa selain harus
mengingat juga berfikir.
Pertanyaan pemahaman biasnya menggunakan kata-kata
perbedaaan, perbandingan, menduga, mengeneralisasikan, memberikan
contoh, menuliskan kembali, memperkirakan
Contoh:
adanya taifun di kepulaian filipina selaluditakuti oelh curah hujan cukup
besar di pulau jawa
sebab
angin pasat tenggara tertarik ke utara katulistiwa melalui pulau jawa yang
menambah banyaknya hujan.
c. Soal aplikasi
Soal aplikasi adalah soal yang menungukur siswa dalam
mengaplikasikan (menerapkan)pengetahannya untuk mememcahkan
masalah sehari-hari atau persoalan yang dikemukakan oleh pembuat
persoalan yang dikarang oleh penyusun soal, bukan kerangan yang
terdapat dalam buku atau pelajaran yang dicatatat.
Kata-kata yan gdigunakan dalam soal aplikasi atau kemampuan
dituntutantara lain mengubah, menghitung mendemonstrasikan,
menemukan, menggunakan
Contoh
Sebuah benda yang terletak di muka sebuah lensa yang mempunyai jarak
fokus 10 cm. Bayangan yang terjadi ternyata tegak dan tinggi dua kali
tinggi benda itu, jarak antara benda dengan lensa adalah
a) 3,3 sm
b) 5 cm
c) 10 cm
d) 15 cm
e) 30 cm
d. Soal analisis
Soal analiss adalah soal yang menuntut kemampuan siswa menganalisa
atau menguraikan sesuatu persoalan utnuk diketahui bagian-bagiannya.
Dalam hierarki taksonomi, analisis lebih tinggi dari aplikasi. Oleh karena
itu, soal analisis harus dimulai dengan kasus yang dikarang sendiri oleh
guru, bukan mengambil uraian dari buku atau catatan pelajaran.
Kata-kata yang digunakan atau kemampuan yang dituntut antara lain,
meliputi memerinci, menyusun diagram, nenbedakan, mengilustrasikan,
menyimpulkan, memilih, memisahkan, membagi.
e. Soal sintesis
Sebagai kebalikan kemampuan untuk menganalisis adalah kemampuan
tuntuk mengadakan sintesis oleh karena itu, soal sintesis juga harus
dimulai dengan satu kasus untuk mengadakan sintesis, yaitu
menyimpulkan mengategorikan, mengkombinasikan, mengarang,
membuat desain mengorganisasikan, menghubungkan, menulis kembali,
membuat rencana, menyusun, mencoptakan
Contoh kasus seperti yang di contohkan soal analisis dapat digunakan
kasus soal sintesit, tergantung dari bagaimana permintaaan pembuat soal.
f. Soal evaluasi
Soal evaluasi adalah soal yang berhubungan dengan menilai, mengambil
kesimpulan, membandingkan, mempertentangkan, mengkritik,
mendeskripsikan, membedakan, menerangkan, memutuskan,
menafsirkan.
Soal evaluas selaudidahului dengan kasus yang ditelaah oelh siswa
dengan teropong hukum dalilm prinsip, kemudian mereka mengadakan
penilaian baik atau tidak didasarkan ats benar atau salah.
Misalnya tentang pembangunan bendungan aswan yang diceritakan
tentang letakm kemiringan, daerah yang dikorbankan, dan sebaginya
siswa menilai tindkan pembangunan bentungan bedasarkan atas
pertimbangan sosial, ekonomi politik dan sebagainya
Contoh”
Kasus dapat diambil dai kisah bendungan aswan
Soal
Bagaimana kesuburan tanah di sekitar bendungan aswan? Bedakan
keadaaan darerah di bagian hulu dan hilir dengan kemungkinan lumpur
terbawa arus air dan sebagainya.
3. Komponen-Komponen Tes
Apabila guru sudah bekerja keras sebelum melaksanakn tes, maka pekerjaan
sesudahnya akan menjadi lancar, mudah dan hasilnya leibh baik
Komponen atau kelengkapan sebuah tes terdiri atas.
a Buku tes, yakni lembaran atau buku yang memuat butir-butir soal yang
mesti dikerjakan oleh siswa
b. Lembar jawaban tes, yaitu lembaran yang disediakan oleh penilain
bagi testee untuk mengerjakan tes, untuk bentuk pilihan ganda dibuat
lembaran nomor dan huruf A, B, C, D, E menurut banyaknya
alternative yang disediakan
c. Kunci jawaban tes, berisi jawaban-jawaban yang dikehendaki. Kunci
jawaban ini dapat berupa huruf atau kalimat. Untuk test bentuk uraian
yang dituliskan adalah kata-kata kunci atau kalimat seingkat untuk
memberikan ancar-ancar jawaban. Ide dari kunci jawaban ini adalah:
1) Pemeriksaan tes dapat dilakukan oleh orang lain
2) Pemeriksaannya betul,
3) Dilakukan dengan mudah,
4) Sedikit mungkin masuknya unsur subjektif
d. Pedoman penilaian,
pedoman penilaian atau pedoman skoring, berisi tentang pedoman
perincian tentang skor atau angka yang diberikan kepada siswa bagi soal-
soal yang telah dikerjakan
BAB 11
TES TERTULIS UNTUK PRESTASI BELAJAR

1. Bentuk-bentuk tes
a) Tes subyektif.
Secara umum soal subyektif adalah pertanyaan yang menuntut peserta
didik menjawab dalam bentuk menguraikan, menjelaskan, mendiskusikan,
membandingkan, memberikan alasan, dan bentuk lain yang sejenis sesuai
dengan tuntutan pertanyaan dengan menggunakan kata-kata dan bahasa
sendiri. Jumlah soal-soal bentuk subyektif biasanya tidak banyak, hanya
sekitar 5-10 buah soal dalam waktu kurang lebih 90-120 menit. Soal-soal
bentuk ini menuntut kemampuan peserta didik untuk dapat mengorganisir,
menginterpretasi, dan menghubungkan pengertian-pengertian yang telah
dimiliki.
1) Kebaikan-kebaikannya
a. Mudah diapkan dan disusun
b. Tidak memberi banyak kesempatan untuk spekulasi atau untung-
untungan
c. Mendorong siswa untuk berani mengemukakan pendapat serta
menyusun dalam bentuk kalimat
d. Memberi kesempartan kepada siswa untuk meengutrakan
maskusnya dengan gaya bahasa dan caranya sendiri
e. Dapat diketahui sejauh mana siswa mendalami sesuat masalah
yang diteskan.
1) Keburukan-keburukannya
a. Kadar validitas dan relibitias rendah karena sukr diketahui segi-
segi mana dari pengetahuan siswa yang betul-betul telah dikuassai
b. Kurang repersentatif dalam hal mewakili seluruh scope bahan
pelajaran yang akan dites karena soalnya hanya beberapa saja
(terbatas)
c. Cara memeriksanya banyak dipengaruhi oelh unsur-unsur
subjektif
d. Pemeriksaanya lebih sulit sebab membutuhakn pertimbangan
individual lebih banyak dari penilai
e. Waktu untuk koreksinya llama dan tidak dapat diwakilkan kepada
orang lain.
2) Petunjuk penyusunan
a. Hendaknya soal-soal tes dapat meliputi ide-ide pokok dari bahan
yang diteskan dan kalu mungkin disusun soal yang sifatnya
komprehensif.
b. Hendaknya soal tidka megambil kalimat-kalimat yangdisalin
langsung dari buku atau catatan.
c. Pada waktu menyusun soal-soal itu sudah dilengkapi dengan
kunci jawaban serta pedoman penilaiannya.
d. Hendaknya diusahakan agar pertanyaanya bervariasi antara
jelaskan mengapa bagaimana seberapa jauh agar diketahui lebih
jau penguasaan siswa tehadap bahan.
e. Hendakjnya rumusan soal dibuat sedemikan rupa sehingga mudah
dipahami oleh tercoba.
f. Hendaknya ditegakn model jawaban apa yang dikehendaki oleh
penyusun tes, untuk ini pertanyaan tidak boleh terlalu umu tetapi
harus spesifik

b) Tes objektif.
Tes objektif adalah tes yang dalam pemeriksaannya dapat
dilakukan secara objektif (Arikunto, 1995 : 165). Karena sifatnya
yang objektif maka penskorannya dapat dilakukan dengan bantuan
mesin. Soal ini tidak memberi peluang untuk memberikan penilaian
yang bergradasi karena dia hanya mengenal benar dan salah. Apabila
respons siswa sesuai dengan jawaban yang dikehendaki maka
respons tersebut benar dan biasa diberi skor 1. Apabila kondisi yang
terjadi sebaliknya, maka respons siswa salah dan biasa diberi skor 0.
Jawaban siswa bersifat mengarah kepada satu jawaban yang benar
(convergence).
Merujuk kepada berbagai pendapat tentang tes objektif dapat
diambil kesimpulan bahwa tes objektif adalah tes yang semua
informasi yang diperlukan peserta tes untuk memberikan respon
telah disediakan oleh penyusun tes, sehingga peserta tes tinggal
memilihnya. Jawaban yang berupa pilihan bersifat deterministik,
sehingga hanya ada dua kemungkinan kebenaran jawaban – benar
atau salah
1) Kebaikan kebaikannya
a) Mengandung lebih banyak segi-segi yang positif mislnya
lebih representative meweakili isi dan luas bahan, lebih
objektif dpat dihindari campur tangannya unsur subjektif
baidari segi siswa maupun guru yang memriksa.
b) Lebih mudah dan cepat cara memriksanya karena
menggunkan kunci tes bahkan alat-alat hasil kemajuan
teknologi
c) Pemeriksaanya dapat disehkan ke oranglain
d) Dalam pemerisaan tidak ada unsur subjetif yang
memengaruhi
2) Kelemahan-kelemahanya
a) Persipan untuk menyusun jeuh lebih sulit dari pada tes esai
karena soelnya banyak dan harus teliti untuk menghindari
kelemahan-kelemahan yang lain.
b) Soalya cenderung untuk menggunkapkan ingatan dan daya
pengenalan kembali saja, dan sukar untuk mengukur proses
mental yang tinggi
c) Banyak kesempatan untuk main untung-untungan
3) Cara mengatasi kelemahan
Bab 12 TABEL SPESIFIKASI

1. Fungsi Tabel Spesifikasi

Fungsi dari tabel spesifikasi ialah untuk menjaga agar tes yang kita susun
tidak menyimpang dari bahan (materi) serta aspek kejiwaan (tingkah laku) yang
akan dicakup dalam tes.

Contoh table spesifikasi:

Aspek yang Ingatan Pemahaman Aplikasi Jumlah


diungkap
(I) (P) (A)
Pokok Materi
Bagian I ………… ……………. …………. ………….

Bagian II ………… …………….. …………. …………

Bagian (terakhir) ………… …………….. …………. …………


Jumlah ……….. ……………. ………….. …………

2. Langkah-Langkah Pembuatan

a. Untuk materi yang seragam

Yang dimaksud “seragam” disini adalah bahwa antara


pokok materi yang satu dengan pokok materi yang lain mempunyai
kesamaan dalam imbangan aspek tingkah laku. Misalnya 50%
untuk ingatan, 30% untuk pemahaman, dan 20% untuk aplikasi.
Selanjutnya banyaknya butir soal untuk setiap sel (kotak kecil)
diperoleh dengan cara menghitung persentase dari banyaknya soal
bagi tiap pokok materi yang sudah tertulis di kolom paling
kanan.Contoh:

Tabel Spesifikasi Penyusunan Tes Tarikh Kelas XI

Aspek yang diungkap Ingatan Pemahaman Aplikasi Jumlah

Pokok Materi (50 %) (30%) (20%)


Latar Belakang [A] [B] [C] 10
Berdirinya Umayyah
(20%)
Kahalifah-Khalifah [D] [E] [F] 15
Besar Umayyah (30%)
Keberhasilan Umayyah [G] [H] [I] 15
(30%)
Keruntuhan Umayyah [J] [K] [L] 10
(20%)
Jumlah 50

Untuk mengisi/menentukan banyaknya butir soal untuk tiap sel


adalah sebagai berikut:

Sel A = 50 % x 10 soal = 5 (5 soal)

Sel B = 30% x 10 soal = 3 (3 soal)

Sel C = 20% x 10 soal = 2 (3 soal)

Untuk memgisi sel-sel yang lain, dilakukan dengan cara yang sama
seperti hal nya mengisi sel A, B, dan C.

Disamping menggunakan cara seperti diatas, dalam menentukan


jumlah butir soal untuk tiap-tiap pokok materi, ada lagi cara lain
yang dapat diambil yaitu mulai dari pengisian sel-sel kemudian
baru diperoleh jumlah soal tiap pokok materi.

b. Untuk materi yang tidak seragam

Untuk membuat tabel spesifikasi pokok-pokok materi yang


tidak seragam, tidak perlu mencantumkan angka persentase
imbangan tingkah laku di kepala kolom. Pemberian imbangan
dilakukan tiap pokok materi didasarkan atas banyaknya soal untuk
pokok materi itu dan imbangan yang dikehendaki oleh penilaian
menurut sifat pokok materi yang bersangkutan.Contoh:

Tabel Spesifikasi Penyusunan Tes Tarikh Kelas XI

Aspek yang diungkap


Ingatan Pemahaman Aplikasi Jumlah
Pokok Materi
Bab I: Daulah Umayyah [A] [B] [C] 15
(30%)
Bab II: Daulah [D] [E] [F] 20
Abbasiyah (40%)
Bab III: Islam di [G] [H] [I] 15
Asia (30%)
Jumlah (100%) 50

Dalam keadaan seperti dicontohkan misalnya: BAB I


mayoritas hafalan, BAB II mayoritas pemahaman, BAB III
mayoritas aplikasi. Maka imbangan aspek tingkah laku, tidak
dituliskan pada kepala kolom. Penentuan angka yang menunjukkan
banyaknya butir soal pada tiap sel, ditentukan per BAB. Misalnya:
untuk Bab I, Ingatan 60%, pemahaman 20%, aplikasi 20%, maka:

Sel A = 60% x 15 soal = 9 soal

Sel B = 20% x 15 soal = 3 soal

Sel C = 20% x 15 soal = 3 soal

Untuk Bab II, ingatan 20%, pemahaman 50%, aplikasi 30%, maka:

Sel D = 20% x 20 soal = 4 soal

Sel E = 50% x 20 soal = 10 soal

Sel F = 30% x 20 soal = 6 soal

Untuk Bab III, ingatan 20%, pemahaman 20%, aplikasi 60%,


maka:

Sel G = 20% x 15 soal = 3 soal

Sel H = 20% x 15 soal = 3 soal

Sel I = 60% x 15 soal = 9 soal

4) Tidak Lanjut Sesudah Penyususnan Tabel Spesifikasi

Terdapat dua langkah lagi sebagai tindak lanjut sesudah penyususnan tabel
spesifikasi untuk memperoleh seperangkat soal tes yaitu:

a. Menentukan bentuk soal. Ada dua hal yang harus dipertimbangkan


dalam menentukan bentuk soal yaitu waktu yang tersedia dan sifat
materi yang diteskan.

b. Menuliskan soal-soal. Langkah terakhir dalam penyusunan tes adalah


penulisan soal-soal tes (item writing). Langkah ini merupakan langkah
penting karena kegagalan dalam hal ini dapat berakibat fatal. Hal-hal
yang harus diperhatikan dalam menuliskan soal-soal tes yaitu:
(1) Bahasanya harus sederhana dan mudah dipahami.

(2) Suatu soal tidak boleh mengandung penafsiran


ganda/membingungkan.

(3) Cara mengenal kalimat atau meletakkan/menata kata-kata perlu


diperhatikan agar tidak ditafsirkan salah.

(4) Petunjuk mengerjakan. Petunjuk ini harus dituliskan sedemikian


rupa sehingga jelas, dan siswa tidak bekerja menyimpang dri yang
dikehendaki guru.

Untuk memperoleh sebuah tes yang standar, harus dilakukan


uji coba (try out) berkali-kali sehingga diperoleh soal-soal yang baik.
Dengan mengadakan uji coba terhadap soal-soal tes yang sudah
disusun, maka akan memperoleh manfaat yaitu: pengalaman
menggunakan tes tersebut, mengetahui kesukaran bahasa, mengetahui
variasi jawaban siswa, mengetahui waktu yang dibutuhkan, dan lain-
lain.

Bab 13 MENGANALISISS HASIL TES

1. Menilai Tes yang Dibuat Sendiri

Guru yang sudah banyak berpengalaman, mengajar dan menyusun soal-


soal tes, juga masih sukar menyadari bahwa tesnya masih belum sempurna. Oleh
karena itu cara yang paling baik adalah secara jujur melihat hasil yang diperoleh
oleh siswa.

Ada 4 cara untuk menilai tes, yaitu:

a. Meneliti secara jujur soal-soal yang sudah disusun, kadang-kadang


dapat diperoleh jawaban tentang ketidak jelasan perintah atau bahasa,
taraf kesukaran, dan lain-lain keadaan soal tersebut. Pertanyaan-
pertanyaan tersebut antara lain:

(1) Apakah banyaknya soal untuk tiap topik sudah seimbang ?

(2) Apakah semua soal menanyakan bahan yang telah diajarkan ?

(3) Apakah soal yang kita susun tidak merupakan pertanyaan yang
membingungkan (dapat disalah tafsirkan)?

(4) Apakah soal itu tidak sukar untuk dimengerti ?

(5) Apakah soal itu dapat dikerjakan oleh sebagian besar siswa ?
b. Mengadakan analisis soal (item analysis). Analisis soal adalah suatu
prosedur Yang sistematis, yang akan memberikan informasi-informasi
yang sangat khusus terhadap butir tes yang kita susun. Faedah
mengadakan analisis soal:

(1) Membantu kita dalam mengidentifikasi butir-butir soal yang


jelek.

(2) Memperoleh informasi yang akan dapat digunakan untuk


menyempurnakan soal-soal untuk kepentingan lebih lanjut.

(3) Memperoleh gambaran secara selintas tentang keadaan yang


kita susun.

c. Mengadakan checking validitas. Validitas yang paling penting dari tes


buatan Guru adalah validitas kurikuler.

d. Mengadakan checking reliabilita. Salah satu indikator untuk tes yang


Mempunyai realibilitas yang tinggi adalah bahwa kebanyakan dari
soal-soal tes itu mempunyai daya pembeda yang tinggi.

2. Analisis Butir Soal(Item Analysis)

Analisis butir soal yang dalam bahasa inggris disebut item analiysis
dilakukan terhadap empirik.Maksudnya, analisis itu baru dapat dilakukan apabila
suatu tes telah dilaksanakan dan hasil jawaban terhadap butir-butir soal telah kita
peroleh.

Untuk mengetahui kapan soal dikatakan baik, kurang baik, dan soal yang
jelek sangat berhubungan dengan analisis soal, yaitu taraf kesukaran, daya
pembeda, dan pola jawaban soal.

a) Taraf Kesukaran

Soal yang baik adalah soal yang tidak terlalu mudah atau tidak
terlalu sukar. Soal yang terlalu mudah tidak merangsang siswa untuk
mempertinggi usaha memecahkannya. Sebaliknya soal yang terlalu
sukar akan menyebabkan siswa menjadi putus asa dan tidak
mempunyai semangat untuk mencoba lagi karena di luar
jangkauannya.

Bilangan yang menunjukkan sukar dan mudahnya sesuatu soal


disebut indeks kesukaran. Besarnya indeks kesukaran antara 0,00
sampai dengan 1,0. Soal yang indeks kesukaran 0,0 menunjukkan
bahwa soal itu terlalu sukar, sebaliknya indeks 1,0 menunjukkan
bahwa soalnya terlalu mudah.
Didalam istilah evaluasi, indeks kesukaran diberi simbol P
(proporsi). Rumus mencari P adalah :

P=B

JS

Dimana :

P= indeks kesukaran

B = Banyaknya siswa yang menjawab soal itu dengan betul

JS = jumlah seluruh siswa peserta tes

Menurut ketentuan yang sering diikuti, indeks kesukaran sering


diklasifikasikan sebagai berikut :

Soal dengan P 1,00 sampai 0,30 adalah soal sukar

Soal dengan P 0,30 sampai 0,70 adalah soal sedang

Soal dengan P 0,70 sampai 1,00 adalah soal mudah

Walaupun demikian ada yang berpendapat bahwa soal – soal yang di


anggap baik yaitu soal – soal sedang, tetapi bukan berarti soal – soal
yang terlalu mudah atau terlalu sukar tidak bisa digunakan, hal ini
tergantung dari penggunaannya.

b) Daya Pembeda.

Daya pembeda soal adalah kemampuan sesuatu soal untuk


membedakan antara siswa yang berkemampuan tinggi dengan siswa
yang berkemampuan rendah.

Angka yang menunjukkan besarnya daya pembeda disebut indeks


diskriminasi, indeks diskriminasi ini sama dengan indeks kesukaran
yaitu berkisar antara 0,00 sampai 1,00. Hanya bedanya, indeks
kesukaran tidak mengenal tanda negatif tetapi pada indeks
diskriminasi ada tanda negatif.

Bagi suatu soal yang dapat dijawab benar oleh siswa pandai maupun
siswa bodoh, maka soal itu tidak baik, demikian pula jika semua
siswa, baik pandai maupun bodoh tidak dapat menjawab dengan
benar, soal tersebut tidak baik karena keduanya tidak mempunyai
daya pembeda. Soal yang baik adalah soal yang dapat dijawab oleh
siswa pandai saja.

Jika seluruh kelompok atas (pandai) dapat menjawab soal dengan


benar, sedang seluruh kelompok bawah (bodoh) menjawab salah,
maka soal tersebut mempunyai diskriminasi paling besar, yaitu 1,00.
Sebaliknya jika semua kelompok atas menjawab salah, tetapi semua
kelompok bawah menjawab betul, maka nilai diskriminasinya adalah
-1,00. Tetapi jika siswa kelompok atas dan siswa kelompok bawah
sama-sama menjawab benar atau sama-sama menjawab salah, maka
soal tersebut mempunyai nilai diskriminasi 0,00 karena tidak
mempunyai daya pembeda sama sekali.

Rumus mencari nilai Diskriminasi adalah :

D = BA/JA – BB/JB = PA – PB

Dimana :

J = jumlah peserta tes

JA = banyaknya peserta kelompok atas

JB = banyaknya peserta kelompok bawah

BA = banyaknya peserta kelompok atas yang menjawab soal itu


dengan benar

BB BA/JA = banyaknya peserta kelompok bawah yang menjawab


soal itu dengan benar.

PA = BB/JB = proporsi peserta kelompok atas yang menjawab benar


( P sebagai indeks kesukaran).

PB = proporsi peserta kelompok bawah yang menjawab benar

c) Pola Jawaban Soal

Pola jawaban yang dimaksud adalah distribusi testee dalam hal


menentukan pilihan jawaban pada soal bentuk pilihan ganda. Pola
jawaban soal diperoleh dengan menghitung banyaknya testee yang
memilih pilihan jawaban a, b, c, atau d atau yang tidak memilih
pilihan manapun.

Dari pola jawaban soal dapat ditentukan apakah pengecoh


(distractor) berfungsi sebagai pengecoh dengan baik atau tidak.
Pengecoh yang tidak dipilih sama sekali oleh testee berarti bahwa
pengecoh itu jelek, sebaliknya sebuah distraktor dapat dikatakan
berfungsi dengan baik apabila distraktor tersebut mempunyai daya
tarik yang besar bagi pengikut – pengikut tes yang kurang
memahami konsep atau kurang menguasai bahan.

Dengan melihat pola jawaban soal, dapat diketahui :

a. Taraf kesukaran soal

b. Daya pembeda soal

c. Baik dan tidaknya distraktor

Kekurangan suatu soal mungkin hanya terletak pada rumusan


kalimatnya sehingga hanya perlu ditulis kembali, dengan perubahan
seperlunya.

Bab 14 MENSKOR DAN MENILAI

1. Menskor

Sementara orang berpendapat bahwa bagian yang paling penting dari


pekerjaan pengukuran dengan tes adalah penyusunan tes. Jika alat tesnya sudah
disusun sebaik-baiknya maka anggapannya sudah tercapailah sebagian besar dari
maksudnya. Tentu saja anggapan itu tidak benar sama sekali. Penyusunan tes baru
merupakan satu bagian dari serentetan pekerjaan mengetes.

Di samping penyusunan dan pelaksanaan tes itu sendiri, menskor dan


menilai merupakan pekerjaan yang menuntut ketekunan yang luar biasa dari
penilai, ditambah dengan kebijaksanan-kebijaksanaan tertentu. Nama lain
menskor adalah memberi angka.

Dalam hal pekerjaan menskor atau menentukan angka, dapat digunakan 3


macam alat bantu yaitu:

a. Pembantu menentukan jawaban yang benar, disebut kunci


jawaban.
b. Pembantu menyeleksi jawaban yang benar dan yang salah, disebut
kunci scoring.
c. Pembantu menentukan angka, disebut pedoman penilaian.
Keterangan dan pengunaannya dalam berbagai bentuk tes.
(1) Kunci jawaban dan kunci pemberian skor untuk tes bentuk betul-
salah.
Untuk tes bentuk betul-salah (true-false) yang dimaksud dengan
kunci jawaban adalah deretan jawaban yang kita persiapkan untuk
pertanyaan atau soal-soal yang kita susun, sedangkan kunci scoring adalah
alat yang kita gunakan untuk mempercepat pekerjaan scoring.
Oleh karena dalam hal ini testee (tercoba) hanya diminta
melingkari huruf B atau S maka kunci jawaban yang disediakan hanya
berbentuk urutan nomor serta huruf dimana kita menghendaki untuk
melingkari (atau dapat juga diberi tanda X).
Ada baiknya jika kunci jawaban ini ditentukan terlebih dahulu
sebelum menyusun soalnya agar:
dapat diketahui imbangan antara jawaban B dan S.
dapat diketahui letak atau pola jawaban B dan S.
Bentuk betul-salah sebaiknya disusun sedemikian rupa sehingga
jumlah jawaban B hampir sama banyaknya dengan jawaban S, dan tidak
dapat ditebak karena tidak diketahui pola jawabannya. Dalam menentukan
angka (skor) untuk tes bentuk B-S ini kita dapat menggunakan 2 cara
yaitu:
 Tanpa hukuman atau tanpa denda.
 Dengan hukuman atau dengan denda.
(2) Kunci jawaban dan kunci pemberian skor untuk tes bentuk pilihan
ganda (multiple choice)
Dengan tes bentuk pilihan ganda, testee diminta melingkari salah
satu huruf di depan pilihan jawaban yang disediakan atau membubuhkan
tanda lingkaran atau tanda silang (x) pada tempat yang sesuai di lembar
jawaban.
(3) Kunci jawaban dan kunci pemberian skor untuk tes bentuk jawab
singkat (sort answer test)
Tes bentuk jawab singkat adalah bentuk tes yang menghendaki
jawaban berbentuk kata atau kalimat pendek. Melihat namanya, maka
jawaban untuk tes tersebut tidak boleh berbentuk kalimat-kalimat panjang,
tetapi harus sesingkat mungkin dan mengandung satu pengertian. Dengan
persyaratan inilah maka bentuk tes ini dapat digolongkan ke dalam bentuk
tes objektif.
Kunci jawaban tes bentuk ini merupakan deretan jawaban sesuain
dengan nomornya.
Dengan mengingat jawaban yang hanya satu pengertian saja, maka
angka bagi tiap nomor soal mudah ditebak. Usaha yang dikeluarkan siswa
sedikit, tetapi lebih sulit daripada tes bentuk betul-salah atau bentuk
pilihan ganda. Sebaiknya setiap soal diberi angka 2. Dapat juga angka itu
kita samakan dengan angka pada bentuk betul-salah atau pilihan ganda jika
memang jawaban yang diharapkannya ringan atau mudah. Tetapi
sebaliknya apabila jawabannya bervariasi misalnya lengkap sekali,
lengkap dan kurang lengkap, maka angka-angkanya dapat dibuat
bervariasi pula misalnya 2; 1,5; dan 1.
(4) Kunci jawaban dan kunci pemberian skor untuk tes bentuk
menjodohkan (matching)
Pada dasarnya tes bentuk menjodohkan adalah tes bentuk pilihan
ganda, dimana jawaban-jawabannya dijadikan satu, demikian pertanyaan-
pertanyaannya. Dengan demikian, maka pilihan jawabannya akan lebih
banyak. Satu kesulitan lagi adalah bahwa jawaban yang dipililh dibuat
sedemikian rupa sehingga jawaban yang satu tidak diperlukan lagi bagi
pertanyaan lain.
Kunci jawaban tes bentuk menjodohkan dapat berbentuk deretan
jawaban yang dikehendaki atau deretan nomor yang diikuti oleh huruf-
huruf yang terdapat di depan alternative jawaban.
Telah dijelaskan bahwa tes bentuk menjodohkan adalah tes bentuk
pilihan ganda yang lebih kompleks. Maka angka yang diberikan sebagai
imbalan juga harus lebih banyak. Sebagai ancar-ancar dapat ditentukan
bahwa angka untuk tiap nomor adalah 2 (dua).
(5) Kunci jawaban dan kunci pemberian skor untuk tes bentuk uraian
(essay test)
Sebelum menyusun sebuah tes uraian sebaiknya kita tentukan
terlebih dahulu pokok-pokok jawaban yang kita kehendaki. Dengan
demikian, maka akan mempermudah kita dalam pekerjaan mengkoreksi
tes itu.
Tidak ada jawaban yang pasti terhadap tes bentuk uraian ini.
Jawaban yang kita peroleh akan sangat beraneka ragam, berada dari siswa
satu ke siswa lain. Untuk menetukan standar terlebih dahulu, tentulah
sukar. Berikut adalah saran langkah-langkah apa yang harus kita lakukan
pada waktu kita mengoreksi dan member angka tes bentuk uraian:
a) Membaca soal pertama dari seluruh siswa untuk mengetahui
situasi jawaban. Dengan membaca seluruh jawaban, kita dapat
memperoleh gambaran lengkap tidaknya jawaban yang
diberikan siswa secara keseluruhan.
b) Menentukan angka untuk soal pertama tersebut. Misalnya jika
jawabannya lengkap diberi angka 5, kurang sedikit diberi angka
4, begitu seterusnya sampai kepada jawaban yang paling minim
jika jawabannya meleset sama sekali. Dalam menentukan angka
pada hal yang terakhir ini umumnya kita perlu berpikir bahwa
tidak ada unsur tebakan. Dengan demikian maka ada dua
pendapat, satu pendapat menentukan angka 1 atau 2 bagi
jawaban yang salah, tetapi pendapat lain menentukan 0 untuk
jawaban itu. Tentu saja bagi jawaban yang kosong (tidak ada
jawaban sama sekali), jelas kita berikan angka 0.
c) Memberikan angka bagi soal pertama.
d) Membaca soal kedua dari seluruh siswa untuk mengetahui
situasi jawaban, dilanjutkan dengan pemberian angka untuk soal
kedua.
e) Mengulangi langkah-langkah tersebut bagi soal-soal tes ketiga,
keempat dan seterusnya hingga seluruh soal diberi angka.
f) Menjumlahkan angka-angka yang diperoleh oleh masing-
masing siswa untuk tes bentuk uraian.
Setelah mempelajari langkah-langkah tersebut kita tahu bahwa
dengan membaca terlebih dahulu seluruh jawaban yang duberikan oleh
siswa, kita menjadi tahu bahwa mungkin tidah ada seorang pun dari siswa
yang menjawab dengan betul untuk sesuatu nomor soal.
Menghadapi situasi seperti ini, kita gunakan cara pemberian angka
yang relative. Misalnya untuk satu nomor soal jawaban yang paling
lengkap hanya mengandung 3 unsur, padahal kita menghendaki 5 unsur,
maka kepada jawaban yang paling lengkap itulah kita berikan angka 5,
sedangkan untuk menjawab hanya 2 atau 1 unsur, kita beri angka sedikit,
yaitu misalnya 3,4; 2; 1,5.
(6) Kunci jawaban dan kunci pemberian skor untuk tugas
Kunci jawaban untuk memeriksa tugas merupakan poko-pokok
yang harus termuat di dalam pekerjaan siswa. Hal ini menyangkut criteria
tentang isi tugas. Namun sebagai kelengkapan dalam pemberian skor,
digunakan suatu tolok ukur tertentu. Tolok ukur yang disarankan sebagai
ukuran keberhasilan tugas adalah:
a) Ketepatan waktu penyerahan tugas.
b) Bentuk fisik pengerjaan tugas yang menandakan keseriusan
mahasiswa dalam mengenakan tugas.
c) Sistematika yang menunjukkan alur keruntutan pikiran.
d) Kelengkapan isi menyangkut ketuntasan penyelesaian dan
kepadatan isi.
e) Mutu hasil tugas, yaitu kesesuaian hasil dengan garis-garis yang
sudah ditentukan oleh dosen.

2. Perbedaan Antara Skor dan Nilai

Apa yang terjadi selama ini, banyak di antara para guru sendiri yang masih
mencampuradukkan antara dua pengertian yaitu skor dan nilai.Skor : adalah hasil
pekerjaan menskor yang diperoleh dengan menjumlahkan angka-angka bagi setiap
soal tes yang dijawab betul oleh siswa.Nilai : adalah angka ubahan dari skor
dengan menggunakan acuan tertentu, yakni acuan normal atau acuan
standar.Secara rinci skor dapat dibedakan atas tiga macam, yaitu skor yang
diperoleh (obtained score), skor sebenarnya (true score), dan skor kesalahan
(error score).

Score yang diperoleh adalah sejumlah biji yang dimiliki oleh testee
sebagai hasil mengerjakan tes. Kelemaham-kelemahan butir tes, situasi yang tidak
mendukung, kecemasan dan lain-lain factor dapat berakibat terhadap skor yang
diperoleh ini. Apabila factor yang berpengaruh ini muncul, baik sebagian
atauppun menyeluruh, penilai tidak dapat mengira-ngira seberapa cermat skor
yang diperoleh siswa ini mampu mencerminkan pengetahuan dan keterampilan
siswa yang sesungguhnya.

Skor sebenarnya (true score) sering kali juga disebut dengan istilah skor
univers = skor alam (universe score), adalah nilai hipotesis yang sangat
tergantung dari perbedaan individu berkenaan dengan pengetahuan yang dimiliki
secara tetap.

Perbedaan antara skor yang diperoleh dengan skor yang sebenarnya,


disebut dengan istilah kesalahan dalam pengukuran atau kesalahan skor, atau
dibalik skor kesalahan. Hubungan antara ketiga macam skor tersebut adalah
sebagai berikut:

Skor yang diperoleh = skor sebenarnya = skor kesalahan

3. Norm ReferenceddanCriterion Referenced

Dalam penggunaan Norm – Referenced, prestasi belajar seorang siswa


dibandingkan dengan siswalain dalam kelompoknya. Kualitas seseorang sangat
dipengaruhi oleh kualitas kelompoknya. Dasar pikiran dari penggunaan standar ini
adalah adanya asumsi bahwa disetiap populasi yang heterogen tentu terdapat
kelomouk baik, kelompok sedang, dan kelompok kurang.

Apabila standar mutlak dan standar relatif ini dihubungkan dengan


pengubahab skor menjadi nilai, maka akan terlihat demikian.

a. Dengan standar mutlak

(1) Pemberian skor terhadap siswa, didasarkan atas pencapaian siswa


terhadap tujuan yang ditentukan.

(2) Nilai diperoleh dengan mencari skor rata-rata langsung dari skor
asal (skor mentah). Contoh :

 dari ulangan ke-1, memperoleh skor 60 (mencapai 60 % tujuan)

 dari ulangan ke-2, memperoleh skor 80 (mencapai 80 % tujuan)


 dari ulangan ke-3, memperoleh skor 50 (mencapai 50 % tujuan)

maka nilai siswa tersebut : 60 + 80 + 50 = 63,3. Dibulatkan 63.

b. Dengan standar relatif

(1) pemberian skor terhadap siswa juga didasakan atas pencapaian


siswa terhadap tujuan yang ditentukan

(2) nilai diperoleh dengan 2 cara :

 mengubah skor dari tiap-tiap ulangan lalu diambil rata-ratanya

 menjumlah skor tiap-tiap ulangan, baru diubah ke nilai

Bab 15 MENGOLAH NILAI

1. Beberapa Skala Penilaian

a. Skala Bebas

Skala bebas yaitu skala yang tidak tetap, ada kalanya skor tertinggi
20, lain kali lagi 50. Ini semua tergantung dari banyak dan bentuk
soal. Jadi, angka tertinggi dari skala yang di gunakan tidak selalu
sama.

b. Skala 1-10

Dalam skala 1-10, guru jarang memberikan angka pecahan, misalnya


5,5. Angka 5,5 tersebut di bulatkan menjadi 6. Dengan menggunakan
skala 1-10 maka bilangan bulat yang ada masih menunjukan penilaian
yang agak kasar.

c. Skala 1-100

Penilaian dengan menggunakan skala 1-100, di mungkinkan


melakukan penilaian yang lebih halus karena terdapat 100 bilangan
bulat. Nilai 5,5 dalam skala 1-10 yang biasanya di bulatkan menjadi 6,
dalam skala 1-100 ini boleh di tuliskan dengan 55.

d. Skala huruf

Selain menggunakan angka, pemberian nilai dapat di lakukan dengan


huruf A,B,C,D,dan E. Huruf tidak menunjukan kuantitas, tetapi dapat
di gunakan sebagai symbol untuk menggambarkan kualitas.
2. Distribusi Nilai

a. Distribusi nilai berdasarkan standar mutlak

Pemberian skor terhadap siswa, didasarkan atas pencapaian


siswa terhadap tujuan yang ditentukan. Nilai diperoleh dengan
mencari skor rata-rata langsung dari skor asal (mentah). Apabila soal-
soal ulangan yang dibuat oleh guru sangat mudah, sebagian besar
siswa akan dapat berhasil mengerjakan soal-soal itu, dan tingkat
pencapaiannya tinggi.sebagian besar siswa akan memiliki nilai sekitar
8, 9 atau 10 apabila telah diubah ke skala 10, sebaliknya apabila soal-
soal tes yang disusun oleh guru termasuk soal sukar, maka pencapaian
siswa akan sebaliknya pula. Sebagian besar siswa akan memiliki nilai
3, 4 bahkan mungkin 2 atau 1. Hanya beberapa orang siswa yang
istimewa saja yang memiliki nilai 6, dan mungkin tidak ada yanig
memiliki nilai 7 ke atas. Namun demikian dengan standar mutlak ini
mungkin pula diperoleh gambar kurva normal jika soal-soal tes
disusun oleh guru dengan tepat seperti gambaran kecakapan siswa-
siswanya.

b. Distribusi nilai berdasarkan standar relative

Pemberian skor terhadap siswa juga didasarkan atas pencapaian


siswa terhadap tujuan yang ditentukan.Nilai diperoleh dengan 2 cara:

 Mengubah skor dari tiap-tiap ulangan lalu diambil rata-ratanya.

 Menjumlah skor tiap-tiap ulangan, baru diubah ke nilai.

Telah diterangkan, bahwa dalam menggunakan standar


relative atau norm refrenced, kedudukan seseorang sealu
dibandingkan dengan kawan-kawannya dalam kelompok. Dalam hal
ini tanpa menghiraukan apakah distribusi skor terletak dalam kurva
juring positif atau juring negative, tetapai dalam norm refrenced selalu
tergambar dalam kurva normal. Hal ini didasarkan atas asumsi bahw
apabila distribusi skor tergambar dalam kurva juring positif, yang
kurang sempurna adalah soal-soal tesnya, yaitu terlalu sukar. Dengan
demikian, nilai siswa lalu direntangkan sedemikian rupa sehingga
tersebar dari nilai tinggi ke nilai rendah, dengan sebagian terbesar
terletak pada nilai sedang. Demikian pula sebaliknya apabila skor
siswa tergambar dalam kurva juring negative. Dalam ubahan menjadi
nilai, disebar sedemikian rupa sehingga kurva normal, dengan nilai
sedang adalah nilai yang paling banyak.

3. Standar Nilai
a. Nilai standar berskala Sembilan (stannine), yaitu rentangan atau skala
nilai yang bergerak mulai dari 1 sampai dengan 9,[7] seperti berikut
ini:

Staines Interpretasi
9 (4%) Tinggi (4%)
8 (7%) Diatas rata-rata (19%)

7 (12%)
6 (17%) Rata-rata (54%)

5 (20%)

4 (17%)
3 (12%) Dibawah rata-rata (19%)

2 (7%)
1 (4%) Rendah (4%)

Misalnya kita memiliki skor-skor seperti disebutkan dalam hasil


ulangan IPS kelas V, dengan mudah dapat kita tentukan 4% dari siswa
yang mendapat nilai 9, selanjutnya 7% mendapat nilai 8, 12%
mendapat nilai 7, 17% mendapat nilai 6, dan seterusnya.

b. Nilai standar berskala sebelas (standar eleven/ stanel= eleven points


scale), yaitu skala nilai yang bergerak mulai dari nilai 0 sampai
dengan nilai 10,[9] yang dikembangkan oleh Fakultas Ilmu
Pendidikan UGM disesuaikan dengan system penilaian di Indonesia.
Dengan stanel ini, system penilaian membagi skala menjadi 11
golongan, yaitu angka-angka 0, 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, yang satu
sama lain berjarak sama. Tiap-tiap angka menempati jarak antara

c. Standar sepuluh. Didalam Buku Pedoman Penilaian (Buku III B Seri


Kurikulum SMA Tahun 1975) ditentukan bahwa untuk mengolah
hasil tes, digunakan standar relative, dengan nilai berskala 1 – 10.
Untuk mengubah skor menjadi nilai, diperlukan dahulu:

 Mean (rata-rata skor)

 Deviasi Standar (Simpangan Baku)

 Tabel Konversi angka ke dalam nilai berskala 1 – 10

Tahap-tahap yang dilalui dalam mengubah skor mentah menjadi nilai


berskala 1 – 10 adalah sebagai berikut:
 Menyusun distribusi frekuensi dari angka-angka atau skor-skor
mentah

 Menghitung rata-rata skor (mean)

 Menghitung deviasi standar

 Mentransformasi (mengubah) angka-angka mentah ke dalam


nilai berskala 1 – 10

Bab 16 KEDUDUKAN SISWA DALAM KELOMPOK

1. Pengertian

Pengertian yang dimaksud kedudukan siswa dalam kelompoknya adalah


letak seorang siswa di dalam urutan tingkatan, dalam istilah disebut rangking.
Untuk dapat diketahui rangking dari siswa di suatu kelas maka harus diadakan
pengurutan nilai siswa tersebut dari yang paling atas sampai ke nilai yang paling
bawah.

2. Cara-cara menentukan kedudukan siswa:

a. Dengan rangking sederhana( simple rank) adalah urutan yang


menunjukkan letak atau kedudukan seseorang dalam kelompoknya
dan dinyatakan dengan nomor atau angka biasa.

b. Dengan rangking presentase (percentile rank) adalah kedudukan


seseorang dalam kelompok, yang menunjukkan banyaknya persentase
yang berada di bawahnya

c. Standar Deviasi adalah penentuan kedudukan dengan membagi kelas


atas kelompok-kelompok. Tiap kelompok dibatasi oleh suatu standar
deviasi tertentu.

d. Standard score atau z-score adalah angka yang menunjukkan


perbandingan perbedaan score seseorang dari mean dengan standar
deviasinya untuk menentukan z-score, harus diketahui:

 Rata-rata skor dari kelompok.

 Standar deviasi dari skor-skor tersebut

Pengetrapan dari z-score ini banyak digunakan di dalam


menentukan kejuaraan seseorang apabila kebetuan jumlah nilainya sama
Kedudukan seseorang dalam sebuah kelas sangat penting karena
dengan begitu peserta didik akan tahu berapa rangking yang telah
dicapainya, jika mendapat rangking yang bagus maka dia akan merasa
bangga dengan hasil yang diperoleh atas usaha yang telah dilakukan
selama ini dalam proses belajar mengajar, sedang apabila rangkingnya
jelek maka peserta didik akan lebih termotivasi untuk memperbaiki
dirinya. Dalam bab ini telah dijelaskan bagaimana cara menentukan
kedudukan siswa melalui beberapa standar yang lazim digunakan.
Bab 17 MENCARI NILAI AKHIR

1. Fungsi Nilai Akhir

a. Fungsi intruksional bertujuan untuk memberikan suatu balikan


yang mencerminkan seberapa jauh seorang siswa telah mencapai
tujuan yang ditetapkan dalam pengajaran atau system intruksional.

b. Fungsi informatif bertujuan untuk memberikan nilai siswa kepada


orang tuanya mempunyai arti bahwa orang tua siswa tersebut menjadi
tahu akan kemajuan dan prestasi putranya di sekolah.

c. Fungsi bimbingan bertujuan untuk mengetahui bagian-bagian


mana dari usaha siswa di sekolah yang masih memerlukan bantuan.

d. Fungsi administratif:

 Menentukan kenaikan dan kelulusan siswa

 Memindahkan atau menempatkan siswa

 Memberikan beasiswa

 Memberikan rekomendasi untuk melanjutkan belajar

 Memberi gambaran tentang prestasi siswa atau lulusan kepada


calon pemakai tenaga kerja.

2. Faktor-faktor yang mempengaruhi penilaian:

a. Prestasi/ pencapaian (achievement)

b. Usaha (effort)

c. Aspek pribadi dan social (personal and social characteristics)


d. Kebiasaan bekerja (working habits).

3. Cara menentukan nilai akhir:

a. Untuk memperoleh nilai akhir, perlu diperhitungkan nilai tes


formatif dan tes sumatif.

b. Nilai akhir diperoleh dari nilai tugas, nilai ulangan harian, dan
nilai ulangan umum dengan bobot 2,3,dan 5.

c. Nilai akhir untuk STTB diperoleh dari rata-rata nilai ulangan


harian (diberi bobot satu) dan nilai EBTA (diberi bobot dua),
kemudian dibagi 3.
BAB 19
MEMBUAT LAPORAN

1. Pentingnya laporan

Pentingnya Laporan

Hamper semua guru tidak menyenangi tugas memriksa pekerjaan


(koreksi) dan membuat catatan tentang hasil atau prestasi siswa pekerjaan
itu membutuhkan ketekunan dan ketelitian yang luar biasa dan menuntut
banyak energi. Jika disuruh memilih kebanyakan guru akan lebih
menyenangi mengajar disbanding dengan memeriksa dan mencataat hasil
ulangan.
Akan tetai dengan kesaran akan pentingnya kegiatan-kegian
tersebut akhirnya guru pun akan melakukan dengan senang hati apalagi bila
telah dijumpai dalam mengajar guru lalu ingin tahu apa sebabnya kesulitan
itu terjadi. Dan hanya dapat ditemukan jika guru sudah memeriksa hasil
ulangan,
Pada waktu mengajar tentu guru sudah berkali-kali membri
kesempatan kepada siswa untuk menanyakan hal yang belum diketahui.
Akan tetapi pada umumnya mereka itu diam, siswa-siwa tersebut sudah
tahu. Walupun sebenarnya guru itu terkecoh. Problemnya baru terbuka
setelah guru memeriksa hasil ulangan. Dari hasil terseut guru mengetahui
bagian-bagian mana dari tujuan pelajaran yang diberikan di kelas belum
tercapai.
Secara sistematis dapat dikemukakan disini bahwa laporan tentang
siswa bermanfaat bagi beberapa pihak yaitu sebagai berikut:
a) Siswa sendiri,
1. secara alamiah setiap orang selalu ingin tahu akibat dari apa yang
telah mereka lakukan,
2. dengan mengetahui hasil yang positif dari perbuatannya, maka
pengetahuan yang diperoleh akan dikuatkan dan
3. jika siswa mendapat informasi bahwa jawwabannya salah, maka
lain kali ia tidak akan menjawab seperti itu lagi.
Jadi dengan singkat dapat dikatan bahwa dengan jawaban yang
diberikan oleh siswa, akibatnya aka nada:
1. konfirmasi- penguatan
2. refisi-penyempurnaan

b) Guru yang mengajar akan mengetahui catatan laporan kemajuan


siswa.
Dengan melihat pada catatan laporan keamajuan siswa, maka guru
akan dengan tenang mengamati hasil tersebut. Daftar nilai yang
disimpan oleh guru measih merupakan cacatan sementara dan masih
bersifat rahasia. Tetapi laporan kemajuan siswa yang berupa rapor
atau STTB (surat Tanda tamat belajar) sudah merupakan resmi
laporan yang bersifat tetap dan terbuka
Oleh karena laporan ini merupakan titik tolak bagi guru untuk
menentukan langkah selanjutnya. Maka laporan ini harus dibuat
sejujur dan setepat mungkin. Amat disayangkan bahwa apa yang
dicantumkan di buku rapor kadang-kadang sudah tidak murni
merupakan cermin siswa lagi karena sudah dibumbui oleh
kebijsanaan-kebijaksanaan.
c) Guru lain,
Yang dimaksud dengan guru lain disini adalah yang akan mengganti
mengajar terdahulu karena siswa tesebut sudah naik kelas atau adanya
perpiondahan baik siswa yang pindah atau guru yang pindak ke
tempat lain.
Apabila tidak ada catatan atau laporan mengenai siswa, maka guru
yang mengganti mengajar akan tidak tahu bagaimana meladeni atau
memperlakukan siswa tersebut
d) Petugas lain disekolah.
Siswa yang berada disuatu sekolah, sebenarnya, bukan hanya
merupakan asuhhan atau tanggung jawab guru yang mengajar saja,
kepal sekolah wali kelas, dan guru pembimbing , ketiganya
merupakan personal-personal penting yang juga memerlukan catatan
tentang siswa. Dengan demikian maka hasil belajar siswa
diperhatikan dan diperkirakan oleh beberapa pihak.
e) Orang tua
Secra alamiah, orang tualah yang mempunya tanggung ajawab utama
terhadap pendidikan anak. Akan tetapi karena berkembangya
pengetahuan secara pesat. Menyebabkan oragn tua tidak mampu laig
menguasai seluruh ilmu yang ada
Dengan menyerahkan ke sekolah ini tidak berarti bahwa orang tua
dapat melepas pemikiran dan menyerahkan cita-citanya kepada guru.
Orang tua masih tetap merupakan penanggun gjawab utama dan
masih pula menentukan cita-cita bagi anaknya. Itulah sebabnya maka
orang tua masih ingin selalu mengetahui kemajuan anak dari hari ke
hari, yang dapat dilihat melalui laporan yang dibuat oleh gurunya.
f) Pemakai lulusan,
Setiap siswa yang sudah lulus dari pendidikan, selalu membawa bukti
bahwa ia memili suatu pengetahuan dan keterampilan tertentu. Namu
pengetahuan dan keterampilan yang diperoleh dari suatu sekolah
tidaklah sama bagi semua siswa. Tingkat keberhasilan ini dinyatakan
secara lengkap dalam laporan prestasi
Catatan tentang diri llusan. Akan berguna baginya apabila ia
1) mencari pekerjaan
dengan gambaran yang tercantum dalam laporan, maka lapangan
kerja akan mengetahui sesuai atau tidaknya bekal pengetahuan
dan keterampilan yang dimiliki oelh lulusan dengan tuntutan bagi
pekerjaan/tugas yang akan diembannya
2) mencari kelanjutan studi
seperti halnya lapangan kerja, lembaga pendidikan merupakan
kelanjutan dari lembaga dimana siswa belajar, juga menginnkan
adanya catatan yang menggambarkan kadaan atau kehasilan siswa
selama menuntut ilmui. Catatan ini akan berguna untuk
a) memupuk apa yang sudah berhasil di lembaga sebelumnya
b) mengatasi masalah yang ada, baik yang sudah dicoba untuk
diatsi maupun yang belum
3. Macam dan Cara Membuat Laporan
pada dasarnya catatan tentang diri siswa ini dusahak selengkap mungkin
agar dapt diperoleh informasi yang selengkapnya pula. Akan tetapi kita
sadrari bahwa membuat catatan yang lengkap setiap saat, meupakan tugas
yang berat dan meminta banyak waktu
secara garis besar, catatan tentang siswa dapat dibuat denga 2 (dua) macam
cara yakni
a. Catatan lengkap
Catatan lengkap adalah catatan tentang siswa yang berisi baik prestai
maupun aspek-aspek pribadi yang lain, misalnya kejujuran,
keberhasilan, kerajainan sikap social, kepercayaan diri sendiri, disiplin,
ketelitian dan sebagainya. Tentang isi catatan ada yang hanya
dinyatkan dengan kata singkat seperti baik sedan atau dengan
keterangan lebih terperinci
b. Catatan tidak lengkap
Catatan tidak lengkap adalah catatan siswa yang hanya berisi
gambaran tentang prestasi siswa dan hanya sedikit saja menyinggung
tentang kepribadian
Tentag catatan prestasi belajar siswa itu sendiri dapat dibekkan atas 2
(dua) cara:
1. Lulus belum lulus
Penilain atas prestasi belajar dalam system pengajaran yang
menganut prinsip belajar tuntas didasarkan atas sudah berhasil atau
belumnya seorang siswa dalam mencapai tujuan. Dalam hal in I
materi pelajaran dibagi atas unit-unit kecil yang masing-masing
untitssudah disertai dengan tujuan yang dirumuskan secara
terperinci. Apabila seoarng siswa mencapai tujuan (paling sedikit
75%) maka unit tersebut dib tanda (misalnya tanda silang) untuk
memberdakan dari unit yang belum diselesaikan. Dengan demikian
maka akan tergambar banyak sedikitnya unit yang telah
diselesaikan per bidang studi. Gambaran inilah yang disebut profil
keberhasilan siswa. Tanda X menunjukan bahwa unit itu sudah
dikuasai (sudah lulu) garis tebal di sebelah kanan menunjukan
target harus diselesaikan dalam 1 tahun. Dengan demikian dapat
diketahui sjauh mana (sudah beapa persen) siswa A pada bulan
oktober ini sudah lulus
2. Nilai siswa
Pencatatan dengan nilai dilakukan apabila seluruh siswa dalam satu
kelompok berjalan bersama-sama secara klasikal dengan demikian
maka prinsip belajar tuntas sangat sukar dilaksnakan dan pencataan
nilai didasarikan atas nilai-nilai ulangan yang telah diikuti.
BAB 20
EVALUASI PROGRAM PENGAJARAN

Semua uraian yang telah disajikan pada bab-bab seblum ini berkenaan dengan
evaluasi hasil belajar. Buku ini berjudul “Dasar-dasar Evaluasi Pendidikan”
sebetulnya secara garis besar terdapat dua kegiatan evaluasi yaitu evaluasi
terhadap hasil belajar siswa dan juga proses pengajarannya. Jadi, apabila
pembicaan dalam buku ini hanya mengenai evaluasi hasil belajar saja, tampak
kurang komprehensif. Bab ini akan menjelaskan evaluasi yang kedua yaitu
evaluasi program.
1. Apakah Evaluasi Program Itu?
Evaluasi merupakan suatu kegiatan yang bertujuan untuk menentukan
apakah target progam yang disusun sudah tercapai dengan begitu maka akan
diketahui bagaimana kualitas mengajar seorang guru apakah sudah efektif
atau belum berdasarkan tingkat pencapaian yang sudah dicapai.
a. Program adalah rencana
b. Program adalah kegiatan yang direncakan dengan seksama. Dalam
pembicaran ini yang dimaksudkan adalah pengertian
Dari sedikit uraian tersebut dapat ditangkap bahwa sesuatu kegian
yang peru direncanakan apabila kegiatan yang bersangkutan memang
dipandang penting sehingga apabila tidak direncanakan secara masak-masak
boleh jadi akan menjumpai kesulitan atau hambatan. Seperti sebuah keluarga
yang akan mengadakan peralatan pernikahan. Tentu tidak lancer. Sesudah
selesai pelaksanaan biasnya juga mengadakan evaluasi. Mungkin evaluasi
tersebut tidak melalui prosedur yang sistematis dan mungkin juga tidak
seketika barangkali pada waktu penyelenggaraan peralatan pernikahan lagi
baru mengingat-ingat dahulu pada waktu pelaksanaan dulu kurangnya apa.
Evaluasi progam merupakan suatu rangkaian kegiatan yang dilakukan
dengan sengaja untuk melihat tingkat keberhasilan progam. Untuk
menentukan seberapa jauh target progam sudah tercapai, yang dijadikan tolak
ukur adalah tujuan yang sudah dirumuskan dalam tahap perencanaan
kegiatan.
Pentingnya evaluasi progam yaitu agar guru mengetahui betul apa
yang terjadi di dalam proses belajar-mengajar, guru berkepentingan atas
kualitas pengajaran. Untuk memperbaiki proses pengajaran yang akan
dilaksanakan lain waktu, guru perlu mengetahui seberapa tinggi tingkat
pencapaian dari tugas yang telah dikerjakan selama kurun waktu tertentu.
Ada emppat macam kebijaksanan lanjutan yang mungkin diambil
setelah evaluasi program dilakukan yaitu:
a. kegiatan tersebut dilanjutkan karena dari data yang terkumpul diketahui
bahwa program ini sangat bermanfaat dan dpat dilaksanakan denan
lancer tanpa hambatan sehingga kualitas pencapaian tujuannya tinggi
b. kegiatan tersebut dilanjukan, dengan penyempurnaan karena dari data
yang terkumpul diketahui bahwa hasil program sangat bermanfaat tetapi
pelaksanaannya kurang, lancer atau kualitas pencapaian tujuan kurang
tinggi
c. kegiatan tersebut dimodifikasi karena dari data yang terkumpul dapat
dikeahui kemampafaatan hasil program kurang tinggi sehingga perlu
disusun lagi perencanaan secara lebih baik. Dalam hal ini mungkin
tujuannya yang perlu diubah.
d. Kegiatan tersebut tidak dapat dilanjutkan (dengan kata lain dihentikan)
karena dari data terkumpul diketahui bwhwa hasil program kurang
bermanfaat ditambah lagi di dalam pelaksanaan sangat banyak hambatan.
2. Mengapa guru perlu melakukan evaluasi program
Guru adalah orang yang penting statusnya di dalam kegiatan belajar-mengajar
karena guru memegan tugs yang amat penting yaitu mengatur dan
mengemudikan bahtera kehidupan kelas. Bagaimana suasana kelas
berlangsung merupakan hasil dari kerja guru. Suasana kelas dapat hidup siswa
belajar tekun tetapi tidak merasa terkekakng atu sebaliknya suasana kelas
suram siswa belajar krang atau sebaliknya suasana suram siswa belajar kurang
semangat dan diliputi rasa tahut, itu semua sebagai akibat dari hasil pemikiran
mereka dan upaya guru..
Di dalam melaksanakan tugs yang penting “menciptakan suasana
kelas” tersebut berupaya sekuat tenaga agar keidupan kelas dapat berjalan
mulus. Siswa dapat belajar tanpa hambatan dan dapat menguasai
Untuk menjawab apa sebag guru melakukan evaluasi program terlebih
dahulu kita tahu tentang siapa saja yang dapat melakukan kegiatan evaluasi
program tersebut. Di dalam buku-buku yang membicarakan (evaluator) dalam
kegiatan program dapat orang-orang dari dalam (orang yangikut terlibat di
dalam kegiatan) dan dapat pula orang dari luar (orang yang tidak ikut terlibat
dalam kegiatan program)
Masing-masing jenis evaluator program, mengandung kelemaham
a. Evaluator dalam (interal evaluator) sangat memahami seluk beluk kegiatan
tetapi ada kemungkinan dapat dipengaruhi oelh keingin untuk dapat
dikatakan bahwa programnya berhasil. Dengan kata lain. Evaluator dalam
dapat diganggu oelh unsur subjektivitas jika hal itu terjadi, data yang
tekumpul kurang benar dan kurang akuran meskipun barangkali cukup
lengkap
b. Evaluator luar (external evaluator) mungkin menjumpai kesulitan dalam
memperoloeh data yang lengkap karena da hal-hal yang disembunyak oleh
para pleksna program. Namun karena evaluator tidak berkepentingan akan
nama baik program. Maka data yang terkumpul lebih objektif.
Berdasarkan atas klasifikasi evaluator tersebut. Maka di dalam
kegiatan belajar-mengajar guru dikategorikan sebagai evaluator dalam, guru
adalah pelaksanana sehingga mereka mengetahi beatul apa yang terjadi di
dalam proses belajr-mengajar. Guru berkepentingan atas kualitas pengajaran.
Untuk memperbaiki proses pengajaran yang akan dilaksanakan lain waktu.
Guru perlu megnetahui seberapa tinggi tingkat pencapaian dari tugas yang
telah dikerjakan selama kurun waktu tertentu.
3. Objek atau sasaran evaluasi progam.
Dalam melakukan evalusi program, apanya dari program yang dievaluasi?
Dengan kata lain, apakah sasaran evalusai progam> untuk dapat mengenal
sasaaran evalusi secara cermat, kita perlu memusatkan perhatian kita pada
aspek-aspek yang bersangkut paut dengan keseluruhan kegiatan belajar-
mengejar. Untuk itu ada baiknya kita mengenal kembali model transformasi
proses pendidikan formal di sekoplah. Di dalam proses transformasi, siswa
yang baru masuk mengikuti proses pendidikan dipandang sebagai bahawn
mentah yang akan diolah (ditransformasikan diubah dari bahan mentah jadi
bahan jadi) melalui proses pengajaran. Siswa yang baru masuk (input)) ini
memiliki karakteristik atau kekhususan sendiri-sendiri yang banyak
mempengaruhi dalam keberhaslilan siswa , yaitu masukan lain yang juga
berpengaruh dalam keberhasilan belajar siswa yaitu masukan instrumental dan
masukan lingkungan. Yang dapat dimasukan sebagai masukan instrumental
adlaah materi/kurikulum guru metode mengajar dan sranana pendidikan
Pada gambar berikut ini disajikan sebuah bagan yang menunjukan hubungan
antara komponmen masukan mentah, saran pemroses dan keluaran yang sudah
selesai di proses.
Gambar proses transformasi belajar mengajar
Setelah digambarkan dalam bentuk bagan seperti disajikandiatas tampak jelas dan
rinci apa-apa yang mungkin mempengaruhi tingakt hsil belajar siswa. Marilah kita
teliti satu persatu.
a. Input(masukan)
Siswa adalah subjek yang meneima pelajaran. Ada siswa pandai, kurang
pandai, dan tidak pandai. Setiap siswa mempunyai bakat intelektual
emosional social dan lain-lain yang sifatnya khussu. Guru harus mammpu
mengenal kekhususan siswanya agar mampu memberikan pelayanan.
Pendidikan dan administrative secara tepat. Pelayanan pendidikan berupa
pemberian remedial dan sebagainya. Pelayanan administrasi juga harus
disesuaikan dengan jenis kemampunaya. Kepada siswa yang hanya
mempunya kemampuan intelektual rendah, disediakn perlekapann sarana
belajar yang dapat mendukung penginkatan prestasi. Sbaliknya siswa
mempunyai pembawewan menonjol juga sediakan sarana caranggih agar
bakat yang dimiliiki tersebut dapat berkembang secar maksimal.
Aspek-aspek yang ada pada siswa tersebut perlu dipertimbangka
oleh pengelola sekolah baik secar garis besar hal hal yang ada pada siswa
dan berpengaruh terhadap keberhalislan belajar dapat dilihat dari segi fisik
dan mental.
b. Materi atau kurikulum.
Di Indonesia kurikulum berlaku secara nasional karena kita menganut system
sentralisasi. Di Negara lain seperti amerika serikat. Kurikulum sekolah
disusun sendiri oleh dan berlaku untuk sesuatu Negara bagian yang
bersangkutan karena mereka menganut system disentralisasi. Seperti yang
tertulis di dalam administrasi kurikulum. Di Indonesia ini kurulum disusun
bersama oleh direktorat yang mengeloa jenjang dan jenis suatu sekolah
bersama dengan pusat pengembangan kurikulum dan sarana pendidikan
Apa sebab pusbangkurrandik mengkoordinasikan menyusun dan
mengembangkan kurikulum semua jenjang dan jenis sekolah? Jika kita ingat
bahwa tugas balitbang sebagai lembaga adalah melakukan penelitian dan
pengembangan hal hal yang berkaitan dengan pendidikan di seluurh Negara,
melakukan evalusi program terhadap semua pelakasaan pendidikan. Jika
lingkup dan wilayah yang dievaluasi sendiri. Maka lingkup dan wilayah yang
dievalusi oelh balitbang dikbud meliputi berbagai jenis kegiatan pendidikan
di Departemen Pendidikan dan Kebudayaan. Dari kegiatan evaluasi inilah
balitbang mempunyai data yang lengkap tentang tingkat keberhasilan tiap
kegiatan pendidikan
Meskipun penyusunan dan pengembangan kurikulum sekolah sudah
dilakukan secara cermat dan melibatkan banyak pihak, namun tidak mustahil
bahwa di lapangan masih juga dijumpai kelemaan dan hambatan. Wilayah
Indonesia yang sedemikian luas mengandung keragaman yang tida seditik.
Itulah sebabnya guru perlu dibekaili dengan kemampuan untuk melakukan
evaluasi program, termasuk mengevaluasi materi kurikulum. Sasaran yang
perlu dievaluasi dari komponen kurikulum HIT. Antara lain. Keelasan
pedoman untuk dipahami, kejelasan materi yang tercantum di dalam GBPP.
Urutan materi, kesesuaian antra sumber yang disarankan dengan materi
kurikulum dan sebaginya.
Apabila guru tidak tanggap terhadap kelemahan yanga dal dalam kurikulum
dan guru tak mau mengutarakan apa yang mereka jumpai bagaiman balitbang
dan ditdikdas tahu bahwa kurikulum yang dikeluarkan tidak lancer
dilaksanakandi sekolah? Nah itulah tambahan alasan mengapa evaluasi
lingkup sempit terhadap kurikulum yang dilaksanakan.

c. Guru.
guru merupakan komponen penting dalam kegiatan belajar-mengajar kepad
guru diserahkan untuk digarap suatu masukan bahan mentah berupa siswa
yang mengingnkan pengetahuan keterampilan dan sikap sikap yang baik yang
akan digunakan oleh mereka untuk menghadapi masa depan dalam
kehidupannya
guru adalah orang yang diberi kepercayaan untuk menciptakan
suasana kelas seperti telah diceritakan diatas. Behasil? Belum tentu mengapa?
Karena guru adalah manusia apakah usaha guru selalu mempunyai kelemahan
bersumber dari fisik dan mental. Hal-hal yang berhubungan denganfisik juga
siswa, antara lain kesehatan, kekebalan dan kerentatan. Hal-hal yang
berhubungan dengan mental antra lain kepandaian, kesabaran tangung jawab
keramah tamahan dan sebagainya.
Apakah dapat dilakukan oleh pengelola dalam memberikan pelayanan
administrative kepada guru? Banyak jika dapat diketahui kebiasan guru dalam
bekerja misalnya dalam mengajar suka OHP, mengajak mengamati barang-
barang yang ada di luar kelas (sekolah), atau suka bekerja tanpa gangguna di
ruang kelas dan lain sebagainya. Maka pengelola berusaha melengkapi sarana
pendudkunya, pemenuhan terhadap kebutuhan psikologis guru berupa antra
lain menyediakantempat bekerja yang nyaman sehingga mereka dapat bekerja
dengan tenang. Akibat selanjutnya mengena pada prestasi belajar siswa yang
optimal
d. Metode atau pendekatan dalam mengajar.
Berbeda denga evaluasi terhadap kurikulum, evaluasi terhadap metode
mengajar merupakan kegiatan guru untuk meninjau kembali tentang metode
mengajar, pendekatan atau strategi pembelajaran yang digunakan oleh guru di
dalam menyampaikan materi kurikulum kepada siswa. Dari perkuliahan lain
kita tahu bahwa yang dimaksud dengan metode mengajar adalah cara-cara
atau teknik yang digunakan dalam mengajar, misalnya ceramah, Tanya jawab
diskusi sosiodrama, demonstrasi eksperimen dan sebagainya. Strategii
pembelajaran menunjuk kepada bagaimana guru mengatur keseluruhan proses
belajar mengajar, meliputi, mengatur waktu, pemenggalan penyajian,
pemilihan metode, pemilihan pendekatan, dan sebagainya. Dengan pengertian
ini maka di dalam memikirkan strategi, sekaligus guru memikirkan metode
dan pendekatan juga.
Di dalam melaksanakan pengajaran, tidak mustahil bahwa guru
menjumpai kesulitan di tengah-tengah waktu mengajar, disebabkan karena
ketidak tepatan dalam memilih metode atau pendekatan yang dimaksud
dengan metode mengajar adalah cara-cara untuk menyampaikan materi
kepada siswa. Sebagai contoh metode adalah ceramah, diskusi Tanya jawab
dan penugasan. Pendekatan lebih banyak menunjuk pada strategi guru untuk
mengatur jalanna proses pembelajaran, misalnya pendekatan individual,
kelompok kecil atau klasikal. Termasuk dalam pemikiran pendekatan adalah
penggaalnan waktu di dalam penyampaian materi pelajaran.
Telah disebutkan bahwa di dalam melaksanakan kegiatan belajar
mengajar ungkin saja guru menjumpai kesulitan, sehubungan dengan keadaan
siswa. Dalam rencana, guru memilih metode tugas karena dipandang paling
tepat. Siswa diatur agar bekerja dalam kelompok. Namun di tengah-tengah
kesibukan, terasa oleh guru bahwa pemilihan metode dan pendekatan tersebut
ternyata kurang tepat. Apa sebab guru tidak disadari sebetulnya guru sudah
melakukan evaluasi tehadap kegiatnya. Evaluasi program dapat dilakukan
selam dansesuddah program berlangsung. Agar dapat melakukan selama dan
sesudah program berlangsung. Agar pekerjaan guru dari tahun ke tahun
bertambah baik, maka mereka harus dapat memanfaatkan dat yang mereka
peroleh. Disarankan kepada para guru agar tidak henti-hentinya membuat
catatan-catatan kecil pada GBPP tentang metode apa. Pendekatan danstrategi
yang bagaiman yang cocok untuk digunakan dalam penyampaian pokok
bahasan yang bersangkutan.

e. Sarana: alat pelajaran atau media pendidikan.


Komponen lain yang perlu dievaluasi oleh guru dalam melaksankan
kegiatan belajar mengajar adalah sarana pendidikan, yang melipti alat
pelajaran dan media pendidikan. Sebelum guru memulai kegiatan megnajar,
bahkan sebelum atau sekurang-kurangnya pada waktu menyusun rencana
megnajar, guru telah memilih alat yang kira-kira dapat membantu
melancarkan atau memperjelas konsep yang diajarkan. Selai guru, mnungkin
siswa juga dapat dijadikan titik tolak dalam menentukan apakah saran yang
digunakan di dalam kegiatan belajar-mengajar sudah tepat.
Apabila guru menjumpai kesulitan dalam megnajar atu tidak
berhasilan siswa dengan nilai yang rendah-rendah, ia dapat mencoba
mengadakan evalausi terhadap sarana yang diguanakan, sasaran evaluasi yang
berkenaan dengan sarana pendidikan antra lain kelengkapanya. Ragam
jenisnya. Modelnya, kemudahanya untuk digunakan (dioperasikan) mudah
dan sukar diperoleh kecocokan degnan materi yang diajarkan, jumlah
persedian dibandingkan dengan banyaknya siswa yang memerlukan
f. Lingkungan manusia.
Ada dua macam masukan lingkungan yaitu lingkungan manusia dan
lingkungan bukan manusia. Yang dibicarakan dalam bagian ini adalah
masukanlingkungan manusia yang dapat digolongkakan sebagai masukan
lingkungan manusia bukan hanya kepala sekolah, guru-guru dan pegawai tata
usaha di sekolah itu, tetapi jgua siapa saja yang dengan atu tidak sengaja
berpengaruh terhadap tingkat hasil belajar siswa. Misalnya di taman kanak-
kanak, mungkin saja ibu-ibu pengantar dapat meamnfaatkan oelh sekolah
untuk emberikan contoh perilaku positif yang memperkuat motivasi siswa
dalam belajar. Kepala sekolah yang secara kebetulan dijumpai oleh siswa di
luar kelas mungkin dijadikan sumber informasi. Memberikan keterang-
ketrangan yang diperlukan oleh siswa untuk memperkaya pengetahuannya.
Guru-guru tersebut dilakanya dapat saja melumpuhkan semangat siswa
karena ketika bertemu di halaman sekolah sempat mengejek (tentu saja tidak
dengan sengaja) atau sebaliknya dapat mengakibatkan tumbuhnya motivasi
pada diri siwa untuk lebih giat dalam belajar.
g. Lingkungan bukan manusia.
Yang dimaksud dengan lingkungan bukan manusia adalah segala hal yang
berada di lingkungan siswa (dalam radius tertentu) yang secara langsung
maupun tidakm berpengaruh terhadap prestasi belajar siswa. Termasuk
kategori lingkungan bukan manusia misalnya suasana sekolah. Tatanan
perabot kelas yang rapi dapat berpengaruh terhadap kesejukan suasana gaduh
di luar kelas dapat menggangu tenteram, sebaliknya Susana garud diluar
dapat menggangu konsentrasi siswa ddan menyebabkan siswa tidak dapat
belajar dengan tenang. Sebagai contoh sedang asyik-asyiknya siswa
mendengarkan penjelasan dari guru atau siswa sedang sibuk melakukan
percobaan, tiba-tiba terdengan sura mobil dengan knalpot terbuka lewat di
sebelah sekolah tidak dapat disangkal bahwa perhatian siswa menjadi buyar
karenya. Dari uraian yang sudah disajikan dapatklah kita ketahui mengapa
guru perlu melakukan evaluasi taerhadap program yang dilaksanakan. Hanya
dengan sambal lalu saja sebetulnya guru sudah dapat menangkap apa kira-
kira yang dapat mengganggu kelancaran proses belajar mengajar.
3. Cara melaksanakan evaluasi progam.
Apabila guru ingin melakukan evaluasi progam dengan lebih seksama,
terlebih dahulu harus menyusun rencana evaluasi sekaligus menyusun instrument
pengumpulan data. Mengenai bagaimana menyiapkan instrumen untuk angket,
pedoman wawancar, pedoman pengamatan dapat dipelajari dari buku-buku
penelitian. Sebagai cara yang paling sederhana adalah mengadakan pencatatan
terhadap peristiwa yang dialami dari kegiatan sehari-hari di kelas.
Akan terlalu sulit dan memakan waktu yang amat banyak apabila guru masih
dibebani dengan evaluasi program secara sistematis sperti singkat dan sederhana
yang disusun dalam bentuk pertanyaan saja. Dari jawaban atas pertanyaan-
pertanyaan tesebut guru akan memperoleh umpan terhadap apa yang dilakukan.
Deretan pertanyaan yang diajukan berpangkal dari komponen komponen
transformsi yang sudah kita ketahui dalam uraian di atas. Berikut ini disampaikan
bebereapa contoh:
a. Pertanyaan tentang siswa
1) Apakah kehadiran siswa sudah baik? Lengkap dan tepat waktu?
2) Apakah siswa tertarik pada pelajaran kita? Jika tidak atau kurang apakah
kira-kira sebabnya?
3) Apakah siswa tidak enggan melibatkan diri dalam kegiatan belajar
mengajar ? dan sebagainya.
b. Pertanyaan tentang guru
1. Apakah sebelum mengeajar guru sudah menguasai materi yang akan
diajarkan dengan sebaik-baiknya?
2. Aapakah guru dapat menjawab pertanyaan yang diajukan oleh siswa
dengan memuaskan
3. Apakah guru dapat berlaku adil terhadap siswa?
4. Apakah gru ssudah memberikan pelayanan yang sebaik-baiknya kepada
siswa? Dan sebagainya.
c. Pertanyaan tentang kurikulum
1. Seberapa tinggikah pemahaman guru terhadap materi yang tertera dala
GBPP?
2. Apakah guru dapat menyajikan materi secara urut seperti urutan
penyajian dalam GBPP?
3. Apaah materi yang tertera dalam GBPP tidak terlalu sulit bagi siswa
untuk kelas yang bersangkutan
d. Pertanyaan tentang sarana
1. Apakah pokok bahasan yang memerlukan alat peraga dipenuhi
kebutuhanya
2. Apakah alat peraga yang dipilh sudah tepat
3. Apakah guru sudah terampil menggunakan alat?
4. Apakah siswa cukup dilibatkan dalam penggunaan alat peraga? Dan
sebagainya.
e. Petanyaan tentang metode dan pendekatan
1. Apakah dengan metode yang digunakan, hasil belajar siswa sudah cukup
tinggi?
2. Apakah dengan metode yang dipih ini siswa mengikuti pelajaran dengan
bergairah?
3. Dengan mengelompokan yang diambil, apakah semua siswa sudah
terlibat dengan aktif?
4. Apakah hasil tugs yang diselesaikan oleh siswa tidak terlihat bahwa satu
dua orang siswa mendominasi kawannya bekerja? Dan sebagainya
f. Pertanyaan tentang lingkungan manusia
1. Apakah guru sudah meamnfaatkan orang-orang yang ada di lingkungan
untuk menunjang pelaksanaan kegian belajar mengajar?
2. Adakah orang-orang di sekitar siswa yang mempunyai pengaruh kurang
baik terhadap siswa? Andaikata acdda, apakah guru sudah mengambil
langkah dengan tepat?
3. Apakah guru sudah mengarahkan siswa untuk mencoba memanfaatkan
orang-orang yang ada sebagai manusia sumber untuk menambah
pengetahuannya?
g. Pertanyaan tentang lingkungan bukan manusia
1) Apakah guru sudah memanfaatkan dengan baik hal-hal yang ada I
lingkungan siswa untuk menunjang kegiatan belajar mengajar?
2) Apakah siswa sudah diarahkan untuk memanfaatkan lingkungan menurut
kepentingan mereka sendir dan sebagainya.

Anda mungkin juga menyukai