Suharsimi Arikunto
≈ 2 Comments
Bab 1 PENDAHULUAN
Menurut Prof. Dr. Suharsimi Arikunto dalam bukunya dasar-dasar evaluasi pendidikan, yang
menyatakan : kita tidak dapat mengadakan penilain sebelum kita mengadakan pengukuran.
Menilai adalah mengambil suatu keputusan terhadap sesuatu dengan ukuran baik dan buruk.
Penilaian bersifat kuantitatif.
Mengadakan Evaluasi meliputi kedua langkah diatas, yakni mengukur dan menilai
Jadi, dalam istilah asing pengukuran adalah Measurement, sedang penilaian adalah Evaluation.
Dari kata evaluation inilah diperoleh kata evaluasi yang berarti menilai (tetapi dilakukan dengan
mengukur terlebih dahulu). Jadi evaluasi adalah kegiatan untuk mengumpulkan informasi
tentang bekerjanya sesuatu, yang selanjutnya informasi tersebut digunakan untuk menentukan
alternatif yang tepat dalam mengambil keputusan, yang dimaksudkan untuk membantu para guru
dalam pengambil keputusan dalam usaha menjawab pertanyaan atau permasalahan yang ada.
Fungsi utama evaluasi dalam hal ini adalah menyediakan informasi-informasi yang berguna bagi
pihak decision maker untuk menentukan kebijakan yang akan diambil berdasarkan evaluasi yang
telah dilakukan.
2. Penilaian Pendidikan
Dalam pendidikan, ada awalnya pengertian evaluasi pendidikan selalu dikaitkan dengan prestasi
belajar siswa. Definisi yang pertama dikembangkan oleh Ralph Tyler (1950). Ahli ini
mengatakan bahwa evaluasi merupakan sebuah proses pengumpulan data untuk menentukan
sejauh mana, dalam hal apa, dan bagian mana tujuan tercapai. Jika belum, bagaimana yang
belum dan apa sebabnya. Definisi ini diperluaskan oleh dua ahli lain, yakni Cronbach dan
Stufflebeam. Tambahan definisi tersebut adalah bahwa proses evaluasi bukan sekedar mengukur
sejauh mana tujuan tercapai, digunakan untuk membuat keputusan.
3. Mengapa Menilai?
Menurut suharsimi arikunto ada beberapa makna dari proses penilaian antara lain sebagai
berikut:
Dengan diadakannya penilaian maka siswa dapt mengetahui sejauh man telah berhasil mengikuti
pelajaran yang diberikan oleh guru. Hasil yang diperoleh oleh siswa ada 2 kemungkinan :
1). Memuaskan. Jika siswa memperoleh hasil yang memuaskan siswa akan memiliki motvasi
yang cukup besar agar dapat belajar lebih giat.
2). Tidak Memuaskan. Jika siswa tidak puas dengan hasil yang diperolehnya, maka ia akan
beruaha agar lain kali tidak seperti itu lagi.
2). Guru dapat mengetahui apakah pelajaran yang ia sampaikan tepat sasaran kepada siswa.
3). Guru akan mengetahui apakah metode yang ia gunakan sudah dapat maksimal atau belum.
1). Apabila guru-guru mangadakan penilaian akan diketahui hasil siswa, maka dapat diketahui
pula apakah kondisi belajar disekolah sudah sesuai harapan atau belum.
3). Akan ada informasi hasil penilaian dari tahun ke tahun yang bias digunakan sebagai pedoman
dari tahun ke tahun.
Dengan diketahuinya makna dari penilaian, maka dapat dikatakan bahwa fungsi penilaian adalah
sebagai berikut:
Dengan cara penilaian guru mempunyai cara untuk mengadakan seleksiatau penilaian terhadap
siswanya.
b. Penilaian berfungsi diagnostik.
Apabila alat yang digunakan dalam penilaian cukup memenuhi syarat, maka dengan melihat
hasilnya guru dapat mengetahui kelemahan siswa. Disamping itu akan diketahui pula sebab-
sebab kelemahan itu. Jadi dengan mengadakan penilaian guru sebanarnya melakukan diagnosis
kepada siswanya.
Setiap siswa sejak lahir telah membawa bakat sendiri-sendiri sehingga belajar akan lebih efektif
jika di sesuaikan dengan pembawaan yang ada. Untuk dapat menentukan dengan pasti kelompok
mana yang sesuai dengan kemampuan siswa, maka digunakan suatu penilaian.
Fungsi ini dimaksudkan untuk mengetahui suatu mana suatu program berhasil diterapkan kepada
siswa.Jadi dapat disimpulkan bahwa penilaian berfungsi sebagai alat ukur keberhasilan dalam
proses belajar.
Untuk dapat menentukan kepandaian seseorang, bukan kepandaian yang diukur. Namun kita
dapat melihat dari gejala-gejala yang tampak atau memancar dari kepandaianya. Salah satu
contohnya adalah bahwa anak yang pandai biasanya dapat menyelesaikan soal-soal yang
diberikan oleh gurunya.
b. Ciri kedua yaitu pengunaan ukuran kuantitatif. Penilaian bersifat kuantitatif artinya
mengunakan simbol bilangan sebagai hasil pertama pengukuran. Setelah itu lalu
diinterpretasikan ke bentuk kualitatif. Contoh : dari hasil pengukuran tia mempunyai IQ 126
sedangkan budi 89. Maka tia dapat dikatagorikan sebagai anak pandai sedangkan budi anak
dibawah rata-rata.
c. Ciri ketiga yaitu bahwa penilaian pendidikan mengunakan, unit-unit atau satuan-satuan
yang tetap misalnya, IQ 126 menurut unit pengukurannya termasuk anak yang pandai sedangkan
89 termasuk anak dibawah rata-rata.
d. Ciri keempat yaitu bersifat relatif artinya tidak selalu tetap dari waktu ke waktu yang di
sebabkan banyak faktor. contoh nilai ulangan MTK pertama tia adalah 90 namun ulangan
keduanya hanya 40.
1). Terletak pada alat ukurnya.Alat yang digunakan untuk mengukur haruslah baik namun sering
kali terjadi kesalahan di alat ukurnya.
2). Terletak pada orang yang melakukan pengukurannya.Hal ini dapat berupa:
a). kesalahan pada waktu penilaian karena factor subjektif penilai yang telah terpengarus oleh
hasil pengukuran, misalnya tulisan jelek atau tidak jelas itu sering mempengaruhi subjektif
penilaian.
b). kecenderungan dari penilai untuk memberikan nilai secara murah atau mahal. Ada guru yang
mudah memberikan nilai ada yang sulit untuk memberikan nilai.
e). kesalahan yang disebabkan oleh kekeliruan menjumlah angka-angka hasil penilaian.
a). siswa adalah manusia yang berperasaan dan bersuasana hati. Suasana hati sangat berpengaruh
terhadap hasil penilaian.
a). suasana pada saat terjadinya penilaian. Keadaan yang gaduh akan mempengaruhi penilaian
yang sebenarnya karena siswa tidak dapat konsenterasi.
b). Pengawasan dalam penilaian. Bentuk pengawasan yang tidak sesuai akan berpengaruh pada
keobjektifan hasil dari pengukuran yang ada.
Dalam keterangan ini yang di maksud dengan subjek evaluasi adalah orang yang melakukan
pekerjaan evaluasi. Siapa yang dapat di sebut sebagai subjek evaluasi untuk setiap tes, di
tentukan oleh suatu aturan pembagian tugas atau ketentuan yang berlaku.
Ada pandangan lain yang mengatakan subjek evaluasi adalah siswa, yakni orang yang di
evaluasi, dalam hal ini yang di pandang sebagai objek evaluasi adalah mata pelajarannya.
Pandangan lain mengatakan siswa sebagai objek evaluasi dan guru sebagai subjek evaluasi.
2. Sasaran Evaluasi
Adapun sasaran evaluasi di sini mencakup beberapa sasaran penilaian untuk unsure-unsurnya,
meliputi : Input, Transformasi dan Out put.
a. In Put
Berkenaan dengan hal ini ada beberapa aspek yang harus di perhatikan untuk mencapai hasil
yang di inginkan, yaitu :
· Kemampuan
Jika sebuah institusi menginginkan out put yang berguna bagi nusa dan bangsa maka haruslah
memperhatikan atau memilah-milah kemampuan dari beberapa calon murid. Adapun tes yang di
gunakan adalah tes kemampuan.
· Kepribadian
Kepribadian adalah sesuatau yang terdapat pada diri manusia serta tampak bentuknya dalam
tingkah laku, sehingga seorang pendidik akan mengetahui satu-persatu calon peserta didiknya.
Adapun alat yang di pakai adalah tes kepribadian.
· Sikap
Sikap adalah bagian dari tingkah laku manusia yang menggambarkan kepribadian seseorang,
akan tetapi karena sikap ini sangat menonjol dalam pergaulan maka banyak orang yang ingin
tahu lebih dalam informasi khusus terkait dengannya. Adapun alat yang di pakai adalah tes sikap.
· Intelegensi
Dalam hal ini para ahli seperti binet dan simon menciptakan tes buatan yang di kenal dengan tes
binet-simon yang dapat mengetahui IQ seseorang, karena IQ bukanlah intelegensi.
b. Transformasi
Di sini ada beberapa unsur yang dapat menjadi sasaran atau objek pendidikan demi di perolehnya
hasil pendidikan yang di harapkan, yaitu :
· Kurikulum/materi
· Media
· Sistem administrasi
· Pendidik dan anggotahnya.
c. Out Put
Penilaian atas lulusan suatu sekolah di lakukan untuk mengetahui seberapa jauh tingkah
pencapaian atau prestasi belajar mereka selama mengikuti program tersebut dengan
menggunakan tes pencapaian.
1. Prinsip Evaluasi
Ada satu prinsip umum dan penting dalam kegiatan evaluasi, yaitu adanya triangulasi atau
hubungan erat tiga komponen, yaitu:
Kegiatan belajar-mengajar yang dirancang dalam bentuk rencana mengajar disusun oleh guru
dengan mengacu pada tujuan yang hendak dicapai. Dengan demikian, anak panah yang
menunjukkan hubungan antara keduanya mengarah pada tujuan dengan makna bahwa KBM
mengacu pada tujuan, tetapi juga mengarah dari tujuan ke KBM, menunjukkan langkah dari
tujuan dilanjutkan pemikirannya ke KBM.
Seperti yang sudah disebutkan dalam poin (a), KBM dirancang dan disusun dengan mengacu
pada tujuan yang telah dirumuskan. Telah disebutkan pula dalam poin (b) bahwa alat evaluasi
juga disusun dengan mengacu pada tujuan. Selain mengacu pada tujuan, evaluasi juga harus
mengacu atau disesuaikan dengan KBM yang dilaksanakan. Sebagai misal, jika kegiatan belajar-
mengajar dilakukan oleh guru dengan menitikberatkan pada keterampilan, evaluasinya juga
harus mengukur tingkat keterampilan siswa, bukannya aspek pengetahuan.
2. Alat Evaluasi
Secara garis besar, maka alat-alat evaluasi yang digunakan dapat digolongkan menjadi dua
macam, yaitu tes dan non tes. Dibawah ini akan dijelaskan secara rinci macam-macam tes dan
non tes.
1) Skala Bertingkat
Skala menggambarkan suatu nilai yang berbentuk angka terhadap suatu hasil pertimbangan.
Sebagai contoh adalah skor yang diberikan oleh guru di sekolah untuk menggambarkan tingkat
prestasi belajar siswa.
2) Kuesioner
Kuesioner (questionaire) juga sering dikenal sebagai angket. Pada dasarnya, kuesioner adalah
sebuah daftar pertanyaan yang harus diisi oleh orang yang akan diukur. Tentang macam
kuesioner, dapat ditinjau dari beberapa segi :
Ø Kuesioner langsung. Kuesioner dikatakan langsung jika kuesioner tersebut dikirimkan dan
diisi langsung oleh orang yang akan dimintai jawaban tentang dirinya.
Ø Kuesioner tidak langsung. Kuesioner tidak langsung adalah kuesioner yang dikirimkan dan
diisi oleh orang yang bukan diminta keterangannya.
Ø Kuesioner tertutup. Kuesioner tertutup adalah kuesioner yang disusun dengan menyediakan
pilihan jawaban langkah sehingga pengisi hanya tinggal memberi tanda pada jawaban yang
dipilih.
Ø Kuesioner terbuka. Kuesioner terbuka adalah kuesioner yang disusun sedemikian rupa
sehingga para pengisi bebas mengemukakan pendapatnya.
3) Daftar cocok (check list). Yang dimaksud dengan daftar cocok adalah deretan pertanyaan,
dimana responden yang dievaluasi tinggal membubuhkan tanda cocok ( √ ) di tempat yang sudah
disediakan.
4) Wawancara. Wawancara atau interview adalah suatu cara yang digunakan untuk
mendapatkan jawaban dari responden dengan jalan tanya jawab sepihak. Wawancara dapat
dilakuakan dengan 2 cara, yaitu:
Ø Intervieu bebas, di mana responden mempunyai kebebasan umtuk mengutarakan
pendapatnya, tanpa dibatasi oleh patokan-patokan yang telah dibuat oleh subjek evaluasi.
Ø Intervieu terpimpin, yaitu intervieu yang dilakukan oleh subjek evaluasi dengan cara
mengajukan pertanyaan-pertanyaan yang sudah disusun terlebih dahulu.
5) Pengamatan. Pengamatan atau observasi adalah suatu teknik yang dilakukan dengan cara
mengadakan pengamatan secara teliti serta pencatatan secara sistematis. Ada 3 macam observasi:
Ø Observasi partisipan, yaitu observasi yang dilakukan oleh pengamat, tetapi dalam pada itu
pengamat memasuki dan mengikuti kegiatan kelompok yang sedang diamati.
Ø Observasi sistematik, yaitu observasi di mana faktor yang diamati sudah didaftar secara
sistematis, dan sudah diatur menurut kategorinya.
Ø Observasi eksperimental
6) Riwayat hidup. Riwayat hidup adalah gambaran tentang keadaan seseorang selama dalam
masa kehidupannya
b. Teknik Tes
Dibawah ini ada beberapa pendapat dari para ahli mengenai pengertian tes.
Dalam bukunya “Evaluasi Pendidikan”, Drs. Amin Daien Indrakusuma mengatakan bahwa tes
adalah suatu alat atau prosedur yang sistematis dan objektif untuk memperoleh data-data atau
keterangan-keterangan yang diinginkan tentang seseorang, dengan cara yang boleh dikatakan
tepat dan cepat.
Dalam bukunya “ Teknik-teknik Evaluasi”, Mucthar Bukhori mengatakan tes ialah suatu
percobaan yang diadakan untuk mengetahui ada atau tidaknya hasil-hasil pelajaran tertentu pada
seorang murid atau kelompok murid.
Dari beberapa kutipan dan uraian di atas dapat disimpulkan bahwa tes merupakan suatu alat
pengumpul informasi tetapi jika dibandingkan dengan alat-alat yang lain, tes ini bersifat lebih
resmi karena penuh dengan batasan-batasan
Ditinjau dari segi kegunaan untuk mengukur siswa, maka dibedakan atas adanya tiga macam tes,
yaitu:
Tes diagnostic. Tes Diagnostik adalah tes yang digunakan untuk mengetahui kelemahan-
kelemahan siswa sehingga berdasarkan kelemahan-kelemahan tersebut dapat dilakukan
pemberian perlakuan yang tepat.
Tes Formatif. Dari kata “form” yang merupakan dasar dari istilah “formatif” maka evaluasi
formatif dimaksudkan untuk mengetahui sejauh mana siswa telah terbentuk setelah mengikuti
sesuatu program tertentu. Dalam kedudukannya seperti ini tes formatif dapat juga dipandang
sebagai tes diagnostik pada akhir pelajaran. Evaluasi formatif mempunyai manfaat baik bagi
siswa, guru, maupun bagi program itu sendiri. Manfaat bagi siswa:
Ø Untuk mengetahui apakah siswa sudah menguasai bahan program secara menyeluruh.
Ø Sebagai diagnose.
Ø Mengetahui sejauh mana bahan yang diajarkan sudah dapat diterima oleh siswa
Ø Mengetahui bagian mana dari bahan pelajaran yang belum menjadi milik siswa.
Ø Dapat meramalkan sukses dan tidaknya seluruh program yang akan diberikan.
Manfaat bagi program. Setelah diadakan test formatif maka diperoleh hasil. Dari hasil tersebut
dapat diketahui :
ü Apakah program yang telah diberikan merupakan program yang tepat dalam arti sesuai dengan
kecakapan anak.
ü Apakah diperlukan alat, sarana dan prasarana untuk mempertinggi hasil yang akan dicapai.
ü Apakah metode, pendekatan dan alat evaluasi yang digunakan sudah tepat.
Tes Sumatif
Evaluasi sumatif atau tes sumatif merupakan tes yang dilaksanakan setelah berakhirnya
sekelompok program atau sebuah program yang lebih besar.
v Untuk menentukan seorang anak dapat atau tidaknya mengikuti kelompok dalam menerima
program berikutnya.
v Untuk mengisi catatan kemajuan belajar siswa yang akan berguna bagi orang tua siswa, pihak
bimbingan dan penyuluhan disekolah, serta pihak-pihak lain apabila siswa tersebut akan pindah
ke sekolah lain, akan melanjutkan belajar atau akan memasuki lapangan kerja
1) Tes diagnostik
· Menetukan kesulitan-kesulitan belajar yang dialami untuk menentukan cara yang khusus
untuk mengatasi atau memberikan bimbingan.
2) Tes formatif
Sebagai umpan balik bagi siswa, guru, maupun program untuk menilai pelaksanaan satu unit
program.
3) Tes sumatif
Untuk memberikan tanda kepada siswa bahwa telah mengikuti suatu program, serta menentukan
posisi kemampuan siswa dibandingkan dengan kawannya dalam kelompok.
1) Tes diagnostik
2) Tes formatif
Selama pelajaran berlangsung untuk mengetahui kekurangan agar pelajaran dapat
berlangsung sebaik-baiknya.
3) Tes sumatif. Pada akhir unit caturwulan, semester akhir tahun, atau akhir pendidikan.
1) Tes diagnostik
3) Tes sumatif. Pada umumnya menekankan pada tingkah laku kognitif, tetapi ada kalanya
pada tingkah laku psikomotor dan kadang-kadang pada afektif.
1) Tes diagnostik
2) Tes formatif
3) Tes sumatif
1) Tes diagnostik
Ø Memilih yang berhubungan dengan tingkah laku fisik, mental, dan perasaan.
2) Tes formatif
Mengukur semua tujuan instruksional khusus.
3) Tes sumatif
1) Tes diagnostik
Untuk tes diagnostik mengukur keterampilan dasar, diambil soal tes yang mudah.
2) Tes formatif
3) Tes sumatif
1) Tes diagnostik
3) Tes sumatif
Kebanyakan menggunakan standar relatif, tetapi dapat pula dipakai standar mutlak
Yang dimaksud dengan tingkat pencapaian adalah skor yang harus dicapai siswa
dalam setiap tes.
1) Tes diagnostik
Untuk tes diagnostik yang sifatnya memonitor kemajuan, tingkat pencapaian yang diperoleh
siswa merupakan informasi tentang keberhasilannya.
2) Tes formatif
Ditinjau dari tujuan, tes formatif digunakan untuk mengetahui apakah siswa sudah mencapai
tujuan insruksional umum yang diuraikan menjadi tujuan instruksional khusus.
3) Tes sumatif
Sesuai dengan fungsi tes sumatif yaitu memberikan tanda kepada siswa bahwa mereka telah
mengikuti suatu program dan untuk menentukan posisi kemampuan siswa dibandingkan dengan
kawan dalam kelompoknya, maka tidak diperlukan suatu tuntutan harus berapa tingkat
penguasaan yang dicapai.
1) Tes diagnostik
2) Tes formatif
Prestasi tiap siswa dilaporkan dalam bentuk catatan berhasil atau gagal menguasai suatu tugas.
3) Tes sumatif
1. Pengertian
Istilah tes berasal dari bahasa Prancis Kuno yaitu “testum” yang berarti piring untuk
menyisihkan logam mulia. Dalam bahasa Indonesia tes diterjemahkan sebagai ujian atau
percobaan.
Menurut Arikunto (2010: 53), tes merupakan alat atau prosedur yang digunakan untuk
mengetahui atau mengukur sesuatu dalam suasana, dengan cara dan aturan-aturan yang sudah
ditentukan.
Suharsismi Arikunto (2008: 57-62) menyatakan bahwa suatu tes dapat dikatakan baik apabila
memenuhi lima syarat yaitu:
a) Validitas merupakan ketepatan, tes yang sebagai alat ukur dikatakan valid jika tes itu tepat
pada hasil belajar dan akan menghasilkan yang valid pula.
b) Reliabilitas, jika memberikan hasil yang tetap dari suatu tes, tidak terpengaruh oleh
apapun.
c) Objektifitas berarti tidak ada unsur pribadi yang mempengaruhinya, tidak ada unsur
subjektifitas yang mempengaruhi tes tersebut.
d) Praktikabilitas, tes ini merupakan tes yang praktis, mudah dan tidak mengecoh. Mudah
pelaksanaannya, mudah diperiksa, dan dilengkapi dengan petunjuk sehingga dapat diberikan
kepada orang lain.
e) Ekonomis, bahwa pelaksanaan tes tidak membutuh biaya yang mahal dan tidak membuang
waktu.
Bab 5 VALIDITAS
Validitas adalah suatu ukuran yang menunjukkan tingkat-tingkat kevalidan atau kesahihan suatu
instrument. Suatu instrument yang valid atau sahih mempunyai validitas tinggi, sebaliknya,
instrument yang kurang valid berarti memiliki validitas rendah (Suharsimi Arikunto 2006).
Menurut Suharsimi ada dua jenis validitas yaitu validitas logis dan validitas empiris. Sementara
validitas itu terbagi menjadi beberapa4 yaitu validitas isi, validitas konstrak, validitas “ada
sekarang” dan validitas predictive.
Yaitu pengujian terhadap isi yang terkandung dalam tes hasil belajar tersebut. Sebuah tes
dikatakan memiliki validitas isi apabila mengukur tujuan khusus tertentu yang sejajar dengan
materi atau isi pelajaran yang diberikan. Validitas isi merupakan validitas yang diperhitungkan
melalui pengujian terhadap isi alat ukur dengan analisis rasional. Pertanyaan yang dicari
jawabannya dalam validasi ini adalah “sejauh mana item-item dalam suatu alat ukur mencakup
keseluruhan kawasan isi objek yang hendak diukur oleh alat ukur yang bersangkutan?” atau
berhubungan dengan representasi dari keseluruhan kawasan.
Pengertian “mencakup keseluruhan kawasan isi” tidak saja menunjukkan bahwa alat ukur
tersebut harus komprehensif isinya akan tetapi harus pula memuat hanya isi yang relevan dan
tidak keluar dari batasan tujuan ukur.
Walaupun isi atau kandungannya komprehensif tetapi bila suatu alat ukur mengikutsertakan pula
item-item yang tidak relevan dan berkaitan dengan hal-hal di luar tujuan ukurnya, maka validitas
alat ukur tersebut tidak dapat dikatakan memenuhi ciri validitas yang sesungguhnya.Apakah
validitas isi sebagaimana dimaksudkan itu telah dicapai oleh alat ukur, sebanyak tergantung pada
penilaian subjektif individu. Dikarenakan estimasi validitas ini tidak melibatkan komputerisasi
statistik, melainkan hanya dengan analisis rasional maka tidak diharapkan bahwa setiap orang
akan sependapat dan sepaham dengan sejauhmana validitas isi suatu alat ukur telah tercapai.
Validitas isi dapat diusahakan tercapainya sejak saat penyusunan dengan cara merinci materi
kurikulum atau meteri buku pelajaran. Yaitu sejauh mana tes hasil belajar sebagai alat pengukur
hasil belajar peserta didik, isinya telah dapat mewakili secara representatif terhadap keseluruhan
materi atau bahan pelajaran yang harus diuji.
Secara etimologis, kata kontruksi mengandung arti susunan, kerangka atau rekaan. Sebuah tes
dikatakan memiliki validitas kontruksi apabila butir- butir soal yang membangun tes tersebut
mengukur setiap aspek berfikir seperti yang disebutkan dalam Tujuan Instruksional Khusus.
Pengujian validitas konstrak merupakan proses yang terus berlanjut sejalan dengan
perkembangan konsep mengenai trait yang diukur. Hasil estimasi validitas konstrak tidak
dinyatakan dalam bentuk suatu koefisien validitas.
Dengan kata lain jika butir- butir soal mengukur aspek berfikir tersebut sudah sesuai dengan
aspek berfikir yang menjadi tujuan instruksional.
Sebagai contoh jika rumusan Tujuan Instruksional Khusus (TIK), “Siswa dapat mengenal tata
cara memandikan mayat”, maka butir soal pada tes merupakan perintah bagaimana cara
memandikan mayat dengan baik.
Istilah “Validitas empiris” memuat kata “empiris” yang artinya “pengalaman” sebuah instrumen
dapat dikatakan memiliki validitas empiris apabila sudah diuji dari pengalaman. Yang dimaksud
dengan validitas empiris adalah ketepatan mengukur yang didasarkan pada hasil analisis yang
bersifat empirik. Sedangkan menurut Ebel bahwa Empirical Validity adalah validitas yang
berkenaan dengan hubungan antara skor dengan suatu kriteria. Kriteria tersebut adalah ukuran
yang bebas dan langsung dengan apa yang ingin diramalkan oleh pengukuran.
Jadi empirical validity adalah validitas yang berkenaan dengan hubungan antara skor dengan
suatu kriteria. Kriteria tersebut adalah ukuran yang bebas dan langsung dengan apa yang ingin
diramalkan oleh pengukuran. Bertitik tolak dari itu maka tes hasil belajar dapat dikatakan telah
memiliki validitas empirik apabila berdasarkan hasil analisis yang dilakukan terhadap data hasil
pengamatan dilapangan, terbukti bahwa tes hasil belajar itu dengan secara tepat telah dapat
mengukur hasil belajar yang seharusnya diungkap atau diukur lewat tes hasil belajar tersebut.
Untuk menentukan apakah tes hasil belajar sudah memiliki validitas empirik ataukah belum
dapat dilakukan penelusuran dari dua segi, yaitu segi daya ketepatan meramal (prediktif
validity), dan daya ketepatan bandingannya (concurren validity).
Setiap kali kita menyebutkan istilah “ramalan” maka didalamnya akan terkandung pengertian
mengenai “sesuatu yang bakal terjadi masa yang akan datang “ atau sesuatu yang pada saat
sekarang belum terjadi dan baru akan terjadi pada waktu-waktu yang akan datang. Apabila istilah
ramalan dikaitkan dengan validitas tes maka yang dimaksut dengan validitas ramalan dari suatu
tes adalah suatu kondisi yang menunjukkan seberapa jauhkah sebuah tes telah dapat dengan
secara tepat menunjukkan kemampuannya untuk meramalkan apa yang bakal terjadi pada masa
yang akan datang.
Menurut Suharsimi meprediksi artinya meramal, dengan meramal selalu mengenai hal yang akan
datang jadi sekarang belum terjadi. Sebuah tes dikatakan memiliki validitas prediksi atau
validitas ramalan apabila mempunyai kemampuan untuk meramalkan apa yang akan terjadi masa
yang akan datang.
Jadi pada dasarnya tes yang dilakukan adalah dengan memberikan bentuk soal, item dan sarat
yang diberikan harus memiliki tujuan akhir yang akan ditempuh sehingga proses atau hasil yang
dicapai dapat diprediksi sebelumnya.
Validitas bandingan juga sering dikenal dengan istilah : validitas sama saat, validitas pengalaman
atau validitas ada sekarang. Dikatakan sama saat sebab validitas tes itu ditentukan atas dasar data
hasil tes yang pelaksanaannya dilakukan pada kurun waktu yang sama. Dikatakan validitas
pengalaman sebab validitas tes tersebut ditentukan atas dasar pengalaman yang telah diperoleh.
Adapun dikatakan sebagai validitas ada sekarang sebab setiap kali kita menyebut istilah
pengalaman maka istilah itu akan selalu kita kaitkan dengan hal-hal yang telah ada atau hal-hal
yang telah terjadi pada waktu yang lalu, sehingga data mengenai pengalaman masa yang lalu itu
pada saat ini sudah ada di tanggan.
Jadi dalam rangka menguji validitas bandingan, data yang mencerminkan pengalaman yang
diperoleh masa yang lalu itu, kita bandingkan dengan data hasil tes yang diperoleh sekarang ini.
Jika hasil tes yang ada sekarang ini mempunyai hubungan searah dengan hasil tes berdasarkan
pengalaman yang lalu, maka tes yang memiliki karakteristik seperti itu dapat dikatakan telah
memiliki validitas bandingan.
Misalnya seorang guru ingin mengetahui apakah tes sumatif yang disusun sudah valid atau
belum. Untuk itu diperlukan sebuah kriterium masa lalu yang sekarang datanya dimiliki.
Misalnya nilai ulangan harian atau nilai ulkangan sumatif yang lalu.
5. Validitas Faktor
Bab 6 REALIBILITAS
Sekali lagi reliabilitas adalah ketetapan suatu tes apabila diteskan kepada subyek yang sama.
Untuk mengetahui ketetapan ini pada dasarnya dilihat kesejajaran hasil.
Kriterium yang digunakan untuk mengetahui ketetapan ada yang berada diluar tes (consistency
external) dan pada tes itu sendiri (consistency internal).
Tes parallel atau tes ekuivalen adalah dua buah tes yang mempunyai kesamaan tujuan, tingkat
kesukaran, dan susunan, tetapi butir-butir soalnya berbeda. Dalam istilah bahasa inggris disebut
alternate-forms method (parallel forms).
Dengan metode bentuk parallel ini, dua uah tes yang paralel, misalnya Matematika Seri A yang
akan dicari reliailitasnya dan Seri B di teskan pada sekelompok siswa yang sama, kemudian
hasilnya dikorelasikan. Koefisien korelasi dari kedua hasil tes inilah yang menunjukan koefisien
reliabilitas tes Seri A. jika oefisiennya tinggi maka tes tersebut sudah reliable dan dapat
digunakan sebagai alat pengetes yang terandalkan.
Dalam menggunakan metode paralel ini pengetes harus menyiapkan dua buah tes, dan masing-
masing dicobakan pada kelompok siswa yang sama. Oleh karena itu, ada orang yang
menyebutkan sebagai double tes-daubel-trial method.
b. Metode tes ulang (test-retest method)
Metode tes ulang dilakukan orang untuk menghindari penyusunan dua seri tes. Dalam
menggunakan teknik atau metode ini pengetes hanya memiliki satu seri tes tetapi dicobakan dua
kali. Oleh karena tesnya hanya satu dan dicobakan dua kali, maka metode ini dapat disebut
dengan single-test-double-trial method. Kemudian hasil dari kedua tes tersebut dihitung
korelasinya.
Untuk tes yang banyak mengungkap pengetahuan (ingatan) dan pemahaman, cara ini kurang
mengena karena tercoba akan masih ingat akan butir-butir soalnya. Oleh karena tenggang waktu
akan pemberian tes pertama dengan kedua menjadi permasalahan tersendiri. jika tenggang waktu
terlalu sempit, siswa masih banyak ingat materi. Sebaliknya kalau tenggang waktu terlalu lama,
maka faktor-faktor atau kondisi tes sudah akan berbeda, dan siswa senddiri barangkali sudah
mempelajari sesuatu. Tentu saja faktor-faktor ini akan berpengaruh pula terhadap reliabilitas.
Kelemahan penggunaan metode dua tes dua kali percobaan dan satu tes dua kali
percobaandiatasi dengan metode ketiga ini yaitu metode belah dua. Dalam menggunakan metode
ini pengetes hanya menggunakan sebuah tes yang dicobakan satu kali. Oleh karena itu, disebut
juga single-test-single-trial method.
Berbeda dengan metode pertama dan kedua yang setelah diketemukan koefisien korelasi
langsung ditafsirkan itulah koefisien reliabilitas, maka dengan metode ketiga ini tidak dapat
demikian. Pada waktu membelah dua dan mengkorelasikan dua belahan, baru diketahui
reliabilitas separo tes. Untuk mengetahui reliabilitas seluruh tes harus digunakan rumus
Spearman-rown .
Bab 7 TAKSONOMI
Menurut taksonomi Bloom ini tujuan pendidikan dibagi menjadi beberapa domain (ranah,
kawasan), dan setiap domain tersebut dibagi kembali ke dalam pembagian yang lebih rinci
berdasarkan hirarkhinya. Domain-domain tersebut antara lain:
Taksonomi lain-lainnya:
a. Mc Guire dan Klickmann (1963) telah menyusun taksonomi untuk bidang biologi, Wood
(1968) untuk matematika, Leuis (1965) untuk IPA.
b. Guilford telah menciptakan pola yang menggambarkan struktur intelek dalam bentuk kubus
c. Gagne dan Merrill menyebutkan ada 8 hierarki tingkah laku, antara lain:
ü Signal learning
ü Stimulus-response learning
ü Chaining
ü Verbal associating
ü Discrimination learning
ü Concept learning
ü Rule learning
ü Problem solving.
d. Garlach dan Sullivan mencoba mengganti gambaran tentang proses dalam rumusan yang
umum menjadi tingkah laku siswa yang dapat diamati. Kategori yang diajukan adalah:
ü Identify
ü Name
ü Describe
ü Construct
ü Order
ü Demonstrate.
Pengembangan di bidang pendidikan didasarkan atas falsafah negara Pancasila dan diarahkan
untuk membentuk manusia-manusia pembangunan yang ber-Pancasila dan untuk membentuk
manusia Indonesia yang sehat jasmani dan rohaninya memiliki pengetahuan dan keterampilan,
dapat mengembangkan kreativitas dan tanggung jawab, dapat menyuburkan sikap demokrasi dan
penuh tenggang rasa, dapat mengembangkan kecerdasan yang tinggi dan disertai budi pekerti
yang luhur, mencitai bangsanya dan mencintai sesama manusia sesuai dengan ketentuan
termaktub dalam UUD 1945.
Dengan adanya pendidikan, maka akan timbul dalam diri seseorang untuk berlomba-lomba dan
memotivasi diri kita untuk lebih baik dalam segala aspek kehidupan. Pendidikan merupakan
salah satu syarat untuk lebih memajukan pemrintah ini, maka usahakan pendidikan mulai dari
tingkat SD sampai pendidikan di tingkat Universitas.
Suharsimi Arikunto menyatakan dalam tujuan instruksional umum menggunakan kata kerja yang
masih umum dan tidak dapat diukur, maka dibutuhkan tujuan instruksional khusus. Jadi ada 2
macam tujuan instruksional:
c. Setiap pendidik mengetahui batas-batas tugas dan wewenang mengajarkan suatu bahan
sehingga diperkecil kemungkinan timbulnya celah (gap) atau saling menutup (overlap) antar
pendidik,
d. Pendidik mempunyai patokan dalam mengadakan penilaian kemajuan belajar peserta didik,
Bagaimana cara merumuskan tujuan pembelajaran atau indikator hasil belajar itu?ada empat
komponen pokok yang harus nampak dalam rumusan indikator hasil belajar seperti yang
digambarkan dalam pertanyaan berikut:
a) Siapa yang belajar atau yang diharapkan dapat mencapai tujuan atau mencapai hasil belajar
itu?
b) Tingkah laku atau hasil belajar yang bagaimana yang diharapkan dapat dicapai itu?.
a. Membuat sejumlah TIU (Tujuan Instruksional Umum) untuk setiap mata pelajaran/bidang
studi yang akan diajarkan dalam kurikulum 1975 maupun 1984, TIU sudah ada tercantum dalam
buku garis-garis besar program pengajaran. Dalam merumuskan TIU digunakan kata kerja yang
sifatnya masih umum dan tidak dapat di ukur karena perubahan tingkah laku masih terjadi di
dalam diri manusia.
b. Dari masing-masing TIU dijabarkan menjadi sejumlah TIK yang rumusannya jelas, khusus,
dapat dimengerti, terukur, dan menunjukkan perubahan tingkah laku.
Tingkah laku akhir adalah tingkah laku yang diharapkan setelah peserta didik mengalami proses
belajar. Di sini tingkah laku ini harus menampakkan diri dalam suatu perbuatan yang dapat
diamati dan diukur (observable and measurable).
Contoh:
Dan lain-lain yang berwujud kata kerja perbuatan/operasional (Action Verb) yang dapat diamati
dan diukur.
6. Kata-Kata operasioanal
a. Kognitif
ü Pengetahuan (knowledge). Kata-kata instruksional yang sering digunakan: Mendefinisikan,
mendeskripsikan, mengidentifikasi, mendaftarkan, menjodohkan, menyebutkan, menyatakan
(state), mereproduksi.
b. Afektif
c. Psikomotorik
2) Peserta didik dapat menunjukkan letak ibu kota negara bagian Jerman.
7. Kondisi Demonstrasi
Kondisi demonstrasi adalah komponen TIK yang menyatakan suatu kondisi atau situasi yang
dikenakan kepadapeserta didik pada saat pendidik mendemonstrasikan tingkah laku akhir.
Standar keberhasilan adalah kelompok TIK yang menunjukkan seberapa jauh tingkat
keberhasilan yang di tuntut oleh penilai bagi tingkah laku pelajar pada situasi akhir.
c) Tanpa kesalahan.
Dalam pedoman pelaksanaan kurikulum di jelaskan bahwa dalam kegiatan belajar-mengajar
pendidik di haruskan memperhatikan pula keterampilan tentang prosesnya. Pendekatan ini di
sebut dengan istilah pendekatan keterampilan proses. Keterampilan-keterampilan di maksud
meliputi keterampilan dalam hal:
a) Mengamati.
c) Merabalkan.
d) Menerapkan konsep.
e) Merencanakan penelitian.
f) Melaksanakan penelitian.
Sesuai dengan tuntutan tersebut maka pendidik dalam merumuskan tujuan instruksional khusus
harus mengandung apa yang dilakukan peserta didik dalam kegiatan belajar-mengajar.
Tujuan instruksional umum yang termuat sudah dirumuskan dalam satu rumusan yang
menjelaskan:
c) Proses pencapaiannya.
Tes adalah salah satu bentuk instrumen evaluasi untuk mengukur seberapa besar kemampuan
siswa dalam memahami dan menguasai pokok-pokok materi yang sudah diajarkan. Tes ada yang
dibuat oleh seorang guru yang kemudian disebut tes buatan guru dan ada tes yang sudah
memenuhi standar suatu satuan pendidikan maupun lembaga pendidikan yang kemudian disebut
tes terstandar.
Dalam menilai, baik tes terstandar maupun tes buatan guru ada beberapa hal yang perlu
diperhatikan yang berkaitan dengan validitas dan reliabilitas.
a. Aptitude test
b. Achievement tes
Perbedaan antara dua tes ini sebenearnya tidak tegas, soal – soal mengenai kedua tes tersebut
sering kali saling melingkupi ( overlap ). Untuk kedua macam tes ini biasanya menggunakan
hitung – hitungan dan perbendaharaan kata – kata dan sekelompok tes dari kedua macam tes ini
biasanya juga menguji tentang keterampilan membaca. Kesamaan yang lain adalah bahwa
keduanya telah digunakan untuk meramalkan hasil untuk yang masa akan dating, walaupun pada
umumnya jika kita menggunakan tes prestasi penilai melihat apa yang telah diperoleh setelah
siswa ( tercoba ) itu diberi suatu pelajaran.
Di antara tes prestasi yang digunakan di sekolah ada yang dinamakan tes prestasi standar. Dalam
salah satu kamus, arti kata ”standar” adalah:
Standar untuk siswa dapat dimaksudkan sebagai suatu tingkat kemampuan yang harus dimiliki
bagi suatu program tertentu. Mungkin standar bagi suatu kursus A berbeda dengan B. Jadi
standar ini dapat dibuat “keras” maupun “lunak” tergantung dari yang mempunyai
kebijaksanaan.
Suatu tes standar dengan demikian berbeda dengan tes prestasi biasa.
Prosedur yang digunakan untuk menyusun tes standar untuk tes prestasi melalui cara langsung
yang ditumbuhkan dari tes yang digunakan di kelas. Sedangkan spesifikasi yang digunakan
untuk menentukan isi dalam tes bakat biasanya didasarkan atas analisis job (jabatan) atau analisis
tugas yang merupakan tuntutan calon pekerjaannya. Disamping itu juga mempertimbangkan
sifat-sifat yang ada pada manusia. Analisis jabatan analisis tugas yang dilakukan biasanya tidak
tidak didasarkan atas satu kurikulum, tetapi diambil dari masyarakat.
Istilah “standar” dalam tes dimaksudkan bahwa semua siswa menjawab pertanyaan-pertanyaan
yang sama dari sejumlah besar pertanyaan dikerjakan dengan menggunakan petunjuk yang sama
dan dalam batasan waktu yang sama pula. Dengan demikian maka seolah-olah ada suatu standar
atau ukuran sehingga diperoleh suatu standar penampilan (performance) dan penampilan
kelompok lain dapat dibandingkan dengan penampilan kelompok standar tersebut.
Istilah “standar” tidak mengandung arti bahwa tes tersebut mengukur apa yang harus dan dapat
diajarkan pada suatu tingkat tertentu atau bahwa tes itu menyiapkan suatu standar prestasi
dimana siswa harus dan dapat mencapai suatu tingkat tertentu. Sekali lagi, tes standar dipolakan
untuk penampilan prestasi sekarang (yang ada) yang dilaksanakan secara seragam, diusahakan
dalam kondisi yang seragam, baik itu diberikan kepada siswa dalam pelaksanaan perseorangan
maupun siswa sebagai anggota dari suatu kelompok.
Tes standar disusun dalam tipe-tipe soal yang sama yang meliputi bahan atau pengetahuan yang
sama banyak dengan bahan atau pengetahuan yang dicakup oleh tes buatan guru. Lalu apakah
perbedaan antara tes standar dengan tes buatan guru, atau apakah keburukan dan keuntungan tes
standar?
Pertama, marilah kita tinjau perbedaan antara tes standar dengan tes buatan guru. Perbedaannya
adalah sebagai berikut:
Tes Standar
a. Didasarkan atas bahan dan tujuan umum dari sekolah-sekolah di seluruh Negara.
Mencakup aspek yang luas dan pengetahuan atau keterampilan dengan hanya sedikit butir tes
untuk setiap keterampilan atau topik.
c. Disusun dengan kelengkapan staf profesor, pembahas, dan editor butir tes.
d. Menggunakan butir tes yang sudah diujicobakan (try out), dianalisis dan direvisi sebelum
menjadi sebuah tes.
a. Didasarkan atas bahan dan tujuan khusus yang dirumuskan oleh guru untuk kelasnya sendiri.
c. Biasanya disusun sendiri oleh guru dengan sedikit atau tanpa bantuan orang lain/tenaga ahli.
d. Jarang menggunakan butir tes yang sudah diujicobakan, dianalisis dan direvisi.
Kedua, untuk menyusun tes standar, diutuhkan waktu yang lama. Seperti disebutkan ahwa untuk
memperoleh sebuah tes standar melalui prosedur:
§ Penyusunan;
§ Uji coba;
§ Analisa;
§ Revisi;
§ Edit.
§ Jika banyak orang yang akan memasuki suatu sekolah tetapi tidak tersedia data tentang calon
ini.
Ø Membandingkan tingkat prestasi siswa dalam keterampilan di berbagai bidang studi untuk
individu atau kelompok.
Ø Membandingkan prestasi siswa antara berbagai sekolah atau kelas.
Secara singkat dapat dikemukakan bahwa kegunaan tes buatan guru adalah:
vUntuk menentukan seberapa baik siswa telah menguasai bahan pelajaran yang diberikan dalam
waktu tertentu.
Selanjutnya baik tes standar dan tes buatan guru dianjurkan dipakai jika hasilnya akan digunakan
untuk:
Sebuah tes yang sudah distandardisasikan dan sudah dapat disebut sebagai tes standar, biasanya
dilengkapi dengan sebuah manual. Manual ini memuat keterangan-keterangan atau petunjuk-
petunjuk yang perlu terutama yang menjelaskan tentang pelaksanaan, menskor, dan mengadakan
interpretasi.Secara garis besar manual tes standar ini memuat:
a. Ciri-ciri mengenai tes, misalnya menyebutkan tingkat validitas, tingkat reliabilitas dan
sebagainya.
b. Tujuan serta keuntungan-keuntungan dari tes. Misalnya yang disebutkan untuk siapa tes
tersebut diberikan dan untuk tujuan apa.
c. Proses standardisasi tes. Misalnya mengenai hal-hal yang berhubungan dengan sampel.
o Besarnya sampel,
o Teknik sampling,
Juga mengenai taraf kepercayaan yang diambil dan bagaimana kaitannya dengan hasil tes.
Misalnya: untuk beberapa skor tiap-tiap soal/unit, menggunakan sistem hukuman atau tidak,
bagaimana cara menghitung nilai akhir dan sebagainya.
Misalnya:
o Betul nomor sekian sampai sekian cocok untuk jabatan kepala seksi,
o Betul nomor sekian saja, cocok untuk jabatan guru dan sebagainya.
g. Saran-saran lain
Misalnya: siapa harus menjadi pengawas, bagaimana seandainya tidak ada calon yang mencapai
skor tertentu dan sebagainya
1. Fungsi Tes
Fungsi tes dapat ditinjau dari 3 hal :
4) memberi kesempatan kepada pembimbing, guru, dan orang tua dalam memahami kesulitan
anak.
4) menilai kurikulum
d. Menderetkan semua TIK dalam tabel persiapan yang memuat pula aspek tingkah laku
dalam terkandung TIK itu, tabel digunakan untuk identifikasi terhadap tingkah laku yang
dikehendaki, agar tidak terlewati.
e. Menyusun tabel spesifikasi yang memuat pokok materi, aspek berfikir yang diukur beserta
imbangan antara kedua hal tersebut. (Uraian penjelasan tentang tabel spesifikasi i akan kami
jelaskan di sub bab berikutnya)
f. Menuliskan butir-butir soal, didasarkan atas TIK-TIK yang sudah dituliskan pada tabel
TIK dan aspek tingkah laku yang dicakup
3. Komponen-Komponen Tes
a. Buku tes, yakni lembaran atau buku yang memuat butir-butir soal yang mesti dikerjakan
oleh siswa
b. Lembar jawaban tes, yaitu lembaran yang disediakan oleh penilain bagi testee untuk
mengerjakan tes, untuk bentuk pilihan ganda dibuat lembaran nomor dan huruf A, B, C, D, E
menurut banyaknya alternative yang disediakan
c. Kunci jawaban tes, berisi jawaban-jawaban yang dikehendaki. Kunci jawaban ini dapat
berupa huruf atau kalimat. Untuk test bentuk uraian yang dituliskan adalah kata-kata kunci atau
kalimat seingkat untuk memberikan ancar-ancar jawaban. Ide dari kunci jawaban ini adalah:
2) Pemeriksaannya betul,
d. Pedoman penilaian, pedoman penilaian atau pedoman skoring, berisi tentang pedoman
perincian tentang skor atau angka yang diberikan kepada siswa bagi soal-soal yang telah
dikerjakan.Contoh pedoman penilaian:
Untuk penilaian dengan contoh soal diatas, tiap soal diberi skor 5.
a. Tes subyektif. Secara umum soal subyektif adalah pertanyaan yang menuntut peserta didik
menjawab dalam bentuk menguraikan, menjelaskan, mendiskusikan, membandingkan,
memberikan alasan, dan bentuk lain yang sejenis sesuai dengan tuntutan pertanyaan dengan
menggunakan kata-kata dan bahasa sendiri. Jumlah soal-soal bentuk subyektif biasanya tidak
banyak, hanya sekitar 5-10 buah soal dalam waktu kurang lebih 90-120 menit. Soal-soal bentuk
ini menuntut kemampuan peserta didik untuk dapat mengorganisir, menginterpretasi, dan
menghubungkan pengertian-pengertian yang telah dimiliki.
b. Tes objektif. Tes objektif adalah tes yang dalam pemeriksaannya dapat dilakukan secara
objektif (Arikunto, 1995 : 165). Karena sifatnya yang objektif maka penskorannya dapat
dilakukan dengan bantuan mesin. Soal ini tidak memberi peluang untuk memberikan penilaian
yang bergradasi karena dia hanya mengenal benar dan salah. Apabila respons siswa sesuai
dengan jawaban yang dikehendaki maka respons tersebut benar dan biasa diberi skor 1. Apabila
kondisi yang terjadi sebaliknya, maka respons siswa salah dan biasa diberi skor 0. Jawaban siswa
bersifat mengarah kepada satu jawaban yang benar (convergence).
Merujuk kepada berbagai pendapat tentang tes objektif dapat diambil kesimpulan bahwa tes
objektif adalah tes yang semua informasi yang diperlukan peserta tes untuk memberikan respon
telah disediakan oleh penyusun tes, sehingga peserta tes tinggal memilihnya. Jawaban yang
berupa pilihan bersifat deterministik, sehingga hanya ada dua kemungkinan kebenaran jawaban –
benar atau salah.
a. Bentuk Tes Benar Salah (True-False Test). Tes benar salah adalah bentuk tes yang
mengajukan beberapa pernyataan yang bernilai benar atau salah. Biasanya ada dua pilihan
jawaban yaitu huruf B yang berarti pernyataan tersebut benar dan S yang berarti pernyataan
tersebut salah. Tugas peserta tes adalah menentukan apakah pernyataan tersebut benar atau salah.
Ø Dapat mencakup bahan yang luas dan tidak memakan tempat yang banyak
Ø Objektif
Ø Praktis
o Mudah ditebak
o Banyak masalah yang tidak dapat dinyatakan hanya dengan kemungkinan benar atau salah
o Reliabilitasnya rendah.
Petunjuk Penyusunan:
ü Hindari kalimat negatif, yakni kalimat yang mengandung kata “tidak” atau “bukan”.
ü Pernyataan harus disusun sedemikian rupa sehingga siswa yang memiliki pengertian samar-
samar dapat terkecoh dalam menjawabnya.
ü Dalam menyusun keseluruhan tes, diharapkan item yang mengandung “salah sedikit” cukup
banyak.
b. Bentuk Pilihan Ganda (Multiple Choice Test). Tes pilihan ganda merupakan tes yang
menggunakan pengertian/ pernyataan yang belum lengkap dan untuk melengkapinya maka kita
harus memilih satu dari beberapa kemungkinan jawaban benar yang telah disiapkan.
Apabila dilihat konstruksinya maka tes pilihan ganda terdiri dari dua hal pokok yaitu stem atau
pokok soal dengan 4 atau 5 alternatif jawaban. Satu di antara alternatif jawaban tersebut adalah
kunci jawaban. Alternatif jawaban selain kunci disebut dengan pengecoh (distractor). Semakin
banyak alternatif jawaban yang ada (misalnya 5) maka probabilitas menebaknya akan semakin
kecil
c. Menjodohkan (Matching Test). Menjodohkan terdiri atas satu sisi pertanyaan dan satu sisi
jawaban, setiap pertanyaan mempunyai jawaban pada sisi sebelahnya. Siswa ditugaskan untuk
memasangkan atau mencocokkan, sehingga setiap pertanyaan mempunyai jawaban yang benar.
ü Kelebihan:
ü Kelemahan:
v Pisahkan menjadi dua kolom, kolom pertama memuat jawaban, nomor soal dan pertanyaan.
Sedangkan kolom kedua memuat kode dan pilihan jawaban.
ü Cara Memberikan Skor: Penskoran pada tes menjodohkan tidak diberikan denda terhadap
jawaban yang salah. Skor = Jumlah jawaban benar
d. Tes Isian (Complementary Test). Tes isian terdiri dari kalimat yang dihilangkan (diberi
titik-titik). Bagian yang dihilangkan ini yang diisi oleh peserta tes merupakan pengertian yang
diminta agar pernyataan yang dibuat menjadi pernyataan yang benar. Contoh:
(1) Yang merupakan nama asli dari Sultan Hamengkubuwono X adalah …..
(2) Para filsuf zaman modern menegaskan bahwa pengetahuan tidak berasal dari kitab suci atau
ajaran agama, tidak juga dari para penguasa, tetapi dari diri manusia sendiri. Namun tentang
aspek mana yang berperan ada beda pendapat. Aliran ……………….. beranggapan bahwa
sumber pengetahuan adalah rasio: kebenaran pasti berasal dari rasio (akal). Aliran ……………,
sebaliknya, meyakini pengalamanlah sumber pengetahuan itu, baik yang batin, maupun yang
inderawi.
ü Cara Memberikan Skor:
Pada tes ini sulit dilakukan tebakan, sehingga tidak diperlukan denda terhadap jawaban yang
salah. Maka rumus yang digunakan adalah :
Pengukuran ranah afktif tidak dapat diukur seperti halnya ranah kognitif, karena dalam ranah
afektif kemampuan yang diukur adalah, Menerima (memperhatikan), merespon, menghargai,
mengorganisasi, dan karakteristik suatu nilai.Sedangkan tujuan penilaian afektif adalah :
a) Untuk mendapatkan umpan balik (feedback) baik bagi guru maupun siswa sebagai dasar
untuk memperbaiki proses belajar mengajar dan mengadakan program perbaikan (remedial
program) bagi anak didiknya.
b) Untuk mengetahui tingkat perubahan tingkah laku anak didik yang dicapai antara lain
diperlukan sebagai bahan bagi : perbaikan tingkah laku anak didik, pemberian laporan kepada
orang tua, dan penentuan lulus tidaknya anak didik.
c) Untuk menempatkan anak didik dalam situasi belajar mengajar yang tepat, sesuai dengan
tingkat pencapaian dan kemampuan serta karakteristik anak didik.
d) Untuk mengenal latar belakang kegiatan belajar dan kelainan tingkah laku anak didik.
Skala Likert di gunakan untuk mengukur sikap, pendapat, dan resepsi seseorang atau
sekelompok orang tentang fenomena social. Dalam penelitian, fenomena social ini telah di
tetapkan secara spesifik oleh peneliti, yang selanjutnya di sebut sebagai variable penelitian
Skala ini bentuknya seperti soal bentuk pilihan ganda yaitu suatu pernyataan yang diikuti oleh
sejumlah alternative pendapat.
c. Skala Thurstone
Skala Thurstone merupakan skala sikap yang pertama dikembangkan dalam pengukuran sikap.
Skala ini mempunyai tiga teknik penskalaan sikap, yaitu :
Ketiga metode ini menggunakan bahan pertimbangan jalur dugaan yang menganggap kepositifan
relatif pernyataan sikap terhadap suatu obyek.
d. Skala Guttman
Skala pengukuran dengan tipe ini, akan di dapat jawaban yang tegas, yaitu ya atau tidak, benar
atau salah, pernah atau tidak, positif atau negative dan lain – lain. Data yang di peroleh dapat
berupa data interval atau rasio dikhotomi (dua alternatif). Jadi kalau pada skala likert terdapat
3,4,5,6,7 interval, dari kata “sangat setuju” sampai “sangat tidak setuju”, maka pada dalam skala
Guttman hanya ada dua interval yaitu “setuju atau tidak setuju”. Penelitian menggunakan sakal
Guttman di lakukan bila ingin mendapatkan jawaban yang tegas terhadap suatu permasalahan
yang di tanyakan. Contoh :
e. Semantic Deferensial.
Skala pengukuran yang berbentuk Semantic defferensial di kembangkan oleh Osgood. Skala ini
juga di gunakan untuk mengukur sikap, hanya bentuknya tidak pilihan ganda maupun checklist,
tetapi tersusun dalam satu garis kontinum yang jawaban “sangat positifnya” terletak di bagian
kanan garis, dan jawaban yang “sangat negatif” terletak di bagian kiri garis, atau sebaliknya.
Data yang di peroleh adalah daya interval, dan biasanya skala ini di gunakan untuk mengukur
sikap/karakteristik tertentu yang di punyai oleh seseorang.
Ranah psikomotor berhubungan erat dengan kerjaan otot sehingga menyebabkan geraknya tubuh
atau bagian-bagiannya. Yang termasuk dalam klasifikasi gerak disini mulai dari gerak yang
paling sederhana yaitu melipat kertas sampai dengan merakit suku cadang televisi serta
komputer. Secara mendasar perlu dibedakan antara 2 hal yaitu keterampilan (skills) dan
kemampuan (abilities)
Kebanyakkan para guru tidak menuntut pencapaian 100 dari tujuan yang dirumuskan kecuali
hanya berharap bahwa keterampilan yang dicapai oleh siswa-siswanya akan sangat mendukung
mempelajari keterampilan lanjutan atau gerakan-gerakan yang lebih kompleks sifatnya. Selain
yang telah dikemukakan tersebut, Harrow juga memberikan saran yang mengenai bagaimana
melakukan pengukuran terhadap ranah psikomotor ini. Menurutnya penentuan kriteria untuk
mengukur keterampilan siswa harus dilakukan dalam jangka waktu sekurang-kurangnya 30
menit. Kurang dari waktu tersebut diperkirakan para penilai belum dapat menangkap gambaran
tentang pola keterampilan yang mencerinkan kemampuan siswa.
Fungsi dari tabel spesifikasi ialah untuk menjaga agar tes yang kita susun tidak menyimpang dari
bahan (materi) serta aspek kejiwaan (tingkah laku) yang akan dicakup dalam tes.
Pokok Materi
Ingatan
(I)
Pemahaman
(P)
Aplikasi
(A)
Jumlah
Bagian I
Bagian II
Bagian (terakhir)
…………
…………
…………
…………….
……………..
……………..
………….
………….
………….
………….
…………
…………
Jumlah
………..
…………….
…………..
…………
2. Langkah-Langkah Pembuatan
Yang dimaksud “seragam” disini adalah bahwa antara pokok materi yang satu dengan pokok
materi yang lain mempunyai kesamaan dalam imbangan aspek tingkah laku. Misalnya 50%
untuk ingatan, 30% untuk pemahaman, dan 20% untuk aplikasi. Selanjutnya banyaknya butir
soal untuk setiap sel (kotak kecil) diperoleh dengan cara menghitung persentase dari banyaknya
soal bagi tiap pokok materi yang sudah tertulis di kolom paling kanan.Contoh:
Pokok Materi
Ingatan
(50 %)
Pemahaman
(30%)
Aplikasi
(20%)
Jumlah
[A]
[B]
[C]
10
[D]
[E]
[F]
15
[G]
[H]
[I]
15
[J]
[K]
[L]
10
Jumlah
50
Untuk mengisi/menentukan banyaknya butir soal untuk tiap sel adalah sebagai berikut:
Untuk memgisi sel-sel yang lain, dilakukan dengan cara yang sama seperti hal nya mengisi sel
A, B, dan C.
Disamping menggunakan cara seperti diatas, dalam menentukan jumlah butir soal untuk tiap-tiap
pokok materi, ada lagi cara lain yang dapat diambil yaitu mulai dari pengisian sel-sel kemudian
baru diperoleh jumlah soal tiap pokok materi.
Untuk membuat tabel spesifikasi pokok-pokok materi yang tidak seragam, tidak perlu
mencantumkan angka persentase imbangan tingkah laku di kepala kolom. Pemberian imbangan
dilakukan tiap pokok materi didasarkan atas banyaknya soal untuk pokok materi itu dan
imbangan yang dikehendaki oleh penilaian menurut sifat pokok materi yang
bersangkutan.Contoh:
Pokok Materi
Ingatan
Pemahaman
Aplikasi
Jumlah
[A]
[B]
[C]
15
[D]
[E]
[F]
20
[G]
[H]
[I]
15
Jumlah (100%)
50
Dalam keadaan seperti dicontohkan misalnya: BAB I mayoritas hafalan, BAB II mayoritas
pemahaman, BAB III mayoritas aplikasi. Maka imbangan aspek tingkah laku, tidak dituliskan
pada kepala kolom. Penentuan angka yang menunjukkan banyaknya butir soal pada tiap sel,
ditentukan per BAB. Misalnya: untuk Bab I, Ingatan 60%, pemahaman 20%, aplikasi 20%,
maka:
Untuk Bab II, ingatan 20%, pemahaman 50%, aplikasi 30%, maka:
Sel D = 20% x 20 soal = 4 soal
Untuk Bab III, ingatan 20%, pemahaman 20%, aplikasi 60%, maka:
Terdapat dua langkah lagi sebagai tindak lanjut sesudah penyususnan tabel spesifikasi untuk
memperoleh seperangkat soal tes yaitu:
a. Menentukan bentuk soal. Ada dua hal yang harus dipertimbangkan dalam menentukan
bentuk soal yaitu waktu yang tersedia dan sifat materi yang diteskan.
b. Menuliskan soal-soal. Langkah terakhir dalam penyusunan tes adalah penulisan soal-soal
tes (item writing). Langkah ini merupakan langkah penting karena kegagalan dalam hal ini dapat
berakibat fatal. Hal-hal yang harus diperhatikan dalam menuliskan soal-soal tes yaitu:
(3) Cara mengenal kalimat atau meletakkan/menata kata-kata perlu diperhatikan agar tidak
ditafsirkan salah.
(4) Petunjuk mengerjakan. Petunjuk ini harus dituliskan sedemikian rupa sehingga jelas, dan
siswa tidak bekerja menyimpang dri yang dikehendaki guru.
Untuk memperoleh sebuah tes yang standar, harus dilakukan uji coba (try out) berkali-kali
sehingga diperoleh soal-soal yang baik. Dengan mengadakan uji coba terhadap soal-soal tes yang
sudah disusun, maka akan memperoleh manfaat yaitu: pengalaman menggunakan tes tersebut,
mengetahui kesukaran bahasa, mengetahui variasi jawaban siswa, mengetahui waktu yang
dibutuhkan, dan lain-lain.
Guru yang sudah banyak berpengalaman, mengajar dan menyusun soal-soal tes, juga masih
sukar menyadari bahwa tesnya masih belum sempurna. Oleh karena itu cara yang paling baik
adalah secara jujur melihat hasil yang diperoleh oleh siswa.
a. Meneliti secara jujur soal-soal yang sudah disusun, kadang-kadang dapat diperoleh
jawaban tentang ketidak jelasan perintah atau bahasa, taraf kesukaran, dan lain-lain keadaan soal
tersebut. Pertanyaan-pertanyaan tersebut antara lain:
(1) Apakah banyaknya soal untuk tiap topik sudah seimbang ?
(3) Apakah soal yang kita susun tidak merupakan pertanyaan yang membingungkan (dapat
disalah tafsirkan)?
(5) Apakah soal itu dapat dikerjakan oleh sebagian besar siswa ?
b. Mengadakan analisis soal (item analysis). Analisis soal adalah suatu prosedur Yang
sistematis, yang akan memberikan informasi-informasi yang sangat khusus terhadap butir tes
yang kita susun. Faedah mengadakan analisis soal:
(2) Memperoleh informasi yang akan dapat digunakan untuk menyempurnakan soal-soal untuk
kepentingan lebih lanjut.
(3) Memperoleh gambaran secara selintas tentang keadaan yang kita susun.
c. Mengadakan checking validitas. Validitas yang paling penting dari tes buatan Guru adalah
validitas kurikuler.
Analisis butir soal yang dalam bahasa inggris disebut item analiysis dilakukan terhadap
empirik.Maksudnya, analisis itu baru dapat dilakukan apabila suatu tes telah dilaksanakan dan
hasil jawaban terhadap butir-butir soal telah kita peroleh.
Untuk mengetahui kapan soal dikatakan baik, kurang baik, dan soal yang jelek sangat
berhubungan dengan analisis soal, yaitu taraf kesukaran, daya pembeda, dan pola jawaban soal.
a) Taraf Kesukaran
Soal yang baik adalah soal yang tidak terlalu mudah atau tidak terlalu sukar. Soal yang terlalu
mudah tidak merangsang siswa untuk mempertinggi usaha memecahkannya. Sebaliknya soal
yang terlalu sukar akan menyebabkan siswa menjadi putus asa dan tidak mempunyai semangat
untuk mencoba lagi karena di luar jangkauannya.
Bilangan yang menunjukkan sukar dan mudahnya sesuatu soal disebut indeks kesukaran.
Besarnya indeks kesukaran antara 0,00 sampai dengan 1,0. Soal yang indeks kesukaran 0,0
menunjukkan bahwa soal itu terlalu sukar, sebaliknya indeks 1,0 menunjukkan bahwa soalnya
terlalu mudah.
Didalam istilah evaluasi, indeks kesukaran diberi simbol P (proporsi). Rumus mencari P adalah :
P=B
JS
Dimana :
P= indeks kesukaran
Menurut ketentuan yang sering diikuti, indeks kesukaran sering diklasifikasikan sebagai berikut :
Walaupun demikian ada yang berpendapat bahwa soal – soal yang di anggap baik yaitu soal –
soal sedang, tetapi bukan berarti soal – soal yang terlalu mudah atau terlalu sukar tidak bisa
digunakan, hal ini tergantung dari penggunaannya.
b) Daya Pembeda.
Daya pembeda soal adalah kemampuan sesuatu soal untuk membedakan antara siswa yang
berkemampuan tinggi dengan siswa yang berkemampuan rendah.
Angka yang menunjukkan besarnya daya pembeda disebut indeks diskriminasi, indeks
diskriminasi ini sama dengan indeks kesukaran yaitu berkisar antara 0,00 sampai 1,00. Hanya
bedanya, indeks kesukaran tidak mengenal tanda negatif tetapi pada indeks diskriminasi ada
tanda negatif.
Bagi suatu soal yang dapat dijawab benar oleh siswa pandai maupun siswa bodoh, maka soal itu
tidak baik, demikian pula jika semua siswa, baik pandai maupun bodoh tidak dapat menjawab
dengan benar, soal tersebut tidak baik karena keduanya tidak mempunyai daya pembeda. Soal
yang baik adalah soal yang dapat dijawab oleh siswa pandai saja.
Jika seluruh kelompok atas (pandai) dapat menjawab soal dengan benar, sedang seluruh
kelompok bawah (bodoh) menjawab salah, maka soal tersebut mempunyai diskriminasi paling
besar, yaitu 1,00. Sebaliknya jika semua kelompok atas menjawab salah, tetapi semua kelompok
bawah menjawab betul, maka nilai diskriminasinya adalah -1,00. Tetapi jika siswa kelompok
atas dan siswa kelompok bawah sama-sama menjawab benar atau sama-sama menjawab salah,
maka soal tersebut mempunyai nilai diskriminasi 0,00 karena tidak mempunyai daya pembeda
sama sekali.
D = BA/JA – BB/JB = PA – PB
Dimana :
BB BA/JA = banyaknya peserta kelompok bawah yang menjawab soal itu dengan benar.
PA = BB/JB = proporsi peserta kelompok atas yang menjawab benar ( P sebagai indeks
kesukaran).
Pola jawaban yang dimaksud adalah distribusi testee dalam hal menentukan pilihan jawaban
pada soal bentuk pilihan ganda. Pola jawaban soal diperoleh dengan menghitung banyaknya
testee yang memilih pilihan jawaban a, b, c, atau d atau yang tidak memilih pilihan manapun.
Dari pola jawaban soal dapat ditentukan apakah pengecoh (distractor) berfungsi sebagai
pengecoh dengan baik atau tidak. Pengecoh yang tidak dipilih sama sekali oleh testee berarti
bahwa pengecoh itu jelek, sebaliknya sebuah distraktor dapat dikatakan berfungsi dengan baik
apabila distraktor tersebut mempunyai daya tarik yang besar bagi pengikut – pengikut tes yang
kurang memahami konsep atau kurang menguasai bahan.
1. Menskor
Sementara orang berpendapat bahwa bagian yang paling penting dari pekerjaan pengukuran
dengan tes adalah penyusunan tes. Jika alat tesnya sudah disusun sebaik-baiknya maka
anggapannya sudah tercapailah sebagian besar dari maksudnya. Tentu saja anggapan itu tidak
benar sama sekali. Penyusunan tes baru merupakan satu bagian dari serentetan pekerjaan
mengetes.
Di samping penyusunan dan pelaksanaan tes itu sendiri, menskor dan menilai merupakan
pekerjaan yang menuntut ketekunan yang luar biasa dari penilai, ditambah dengan kebijaksanan-
kebijaksanaan tertentu. Nama lain menskor adalah memberi angka.
Dalam hal pekerjaan menskor atau menentukan angka, dapat digunakan 3 macam alat bantu
yaitu:
b. Pembantu menyeleksi jawaban yang benar dan yang salah, disebut kunci scoring.
Untuk tes bentuk betul-salah (true-false) yang dimaksud dengan kunci jawaban adalah deretan
jawaban yang kita persiapkan untuk pertanyaan atau soal-soal yang kita susun, sedangkan kunci
scoring adalah alat yang kita gunakan untuk mempercepat pekerjaan scoring.
Oleh karena dalam hal ini testee (tercoba) hanya diminta melingkari huruf B atau S maka kunci
jawaban yang disediakan hanya berbentuk urutan nomor serta huruf dimana kita menghendaki
untuk melingkari (atau dapat juga diberi tanda X).
Ada baiknya jika kunci jawaban ini ditentukan terlebih dahulu sebelum menyusun soalnya agar:
Bentuk betul-salah sebaiknya disusun sedemikian rupa sehingga jumlah jawaban B hampir sama
banyaknya dengan jawaban S, dan tidak dapat ditebak karena tidak diketahui pola jawabannya.
Dalam menentukan angka (skor) untuk tes bentuk B-S ini kita dapat menggunakan 2 cara yaitu:
(2) Kunci jawaban dan kunci pemberian skor untuk tes bentuk pilihan ganda (multiple choice)
Dengan tes bentuk pilihan ganda, testee diminta melingkari salah satu huruf di depan pilihan
jawaban yang disediakan atau membubuhkan tanda lingkaran atau tanda silang (x) pada tempat
yang sesuai di lembar jawaban.
(3) Kunci jawaban dan kunci pemberian skor untuk tes bentuk jawab singkat (sort answer test)
Tes bentuk jawab singkat adalah bentuk tes yang menghendaki jawaban berbentuk kata atau
kalimat pendek. Melihat namanya, maka jawaban untuk tes tersebut tidak boleh berbentuk
kalimat-kalimat panjang, tetapi harus sesingkat mungkin dan mengandung satu pengertian.
Dengan persyaratan inilah maka bentuk tes ini dapat digolongkan ke dalam bentuk tes objektif.
Kunci jawaban tes bentuk ini merupakan deretan jawaban sesuain dengan nomornya.
Dengan mengingat jawaban yang hanya satu pengertian saja, maka angka bagi tiap nomor soal
mudah ditebak. Usaha yang dikeluarkan siswa sedikit, tetapi lebih sulit daripada tes bentuk
betul-salah atau bentuk pilihan ganda. Sebaiknya setiap soal diberi angka 2. Dapat juga angka itu
kita samakan dengan angka pada bentuk betul-salah atau pilihan ganda jika memang jawaban
yang diharapkannya ringan atau mudah. Tetapi sebaliknya apabila jawabannya bervariasi
misalnya lengkap sekali, lengkap dan kurang lengkap, maka angka-angkanya dapat dibuat
bervariasi pula misalnya 2; 1,5; dan 1.
(4) Kunci jawaban dan kunci pemberian skor untuk tes bentuk menjodohkan (matching)
Pada dasarnya tes bentuk menjodohkan adalah tes bentuk pilihan ganda, dimana jawaban-
jawabannya dijadikan satu, demikian pertanyaan-pertanyaannya. Dengan demikian, maka pilihan
jawabannya akan lebih banyak. Satu kesulitan lagi adalah bahwa jawaban yang dipililh dibuat
sedemikian rupa sehingga jawaban yang satu tidak diperlukan lagi bagi pertanyaan lain.
Kunci jawaban tes bentuk menjodohkan dapat berbentuk deretan jawaban yang dikehendaki atau
deretan nomor yang diikuti oleh huruf-huruf yang terdapat di depan alternative jawaban.
Telah dijelaskan bahwa tes bentuk menjodohkan adalah tes bentuk pilihan ganda yang lebih
kompleks. Maka angka yang diberikan sebagai imbalan juga harus lebih banyak. Sebagai ancar-
ancar dapat ditentukan bahwa angka untuk tiap nomor adalah 2 (dua).
(5) Kunci jawaban dan kunci pemberian skor untuk tes bentuk uraian (essay test)
Sebelum menyusun sebuah tes uraian sebaiknya kita tentukan terlebih dahulu pokok-pokok
jawaban yang kita kehendaki. Dengan demikian, maka akan mempermudah kita dalam pekerjaan
mengkoreksi tes itu.
Tidak ada jawaban yang pasti terhadap tes bentuk uraian ini. Jawaban yang kita peroleh akan
sangat beraneka ragam, berada dari siswa satu ke siswa lain. Untuk menetukan standar terlebih
dahulu, tentulah sukar. Berikut adalah saran langkah-langkah apa yang harus kita lakukan pada
waktu kita mengoreksi dan member angka tes bentuk uraian:
a) Membaca soal pertama dari seluruh siswa untuk mengetahui situasi jawaban. Dengan
membaca seluruh jawaban, kita dapat memperoleh gambaran lengkap tidaknya jawaban yang
diberikan siswa secara keseluruhan.
b) Menentukan angka untuk soal pertama tersebut. Misalnya jika jawabannya lengkap diberi
angka 5, kurang sedikit diberi angka 4, begitu seterusnya sampai kepada jawaban yang paling
minim jika jawabannya meleset sama sekali. Dalam menentukan angka pada hal yang terakhir ini
umumnya kita perlu berpikir bahwa tidak ada unsur tebakan. Dengan demikian maka ada dua
pendapat, satu pendapat menentukan angka 1 atau 2 bagi jawaban yang salah, tetapi pendapat
lain menentukan 0 untuk jawaban itu. Tentu saja bagi jawaban yang kosong (tidak ada jawaban
sama sekali), jelas kita berikan angka 0.
d) Membaca soal kedua dari seluruh siswa untuk mengetahui situasi jawaban, dilanjutkan
dengan pemberian angka untuk soal kedua.
e) Mengulangi langkah-langkah tersebut bagi soal-soal tes ketiga, keempat dan seterusnya
hingga seluruh soal diberi angka.
f) Menjumlahkan angka-angka yang diperoleh oleh masing-masing siswa untuk tes bentuk
uraian.
Setelah mempelajari langkah-langkah tersebut kita tahu bahwa dengan membaca terlebih dahulu
seluruh jawaban yang duberikan oleh siswa, kita menjadi tahu bahwa mungkin tidah ada seorang
pun dari siswa yang menjawab dengan betul untuk sesuatu nomor soal.
Menghadapi situasi seperti ini, kita gunakan cara pemberian angka yang relative. Misalnya untuk
satu nomor soal jawaban yang paling lengkap hanya mengandung 3 unsur, padahal kita
menghendaki 5 unsur, maka kepada jawaban yang paling lengkap itulah kita berikan angka 5,
sedangkan untuk menjawab hanya 2 atau 1 unsur, kita beri angka sedikit, yaitu misalnya 3,4; 2;
1,5.
Kunci jawaban untuk memeriksa tugas merupakan poko-pokok yang harus termuat di dalam
pekerjaan siswa. Hal ini menyangkut criteria tentang isi tugas. Namun sebagai kelengkapan
dalam pemberian skor, digunakan suatu tolok ukur tertentu. Tolok ukur yang disarankan sebagai
ukuran keberhasilan tugas adalah:
b) Bentuk fisik pengerjaan tugas yang menandakan keseriusan mahasiswa dalam mengenakan
tugas.
e) Mutu hasil tugas, yaitu kesesuaian hasil dengan garis-garis yang sudah ditentukan oleh
dosen.
Apa yang terjadi selama ini, banyak di antara para guru sendiri yang masih mencampuradukkan
antara dua pengertian yaitu skor dan nilai.Skor : adalah hasil pekerjaan menskor yang diperoleh
dengan menjumlahkan angka-angka bagi setiap soal tes yang dijawab betul oleh siswa.Nilai :
adalah angka ubahan dari skor dengan menggunakan acuan tertentu, yakni acuan normal atau
acuan standar.Secara rinci skor dapat dibedakan atas tiga macam, yaitu skor yang diperoleh
(obtained score), skor sebenarnya (true score), dan skor kesalahan (error score).
Score yang diperoleh adalah sejumlah biji yang dimiliki oleh testee sebagai hasil mengerjakan
tes. Kelemaham-kelemahan butir tes, situasi yang tidak mendukung, kecemasan dan lain-lain
factor dapat berakibat terhadap skor yang diperoleh ini. Apabila factor yang berpengaruh ini
muncul, baik sebagian atauppun menyeluruh, penilai tidak dapat mengira-ngira seberapa cermat
skor yang diperoleh siswa ini mampu mencerminkan pengetahuan dan keterampilan siswa yang
sesungguhnya.
Skor sebenarnya (true score) sering kali juga disebut dengan istilah skor univers = skor alam
(universe score), adalah nilai hipotesis yang sangat tergantung dari perbedaan individu berkenaan
dengan pengetahuan yang dimiliki secara tetap.
Perbedaan antara skor yang diperoleh dengan skor yang sebenarnya, disebut dengan istilah
kesalahan dalam pengukuran atau kesalahan skor, atau dibalik skor kesalahan. Hubungan antara
ketiga macam skor tersebut adalah sebagai berikut:
Dalam penggunaan Norm – Referenced, prestasi belajar seorang siswa dibandingkan dengan
siswalain dalam kelompoknya. Kualitas seseorang sangat dipengaruhi oleh kualitas
kelompoknya. Dasar pikiran dari penggunaan standar ini adalah adanya asumsi bahwa disetiap
populasi yang heterogen tentu terdapat kelomouk baik, kelompok sedang, dan kelompok kurang.
Apabila standar mutlak dan standar relatif ini dihubungkan dengan pengubahab skor menjadi
nilai, maka akan terlihat demikian.
(1) Pemberian skor terhadap siswa, didasarkan atas pencapaian siswa terhadap tujuan yang
ditentukan.
(2) Nilai diperoleh dengan mencari skor rata-rata langsung dari skor asal (skor mentah). Contoh
:
(1) pemberian skor terhadap siswa juga didasakan atas pencapaian siswa terhadap tujuan yang
ditentukan
a. Skala Bebas
Skala bebas yaitu skala yang tidak tetap, ada kalanya skor tertinggi 20, lain kali lagi 50. Ini
semua tergantung dari banyak dan bentuk soal. Jadi, angka tertinggi dari skala yang di gunakan
tidak selalu sama.
b. Skala 1-10
Dalam skala 1-10, guru jarang memberikan angka pecahan, misalnya 5,5. Angka 5,5 tersebut di
bulatkan menjadi 6. Dengan menggunakan skala 1-10 maka bilangan bulat yang ada masih
menunjukan penilaian yang agak kasar.
c. Skala 1-100
Penilaian dengan menggunakan skala 1-100, di mungkinkan melakukan penilaian yang lebih
halus karena terdapat 100 bilangan bulat. Nilai 5,5 dalam skala 1-10 yang biasanya di bulatkan
menjadi 6, dalam skala 1-100 ini boleh di tuliskan dengan 55.
d. Skala huruf
Selain menggunakan angka, pemberian nilai dapat di lakukan dengan huruf A,B,C,D,dan E.
Huruf tidak menunjukan kuantitas, tetapi dapat di gunakan sebagai symbol untuk
menggambarkan kualitas.
2. Distribusi Nilai
Pemberian skor terhadap siswa, didasarkan atas pencapaian siswa terhadap tujuan yang
ditentukan. Nilai diperoleh dengan mencari skor rata-rata langsung dari skor asal (mentah).
Apabila soal-soal ulangan yang dibuat oleh guru sangat mudah, sebagian besar siswa akan dapat
berhasil mengerjakan soal-soal itu, dan tingkat pencapaiannya tinggi.sebagian besar siswa akan
memiliki nilai sekitar 8, 9 atau 10 apabila telah diubah ke skala 10, sebaliknya apabila soal-soal
tes yang disusun oleh guru termasuk soal sukar, maka pencapaian siswa akan sebaliknya pula.
Sebagian besar siswa akan memiliki nilai 3, 4 bahkan mungkin 2 atau 1. Hanya beberapa orang
siswa yang istimewa saja yang memiliki nilai 6, dan mungkin tidak ada yanig memiliki nilai 7
ke atas. Namun demikian dengan standar mutlak ini mungkin pula diperoleh gambar kurva
normal jika soal-soal tes disusun oleh guru dengan tepat seperti gambaran kecakapan siswa-
siswanya.
Telah diterangkan, bahwa dalam menggunakan standar relative atau norm refrenced, kedudukan
seseorang sealu dibandingkan dengan kawan-kawannya dalam kelompok. Dalam hal ini tanpa
menghiraukan apakah distribusi skor terletak dalam kurva juring positif atau juring negative,
tetapai dalam norm refrenced selalu tergambar dalam kurva normal. Hal ini didasarkan atas
asumsi bahw apabila distribusi skor tergambar dalam kurva juring positif, yang kurang sempurna
adalah soal-soal tesnya, yaitu terlalu sukar. Dengan demikian, nilai siswa lalu direntangkan
sedemikian rupa sehingga tersebar dari nilai tinggi ke nilai rendah, dengan sebagian terbesar
terletak pada nilai sedang. Demikian pula sebaliknya apabila skor siswa tergambar dalam kurva
juring negative. Dalam ubahan menjadi nilai, disebar sedemikian rupa sehingga kurva normal,
dengan nilai sedang adalah nilai yang paling banyak.
3. Standar Nilai
a. Nilai standar berskala Sembilan (stannine), yaitu rentangan atau skala nilai yang bergerak
mulai dari 1 sampai dengan 9,[7] seperti berikut ini:
Staines
Interpretasi
9 (4%)
Tinggi (4%)
8 (7%)
7 (12%)
6 (17%)
5 (20%)
4 (17%)
Rata-rata (54%)
3 (12%)
2 (7%)
Dibawah rata-rata (19%)
1 (4%)
Rendah (4%)
Misalnya kita memiliki skor-skor seperti disebutkan dalam hasil ulangan IPS kelas V, dengan
mudah dapat kita tentukan 4% dari siswa yang mendapat nilai 9, selanjutnya 7% mendapat nilai
8, 12% mendapat nilai 7, 17% mendapat nilai 6, dan seterusnya.
b. Nilai standar berskala sebelas (standar eleven/ stanel= eleven points scale), yaitu skala nilai
yang bergerak mulai dari nilai 0 sampai dengan nilai 10,[9] yang dikembangkan oleh Fakultas
Ilmu Pendidikan UGM disesuaikan dengan system penilaian di Indonesia. Dengan stanel ini,
system penilaian membagi skala menjadi 11 golongan, yaitu angka-angka 0, 1, 2, 3, 4, 5, 6, 7, 8,
9, 10, yang satu sama lain berjarak sama. Tiap-tiap angka menempati jarak antara
c. Standar sepuluh. Didalam Buku Pedoman Penilaian (Buku III B Seri Kurikulum SMA
Tahun 1975) ditentukan bahwa untuk mengolah hasil tes, digunakan standar relative, dengan
nilai berskala 1 – 10. Untuk mengubah skor menjadi nilai, diperlukan dahulu:
1. Pengertian
Pengertian yang dimaksud kedudukan siswa dalam kelompoknya adalah letak seorang siswa di
dalam urutan tingkatan, dalam istilah disebut rangking. Untuk dapat diketahui rangking dari
siswa di suatu kelas maka harus diadakan pengurutan nilai siswa tersebut dari yang paling atas
sampai ke nilai yang paling bawah.
a. Dengan rangking sederhana( simple rank) adalah urutan yang menunjukkan letak atau
kedudukan seseorang dalam kelompoknya dan dinyatakan dengan nomor atau angka biasa.
d. Standard score atau z-score adalah angka yang menunjukkan perbandingan perbedaan
score seseorang dari mean dengan standar deviasinya untuk menentukan z-score, harus
diketahui:
Pengetrapan dari z-score ini banyak digunakan di dalam menentukan kejuaraan seseorang
apabila kebetuan jumlah nilainya sama
Kedudukan seseorang dalam sebuah kelas sangat penting karena dengan begitu peserta didik
akan tahu berapa rangking yang telah dicapainya, jika mendapat rangking yang bagus maka dia
akan merasa bangga dengan hasil yang diperoleh atas usaha yang telah dilakukan selama ini
dalam proses belajar mengajar, sedang apabila rangkingnya jelek maka peserta didik akan lebih
termotivasi untuk memperbaiki dirinya. Dalam bab ini telah dijelaskan bagaimana cara
menentukan kedudukan siswa melalui beberapa standar yang lazim digunakan.
c. Fungsi bimbingan bertujuan untuk mengetahui bagian-bagian mana dari usaha siswa di
sekolah yang masih memerlukan bantuan.
d. Fungsi administratif:
Ø Memberikan beasiswa
Ø Memberi gambaran tentang prestasi siswa atau lulusan kepada calon pemakai tenaga kerja.
b. Usaha (effort)
c. Aspek pribadi dan social (personal and social characteristics)
a. Untuk memperoleh nilai akhir, perlu diperhitungkan nilai tes formatif dan tes sumatif.
b. Nilai akhir diperoleh dari nilai tugas, nilai ulangan harian, dan nilai ulangan umum
dengan bobot 2,3,dan 5.
c. Nilai akhir untuk STTB diperoleh dari rata-rata nilai ulangan harian (diberi bobot satu)
dan nilai EBTA (diberi bobot dua), kemudian dibagi 3.
1. Pentingnya Laporan
Laporan biasanya dibuat oleh seorang guru dibuat pada akhir semester, dibuatnya laporan ini
diperlukan untuk mengetahui hasil akhir dari apa yang dilakukan oleh siswa-siswi serta
diperlukan agar guru dapat mengetahui tingkat keberhasilannya dalam mengajar sudah berhasil
atau belum jika belum maka guru akan meninjau kembali metodenya dalam mengajar.Secara
sistematis dapat dikemukakan disini bahwa laporan tentang siswa bermanfaat bagi beberapa
pihak yaitu sebagai berikut:
a) Siswa sendiri, secara alamiah setiap orang selalu ingin tahu akibat dari apa yang telah
mereka lakukan, dengan mengetahui hasil yang positif dari perbuatannya, maka pengetahuan
yang diperoleh akan dikuatkan dan jika siswa mendapat informasi bahwa jawwabannya salah,
maka lain kali ia tidak akan menjawab seperti itu lagi.
b) Guru yang mengajar akan mengetahui catatan laporan kemajuan siswa.
c) Guru lain, maka guru yang akan mengganti mengajar akan tahu bagaimana meladeni atau
memperlakukan siswa.
ü Catatan lengkap.
ü Lulus-belum lulus.
ü Nilai siswa.
Evaluasi merupakan suatu kegiatan yang bertujuan untuk menentukan apakah target progam
yang disusun sudah tercapai dengan begitu maka akan diketahui bagaimana kualitas mengajar
seorang guru apakah sudah efektif atau belum berdasarkan tingkat pencapaian yang sudah
dicapai.
Evaluasi progam merupakan suatu rangkaian kegiatan yang dilakukan dengan sengaja untuk
melihat tingkat keberhasilan progam. Untuk menentukan seberapa jauh target progam sudah
tercapai, yang dijadikan tolak ukur adalah tujuan yang sudah dirumuskan dalam tahap
perencanaan kegiatan.
Pentingnya evaluasi progam yaitu agar guru mengetahui betul apa yang terjadi di dalam proses
belajar-mengajar, guru berkepentingan atas kualitas pengajaran. Untuk memperbaiki proses
pengajaran yang akan dilaksanakan lain waktu, guru perlu mengetahui seberapa tinggi tingkat
pencapaian dari tugas yang telah dikerjakan selama kurun waktu tertentu.
Ø Input(masukan)
Ø Guru.
Apabila guru ingin melakukan evaluasi progam dengan lebih seksama, terlebih dahulu
harus menyusun rencana evaluasi sekaligus menyusun instrument pengumpulan data. Mengenai
bagaimana menyiapkan instrumen untuk angket, pedoman wawancar, pedoman pengamatan
dapat dipelajari dari buku-buku penelitian. Sebagai cara yang paling sederhana adalah
mengadakan pencatatan terhadap peristiwa yang dialami dari kegiatan sehari-hari di kelas.