Anda di halaman 1dari 13

BAB II

KAJIAN PUSTAKA

2.1 Tes

2.1.1 Pengertian dan Tujuan Tes

Menurut Kamus Besar Bahasa Indonesia, tes berarti ujian tertulis, lisan

atau wawancara untuk mengetahui pengetahuan, kemampuan, bakat dan

kepribadian individu. Dengan munculnya statistik dalam penganalisaan data dan

informasi maka akhirya tes digunakan dalam berbagai bidang sepertti tes minat,

tes bakat, tes kemampuan dasar, tes ingatan dan sebagainya. Dalam dunia

pendidikan di sekolah, tes yang digunakan adalah tes prestasi belajar.

Ada beberapa istilah yang berhubungan dengan tes yaitu testing, tester dan

testee yang masing-masing mempunyai arti yang berbeda. Testing adalah

pelaksanaan tes atau peristiwa berlangsungnya pengukuran dan penilaian. Tester

adalah penguji atau orang yang diberikan tugas untuk melaksanakan tes terhadap

responden. Sedangkan testee adalah peserta atau pihak atau responden yang

sedang mengerjakan tes. Di sisi lain, Sudjono (2005: 67) mengatakan:

“Tes adalah cara atau prosedur dalam rangka pengukuran dan penilaian di
bidang pendidikan yang berbentuk pemberian tugas atau serangkaian tugas
(baik berupa pertanyaan-pertanyaan) yang harus dijawab, atau perintah-
perintah (yang harus dikerjakan) oleh testee, sehingga dapat dihasilkan nilai
yang melambangkan tingkah laku atau prestasi testee, nilai mana yang dapat
dibandingkan dengan nilai-nilai yang dicapai oleh testee yang lain atau
dibandingkan dengan nilai standar tertentu”.

Tujuan dari tes itu sendiri adalah untuk mengumpulkan informasi tentang

tingkat perkembangan dan kemajuan peserta didik, mendiagnosis kesulitan belajar

peserta didik, mengetahui hasil pengajaran, mengetahui hasil belajar dan

4
mendorong guru agar mengajar lebih baik dalam rangka mencapai tujuan yang

telah ditetapkan dalam standar kompetensi yang dijabarkan dalam kompetensi

dasar.

2.1.2 Fungsi Tes

Tes mempunyai peranan dalam mengukur keberhasilan belajar siswa,

selain itu tes juga mempunyai fungsi yang sangat penting. Sehubung hal itu,

Sudijono (2005: 67) mengemukakan, “Secara umum, tes memiliki dua fungsi

yaitu sebagai alat ukur terhadap peserta didik dan sebagai alat pengukur

keberhasilan program pengajaran”. Di samping itu dalam sumber lain Arikunto

(2005) juga menjelaskan beberapa fungsi tes dalam proses pembelajaran, yaitu:

1) Fungsi untuk kelas


a. Mengadakan diagnosa terhadap kesulitan belajar siswa
b. Mengevaluasi celah antara bakat dan pencapaian
c. Menaikkan tingkat prestasi
d. Mengelompokkan siswa dalam kelas pada waktu menerapkan
pembelajaran dengan menggunakan metode kelompok
2) Fungsi bimbingan
a. Membantu siswa dalam menentukan pilihan
b. Membantu siswa mencapai tujuan pendidikan dan jurusan
c. Memberi kesempatan kepada pembimbing, guru dan orang tua dalam
memahami kesulitan anak
3) Fungsi untuk administrasi
a. Memberi petunjuk dalam pengelompokkan siswa
b. Untuk penempatan siswa baru
c. Menilai kurikulum

2.1.3 Penyusunan Tes dan Kualitas Tes

Menyusun tes yang baik merupakan pekerjaan yang sulit bagi seorang

guru, guru harus memperhatikan dengan cermat dan tepat untuk tes yang akan

dibuat mulai dari menyusun, melaksanakan dan memeriksa atau menilai jawaban

tes yang telah dijawab oleh siswa. Dalam menyusun tes, guru hendaknya mampu

5
mempertimbangkan tentang aspek yang diukur baik kognitif (pengetahuan),

afektif (sikap) dan psikomotor (keterampilan).

Penyusun tes pada dasarnya merupakan kemampuan menulis soal-soal

yang akan disajikan kepada siswa pada saat berlangsungnya tes. Sebelum

menyusun tes diharuskan membuat kisi-kisi yang memuat ruang lingkup materi

agar tidak terjadi kesalahan dalam membuat soal. Jadi kisi-kisi ini merupakan

penjabaran dari materi dan sesuai dengan indikator berdasarkan kompetensi dasar

dan standar kompetensi. Dengan demikian peeran tes sebagai salah satu alat

penilaian sangatlah penting.

Arikunto (2005) mengemukakan beberapa urutan langkah yang dilakukan

dalam menyusun tes yaitu:

a. Menentukan tujuan mengadakan tes.


b. Mengadakan pembatasan terhadap bahan yang akan dites.
c. Merumuskan tujuan instruksional khusus dari tiap-tiap bagian bahan.
d. Menderetkan semua Tujuan Instruksional Khusus (TIK) dalam tabel
persiapan yang membuat pola aspek tingkah laku yang terkandung dalam
TIK itu. Tabel ini digunakan untuk mengadakan identifikasi terhadap
tingkah laku yang dikehendaki agar tidak terlewatkan
e. Menyusun tabel spesifikasi yang memuat pokok materi, aspek pikiran
yang akan diukur, dan dipertimbangkan antara kedua hal tersebut.
f. Menulis butir-butir tes berdasarkan atas TIK-TIK yang dituliskan pada
tabel TIK dan aspek tingkah laku yang dicakup.

Sedangkan untuk kriteria tes yang baik Arikunto (2005) mengemukakan:

Sebuah tes dikatakan baik sebagai alat ukur harus memenuhi syarat tes yaitu:
a. Validitas, sebuah tes dikatakan valid apabila tes itu dapat mengukur apa
yang hendak diukur.
b. Reliabilitas, sebuah tes dikatakan reliabel apabila hasil tes tersebut
menunjukkan ketetapan.
c. Objektifitas, dikatakan objektif apabila dalam pelaksanaan tes itu tidak
ada faktor atau unsur pribadi yang mempengaruhi hal ini terutama terjadi
pada skornya.
d. Praktibilitas, sebuat tes dikatakan mempunyai praktibilitas yang tinggi
apabila tes tersebut bersifat praktis, mudah diaksanakan dan efisien dari
segi biaya dan tenaga.

6
e. Ekonomis, yang dimaksud dengan ekonomis di sini pelaksanaan tes
tersebut tidak membutuhkan biaya yang mahal dan waktu yang banyak.

Dengan demikian, seorang guru hendaknya memiliki pengetahuan dan

keterampilan dalam menyusun tes agar butir-butir soal yang disusunnya dapat

mengukur dengan tepat apa yang hendak diukur terhadap siswa.

2.2 Analisis Butir Soal

Arikunto (2005: 211) menjelaskan, “Analisis butir soal antara lain

bertujuan untuk mengadakan identifikasi soal-soal yang baik, kurang baik dan

soal yang jelek”. Jadi dengan adanya analisi butir soal maka pendidik dapat

mengetahui kualitas butir soal yang digunakannya dan dapat melakukan tindakan

selanjutnya, misalnya bagi soal-soal yang kurang baik dapat direvisi kembali

sedangkan bagi soal yang jelek lebih baik dibuang sehingga perangkat soal

tersebut memiliki kualitas yang memadai.

2.2.1 Validitas

Validitas berasal dari kata vali yang berarti tepat atau benar, jadi validitas

dapat diartikan dengan ketepatan, kebenaran, atau keabsahan. Validitas dapat

diartikan sebagai perangkat tes yang berguna dalam mengambil keputusan yang

relevan, dengan tujuan yang telah ditentukan. Sudjana (2005) mengungkapkan

pendapatnya bahwa validitas berkenaan dengan ketetapan alat penilaian terhadap

konsep yang dinilai sehingga betul-betul menilai apa yang seharusnya dinilai.

Selain itu, Sukardi (2009) mengemukakan bahwa:

Validitas suatu instrumen evaluasi mempunyai beberapa makna penting


diantaranya sebagai berikut:
1. Validitas berhubungan dengan ketetapan interpretasi hasil tes atau
instrumen evaluasi untuk group individual dan bukan instrumen itu sendiri.
2. Validitas diartikan sebagai derajat yang menunjukkan kategori rendah,
menegah dan tinggi.

7
3. Prinsip suatu tes valid, tidak universal. Validitas suatu tes yang perlu
diperhatikan oleh para peneliti adalah bahwa ia hanya valid untuk suatu
tujuan tertentu saja. Tes valid untuk bidang studi metrologi industri belum
tentu valid untuk bidang lain misalnya bidang mekanika teknik.

Berdasarkan penjelasan di atas, maka dapat dikatakan bahwa validitas adalah

ketetapan alat ukur dengan objek yang dinilai, serta diukur. Suatu tes dikatakan

mempunyai validitas yang baik jika suatu alat ukur tepat digunakan, harus sesuai

dengan apa yang diujikan. Sudjana (2005) menyatakan bahwa ada empat jenis

validitas yang sering digunakan yaitu validitas isi, validitas bangun pengertian,

validitas ramalan dan validitas kesamaan.

a. Validitas isi adalah validitas yang menunjukkan isi tes sebagai sampel

yang mewakili kemampuan yang diukur dan materi pelajaran yang

diberikan. Tes dikatakan valid dari segi isi jika materi tes sesuai dengan

kurikulum.

b. Validitas bangun pengertian (konstruksi) adalah tes dimana butir soal

membangun setiap aspek tingkah laku yang disebutkan dalam indikator

soal.

c. Validitas ramalan (perdiksi) adalah tes yang mempunyai kemampuan

untuk meramalkan apa yang akan terjadi pada masa yang akan datang.

d. Validitas kesamaan adalah tes memiliki kesuaian dengan hasil pengukuran

lain yang dilaksanakan pada saat itu, dengan alat ukur yang berbeda.

Keempat macam validitas tersebut sering pula dikelompokkan menjadi

dua macam menurut rentetan berpikirnya. Validitas isi dan konstruksi

dikelompokkan ke dalam validitas logis (penyusunan berdasarkan ketentuan atau

teori), sedangkan validitas prediksi dan kesamaan dikelompokkan ke dalam

validitas empiris (menggunakan formulasi statistik, sehingga lebih objektif).

8
Koefisien validitas tes dapat ditemukan dengan menganalisa keseluruhan

tes apabila ditemukan koefisien validitas rendah, maka perlu dicari validitas butir

soal tes. Dengan demikian dapat ditemukan butir soal mana yang memuat

seperangkat tes mempunyai validitas rendah.

2.2.2 Reliabilitas

Reliabilitas adalah karakter lain dari hasil evaluasi. Reliabilitas alat

penilaian adalah ketetapan atau keajengan alat tersebut dalam menilai apa yang

dinilainya. Artinya, kapanpun alat penilaian tersebut digunakan akan memberikan

hasil yang relatif sama (Sudjana, 2005). Tes hasil belajar dapat dikatakan reliabel

apabila hasil pengukuran dan penilaian yang dilakukan menunjukkan kesamaan

hasil. Hasil pengukuran berupa skor itulah yang seharusnya tidak berubah-ubah.

Artinya peserta tes yang sama seharusnya memperoleh skor yang hampir sama

pula seandainya ia kembali mengerjakan tes yang sama, pada kesempatan yang

berbeda.

Di samping itu, reliabilitas tidak sama dengan validitas. Artinya

pengukuran yang dapat diandalkan akan mengukur secara konsisten, tapi belum

tentu mengukur apa yang seharusnya diukur. Sehingga dapat dikatakan bahwa

reliabilitas memberikan konsistensi yang membuat terpenuhinya syarat utama,

yaitu validnya suatu hasil instrumen. Sebagaimana yang dikemukakan oleh

Sukardi (2009) bahwa:

Reliabilitas sama dengan konsistensi atau keajegan. Suatu instrumen evaluasi


dikatakan mempunyai reliabilitas tinggi, apabila tes yang dibuat mempunyai
hasil yang konsisten dalam mengukur yang hendak diukur. Instrumen
evaluasi dikatakan memiliki reliabilitas tinggi, berarti a) hasil interpretasi
instrumen menunjukkan konsisten yang baik, b) menunjukkan betapa
yakinnya evaluator atau guru menempatkan sebagai hasil evaluasi, dan c)
menjadi perhatian para guru agar hasil interpretasi instrumen evaluasi dapat
dioperasionalkan di kelas atau sekolah.

9
Penafsiran reliabilitas dapat dilakukan dengan menghitung harga r dan

kemudian diinterpretasikan dengan kriteria indeks atau derajat reliabilitas

seperangkat tes yang dapa diketahui dengan berbagai cara atau metode.

a. Metode bentuk paralel, tes yang bersifat paralel diberikan kepada

sekelompok siswa dalam periode waktu singkat. Kedua skor tes yang

diperoleh dikorelasikan. Apabila koefisien korelasi tinggi maka skor kedua

tes yang diperoleh mempunyai ekuivalensi yang tinggi pula. Koefisien

reliabilitas yang dipergunakan untuk mengukur ekuivalensi dapat dipakai

rumus korelasi product moment dari Spearman Brown.

b. Metode tes ulang, satu tes diberikan dua kali kepada satu kelompok

peserta tes. Kemudian hasil dari kedua kali tes tersebut dihitung

korelasinya. Apabila diperoleh koefisien tinggi berarti tes stabil, siswa

pada tes pertama dan kedua memperoleh skor yang baik.

c. Metode belah dua, tes diberikan hanya satu kali. Kemudian hasil yang

diperoleh itu dikelompokkan menjadi dua dan apabila diperoleh koefisien

tinggi berarti hasil tes stabil.

2.2.3 Tingkat Kesukaran

Tingkat kesukaran dapat diartikan sebagai kemampuan siswa untuk

menjawab soal yang diberikan dengan benar. Bermutu atau tidaknya butir-butir

soal tersebut dapat diketahui dari derajat kesukaran yang dimililki oleh masing-

masing butir soal dan yang harus diperhatikan jangan sampai tes itu sangat sukar

atau sangat mudah, dalam hal ini Arikunto (2005: 214) mengemukakan:

“Soal yang baik adalah soal yang tidak terlalu mudah atau tidak terlalu sukar,
soal yang mudah tidak merangsang siswa untuk mempertinggi usaha untuk
memecahkannya, sebaliknya soal yang terlalu sukar menyebabkan siswa

10
menjadi putus asa dan tidak mempunyai semangat untuk mencoba lagi karena
di luar jangkauannya”.

Sukar atau mudahnya soal yang diberikan dinyatakan dalam indeks

kesukaran. Besarnya tingkat kesukaran antara 0.00 sampai dengan 1.0. Semakin

besar indeks kesukaran berarti semakin mudah soal tersebut dan sebaliknya.

Fungsi tingkat kesukaran butir biasanya dikaitkan dengan tujuan tes. Misalnya

untuk ujian akhir semester digunakan soal dengan tingkat kesukaran sedang,

untuk keperluan seleksi digunakan soal dengan tingkat kesukaran tinggi, dan

untuk keperluan diagnostik digunakan soal dengan tingkat kesukaran mudah.

Terdapat perbedaan antara kelompok besar dan kelompok kecil di dalam

menganalisa indeks kesukaran soal, sebagaimana yang dijelaskan oleh Arikunto

(2005):

Untuk kelompok kecil (kurang dari 100 orang), maka seluruh kelompok tes
dibagi atas dua kelompok yang sama besarnya, yaitu kelompok bawah 50%
dan kelompok atas 50%. Seluruh pengikut tes dideretkan mulai dari skor
tertinggi sampai terendah, lalu dibagi dua. Sedangkan untuk kelompok yang
besarnya (100 orang ke atas), maka diambil 27% skor tertinggi sebagai
kelompok atas dan 27% skor terendah sebagai kelompok bawah.

Butler (2018) mengemukakan beberapa penyebab soal menjadi mudah atau sukar,

yaitu:

a. Soal mudah:
- Pengecoh butir soal tidak berfungsi
- Siswa telah memahami materi yang ditanyakan
b. Soal sukar:
- Butir soal itu mungkin salah kunci
- Butir soal itu mempunyai lebih dari dua jawaban yang benar
- Materi yang ditanyakan belum diajarkan atau belum tuntas
pembelajarannya
- Tidak cocok alat tesnya
- Kalimat soal mungkin terlalu komplek dan panjang

11
2.2.4 Daya Beda

Daya beda soal adalah kemampuan suatu soal untuk membedakan antara

siswa yang pandai (berkemampuan tinggi) dengan siswa yang kurang pandai

(berkemampuan rendah). Soal yang dapat dijawab benar oleh siswa yang

berkemampuan tinggi dan berkemampuan rendah maka soal itu tidak baik.

Demikian pula jika siswa berkemampuan tinggi maupun siswa berkemampuan

rendah tidak dapat menjawab soal dengan benar, maka soal tersebut tidak baik

karena tidak mempunyai daya pembeda butir soal. Jadi soal yang baik adalah soal

yang dapat dijawab oleh siswa yang berkemampuan tinggi saja. Sebagaimana

yang dikemukakan oleh Arikunto (2005: 211):

“Daya pembeda dari sebuah butir soal menyatakan seberapa jauh kemampuan
butir soal tersebut mampu membedakan antara testee yang mengetahui
jawabannya dengan benar dengan testee yang tidak dapat menjawab soal
tersebut (testee yang menjawab soal salah). Dengan perkataan lain daya
pembeda sebuah butir soal adalah kemampuan butir soal itu untuk
membedakan testee (siswa) yang pandai dengan siswa yang kurang pandai”.

Angka yang menunjukkan besarnya daya pembeda disebut indeks daya pembeda

(DP). Semakin tinggi indeks daya pembeda soal berarti semakin mampu soal yang

bersangkutan membedakan siswa yang sudah memahami dan belum memahami

materi. Indeks daya pembeda berkisar antara -1.00 sampai dengan +1.00. Semakin

tinggi daya pembeda suatu soal maka semakin baik soal tersebut. Jika daya

pembeda negatif berarti lebih banyak kelompok siswa yang belum memahami

materi soal tersebut.

2.3 High Order Thinking Skill (HOTS)

High Order Thinking Skill merupakan suatu proses berpikir peserta didik

dalam level kognitif yang lebih tinggi yang dikembangkan dari berbagai konsep

12
dan metode kognitif dan taksonomi pembelajaran seperti metode problem solving,

taksonomi bloom, dan taksonomi pembelajaran, pengajaran, dan penilaian

(Saputra, 2016). High order thinking skills ini meliputi di dalamnya kemampuan

pemecahan masalah, kemampuan berpikir kreatif, berpikir kritis, kemampuan

berargumen, dan kemampuan mengambil keputusan. Menurut King, high order

thinking skills termasuk di dalamnya berpikir kritis, logis, reflektif, metakognitif,

dan kreatif, sedangkan menurut Widodo (2013) dengan high order thinking

peserta didik akan dapat membedakan ide atau gagasan secara jelas, berargumen

dengan baik, mampu memecahkan masalah, mampu mengkonstruksi penjelasan,

mampu berhipotesis dan memahami hal-hal kompleks menjadi lebih jelas.

Menurut Vui (dalam Kurniati, 2014) high order thinking skills akan terjadi ketika

seseorang mengaitkan informasi baru dengan infromasi yang sudah tersimpan di

dalam ingatannya dan mengaitkannya dan/atau menata ulang serta

mengembangkan informasi tersebut untuk mencapai suatu tujuan atau

menemukan suatu penyelesaian dari suatu keadaan yang sulit dipecahkan.

Tujuan utama dari high order thinking skills adalah bagaimana

meningkatkan kemampuan berpikir peserta didik pada level yang lebih tinggi,

terutama yang berkaitan dengan kemampuan untuk berpikir secara kritis dalam

menerima berbagai jenis informasi, berpikir kreatif dalam memecahkan suatu

masalah menggunakan pengetahuan yang dimiliki serta membuat keputusan

dalam situasi-situasi yang kompleks (Saputra, 2016). Konsep dari high order

thinking skills didasari oleh beberapa pendapat, seperti bisa dilihat pada tabel

berikut:

13
Tabel 1. Dasar Konsep High Order Thinking Skills

Problem Solving Taksonomi Taksonomi Bloom High Order


Krulik & Rudnick Kognitif Bloom Revisi Ander & Thinking Skills
(1998) Original (1956) Krathwohl (2001)
Recall Knowledge Remember
Basic (Dasar) Comprehense Understand
Application Apply
Critical Analysis Analize Critical Thinking
Creative Synthesis Evaluate Creative Thinking
Evaluation Create Problem Solving
Decision Making

Terlihat pada tabel di atas, Bloom membagi domain kognitif menjadi

enam level berpikir yaitu, (1) knowledge atau pengetahuan tentang mengingat

kembali infomasi yang telah dipelajari, (2) comprehension atau memahami makna

dari materi, (3) application, menggunakan pengetahuan pada situasi baru dan

situasi yang belum pernah dialami sebelumnya atau menerapkan aturan atau

prinsip-prinsip, (4) analysis, mengidentifikasi dan memahami bagian-bagian

materi atau keseluruhan materi, (5) synthesis, menggabungkan elemen untuk

membentuk keseluruhan yang baru, dan (6) evaluation, memeriksa atau menilai

secara hati-hati berdasarkan beberapa kriteria.

Revisi teksonomi bloom yang dilakukan oleh Anderson dan Krathwohl

lebih berfokus pada bagaimana domain kognitif lebih hidup dan aplikatif bagi

pendidik dan praktik pembelajaran yang diharapkan dapat membantu pendidik

dalam mengolah dan merumuskan tujuan pembelajaran dan strategi penilaian

yang efisien. Ketiga konsep di atas yang menjadi dasar high order thinking skills

merujuk pada aktivitas menganalisis, mengevaluasi, mencipta pengetahuan yang

disesuaikan dengan konseptual, prosedural dan metakognitif. Menurut Krathwohl

(2002) dalam A revision of Bloom’s Taxonomy, menyatakan bahwa indikator

14
untuk mengukur kemampuan berpikir tingkat tinggi meliputi menganalisis yaitu

kemampuan memisahkan konsep ke dalam beberapa komponen dan

menghubungkan satu sama lain untuk memperoleh pemahaman atas konsep

secara utuh, mengevaluasi yaitu kemampuan menetapkan derajat sesuatu

berdasarkan norma, kriteria atau patokan tertentu, dan mencipta yaitu kemampuan

memadukan unsur-unsur menjadi sesuatu bentuk baru yang utuh dan luas, atau

membuat sesuatu yang orisinil.

2.4 Computer Based Test (CBT)

Computer Based Test (CBT) adalah system evaluasi berbantuan komputer

yang bertujuan untuk membantu guru dalam melaksanakan evaluasi, baik

penskoran, pelaksanaan tes maupun efektivitas dan efisiensi pelaksanaannya. Tes

nantinya akan berbantuan media dan pelaksanaannya pun menggunakan

komputer. Menurut John Daintith, CBT merupakan penggunaan komputer untuk

mengendalikan baik digital maupun analog teknik pengujian dan evaluasi kualitas

komponen dan produk.

Sistem computer based test (CBT) atau pelaksanaan evaluasi dengan

berbantuan komputer merupakan turunan atau pengembangan sistem computer

assisted instructional (CAI) atau pembelajaran berbantuan komputer yang

dikhususkan pada bidang garapan evaluasi meliputi kumpulan-kumpulan soal dan

proses penskoran otomatis, media audio, video dan interaktif serta autorun.

Menurut Sri Lestari, CBT adalah suatu metode administrasi tes yang dilakukan

secara elektronik dengan dicatat, dinilai, atau keduanya. Beberapa keuntungan

sistem CBT disebut di atas meliputi kemasan soal lebih menarik karena

disampaikan secara multimedia, tidak menggunakan pena dan kertas, mengurangi

15
biaya, uji penghitungan skor valid, menghemat waktu, lebih cepat dalam

mengambil keputusan sebagai hasil dari pelaksanaan tes. CBT dapat

menggunakan software apapun dalam praktik atau penerapannya dengan

ketentuan memenuhi sebagai tools atau alat pelaksana tes hasil belajar.

16

Anda mungkin juga menyukai