Anda di halaman 1dari 8

EduChannel Indonesia

Blog

WeBooks

LMS

Pembelajaran

Video

MENU

Diperbarui tanggal 4/Des/2022

Instrument Penilaian Tes dalam Pembelajaran

kategori Asesmen dan Evaluasi Pembelajaran / tanggal diterbitkan 2 Juni 2021 / dikunjungi:
5.68rb kali

Pengertian Instrumen Tes

Menurut arikunto (2003:40) instrument adalah alat yang digunakan untuk mengukur
kemampuan ataupun keterampilan siswa yang akan dinilai atau dievaluasi. Maksudnya
instrument adalah yang dapat digunkan untuk membantu proses evaluasi sehingga hasil yang
diperoleh akan lebih baik. Menurut uno (2013:109) dalam tes hasil belajar instrument adalah
alat yang dibunakan untuk mengukur hasil belajar. Menurut sugiyono (2010:95) menjelaskan
bahwa instrument merupakan suatu alat yang digunakan untuk mengukur fenomena alam
maupun social yang diamati. Menurut setyosari (2012:152) instrumen adalah alat ukur yang
dipakai selama pelaksanaan perlakuan. Sedangkan riduwan (2012:78) mengungkapkan
bahawa instrument merupakan alat untuk mengukur nilai variable yang akan diteliti.
Maksudnya adalah jika seorang peneliti ingin melakukan peneliti terhadap nilai ujian siswa
maka secara otomatis instrument yang digunakan oleh peneliti tersebut adalah sebuah tes.
Jadi dapat disimpulkan bahwa salah satu jenis instrument itu ialah tes.

Menurut arifin (2012:3) tes adalah alat pengumpulan data yang dirancang secara khusus.
Menurut nurjanah (2015:70) alat yang digunakan sebagai sarana untuk menentukan penilaian
atau evaluasi adalah tes. Menurut sudaryono (2013:63) tes adalah himpunan pertanyaan yang
hasrus dijawab. Ditanggapi atupun dilaksanakan oleh orang yang dites. Tes digunkan untuk
mengukur sejauh mana seorang siswa telah menguasai pelajaran yang telah disampaikan
selama proses pembelajaran. Menurut uno (2013:111) tes adalah seperangkat rangsangan
(stimuli) yang diberikan kepada seseorang dengan maksud untuk mendaptkan jawaban-
jawaban yang menjadi dasar bagi penetapan skor angka.

Sehingga dapat disimpulakan bahwa instrument tes adalah suatu alat yang terdiri dari
himpunan pertanyaan yang digunkan untuk mengukur kemampuan siswa dalam memahami
meteri pelajaran yang telah disampaikan.

Fungsi Instrumen Tes

Menurut arikunto (2013::165-167) fungsi dari tes 3 yaitu:

Fungsi untuk kelas ada 7 yaitu:

Mengadakan diagnosis tergadap kesulitan belajar siswa,

Mengevaluasi celah antara bakat dengan pencapaian,

Menaikkan tingkat prestasi,

Mengelompokkan siswa dalam kelas pada waktu metode kelompok,

Merencanakan kegiatan prose belajar-mengajar untuk siswa secara perorangan,

Menentukan siswa mana yang memerlukan bimbingan khusus, dan

Menentukan tingkat pencapaian untuk setiap anak.

Fungsi untuk bimbingan ada 3 yaitu:

Menentukan arah pembicaraan dengan orang tua tentang anak-anak mereka,

membantu siswa dalam menentukan pilihan,


Membantu siswa mencapai tujuan pendidikan dan jurusan.

Fungsi untuk administrasi ada 6 yaitu:

Memberi petunjuk dalam pengelompokan siswa,

Penempatan siswa baru,

Membantu siswa memilih kelompok,

menilai kurikulum,

Memperluas hubungan masyarakt (public relation),

Menyediakan informasi untuk badan-badan lain diluar sekolah.

Komponen Instrumen Tes

Menurut arikunto (2013::173-174) fungsi dari tes 4 yaitu:

Buku Tes, yakni lembaran atau buku yang memuat KD, indicator, kisi-kisi soal, ringkasan
rumus dan butir-butir soal yang harus dikerjakan oleh siswa.

Lembar Jawaban Tes, yakni lembaran yang disediakan oleh penilaian bagi testee untuk
mengerjakan tes. Untuk lembaran jawaban pilihan ganda disediakan petunjuk pengerjaan
apakah akan dilingkari atau disilang. Sedangkan untuk lembar jawaban essay akan diberikan
satu lembar halaman kosong uuntuk siswa mengerjakan soal yang diberikan.

Kunci Jawaban, berisi jawaban-jawaban yang dikehendaki. Kunci jawaban ini dapat diberupa
huruf-huruf yang dikehendaki atau kata/kalimat. Untuk tes uraian yang dituliskan adalah
kata-kata kunci ataupun kalimat singkat untuk memberikan ancar-ancar jawaban. Kunc jawab
ini diperlukan agar: 1) Pemeriksaan tes dapat dilakukan oleh orang lain, 2) pemeriksaannya
berul, 3) dilakukan dengan mudah, 4) Sesedikitnya mungkin masuknya unsur subjektif.

Pedoman Penilaian atau pedoman skoring berisi keterangan perincian tentang skor atau angka
yang diberikan kepada siswa bagi soal-soal yang telah dikerjakan.

Penyusunan Instrumen Tes


Menurut Djali dalam Sudaryono (2013:65) langkah-langkah dalam pengembangan instrument
tes ada 12 yaitu:

Menetetapkan tujuan tes. Sebelum mengembangkan insturmen tes terlebih dahulu tentukan
tujuan untuk keprluan apa.

Analisis kurikulum. Hal ini bertujuan untuk menentukan bobot setiap pokok bahasan.

Analisis buku pelajaran. Hal ini juga bertujuan untuk menentukan bobot setiap pokok
bahasan.

Membuat kisi-kisi. Manfaat kisi-kisi adalah untuk menjamin sampel soal yang baik, dalam
arti mencakup semua pokok bahasan secara proposional.

Penulisan tujuan instruksional khusus. Penulisan TIK harus sesuai dengan ketentuan yang
telah ditetapkan.

Penulisan soal. Dalam penulisan soal hal perlu diperhatikan adalah:

soal yang dibuat harus valid dalam arti dapat mengukur tercapai tidaknya tujuan
pembelajaran,

soal yang dibuat harus dapat dikerjakan dengan menggunkan satu kemampuan spesifik,

soal yang dibuat harus terlebih dahulu dikerjakan dan diselesaikan dengan langkah-langkah
lengkap sebelum digunakan pada tes yang sesungguhnya,

menetapkan sejak awal aspek kemampuan yang hendak diukur untuk setiap soal matematika
yang dibuat,

dalam membuat soal matematika, hindari sejauh mungkin kesalahan-kesalahan ketik betapa
kecilny, karena hak itu akan mempengaruhi validitas soal,

memberikan petunjuk mengerjakan soal secara lengkap dan jelas untuk setiap bentuk soal
matematika dalam suatu tes.

Telaah soal. Soal-soal yang dibuat masih mungkin terjadi kekurangan atau kekeliruan yang
menyangkut aspek kemampuan spesifik yang diukur, bahasa yang digunakan, kesalahan ketik
dan sebagainya.
Reproduksi tes terbatas. Tes yang sudah jadi diperbanyak dalam jumlah yang cukup menurut
jumlah sampel uji coba.

Uji-coba tes. Tes yang telah diperbanyak akan diuji-cobakan pada sejumlah sampel yang
telah ditentukan.

Analisis hasil uji-coba. Berdasarkan data hasil uji-coba dilakukan analisis, terutama analisis
butir soal yang meliputi validitas, reliable, tingkat kesukaran dan daya beda.

Revisi soal. Soal-soal yang valid berdasarkan kriterian empiric yang dikompirmasi dengan
kisi-kisi.

Merakit soal menjadi tes. Urutan soal dalam suatu tes dilakukan menurut tingkat kesukaran
soal yaitu dari soal yang mudah sampai soal yang sulit.

Kriteria Instrumen Tes yang Baik

Menurut Arikunto (2013::200-220) suatu tes dapat dikatakan baik apabila memenuhi lima
persyaratan, yaitu: validitas, reliabilitas, objektivitas, praktikabilitas dan ekonomis.

Validitas merupakan syarat yang terpenting dalam suatu alat evaluasi. Suatu tes disebut valid
apabila tes tersebut dapat mengukur apa yang hendak dan seharusnya diukur. Secara garis
besar ada 2 (dua) macam validitas, yaitu validitas tes dan validitas butir soal.

Validitas Tes terdiri dari dua macam validitas yaitu validitas isi dan validitas konstruksi
seperti dibawah ini

Validitas isi adalah validitas yang ditilik dari segi isi tes itu sendiri sebagai alat pengukur
hasil belajar, yaitu: sejauh mana tes hasil belajar sebagai alat pengukur hasilbelajar peserta
didik, isinya telah dapat mewakili secara representatif terhadap keseluruhan materi atau
bahan pelajaran yang seharusnya diteskan (diujikan). Pengujian validitas isi yang dilakukan
dengan menelaah butir (item review) dilakukan dengan mencermati kesesuaian isi butir yang
ditulis dengan perencanaan yang dituangkan dalam kisi-kisi. Butir-butir tes dinyatakan valid
(logically valid) apabila setelah mencermati isi butir-butir yang ditulis telah menunjukkan
kesesuaian dengan kisikisi.
Validitas konstruk adalah suatu tes di mana butir soal tersebut membangun setiap aspek
berfikir seperti yang disebutkan dalam tujuan instruksional khusus.44 Menurut Benjamin S.
Bloom bahwa taksonomi (pengelompokan) tujuan pendidikan harus senantiasa mengacu
kepada tiga jenis ranah (domain) yang melekat pada diri peserta didik, yaitu: Ranah proses
berpikir (cognitive domain), Ranah nilai atau sikap (affective domain), Ranah keterampilan
(psychomotor domain). Setiap domain disusun menjadi beberapa jenjang kemampuan, mulai
dari hal yang sederhana sampai dengan hal yang kompleks, mulai dari hal yang mudah
sampai dengan hal yang sukar, dan mulai dari hal yang konkrit sampai dengan hal yang
abstrak.

Validitas Butir Soal (item) dari suatu tes adalah ketepatan mengukur yang dimiliki oleh
sebuah item (yang merupakan bagian tak terpisahkan dari tes sebagai suatu totalitas), dalam
mengukur apa yang seharusnya diukur lewat butir item tersebut. Setiap butir item yang ada
dalam tes hasil belajar itu merupakan bagian tak terpisahkan dari tes hasil belajar tersebut
sebagai suatu totalitas. Eratnya hubungan antara item dengan tes hasil belajar sebagai suatu
totalitas itu kiranya dapat dipahami dari kenyataan, bahwa semakin banyak butir-butir item
yang dapat dijawab dengan betul oleh testee, maka skor-skor total hasil tes tersebut akan
semakin tinggi. Sebaliknya, semakin sedikit butir-butir item yang dapat dijawab dengan betul
oleh testee, maka skor-skor total hasil tes itu akan semakin rendah atau semakin menurun.

Reliabilitas adalah ketetapan atau ketelitian suatu alat evaluasi. Suatu tes atau alat evaluasi
dikatakan andal jika ia dapat dipercaya, konsisten, atau stabil dan produktif. Tes dikatakan
dapat dipercaya (reliable) jika memberikan hasil yang tetap atau ajeg (consistent) apabila
diteskan berkali-kali. Jika kepada siswa diberikan tes yang sama pada waktu yang berlainan,
maka setiap siswa akan tetap berada dalam urutan (rangking) yang sama atau ajek dalam
kelompoknya.

Obyektivitas atau Objektif berarti tidak adanya unsur pribadi yang mempengaruhinya. Lawan
dari objektif adalah subjektif, artinya terdapat unsur pribadi yang masuk memengaruhinya.
Sebuah tes dikatakan memiliki obyektivitas apabila dalam melaksanakan tes tidak ada faktor
subjektif yang memengaruhinya, terutama dalam sistem skoringnya. Ada 2 faktor yang
memengaruhi subjektivitas dari suatu tes, yaitu bentuk tes dan penilai. Bentuk tes uraian akan
memberi banyak kemungkinan kepada penilai untuk memberikan penilaian menurut caranya
sendiri. Dengan demikian maka hasil dari seorang siswa yang mengerjakan soal dari sebuah
tes, akan memperoleh skor yang berbeda apabila dinilai oleh dua orang. Itulah sebabnya pada
waktu sekarang ini ada kecenderungan penggunaan tes objektif di berbagai bidang. Untuk
menghindari masuknya unsur subjektivitas dari penilai, maka sistem skoringnya dapat
dilakukan dengan sebaik-baiknya, antara lain dengan membuat pedoman skoring terlebih
dahulu.

Praktikabilitas artinya praktis dan mudah pengadministrasiannya. Tes yang praktis adalah tes
yang: a) Mudah dilaksanakan, artinya tidak menuntut peralatan yang banyak dan memberi
kebebasan kepada siswa untuk mengerjakan terlebih dahulu bagian yang dianggap mudah
oleh siswa. b) Mudah pemeriksaannya, artinya bahwa tes itu dilengkapi dengan kunci
jawaban maupun pedoman skoringnya. Untuk soal bentuk obyektif, pemeriksaan akan lebih
mudah dilakukan jika dikerjakan oleh siswa dalam lembar jawaban.c) Dilengkapi dengan
petunjuk-petunjuk sehingga dapat diberikan oleh orang lain.

Ekonomis berarti biaya dengan kata lain pelaksanaan tes tersebut tidak membutuhkan biaya
yang mahal,tenaga yang banyak dan waktu yang lama.

Selain 5 kriteria yang disebutkan diatas ada 2 kriteria lagi. Akan tetapi 2 kriteria ini tidak
terlalu berpengaruh dalam menentukan instrumen tes tersebut baik atau tidak. Adapun 2
kriteria tersebut adalah sebagai berikut

Tingkat Kesukaran atau Analisis tingkat kesukaran soal artinya mengkaji soal-soal tes dari
segi kesulitan sehingga dapat diperoleh soal-soal yang termasuk muda, sedang dan sukar.
Tingkat kesukaran tes item pada umumnya ditunjukkan dengan persentase siswa yang
memperoleh jawaban item benar. Menentukan proporsi jumlah soal kategori mudah, sedang
dan sukar. Soal yang baik adalah soal yang tidak terlalu mudah atau tidak terlalu sukar. Soal
yang terlalu mudah tidak merangsang siswa untuk mempertinggi usaha memecahkannya.
Sebaliknya soal yang terlalu sukar akan menyebabkan siswa menjadi putus asa dan tidak
mempunyai semangat Ada beberapa dasar pertimbangan dalam menentukan proporsi jumlah
soal kategori mudah, sedang dan sukar. Pertimbangan pertama adalah keseimbangan, yakni
jumlah soal sama untuk ketiga kategori tersebut. Artinya soal mudah, sedang dan sukar
jumlahnya seimbang. Pertimbangan kedua proporsi jumlah soal untuk ketiga kategori
tersebut didasarkan atas kurva normal. Artinya, sebagian besar soal berada dalam kategori
sedang, sebagian lagi termasuk ke dalam kategori mudah dan sukar dengan proporsi yang
seimbang. Perbandingan antara soal mudah-sedang-sukar bisa dibuat 3-4-3. Artinya, 30%
soal kategori mudah, 40% soal kategori sedang, dan 30% lagi soal kategori sukar.

Daya Pembeda soal adalah kemampuan suatu soal untuk membedakan antara peserta didik
yang pandai (menguasai materi) dengan peserta didik yang kurang pandai (kurang atau tidak
menguasai materi. Analisis daya pembeda mengkaji butir-butir soal dengan tujuan untuk
mengetahui kesanggupan soal dalam membedakan siswa yang tergolong mampu
(tinggiprestasinya) dengan siswa yang tergolong kurang atau lemah prestasinya. Artinya, bila
soal tersebut diberikan kepada anak yang mampu, hasilnya menunjukkan prestasi yang tinggi,
dan bila diberikan kepada siswa yang lemah, hasilnya rendah. Langkah-langkah Menghitung
Daya pembeda item itu dapat diketahui melalui atau dengan melihat besar kecilnya angka
indeks diskriminasi D (d besar). Daya pembeda pada dasarnya dihitung atas dasar pembagian
testee ke dalam dua kelompok, yaitu kelompok pandai atau kelompok atas (upper group) dan
kelompok bodoh atau kelompok bawah (lower group). Adapun cara menentukan dua
kelompok itu bisa bervariasi, misalnya dapat menggunakan median sehingga pembagian
menjadi dua kelompok itu terdiri atas 50% testee kelompok atas dan 50% testee kelompok
bawah, dapat juga dengan hanya mengambil 20% dari testee yang termasuk dalam kelompok
atas dan 20% lainnya diambil dari testee yang termasuk dalam kelompok bawah, dapat juga
menggunakan angka persentase lainnya. Namun pada umumnya para pakar di bidang
evaluasi pendidikan lebih banyak menggunakan persentase sebesar 27% dari testeeyang
termasuk dalam kelompok atas dan 27% lainnya diambilkan dari testee yang termasuk dalam
kelompok bawah. Hal ini disebabkan karena berdasarkan bukti-bukti empirik pengambilan
subyek sebanyak 27% testee kelompok atas dan 27% testee kelompok bawah itu telah
menunjukkan kesensitifannya, atau dengan kata lain cukup dapat diandalkan.

Anda mungkin juga menyukai