Anda di halaman 1dari 31

KATA PENGANTAR

Puji syukur penyusun ucapkan kepada Tuhan Yang Maha Esa, berkat rahmat dan
karunianya, penyusun dapat menyelesaikan makalah ini dengan judul “Makalah Tes” guna untuk
memenuhi tugas mata kuliah evaluasi pembelajaran matematika.

Penyusun mengucapkan terimakasih kepada semua pihak yang telah berperan dalam
membantu penyusun menyelesaikan makalah ini, khususnya ibu ……… selaku dosen
pembimbing mata kuliah Bimbingan Konseling yang telah membimbing dan mengarahkan
penyusun dalam penyelesaian makalah ini.

Penyusun menyadari bahwa isi makalah ini masih terdapat kekurangan, untuk itu kritik
dan saran penyusun harapkan kepada pembaca demi kesempurnaan makalah ini. Akhir kata
penyusun mengucapkan terimakasih.

Padang, 02 Oktober 2018

Kelompok 9
DAFTAR ISI

KATA PENGANTAR..................................................................................................................ii

DAFTAR ISI...............................................................................................................................iii

BAB I PENDAHULUAN.............................................................................................................1

A. Latar Belakang.............................................................................................................1

B. Rumusan Masalah........................................................................................................1

C. Tujuan Penulisan..........................................................................................................1

D. Manfaat Penulisan........................................................................................................2

BAB II PEMBAHASAN..............................................................................................................3

A. Pengertian Tes......................................................................................................3

B. Jenis-jenis Tes......................................................................................................6

C. Validitas Tes....................................................................................................10

D. Reabilitas Tes..................................................................11

E. Indeks Kesukaran.........................................................................................................13

F. Indeks Daya Pembeda

BAB III PENUTUP.....................................................................................................................14

A. Kesimpulan.................................................................................................................14

B. Saran...........................................................................................................................14

DAFTAR PUSTAKA.................................................................................................................16
BAB I
PENDAHULUAN

A. Latar Belakang
Analisis kualitas instrumen evaluasi atau istilah lainnya kualitas alat evaluasi merupakan
hal penting dalam melakukan evaluasi karena kita merasa bahwa instrumen atau alat ukur yang
dibuat ada banyak kelemahannya dari beberapa sisi. Kelemahan itu bisa terjadi karena alat untuk
mengevaluasi tidak tepat untuk mengevaluasi, berbobot mudah, sedang, dan sukar bagi siswa.
Soal yang terlalu sukar untuk menilai peserta didik menyebabkan harapan dalam pembelajaran
tidak tercapai. Demikian pula halnya dengan instrumen yang terlalu mudah untuk dijawab,
menyebabkan kesukaran dalam mengkategorisasikan mana siswa yang pintar dan yang tidak
pintar. Kualitas alat evaluasi dimunculkan ke permukaan ketika seorang guru melakukan tes
selesai proses pembelajaran selama empat bulan kemudian hasilnya dicermati dan ternyata tidak
sesuai dengan apa yang diharapkan yakni menunjukkan apa di bawah rerata yang dicapai guru.
Di manakah letak kesalahannya? Apakah ada di guru atau di siswa?
Kalau kesalahan ada pada guru maka menjadi persoalan baru adalah bagaimana metode
mengajar yang dilakukan guru? Bagaimanakah keadaan alat evaluasi itu?
Ada cara dengan mengumpulkan rencana pelaksanaan pembelajaran selama empat bulan
dilihat dan dianalisis tujuan pembelajaran yang ditulis tidak terlalu tinggi, sesuai dangan tingkat
perkembangan siswa. Dilihat dari sisi lain yaitu proses pelaksanaan pembelajaran yang dilakukan
guru, berjalan dengan baik sesuai dengan acuan rencana pelaksanaan pembelajaran seperti
memilih metode, pendekatan, startegi, dan media yang baik untuk mendukung proses
pembelajaran.
Ada hubungan timbal balik antara tujuan pembelajaran, proses pembelajaran dan
penilaian hasil belajar. Bila kedua hal yakni tujuan dan proses pembelajaran tidak bermasalah
maka persoalan yang ada dengan nilai hasil belajar rendah tidak sesuai dengan yang diharapkan,
adalah alat penilaian. Dipertanyakan alat kualitas penilaian apakah sudah baik atu belum untuk
mengukur tujuan pembelajaran dan indikator kompetensi yang telah ditentukan?
Menguji instrumen dalam hal ini perlu sekali, di samping kesesuaian instrumen yang
dibuat dengan objekyang akan diuji diakatakan juga bahwaperlu diuji kualitas instrumen untuk
dapat dipakai pada lain kesempatan dan objek lain dalam satuan pendidikan yang sama.
Kadangkala kita menemui instrumen seperti tes soal matematika yang tidak dapat diapakai
untukmenguji objek sekolah yang berbeda walaupun sama satuan pendidikannya. Kualitas
instrumen evaluasi yang rendah menyebabkan produk lulusan yang tidak baik.
Beberapa manfaat dan kepentingan lain perlunya kualitas instrumen evaluasi yang baik
antara lain untuk:
1. membentuk bank soal standar
2. menentukan grade tingkat mutu lembaga pendidikan
3. memudahkan mengambil data lapangan yang berkualitas.
Dalam menganalisis kualitas instrumen evaluasi dilakukan uji validitas, uji realibiltas,
daya beda instrumen dan tingkat kesukaran instrumen.

B. Rumusan Masalah

1. Apa yang dimaksud dengan tes?


2. Apakah jenis-jenis tes?
3. Apa yang dimaksud validitas tes?
4. Apa yang dimaksud reliabilitas tes?
5. Apa yang dimaksud dengan indeks kesukaran?
6. Bagaimana cara menentukan indeks daya pembeda?

C. Tujuan Penulisan
1. Untuk mengetahui apa itu tes.
2. Untuk mengetahui jenis-jenis tes.
3. Untuk mengetahui pengertian validitas tes
4. Untuk mengetahui pengertian reliabilitas tes
5. Untuk mengetahui cara menentukan daya beda
6. Untuk mengetahui pengertian indeks kesukaran.

D. Manfaat Penulisan
Manfaat yang dapat diperoleh dari penulisan makalah ini mencakup beberapa yang terkait
diantaranya sebagai berikut :
1. Bagi Mahasiswa

Makalah ini dapat digunakan sebagai bahan referensi atau masukan tentang kualitas alat
penilaian. Kualitas alat penilaian ini sangat bermanfaat bagi mahasiswa sebagai calon guru.

2. Bagi Masyarakat umum

Sebagai bahan bacaan yang bermanfaat untuk menambah pengetahuan tentang evaluasi
pembelajaran bahas, serta untuk menambahkan peran aktif masyarakat dalam pendidikan.

BAB II

PEMBAHASAN

A. Instrumen evaluasi Tes

1. Pengertian Tes
Tes secara sederhana dapat diartikan sebagai himpunan pertanyaan yang harus dijawab,
pernyataan-pernyataan yang harus dipilih/ditanggapi, atau tugas-tugas yang harus dilakukan oleh
peserta tes dengan tujuan untuk mengukur suatu aspek tertentu dari peserta tes. Dalam kaitan
dengan pembelajaran aspek tersebut adalah indikator pencapaian kompetensi. Tes berasal dari
bahasa Perancis yaitu “testum” yang berarti piring untuk menyisihkan logam mulia dari material
lain seperti pasir, batu, tanah, dan sebagainya. Kemudian diadopsi dalam psikologi dan
pendidikan untuk menjelaskan sebuah instrumen yang dikembangkan untuk dapat melihat dan
mengukur dan menemukan peserta Tes yang memenuhi criteria tertentu. Cronbach(dalam Azwar,
2005) mendefinisikan tes sebagai “a systematic procedure for observing a person’s behavior and
describing it with the aid of a numerical scale or category system”. Sedangkan Menurut Ebster’s
Collegiate (dalam Arikunto, 1995), tes adalah serangkaian pertanyaan atau latihan atau alat lain
yang digunakan untuk mengukur keterampilan, pengetahuan, intelegensia, kemampuan atau
bakat yang dimiliki oleh individu atau kelompok.

Keunggulan metode ini adalah


 Hanya mengukur satu aspek data
 Memerlukan jangka waktu yang panjang karena harus dilakukan secara berulang-ulang
 Hanya mengukur keadaan siswa pada saat tes itu dilakukan.

Dalam perkembangannya istilah tes diadobsi dalam psikologi dan pendidikan.


Tes pada dasarnya adalah alat ukur atribut psikologis yang objektif atas sampel perilaku
tertentu.
Dalam psikologi, tes dapat diklasifikasikan menjadi empat, yaitu:

a. tes yang mengukur intelegensia umum yang dirancang untuk mengukur kemampuan
umum seseorang dalam suatu tugas
b. tes yang mengukur kemampuan khusus atau tes bakat yang dibuat untuk mengungkap
kemampuan potensial dalam bidang tertentu
c. tes yang ditujukan untuk mengukur prestasi yang digunakan untuk mengungkapkan
kemampuan aktual sebagai hasil belajar
d. tes yang mengungkap aspek kepribadian (personality assesment) yang bertujuan
mengungkap karakteristik individual subjek dalam aspek yang diukur.

Untuk mengumpulkan data penelitian tentang hasil belajar atau prestasi belajar bisa
dilakukan dengan memakai instrumen tes. Kata tes secara harfiah berasal dari istilah Perancis
kuno yaitu testum, yang mempunyai arti “piring yang berfungsi menyisihkan logam - logam
mulia yang nilainya sangat tinggi seperti emas”. Sedangkan, di dalam bahasa Inggris testum ini
dikenal dengan test yang kemudian diterjemahkan dalam bahasa Indonesia yang berarti tes,
percobaan atau ujian, dan kata ini di dalam bahasa Arab sama artinya dengan imtihan.
Secara teoritis, test merupakan suatu alat atau prosedur yang dipakai dalam rangka
kegiatan pengukuran dan penilaian. Tes merupakan bagian tersempit dari penilaian. Menurut
Dejamri (2008:67), tes ,erupakan salah satu cara untuk menaksirkan besarnya kemampuan
seseoarng secaratidak langsung, yaitu melalui respons seseorang terhadap stimulus atau
pertanyaan. Tes juga dapat diartikan sebagai jumlah pertanyaan yang harus diberikan tanggapan
dengan tujuan untuk mengukur tingkat kemampuan seseorang atau mengungkap aspek tertentu
dari orang yang dikenai tes. Tester merupakan orang yang melakukan tes, pembuat tes atau
eksperimentor merupakan orang yang melakukan percobaan dengan menggunakan tes,
sedangkan testee merupakan orang yang dikenai tes atau yang sedang dikenai percobaan
(Dimyati dan Mudjiono,1999:209).

Tes juga dapat diartikan berupa sejumlah pertanyaan yang diberikan kepada seseorang
untuk diberi respon atau dijawab. Sedangkan, pengukuran mempunyai pengertian lebih luas lagi
bila dibandingkan dengan tes. Adapun evaluasi, merupakan suatu proses pengumpulan informasi
guna membuat sebuah penilaian terhadap sesuatu, yang selanjutnya dipakai sebagai bahan
pertimbangan dalam mengambil suatu keputusan (Farida, 2008189-190).

2. Jenis Dan Bentuk Evaluasi Dalam Pembelajaran


Dalam pendidikan terdapat bermacam-macam instrumen atau alat evaluasi yang dapat
dipergunakan untuk menilai proses dan hasil pendidikan yang telah dilakukan terhadap anak
didik. Instumen evaluasi itu dapat digolongkan menjadi dua yakni, tes dengan non-tes yang lebih
lanjut akan dipaparkan dibawah ini.
a. Tes.
Istilah “tes” berasal dari bahasa Perancis, yaitu “testum”, berarti piring yang digunakan
untuk memilih logam mulia dari benda-benda lain, seperti pasir, batu, tanah, dan sebagainya. Tes
merupakan suatu teknik atau cara yang digunakan dalam rangka melaksanakan kegiatan
pengukuran, yang di dalamnya terdapat serangkaian pertanyaan atau latihan atau alat lain yang
digunakan untuk mengukur keterampilan, pengetahuan, kecerdasan, kemampuan, atau bakat
yang dimiliki oleh sesesorang atau kelompok.
Dilihat dari bentuknya, maka penilaian jenis tes ini dapat diklasifikasikan menjadi 3
bagian, yaitu:
1) Tes Tertulis
Tes tertulis adalah tes yang soal-soalnya harus dijawab peserta didik dengan memberikan
jawaban tertulis. Jenis tes tertulis secara umum dapat dikelompokkan menjadi dua yaitu:
a. Tes Bentuk Uraian
Bentuk uraian dapat digunakan untuk mengatur kegiatan-kegiatan belajar yang sulit diukur
oleh bentuk objektif. Disebut bentuk uraian, karena menuntut peserta didik untuk menguraikan,
mengorganisasikan dan menyatakan jawaban dengan kata-katanya sendiri dalam bentuk, teknik,
dan gaya yang berbeda satu dengan yang lainnya.
Dilihat dari luas-sempitnya materi yang ditanyakan, maka tes bentuk uraian ini dapat dibagi
menjadi 2 bentuk, yaitu:
a.) Uraian Terbatas (Restricted Respons Items)
Dalam menjawab soal bentuk uraian ini, peserta didik harus mengemukakan hal-hal
tertentu sebagai batas-batasnya. Walaupun kalimat jawaban peserta didik itu beraneka ragam,
tetap harus ada pokok-pokok penting yang terdapat dalam sistematika jawabannya sesuai dengan
batas-batas yang telah ditentukan dan dikendaki dalam soalnya. Contoh:
 Jelaskan bagaimana prosedur operasional sebuah pesawat komputer!
 Sebutkan lima komponen dalam sistem komputer!

b.) Uraian Bebas (Extended Respons Items)


Dalam bentuk ini peserta didik bebas untuk menjawab soal dengan cara dan sistematika
sendiri. Peserta didik bebas mengemukakan pendapat sesuai dengan kemampuannya. Oleh
karena itu, setiap peserta didik mempunyai cara dan sistematika yang berbeda-beda. Namun,
guru tetap mempunyai acuan atau patokan dalam mengoreksi jawaban peserta didik nanti.
Contoh:
 Bagaimana perkembangan komputer di Indonesia, jelaskan secara singkat!
 Bagaimana peranan komputer dalam pendidikan!
Dalam menyusun soal bentuk uraian, ada baiknya guru mengikuti petunjuk praktis
berikut ini.
(1) Setiap pertanyaan hendaknya menggunakan petunjuk dan rumusan yang jelas dan mudah
dipahami.
(2) Jangan memberikan kesempatan kepada peserta didik untuk memilih beberapa soal dari
sejumlah soal yang diberikan, sebab cara demikian tidak memungkinkan untuk memperoleh
skor yang dapat dibandingkan.
(3) Instrumen soalnya dapat berupa: menjelaskan, menelaah, mendeskripsikan, membandingkan,
mengemukakan kritik, memecahkan masalah, dan lain sebagainya.
Terdapat kelebihan dan kekurangan yang dimiliki pada soal bentuk uraian,. Adapun
kelebihan bentuk soal uraian antara lain:
- Proses penyusunan soal relatif mudah.
- Memberikan kebebasan luas kepada peserta didik untuk menyatakan tanggapannya.
- Dapat mengukur kemampuan mengorganisasikan pikiran.
- Mengurangi faktor menebak dalam menjawab.
Sedangkan kelemahan bentuk soal uraian antara lain:
- Proses pengoreksian membutuhkan waktu yang relatif lama.
- Ada kecenderungan dari guru bersikap subjektif.
- Guru sering terkecoh dalam memberikan nilai, karena keindahan kalimat dan tulisannya.

b. Tes Bentuk Objektif


Tes objektif sering juga disebut tes dikotomi (dichotomously scored item) karena
jawabannya antara benar atau salah dan skornya antara 1 atau 0.
Tes objektif terdiri dari beberapa bentuk, antara lain:
b.1. Benar-Salah (True-False, or Yes-No)
Bentuk tes benar-salah (B-S) adalah pernyataan yang mengandung dua kemungkinan
jawaban, yaitu benar atau salah. Salah satu fungsi bentuk soal benar-salah adalah untuk
mengukur kemampuan peserta didik dalam membedakan antara fakta dengan pendapat. Bentuk
soal seperti ini lebih banyak digunakan unyuk mengukur kemampuan mengidentifikasi informasi
berdasarkan hubungan yang sederhana.
Ada beberapa teknik/petunjuk praktis dalam penyusunan soal bentuk B-S, yaitu:
(1) Jumlah item yang benar dan salah hendaknya sama.
(2) Berilah petunjuk cara mengerjakan soal yang jelas dan memakai kalimat sederhana.
(3) Hendaknya jumlah item cukup banyak, sehingga dapat dipertanggungjawabkan.
b.2. Pilihan Ganda (Multiple Choice)
Soal tes bentuk pilihan ganda dapat digunakan untuk mengukur hasil belajar yang lebih
kompleks dan berkenaan dengan aspek ingatan, pengertian, aplikasi, analisis, sintesis, dan
evaluasi. Pilihan jawaban (option) terdiri atas jawaban yang benar atau paling benar, selanjutnya
disebut kunci jawaban dan kemungkinan jawaban salah yang dinamakan pengecoh
(distractor/decoy/fails).1[1]
Beberapa petunjuk praktis dalam menyusun soal bentuk pilihan ganda, yaitu:
- Harus mengacu pada kompetensi dasar dan indikator soal.
- Jangan memasukkan materi soal yang tidak relevan dengan apa yang sudah dipelajari peserta
didik.
- Pernyataan dan pilihan hendaknya merupakan kesatuan kalimat yang tidak terputus.
- Harus diyakini bahwa hanya ada satu jawaban yang benar.
- Bila perlu beri jawaban pengecohnya.

Kebaikan soal bentuk pilihan-ganda, antara lain: (1) cara penilaian dapat dilakukan dengan
mudah, cepat, dan objektif, (2) dapat mencakup ruang lingkup bahan/materi yang luas, (3)
mampu mengungkap tingkat kognitif rendah sampai tinggi, dan (4) dapat digunakan berulang
kali.
Sedangkan kelemahannya antara lain: (1) proses penyusunan soal benar-benar membutuhkan
waktu yang lama, (2) memberi peluang siswa untuk menebak jawaban, dan (3) kurang mampu
meningkatkan daya nalar siswa.

c.) Menjodohkan (Matching)


Soal tes bntuk menjodohkan terdiri atas kumpulan soal dan kumpulan jawaban yang
keduanya dikumpulkan pada dua kolom berbeda, yaitu kolom sebelah kiri menunjukkan
kumpulan persoalan, dan kolom sebelah kanan menunjukkan kumpulan jawaban. Bentuk soal
seperti ini sangat baik untuk mengukur kemampuan peserta didik dalam mengidentifikasi
hubungan antara dua hal.
Untuk penyusunan soal bentuk ini perlu memperhatikan teknik berikut:
(1) Sesuaiakan dengan kompetensi dasar dan indikator.
(2) Kumpulan soal diletakkan di sebelah kiri, dan jawaban di sebelah kanan.
(3) Gunakan kalimat singkat dan terarah pada pokok persoalan.
(4) Melengkapi (Completion)
Soal bentuk melengkapi (completion) dikemukakan dalam kalimat yang tidak lengkap.
Beberapa petunjuk teknis dalam penyusunan soal bentuk melengkapi (completion), antara
lain:
(1) Hendaknya tidak mengambil pernyataan langsung dari buku (textbook).
(2) Titik-titik kosong sebagai tempat jawaban hendaknya diletakkan di akhir kalimat.
(3) Jangan menyediakan titik-titik kosong terlalu banyak.
(4) Jika perlu, dapat diberi gambar-gambar sehingga dapat dipersingkat dan jelas.2[2]

2. Tes Lisan
Tes lisan yakni tes yang pelaksanaannya dilakukan dengan mengadakan tanya jawab
secara langsung antara pendidik dan peserta didik. Tes ini memiliki kelebihan dan kelemahan.
Kelebihannya antara sebagai berikut.
1.) Dapat menilai kemampuan dan tingkat pengetahuan yang dimiliki peserta didik, sikap, serta
kepribadiannya karena dilakukan secara berhadapan langsung.
2.) Bagi peserta didik yang kemampuan berpikirnya relatif lambat sehingga sering mengalami
kesukaran dalam memahami pernyataan soal, tes bentuk ini dapat menolong sebab peserta didik
dapat menanyakan langsung kejelasan pertanyaan yang dimaksud.
3.) Hasil tes dapat langsung diketahui peserta didik.
Sedangkan kelemahan dari tes lisan adalah sebagai berikut.
1.) Subjektivitas guru sering mencemari hasil tes
2.) Waktu pelaksanaan yang diperlukan relatif cukup lama.
3. Tes Perbuatan
Tes perbuatan yakni tes yang penugasannya disampaikan dalam bentuk lisan atau tertulis
dan pelaksanaan tugasnya dinyatakan dengan perbuatan atau unjuk kerja. Penilaian tes perbuatan
dilakukan sejak peserta didik melakukan persiapan, melaksanakan tugas, sampai dengan hasil
yang dicapainya.
Untuk menilai tes perbuatan pada umumnya diperlukan sebuah format pengamatan, yang
bentuknya dibuat sedemikian rupa agar pendidik dapat menuliskan angka-angka yang
diperolehnya pada tempat yang sudah disediakan. Bentuk formatnya dapat disesuaikan menurut
keperluan. Untuk tes perbuatan yang sifatnya individual, sebaiknya menggunakan format
pengamatan individual. Untuk tes perbuatan yang dilaksanakan secara kelompok digunakan
format tertentu yang sudah disesuaikan untuk keperluan pengamatan kelompok.3

3. Validitas Tes

Validitas berasal dari kata validity yang berarti sejauh mana ketepatan dan kecermatan
suatu alat ukur dalam melakukan fungsi ukurnya. Menurut Scarvia B. Anderson dkk suatu tes
dikatakan valid apabila tes tersebut mengukur apa yang hendak diukur. Valid berarti shahih,
artinya keabsahan instrumen itu tidak diragukan lagi. Suatu tes atau nontes dari alat ukur atau
instrmen pengukuran diikatakan memiliki valiidtas yang tngg apabla alat tersebut menjalankan
fungsi ukurnya atau memberikan hasil ukur yang sesuai dengan maksud dilakukannya
pengukuran itu. Hasil ukur dari pengukuran merupakan besaran yang mencerminkan secara tepat
dan fakta atau keadaan yang sesungguhnya dari apa yang diukur. Diberikan tes kepada
sekelompok orang misalkan berhubungan dengan kemampuan mekanik terhadap mobil, maka
skor yang diperoleh berhubungan dengan kemampuan seseorang dalam mengendarai dan
memperbaiki mobil bukan kemampuan seseorang berkenaan dengan pengetahuan tentang mobil
seperti macam-macam mobil, jenis mobil yang baik, dan sebagainya. Contoh lain misalkan
gurumemberi tes tentang penalaran kritis seorang siswa berkaitan dengan soal konsep
matematika, bukan skor yang berkaitan dengan kemampuan penerapan konsep matematika
ataukemampuan menyelesaikan soal cerita dalam matematika.

Validitas instrumen mempermasalahkan apakah instrumen atau tes tersebut benar-benar


mengukur apa yang hendak diukur. Cureton dalam tahun 1978 yang dikutip Djaali menagatkan
“ the essential question of test validity iis how well a test does the job it employed to do”.
Maksudnya seberapa jauh suatu tesmampu mengungkapkan dengan tepat cir atau keadaan yang
sesungguhnya dari objek ukur akan tergantung dari tingkat validitas tes yang bersangkutan. Ada
suatu sikap yang dbangun pada peneliti atau guru bahwa soal yang dibuat belum tentu sempurna
dan perlu diuji keabsahannya, karena bisa saja ada beberapa soal tes yang dibuat invalid
sehiingga akan bias hasilnya ketika akan diminta siswa untuk menyelesaikannya. Validitas
berasal dari kata validity yang berarti sejauh mana ketepatan dan kecermatan suatu alat ukur
dalam melakukan fungsi ukurnya.
Pada tahun 1975 Cronbach menyatakan bahwa suatu alat ukur yang valid untuk tujuan
tertentu atau pengambilan keputusan tertentu mungkin tidak valid untuk tujuan atau
pengambilan keputusan lain. Validitas suatu tes atau alat ukur harus dikaitkan dengan tujuan atau
pegambilan keputusan lain. Validitas suatu tes atau alat ukur harus dikaitka dengan tujuan, agar
soal tes atau nontes yang disusun terarah berangkat dari tujuan pembelejaran yang ditentukan.
Untuk itu perlu dipahami keberadaan indikator kompetensi suatu pokok bahasan atau subpokok
bahasan.

Berdasarkan pengertian di atas tentang validitas dapatlah dismpulkan definisi validitas


adalah derajat yang menunjukkan sejauh mana ketepatan dan kecermatan suatu alat ukur tes atau
nontes dalam melakukan fungsi ukurnya benar-benar mengukur apa yang hendak diukur. Alat
ukur iitu hanya valid untuk suatu tujuan, tidak universal. Contoh seorang guru membuat suatu tes
matematika yang valid untuk satuan pendidikan SMA belum tentu valid untuk SMK, walaupun
pokok bahasannya sama misalkan statistik. Derajat validitas hanya berlaku untuk suatu
kelompok tertentu yang memang telah direncanakan pemakainya oleh si pembuat instrumen.

Validitas suatu instrumen tes secara umum dibagi dua yaitu validitas teori dan validitas
empirik. Pembagan lain dari macam validitas menjadiempat bagian yaitu validitas isi, konstruk,
konkuren, dan prediksi. Validitas konkuren dan validitas prediksi masuk dalam validitas empirik.
Pembagian lain dari validitas adalah validitas logik dan validitas empirik.

Validitas Secara Umum Dikelompokkan Menjadi Dua :

1. Validitas teori

Validitas teoritik atau validitas logik adalah validitas alat evaluasi yang dilakukan
berdasarkan pertimbangan (judgement) teoritik atau logika yang dilakukan oleh para ahli atau
orang yang dianggap ahli. Validitas teori ini pula terbagi atas dua yaitu:

a. Validitas isi (content validity)

Validitas isi adalah suatu tes yang mempermasalahkan seberapa jauh suatu tes mengukur
tingkat penguasaan terhadap isi suatu materi tertentu yang seharusnya dikuasai sesuai dengan
tujuan pengajaran. Dalam pengertian lain validitas isi mengacu pada seberapa banyak materi tes
tersebut dapat mengukur keseluruhan bahan atau materi yang telah diajarkan, merupakan
tuntutan yang harus dipenuhi oleh tes hasil belajar. Validitas isi menurut Sukari adalah derajat di
mana sebuah tes mengukur cakupan substansi yang ingin diukur. Tes yang mempunyai validitas
isi yang baik ialah tes yang benar-benar mengukur penguasan materi yang seharusnya dikuasai
sesuai dengan konten pengajaran yang tercantum dalam garis-garis besar program pengajaran,
tugas atau butir dalam suatu tes atau instrumen mampu mewakili secara keseluruhan dan
proporsional perilaku sampel yang dikenal tes tersebut. Menurut Suharsini Arikunto “sebuah tes
dikatakan memiliki validitas isi apabila mengukur tujuan pembelajaran tertentu yang sejajar
dengan materi atau isi pembelajaran yang diberikan. Oleh karena itu materi yang diajarkan
tertera dalam kurikulum maka validitas isi ini dikatakan validitas kurikuler. Validitas isi dapat
diusahakan tercapainya sejak saat penyusunan dengan cara memerinci atau materi buku pelajaran.
Tes mencerminkan keseluruhan konten atau materi yang diujikan atau yang seharusnya dikuasai
secara proporsional. Untuk menhgetahui apakah tes itu valid atau tidak harus dilakukan melalui
penelaahan kisi-kisi tes untuk memastikan bahwa soal-soal tes itu sudah mewakili atau
mencerminkan keseluruhan konten atau materi yang seharusnya dikuasai secara proporsional.
Oleh karena itu, validitas isi suau tes tidak mempunyai besaran tertentu yang dihitung secara
statistika, tetapi dipahami bahwa tes itu sudah valid berdasarkan telaah kisi-kisi tes.

Wierma dan Jurs (1991) menyatakan bahwa validitas isi sebenarnya mendasarkan pada
analisis logika jadi tidak merupakan suatu koefisien validitas yang dihitung secara statistika.
Untuk memperbaiki validitas suatu tes maka isi suatu tes harus diusahakan agar mencakup suatu
pokok atau subpokok bahasan yang hendak diukur. Kriteria untuk menentukan proporsi masing-
masing pokok atau subpokok bahasan yang tercakup dalam suatu tes ialah berdasarkan pada
banyaknya isi atau materi masing-masing pokok bahasan atau subpokok bahasan seperti
tercantum dalam kurikulum atau garis-garis besar program pengajaran. Selain itu penentuan
proporsi tersebut dapat pula didasarkan pendapat para ahli dalam bidang yang bersangkutan.
Dengan demikian, dapat dikatakan suatu tes akan mempunyai validitas isi yang baik jika tes
tersebut terdiri dari item-item yang mewakili semua materi yang hendakdiukur. Salah satu cara
yang biasa dilakukan untuk memperbaiki validitas isi suatu tes ialah dengan menggunakan blue
print untuk menentukan kisi-kisi tes.

b. Validitas konstruk (construct validity)

Validitas konstruk adalah validitas yang mempermasalahkan seberapa jauh item-item tes
mampu mengukur apa yang benar-benar hendak diukur sesuai dengan konsep khusus atau
definisi konseptual yang telah diterapkan. Validitas konstruk biasanya digunakan untuk
instrumen-instrumen yang dimaksudkan untuk mengukur variabel-variabel konsep baik yang
sifatnya performansi tipikal seperti instrumen untuk mengukur sikap, minat, konsep diri, fokus
kontrol, gaya kepemimpinan, motivasi berprestasi, dan sebagainya maupun yang sifatnya
performansi maksimum seperti instrumen untuk mengukur bakat, intelegensi, kecerdasan
emosional, dan sebagainya. Untuk menentukan validitas konstruk suatu instrumen harus
dilakukan proses penelaahan teoritis dari suatu konsep dari variabel yang hendak diukur, mulai
dari perumusan konstruk, penentuan dimensi dan indikator, sampai kepada penjabaran dan
penulisan butir-butir item instrumen. Perumusan konstruk harus dilakukan berdasarkan sintesis
dari teori-teori mengenai konsep variabel yang hendak diukur melalui proses analisis dan
komparasi yang logik dan cermat. Dimensi dan indikator dijabarkan dari konstruk yang telah
dirumuskan dengan memperhatikan hal-hal:

1. Seberapa jauh indikatoor tersebut merupakan indikator yang tepat dan konstruk yang telah
dirumuskan.
2. Indikator-indikator dari suatu konstruk harus homogen, konsisten, dan konvergen untuk
mengukur konstruk dari variabel yang hendak diukur.

3. Indikator-indikator tersebut harus lengkapuntuk menguukur suatu konstruk secara utuh.

Butir-butir instrumen yang ditulis untuk masing-masing indikator harus benar-benar


dapat mengukur secara tepat indikator yang hendak diukur. Jumlah butir untuk mengukur setiap
indikator harus disesuaikan dengan bobot atau penilaian masing-masing indikator sebagai
penanda konsep variabel yang hendak diukur. Validitas konstruk suatu instrumen harus
dilakukan melalui penelaahan atau justifikasi pakar atau melalui penialaian sekelompok panel
yang terdiri dari orang-orang yang menguasai substansi atau konten dari variabel yang hendak
diukur.

2. Validitas Empiris

Validitas empiris sama dengan validitas kriteria yang berarti bahwa validitas ditentukan
berdasarkan kriteria baik kriteria internal maupun kriteria eksternal. Kriteria internal adalah tes
atau instrumen itu sendiri yang menjadi kriteria, sedangkan kriteria eksternal adalah hasil ukur
instrumen atau tes lain diluar instrumen itu sendiri yang menjadi kriteria. Ukuran lain yang
dianggap sudah baku atau dapat dipercaya dapat pula dijadikan sebagai kriteria eksternal.
Validitas yang ditentukan berdasarkan kriteria internal disebut validitas internal sedangkan
validitas yang ditentukan berdasarkan kriteria eksternal disebut validitas eksternal. Validitas
eksternal dapat dijadikan menjadi dua macam yaitu

1. Validitas konkuren

Validitas konkuren atau “ada sekarang” lebih dikenal dengan validitas empiris, dimana
suatu tes dikatakan memeiliki validitas “ada sekarang” jika hasilnya sesuai dengan pengalaman.
Kata sesuai mempunyai konotasi ada dua hal yang dipasangkan dalam hal ini hasil tes
dipasangkan dengan hasil pengalaman. Pengalaman selalu mengenai hasil yang telah lampau
sehingga data pengalaman tersebut sekarang sudah ada. Misalkan seorang guru matematika ingin
tes sumatif yang disusun sudah valid atau belum untuk itu diperlukan suatu kriteria masa lalu
yang sekarang datanya dimiliki misalkan nilai ulangan harian atau nilai ulangan sumatif.

2. Validitas prediksi

Validitas prediksi adalah tes yang mempunyai kemampuan meramalkan apa yang akan
terjadi pada masa yang akan datang. Misalkan tes masuk perguruan tinggi diamana ada tes
potensi akademik, tes matematika, tes ipa dan lain-lain, diperkirakan mampu meramal
keberhasilan peserta tes dalam mengikuti kuliah dimasa yang akan datang. Calon yang disaring
berdasarkan hasil tes diharapkan mencerminkan tinggi rendah kemampuan mengikuti
perkuliahan. Jika nilai tesnya tinggi tentu menjamin keberhasilannya dalam bidang akademik,
demikian sebaliknya. Sebagai alat pembanding validitas prediksi adalah nilai-nilai yang
diperoleh peserta tes mengikuti pelajaran di perguruan tinggi. Jika ternyata siapa yang memiliki
nilai tes yang lebih tinggi gagal dalam ujian semester dibandingkan dengan mahasiswa yang
dahulu nilai tesnya lebih rendah maka tes masuk yang dimaksud itu tidak memiliki validitas
prediksi.

Sedangkan validitas internal termasuk kelompok validitas kriteria yang merupakan


validitas yang diukur dengan besaran yang menggunakkan instrumen sebagai suatu kesatuan
sebagai kriteria untuk menentukan validtas item atau butir dari instrumen itu. Dengan demikian
internal mempermasalahkan validitas butir atau item suatu instrumen dengan manggunakan hasil
ukur instrumen tersebut konsisten dengan hasil ukur secara keseluruhan. Oleh karena itu,
validitas butir tercermin pada besaran koefisien korelasi antara skor butir dengan skor total
instrumen positif dan signifikan maka butir tersebut dapat dianggap valid berdasarkan ukuran
validitas internal. Apabila besaran koefisien korelasi yang tinggi antara skor dan butir dengan
skor total instrumen mencerminkan tingginya konsistensi antara hasil ukur keseluruhan
instrumen dengan hasil ukur butir instrumen atau dapat dikatakan bahwa butir instrumen tersebut
konvergen dengan butir-butir lainnya dalam mengukur suatu konsep atau konstruk yang hendak
diukur. Untuk menghitung koefisien korelasi antara skor butir dengan dengan skor total
instrumen digunakan rumus statistika yang sesuai dengan jenis skor butir dari koefisien korelasi
antara skor butir kontinum maka untuk menghitung koefisien korelasi antara skor butir dengan
skor total instrumen digunakan instrumen digunakan koefisien korelasi product moment (r)

4. Reliabilitas Tes

Realibitas berasal darikata reliability berarti sejauh mana hasil suatu pengukuran dapat
dipercaya. Suatu hasil pengukuran hanya dapat dipercaya apabila dalam beberapa kali
pelaksanaan pengukuran terhadap kelompok yang sama diperoleh hasil pengukuran yang relative
sama selama aspek yang diukur dalam diri subjek memang belum berubah. Konsep realibitas
dalam arti realibitas alat ukur berkaitan erat dengan masalah eror pengukuran terjadi apabila
dilakukan pengukuran ulang terhaap kelompok subjek yang sama. Sedangkan konsep relibitas
dalam arti reliabilitas hasil ukur bherkaitan erat dengan error dalam pengambilan sampel yang
mengacu pada kelompok yang berbeda.

Salah satu syarat agar hasil ukur suatu tes dapat dipercaya ialah tes tersebut harus
mempunyai reliabilitas yang memadai. Hasil pengukuran dikatakan mempunyai reliabilitas yang
tinggi jika hasil pengukuran pertama hamper sama dengan hasil pengukuran kedua, begitu pula
sebaliknya hasil pengukuran mempunyai reliabilitas yang rendah bila hasil pengukuran pertama
jauh berbeda dengan hasil pengukuran kedua. Bila kita mempunyai tes matematika dan ingin
mengetahui reliabilitas tes tersebut termasuk tinggi atau rendah dapat kita lakukan dengan cara
mengujikan set tes tersebut pada kelas yang sama sebanyak dua kali dengan selisih waktu tidak
boleh terlalu lama dan tidak boleh terlalu dekat. Tenggang waktunya tidak boleh terlalu lama di
khawatirkan adanya penambahan pengetahuan selama selang waktu kedua pengukuran ini
menyebabkan hasilnya bias. Persyaratan tidak boleh terlalu dekat dikhwatirkan soal tes pada
pengukuran pertama masih kuat dalam ingatan siswa ketika ia menjawab pengukuran kedua.
Dikatakan reliabilitasnya tinggi bila skor tes yang diperoleh siswa mendekati sama antara
pengukuran pertama dan pengukuran kedua. Skor yang sama berarti ajeg/ tetap / mantap atau
realibitasnya tinggi.

Realibitas tes dapat ditingkatkan dengan menambahkan butir soal kedalam butir soal
tersebut. Setiap penambahan butir soal belum tentu dapat meningkatkan kualitas reliabilitas, bisa
meningkatkan bila penambahan butir soal adalah homogen dengan butir soal yang sudah ada.
Homogen yang dimaksud disini adalah butir soal yang mengukur hal yang sama dengan butir
soal yang sudah ada. Rumus mencari kofisien reliabilitas yang baru adalah :

rₓₓ= Jrₓₓ/1+(J-1)rᵧᵧ

rᵧᵧ = reliabilitaas sebelum penambahan

rₓₓ = reliablitaas sesudah penambahan

J = rasio jumlah butir soal setelah dan sebelum penambahan

Ada beberapa hal yang mempengaruhi hasil tes yaitu panjang tes dan kualitas butir soal,
berhubungan dengan tercoba, berhubungan dengan penyelenggara , metode tes ulang, metode
belah dua

Kita juga harus mengukur reliabilitas instrumen penelitian. Reliabilitas adalah ketepatan
atau keajegan hasil yang diperoleh dari suatu pengukuran ( Gronlund dan Linn, 1990).

Reliabilitas konsistensi tanggapan responden mempersoalkan apakah tanggapan


responden atau objek terhadap tes sudah baik atau konsisten. Apakah responden terhadap item-
item itu tetap mantap dan masih konsisten ketika dilakukan pengukuran kembali pada obyek
yang sama. Bila pengukuran kedua menunjukkan ketidakkonsistensian maka jelas hasil
pengukuran itu tidak mencerminkan keadaan obyek yang sesungguhnya. Hasil ukur tes itu tidak
dapat dipercaya atau tidak reliabel. Kita katakan untuk mengetahui apakah tanggapan terhadap
tes atau instrument itu mantap, konsisten dapat dilakukan dengan cara memberikan tes yang
sama secara berulangkali kepada objek ukur responden yang sama. Pengetesan dua kali
merupakan syarat minimal untuk mengetahui apakah tanggapan objek ukur terhadap tes rersebut
konsisten atau tidak. Dalam pelaksanaan pengetasaan dua kali dapat ditempuh berbagai cara
yaitu pengetesan dua kali dengan tes yang sama terhadap objek ukur yang sama atau dengan
melakukan pengetesan sekali dengan menggunakan dua tes item itemnya setara. Jika kita
menggunakan pengetesan sekali maka kesamaan atau kesetaraan tes yang digunakan mereupakan
syarat mutlak yang harus dipenuhi, karena kemantapan atau konsisten tanggapan terhadap item
item itulah yang akan diperiksa.

Cara mencari besarnya reliabilitas dapat dilakukan dengan teknik menggunakan rumus
korelasi product moment untuk mengetahui validitas, kesejajaran hasil dalam reliabilitas tes.

Metode kriteria mencari reliabilitas dibagi menjadi tiga yaitu:

1. Metode bentuk paralel (equivalent)

2. Metode tes ulang tes (retest method)

3. Metode belah dua (split half method)

Langkah langkah Penghitungan Reliabilitas tes uraian sebagai berikut:

1. Menetukan nilai varians skor tiap tiap soal. Misal nomor 1: = 2,60110

2. Menentukan nilai jumlah varians semua soal.

3. Menentukan nilai varians total

4. Mentukan n = banyaknya soal

5. Menetukan nilai

6. Berdasarkan kriteria reliabilitas, nilai = 0,82355 berada di antara interval nilai 0,80-1,00
maka tes uraian tersebut memiliki tingkat reliabilitas tinggi.

Mencari besar kofisien reliabilitas dengan metode bentuk paralel atau tes paralel atau tes
ekuivalen adalah dua buah tes yang mempunyai kesamaan tujuan ,tingkat kesukaran dan susunan,
tetapi butur-butir soalnya berbeda dengan istilah alternative form method ( paralel from ). Dua
buah tes yang paralel missal tes matematika seri A yang akan sama, dan hasilnya dikorelasikan,
mantap/ ajeg, dapat digunakan sebagai alat pengetasan yang terandal. Dengan demikian pengetes
harus mennyiapkan dua perangkat tes masing-masing dicobakan pada kelompok yang sama.
Metode tes paralel dikenal juga dengan nama double test double trial method. Karena siswa
dihadapkan pada dua tes maka tidak ada faktor masih ingat soalnya yang dalam evaluasi disebut
practice effect dan carry over effect artinya ada faktor yang dibawa oleh testee karena sudah
mengerjakan soal tersebut.

Metode tes ualang adalah pengetes hanya memiliki satu tes, tetapi dicobakan dua kali.
Istilahnya single tes double trial method. Kemudian hasil dari kedua kali tes itu dihitung
korelasinya. Ada tes yang banyak mengungkap pengetahuan atau ingatan dan pemahaman.
Menggunakan cara ini tidak tepat karena tercoba akan masih ingat tentang butir-butir soalnya.
Solusi masalah ini tenggang waktu tes pertama dan tes kedua tidak terlalu sempit dan tidak
terlalu lama. Hanya pengalaman yang akan menentukan secara tepat tenggang waktu ini. Selain
itu pada kenyataannya hasil yang kedua cenderung lebih baik dari pada hasil tes ;pertamaa
karena adanya practice effect atau over effect . Kepetingan kita dalam mencari nilai reliabilitas
dengan metede ini adalah kesejajaran hasil atau ketetapan hasil yang ditunjukkan oleh koefisien
korelasi yang tinggi .

Mencari reliabilitas dengan metode belah dua yakni pengetes hanya menggunakan sebuah tes
dan di cobahkan satu kali sehingga didapat dikofisien korelasi setelah membelah dua dan
mengkorelasikan duabelahan itu. Kemudiaan baru diketahui separuh belahan tes.

Macam pembelahan yaitu pembelahan ganjil genap dan pembelahan awal akhir yaitu 1, 3, 5, 7, 9,
11, 13, 15, 17, 19 dan kelompok genap yaitu 2, 4, 6, 8, 10, 12, 14, 16, 18, dan 20. Pembelahan
awal akhir misalkan butir soal awal adalah 1, 2, 3, 4, 5, 6, 7, 8, 9 dan 10 kemudian butir soal
yang terakhir adalah 11, 12, 13, 14, 15, 16, 17, 18, 19, dan 20 banyaknya butir soal harus genap
misal 20 soal 30 , 36, dan seharusnya, sehingga pembelahannya sama.

5. Indeks Kesukaran (difficult index)

Perhitungan tingkat kesukaran soal adalah pengukuran seberapa besar derajat kesukaran
suatu soal. Jika suatu soal memiliki tingkat kesukaran seimbang (proporsional), maka dapat
dikatakan bahwa soal tersebut baik. Satu soal tes hendaknya tidak terlalu sukar dan tidak terlalu
mudah.

a. Menghitung tingkat kesukaran soal bentuk objekif

Untuk menghitung tingkat kesukaran soal bentuk objektif dapat digunakan dengan dua cara
yaitu :

1. Menggunakan rumus tingkat kesukaran (TK) :

TK={(WL+WH)/(nL+nH)}X100%

Keterangan :

WL : jumlah peserta didik yang menjawab salah dari kelompok bawah

WH : jumlah peserta didik yang menjawab salah dari kelompok atas

nL : jumlah kelompok bawah

nH : jumlah kelompok atas

sebelum menggunakan rumus diatas, harus ditempuh terlebih dahulu langkah-langkah sebagai
berikut.
· Menyusun lembar jawaban peserta didik dari skor tertinggi sampai skor terendah.

· Mengambil 27% lembar jawaban dari atas yang selanjutnya disebut kelompok atas
(higher group), dan 27% lembar jawaban dari bawah yang selanjutnya disebut kelompok bawah
(lower group). Sisa sebanyak 46% disisihkan.

· Membuat tabel untuk mengetahui jawaban (benar atau salah) dari setiap peserta didik,
baik untuk kelompok atas maupun kelompok bawah. Jika jawaban peserta didik benar, diberi
tanda + (plus), sebaliknya jika jawaban peserta didik salah diberi tanda – (minus).

b. Menghitung tingkat kesukaran untuk soal bentuk uraian

Cara menghitung tingkat kesukaran untuk soal bentuk uraian adalah menghitung berapa persen
peserta didik yang gagal menjawab benar atau ada dibawah batas lulus (passing grade) untuk
tiap-tiap soal. Untuk menafsirkan tingkat kesukaran soalnya dapat digunakan kriteria sebagai
berikut :

1. Jika jumlah peserta didik yang gagal mencapai 27%, termasuk mudah.

2. Jika jumlah peserta didik yang gagal antara 28% sampai dengan 72%, termasuk sedang.

3. Jika jumlah peserta didik yang gagal 72% keatas, termasuk sukar.

Contoh :

33 orang peserta didik dites dengan 5 soal bentuk uraian. Skor maksimum ditentukan 10 dan skor
minimum 0. Jumlah peserta didik yang memperoleh nilai 0-5 = 10 orang (berarti gagal), nilai 6 =
12 orang, dan nilai 7 – 10 = 11 orang.

Jadi, tingkat kesukaran (TK) =10/33 X 100% =30,3%

Tingkat kesukaran 30,3 berada diantara 28 dan 72, berarti soal tersebut termasuk sedang.
Catatan : Batas lulus ideal = 6 (skala 0-10).

6. Indeks Daya Pembeda

Yang dimaksud Daya Pembeda suatu soal tes ialah bagaimana kemampuan soal itu
untuk membedakan siswa-siswa yang termasuk kelompok pandai (upper group) dengan siswa-
siswa yang termasuk kelompok kurang (lower group). Daya pembeda suatu soal tes dapat
dihitung dengan menggunakan rumus seperti berikut:

DP=(WL-WH) / n

Keterangan:
DP : Daya Pembeda

n : Jumlah kelompok atas atau kelompok bawah

WL : jumlah peserta didik yang menjawab salah dari kelompok bawah

WH : jumlah peserta didik yang menjawab salah dari kelompok atas

Contoh:

Untuk mendapatkan gambar yang lebih jelas mengenai langkah-langkah yang ditempuh dalam
mencari Indeks kesukaran dan daya pembeda suatu item, di bawah ini akan dikemukakan sebuah
contoh.

a. Kita misalkan murid yang mengikuti tes yang kita berikan adalah sebanyak 50 orang.
Lembar jawaban murid-murid tersebut kita susun dari skor tertinggi paling atas sampai dengan
skor rendah yang terbawah.

b. Kita ambil 27% dari mereka yang mendapatkan skor tertinggi. Dalam hal ini, 27% x 50
orang sama dengan 13,5 orang kita bulatkan menjadi 14 orang. Begitu pula kita ambil 27% dari
mereka yang mendapatkan skor yang terendah. Jumlahnya tentu sama dengan kelompok atas,
yaitu 14 orang.

c. Misalkan data yang diperoleh adalah sebagai berikut:

· Untuk item no.1, dari kelompok bawah salah 9 orang dan dari kelompok atas salah 2 orang.

· Untuk item no.2, dari kelompok bawah salah 8 orang dan dari kelompok atas salah 5 orang.

· Untuk item no.3, dari kelompok bawah salah 14 orang dan dari kelompok atas salah 5 orang.

· Untuk item no.4, dari kelompok bawah salah 6 orang dan dari kelompok atas tidak ada yang
salah.

· Untuk item no.5, dari kelompok bawah salah 13 orang dan dari kelompok atas salah 10
orang.

· Untuk item no.6, dari kelompok bawah salah 2 orang dan dari kelompok atas salah 3 orang.

e. Berdasarkan tabel diatas, maka indeks kesukaran untuk masing-masing item dapat dicari
sebagai berikut:

· Untuk item no.1

DP=7/14=0,5

· Untuk item no.2


DP=3/14=0,21

· Untuk item no.3

DP=6/14=0,43

· Untuk item no.4

DP=6/14=0,43

· Untuk item no.5

DP=2/14=0,14

· Untuk item no.6

DP=-1/14=-0,07

Daya Pembeda yang ideal adalah daya pembeda 0,40 ke atas. Namun untuk ulangan-ulangan
harian, masih dapat ditolerir daya pembeda
BAB III
PENUTUP

A. Kesimpulan

Pengertian instrumen dalam lingkup evaluasi didefinisikan sebagai perangkat untuk


mengukur hasil belajar siswa yang mencakup hasil belajar dalam ranah kognitif, afektif, dan
psikomotor. Bentuk instrumen dapat berupa tes dan non-tes. Instrumen bentuk tes mencakup: tes
uraian (uraian objektif dan uraian bebas), tes pilihan ganda, jawaban singkat, menjodohkan,
benar salah, unjuk kerja (performance test), dan portofolio. Instrumen bentuk non-tes mencakup:
wawancara, angket, dan pengamatan (observasi).
Instrumen Evaluasi yang baik memiliki ciri-ciri dan harus memenuhi beberapa kaidah
antara lain:Validitas, Reliabilitas, Objectivitas, Pratikabilitas, Ekomonis, Taraf Kesukaran,dan
daya pembeda.Tes sebagai alat penilaian adalah pertanyaan-pertanyaan yang diberikan kepada
siswa untuk mendapat jawaban dari siswa dalam bentuk lisan (tes lisan), dalam bentuk tulisan
(tes tulisan), dan dalam bentuk perbuatan (tes tindakan). Tes pada umumnya digunakan untuk
menilai dan mengukur hasil belajar siswa, terutama hasil belajar kognitif berkenaan dengan
penguasaan bahan pengajaran sesuai dengan tujuan pendidkan dan pengajaran.
Guru yang baik selalu akan meningkatkan mutu tes yang di gunakan. Oleh karena
menyusun tes itu sukar maka mereka disarankan untuk mengumpulkan soal-soal tesnya, dan
disertai dengan catatan-catatan mengenai butir-butir mana yang terlalu mudah, terlalu sukar, atau
membingungkan. Dengan cara demikian maka keterampilan guru dalam menyusun tes akan
meningkat, dan akan diperoleh sekumpulan tes yang mutunya bukan lagi yang paling bawah.
Penyusunan tes yang disertai dengan melalui tabel spesifikasi dapat dijamin bahwa tesnya cukup
mempunyai validitas isi dan validitas tingkah laku.

.
Daftar Pustaka

Asmawi Zaenul dan Noehi Nasution. 2005. Penilaian Hasil Belajar. Jakarta:DIKTI

Dimyati dan Mudjiono. 1999.Belajar Dan Pembelajaran. Jakarta: Rineka Cipta.

Purwanto, Ngalim. 2009. Prinsip-Prinsip Dan Teknik Evaluasi Pengajaran. Bandung:


Rosdakarya.

Yusuf Tayibnapis, Farida. 2008. Evaluasi Program Dan Instrumen Evaluasi Untuk Program
Pendidikan Dan Penelitian. Jakarta: Rineka Cipta.

Suharsimi Arikunto.2006.Prosedur Penelitian, Suatu Pendekatan Praktik.Jakarta: Rineka Cipta.

S. Eko Putro Widoyok.2012.Teknik Penyusunan Instrumen Penelitian.Yogyakarta: Pustaka


Pelajar.

Brenan, Robert L. 2006. Educational Measurement. Washington: American Council on


Education Praeger.

Djemari Mardapi. 2003. Konstruksi Tes dan Analisis Butir. Bahan lokakarya Metodologi
Interaksi Pembelajaran. Unpublished.

http://violetatniyamani.blogspot.com/2007/09/teori-validitas.html

Kumaidi. 2008. Konstruksi Instrumen. Bahan Kuliah Pascasarjana UNY. Unpublished.

Fernandes, H.J.X. 1984, Testing and Measurenment. Jakarta : National Education Planning,
Evaluation and Curriculum Development

Koyan, I Wayan. 2004. Konsep Dasar dan Teknik Evaluasi Hasil Belajar. Singaraja : IKIP
Negeri Singaraja

Anda mungkin juga menyukai