Anda di halaman 1dari 15

BAB 13 MENGANALISIS HASIL TES

1. Menganalisis Tes yang Dibuat Sendiri Tidak ada usaha guru yang lebih baik selain usaha untuk selalu meningkatkan mutu tes yang disusunnya. Namun, hal ini tidak dilaksanakan karena kecenderungan seseorang untuk beranggapan bahwa hasil karyanya adalah yang terbaikatau setidak- tidaknya sudah cukup baik. Oleh karena itu, cara yang paling baik adalah secara jujur melihat hasil yang diperoleh siswa. Secara teoretis, siswa dalam satu kelas merupakan populasi atau kelompok yang keadaannya heterogen. Dengan demikian, maka apabila dikenai sebuah tes akan tercermin hasilnya dalam suatu kurva normal. Sebagian besar siswa berada di daerah sedang, sebagan kecil berada di ekor kiri, dan sebagian kecil yang lain berasa di ekor kanan kurva. Apabila keadaan setelah hasil tes dianalisis seperti yang diharapkan dalam kurva normal, maka tentu ada apa-apa dengan soal tesnya.Apabila hampir seluruh siswa memperoleh skor jelek, berarti bahwa tes yang disusun mungkin terlalu sukar. Sebaliknya, jika seluruh siswa memeroleh skor baik, dapat diartikan bahwa tesnya terlalu mudah. Tentu saja interpretasi terhadap soal tes akan lain seandainya tes itu sudah disusun sebaik-baiknya sehingga memenuhi persyaratan sebagai tes. Ada 4 cara untuk menilai tes, yaitu : a. Meneliti secara jujur soal- soal yang sudah disusun, kadang- kadang dapat diperoleh jawaban tentang ketidakjelasan perintah atau bahasa, taraf kesukaran, dan lain- lain keadaan soal tersebut.

Pertanyaan- Pertanyaan tersebut, antara lain : 1. Apakah banyaknya soal untuk tiap topik sudah seimbang? 2. Apakah semua soal menanyakan bahan yang telah diajarkan? 3. Apakah soal yang kita sususn tidak merupakan pertanyaan yang membingungkan (dapat disalahtafsirka)? 4. Apakah soal itu tidak sukar untuk dimengerti?

5. Apakah soal itu dapat dikerjakan oleh sebagian besar siswa ?

b. Mengadakan analisis soal (item analysis). Analisis soal adalah suatu prosedur yang sistematis, yang akan memberikan informasi- informasi yang sangat khusus terhadap butir tes yang kita susun.

Faedah mengadakan analisis soal : 1. Membantu kita dalam mengidentifikasi butir- butir soal yang jelek. 2. Memperoleh informasi yang akan dapat digunakan untuk meneyempurnakan soalsoal untuk kepentingan lebih lanjut. 3. Memperoleh gambaran secara selintas tentang keadaan yang kita susun.

c. Mengadakan checking validitas. Validitas yang paling penting dari tes buatan guru adalah validitas kulikuler (content validity). Untuk mengadakan checking validitas kulikuler, kita harus merumuskan tujuan setiap bagian pelajaran secara khusus dan jelas sehingga setiap soal dapat kita jodohkan dengan setiap tujuan khusus tersebut. Tes yang tidak mempunyai validitas kulikuler atau walupun mempunyai tetapi kecil maka dapat juga terjadi jika salah satu atau beberapa tujuan husus tidak dicantumkan dalam tabel spesifikasi. Semakin banyak tujuan khusus yang tidak dicantumkan, berarti bahwa validitas kulikulernya semakin kecil.

d. Mengadakan checking reabilita. Salah satu indikator untuk tes yang mempunyai reliabilitas yang tinggi adalah bahwa kebanyakan dari soal- soal tes itu mempunyai daya pembeda yang tinggi.

2. Analisis Butir Soal Analisis soal bertujuan untuk mengadakan identifikasi soal- soal yang baik, kurang baik, dan soal yang jelek. Dengan analisis soal dapat diperoleh informasi tentang kejelekan sebuah soal dan petunjuk untuk mengadakan perbaikan.

Kapan sebuah soal dikatakan baik ? untuk memberi jawaban pertanyyan ini ada tiga masalah yang berhubungan dengan analisis soal, yaitu taraf kesukaran, daya pembeda, dan pola jawaban soal.

a. Taraf Kesukaran

Soal yang baik adalah soal yang tidak teralu mudah atau tidak terlalu sukar. Soal yang terlalu mudah tidak merangsang siswa untuk mempertinggi usaha memecahkannya. Sebaliknya, soal yang terlalu sukar akan menyebabkan siswa menjadi putus asa dan tidak mempunyai semangat untuk mencoba lagi karena di luar jangkauannya.

Bilangan yang menunjukkan sukar dan mudahnya sesuatu soal disebut indeks kesukaran (difficulty index). Besarnya indeks kesukaran antara 0,00 samapai 1,0. Indeks kesukaran ini menunjukkan taraf kesukaran soal. Soal dengan indeks kesukaran 0,0 menunjukkan bahwa soal itu terlalu sukar, sebaliknya indeks 1,0 menunjukkan bahwa soal terlalu mudah.

0,0 Sukar

0,1 Mudah

Di dalam istilah evaluasi, indeks kesukaran ini diberi simbol P (p besar), singkatan dari kata proporsi. Dengan demikian maka soal dengan P= 0,70 lebih mudah dibandingkan dengan P = 0,20. Sebaliknya soal dengan P = 0,30 lebih sukar daripada soal dengan P=0,80. Melihat besarnya bilangan indeks ini maka lebih cocok jika bukan disebut sebagai indeks kesukaran tetapi indeks kemudahan atau indeks fasilitas,karena semakin mudah soal itu, semakin besar pula bilangan indeksnya. Akan tetapi telah disepakati bahwa walaupun semakin tinggi indeksnya menunjukkan soal yang semakin mudah, tetapi tetap disebut indeks kesukaran.

Rumus Mencari P adalah :

P= B JS

Dimana : P = indeks kesukaran B = banyaknya siswa yang menjawab soal itu dengan betul

JS = jumlah seluruh siswa pserta tes

b. Daya Pembeda

Daya pembeda soal adalah kemampuan sesuatu soal untuk membedakan antara siswa yang berkemampuan tinggi dan yang berkemampuan rendah. Indeks diskriminasi (D) adalah angka yang menunjukkan daya pembeda , kisarannya yaitu 0.00 sampai

dengan 1.00. Titik daya pembeda terdiri dari titik negatif, rendah, sampai tinggi (1.00, 0.00, dan 1.00). Titik daya pembeda yang negatif menunjukkan kualitas testee jika suatu soal terbalik (pandai-bodoh, bodoh-pandai). Soal tanpa daya pembeda merupakan soal yang tidak baik. Adapun klasifikasi daya pembeda sebagai berikut: D = 0,00 0,20 = jelek D = 0,20 0,40 = cukup D = 0,40 0,70 = baik D = 0,70 1,00 = baik sekali D = negatif = semuanya tidak baik, sebaiknya dibuang Dalam penentuan nilai daya pembeda (D), peserta tes dibagi menjadi dua kelompok, kelompok atas (upper) dan kelompok bawah (lower). Dalam kelompok kecil yang jumlahnya kurang dari 100, kedua kelompok dibagi menjadi 50% dan 50%, sedangkan pada kelompok besar yang jumlahnya lebih dari 100, kedua kelompok hanya diambil 27% teratas dan 27% terbawah. Rumus yang digunakan untuk menentukan indeks diskriminasi adalah seperti di bawah ini: D = BA/JA BB/JB = PA - PB dimana, J = jumlah peserta tes JA = banyaknya peserta upper group JB = banyaknya peserta lower group BA = banyaknya peserta upper group yg menjawab benar

= banyaknya peserta lower group yg menjawab benar PA = proporsi peserta upper group yg menjawab benar (P indeks kesukaran) PB = proporsi peserta lower group yg menjawab benar (P indeks kesukaran) Adanya pola jawaban soal adalah untuk mengetahui: Taraf kesukaran soal Daya pembeda soal Baik/tidaknya distraktor Distraktor adalah pengecoh jawaban. Perlakuan distraktor: Diterima (baik) Ditolak (tidak baik) Ditulis kembali (kurang baik) Distraktor yg baik minimal dipilih 5% oleh pengikut

BAB 14 MENSKOR DAN MENILAI 1. Menskor Menskor yaitu kegiatan memberi nilai yang menggunakan alat bantu: Kunci jawaban Kunci skoring Pedoman penilaian Kunci Jawaban adalah deretan jawaban yang kita persiapkan untuk pertanyaanpertanyaan/soal yg kita susun. Kunci skoring adalah alat yg kita gunakan untuk

mempercepat pekerjaan seseorang . Kunci jawaban dan kunci skoring berbeda-beda sesuai dengan macam tesnya, antara lain: 1. Tes Benar atau Salah Testee diminta melingkari jawaban B atau S Sebelum menyusun soal, tentukan dulu kunci jawabannya, usahakan jawaban B hampir sama banyaknya dgn S Kunci jawaban dapat diganti dengan scoring key sebagai berikut: a. Tanpa Hukuman Angka yg diperoleh siswa sebanyak jawaban yg cocok dgn kunci b. Dengan Hukuman 1) S = R - W dimana S = skor, R = right, dan W = wrong 2) S = T 2 W T adalah total jumlah soal dalam tes jumlah

2. Tes Pilihan Ganda a. Tanpa Hukuman b. Dengan Hukuman S = R (W/(n-1)) n = banyaknya pilihan jawaban

3. Tes Jawaban Singkat Tes bentuk jawab singkat adalah bentuk tes yg menghendaki jawaban terbentuk kata atau kalimat pendek Kalau jawaban mudah, skor disamakan dengan pilihan ganda Kalau jawaban bervariasi tingkatnya, lengkap, lengkap sekali, kurang lengkap maka skornya juga bervariasi Normalnya, tiap soal diberi skor 2 Kunci jawabannya berderet sesuai nomor

4. Tes Menjodohkan

Berupa deretan jawaban yg dikehendaki atau deretan nomor yg diikuti huruf-huruf yg terdapat di depan alternatif jawaban Angka tiap nomor adalah 2

5. Tes bentuk uraian atau essay Tidak ada jawaban yang pasti pada tes bentuk uraian ini, untuk itu akan lebih mudah jika menggunakan suatu cara dengan melakukan bebrapa hal. Dibawah ini merupakan langkah-langkah yang sebaiknya dilakukan dalam memberi skor untuk tes bentuk uraian berdasarkan pada norma kelompok (norm referenced test) 1. Membaca soal pertama dari seluruh siswa untuk mengetahui situasi jawaban. Dengan membaca seluruh jawaban, kita dapat memperoleh gambaran lengkap tidaknya jawaban yang diberikan siswa secara keselurruhan. 2. Menentukan angka untuk soal pertama tersebut. Dalam menentukan angka, kita perlu berpikir bahwa tidak ada unsure tebakan. Dengan demikian maka ada dua pendapat, satu pendapat menentukan menentukan angka 1 atau 2 untuk untuk jawaban yang salah, pendapat lain menentukan angka 0 untuk jawaban tersebut. 3. Memberikan angka untuk soal pertama. 4. Mengulangi langkah-langkah tersebut bagi soal-soal lainnya. 5. Menjumlahkan angka-angka yang diperoleh masing-masing siswa untuk tes bentuk uraian. Dengan melakukan langkah-langkah tersebut, kita tahu bahwa dengan membaca terlebih dahulu seluruh jawaban yang diberikan siswa, kita menjadi tahu bahwa mungkin tidak ada seorangpun dari siswa yang menjawab dengan betul suatu nomor soal. Mendapati situasi yang seperti ini, kita gunakan cara pemberian angka yang relative. Misalnya, untuk suatu nomor soal jawaban yang paling lengkap hanya mengandung 3 unsur, padahal kita menghendaki 5 unsur, maka kepada jawaban paling lengkap itulah kita memberikan angka 5 sedangkan untuk yang menjawab hanya 1 atau 2 unsur, beri angka lebih sedikit. Dengan cara ini maka [emberian angka untuk jenis tes uraian akan lebih konsisten. Jika dalam memebrikan angka mendasarkan pada standar mutlak (criterion referenced test), maka langkah-langkahnya akan berbeda. berikut langkah-langkah yang harus dilakukan dalam pemberian skor pada tes bentuk uraian berdasarkan standar mutlak:

1. Membaca setiap jawaban yang diberikan oleh siswa, dan dibandingkan dengan kunci jawaban yang telah kita susun. 2. Membubuhkan skor di sebelah kiri setiap jawaban. Hal ini dilakukan per nomr soal. 3. Menjumlah skor-skor yang telah dituliskanpada setiap soal. Dengan cara ini, maka skor siswa tidak dibandingkan dengan jawaban paling lengkap dengan jawaban siswa lain, tetapi dibandingkan dengan jawaban lengkap yang dikehendaki dan sudah ditentukan oleh guru. Adakalanya kita dituntut untuk memberikan nilai tetrhadap prestasi belajar siswa tanpa memberikan skor terlebih dahulu. Misalnya pada waktu ujian lisan. Sesuatu yang dilarang adalah masuknya unsure subjektivitas dalam diri kita sehingga kita seringkali melakukan hal-hal di luar keadilan. Kemungkinannya adalah apabila kita hanya memberikan nilai satu kali, yakni pada akhir ujian. Untuk mengurangi masuknya unsure subjektivitas, kita dapat menentukan sendiri aspek-aspek yang menjadi bagian dari penilaian. Untuk masing-masing aspek dapat ditentukan berapa nilainya, kemudian dijumlah dan ditentukan nilai akhirnya. Dalam menentukan nilai akhir, dapat juga memberikan bobot yang berbeda pada masing-masing aspek, asalkan dengan argumentsi yang kuat. Dalam menentukan nilai pada tiap-tiap aspek ini pun kita dituntut untuk memberikan pertimbangan yang didasari oleh kebijaksanaan. Kita dapat mengambil salah satu dari dua cara di bawah ini, yaitu; 1. Bertitik tolak dari batas bawah, yaitu berpikir dari pekerjaan yang paling jelek dahulu, kemudian membandingkan hasil pekerjaan yang kita hadapi dengan nilai batas bawah tersebut. 2. Bertitik tolak pada batas atas. Dengan cara ini kita berpikir mengenai kesempurnaan pekerjaan tetapi diukur menurut ukuran yang bisa dicapai oleh siswa/mahasiswa.

6. Tugas

Kunci jawaban untuk memeriksa tugas merupakan pokok-pokok yang harus termuat di dalam pekerjaan siswa. hal ini menyangkut kriteria untuk isi tugas. Namun, sebagai kelengkapan dalam pemberian skor, digunakan suatu tolak ukur tertentu. Tolak ukur yang disarankan dalam keberhasilan tugas adalah: a. Ketepatan waktu penyerahan tugas b. Bentuk fisik pengerjaan tugas yang menunjukka keseriussan siswa dalam mengerjakan tugas c. Sistematika yang menunjukan alur keruntutan pikiran d. Kelengkapan isi menyangkut ketuntasan penyelesaian dan kepadatan isi e. Mutu hasil tugas, yaitu kesesuaian hasil dengan garis-garis yang sudah ditentukan Dalam mempertimbangkan nilai akhir, perlu dipikirkan peranan masing-masing aspek. Maka nilai akhir tugas tersebut dapat dihitung dengan mengkalikan masing-masing nilai aspek dengan bobot aspek, kemudian menjumlahkan keseluruhannya. 2. Perbedaan antara skor dan nilai Banyak diantara para guru yang masih mencampuradukkan antara dua pengertian yaitu antara skor dan nilai. Skor: adalah hasil pekerjaan menskor yang diperoleh dengan menjumlahkan angka-

angka setiap soal tes yang dijawab betul oleh siswa. Nilai: adalah angka ubahan dari skor dengan menggunakan acuan tertentu, yakni

acuan normal atau acuan standar Seorang siswa yang memperoleh skor 40 bagi tes yang menghendaki skor maksimum 40, mempunyai arti bahwa siswa tersebut sudah menguasai 100% dari tujuan instruksional khusus yang dirancangkan oleh guru. Akan tetapi jika skor 40 tersebut diperoleh dari pengerjaan tes yang menghendaki soal maksimum 100, maka skor 40 mencerminkan 40% penguasaab tujuan saja. Dengan demikian maka angka 40 yang diperoleh siswa belum berbicara apa-apa sebelum diketahui berapa skor maksimum yang diharapkan jika siswa tersebut dapat mengerjakannya dengan sempurna. Angka 40 ini disebut skor mentah.

Atas dasar itulah, guru diwajibkan untuk mengubah skor mentah menjadi skor berstandar 100. Contoh: Skor yang diharapkan 40. A memperoleh skor 24. Ini berarti bahwa A hanya menguasai tujuan

instruksional khusus tersebut atau hanya 60% dari tujuan. Dalam daftar nilai dituliskan A mendapat nilail 60. Jadi 24 adalah skor dan 60 adalah nilai. Secara rinci skor dapat dibedakan menjadi 3 macam, yaitu skor yang diperoleh (obtained score), skor sebenarnya (true score), dan skor kesalahan (error score). Skor yang diperoleh adalah sejumlah biji yang dimiliki oleh testee sebagi hasil mengerjakan tes. Kelemahan-kelemahan butir tes, situasi yang tidak mendukung, kecemasan, dan lain-lain faktor dapat berakibat terhadap skor yang diperoleh ini, apabila faktor-faktor yang berpengaruh ini muncul, baik sebagian atau menyeluruh, penilai tidak dapat mengira-ngira seberapa cermat skor yang diperoleh siswa ini mampu mencerminkan pengetahuan dan keterampilan siswa yang sesungguhnya. Skor sebenarnya seringkali juga juga disebut dengan istilah skor univers skor alam, adalah nilai hipotesis yang sangat tergantung dari perbedaan individu berkenaan dengan pengetahuan yang dimilki secara tetap. Perbedaan skor yang diperoleh dengan skor yang sebenarnya disebut dengan istilah kesalahan dalam pengukuran atau skor kesalahan. 3. Norm referenced dan criterion referenced Dari sederetan skor yang telah diubah ke standar 100 inilah maka dapat diperoleh gabungannya, misalnya gabungan antara nilai ulangan ke-1, ulangan ke-2 dst, yang merupakan catatan untuk dirata-rata dan menggambarkan penguasaan siswa terhadap materi yang diajarkan, atau menggambarkan sejauh manasiswa mencapai tujuan instruksional umum dari satu unit bahan yang dipelajari dalam satu ukuran waktu. Dalam penggunaan norm referenced, prestasi belajar seorang siswa dibandingkan dengan siswa lain dalam kelompoknya. Kualitas seseorang sangat dipengaruhi oleh

kualitas kelompoknya. Seorang siswa apabila terjun ke kelompok A termasuk hebat mungkin jika pindah ke kelompok lain hanya menduduki kuailtas sedang saja. Ukurannnya adalah relative. Oleh sebab itu, maka dikatakan pula diukur dengan standarrelatif. Ukuran demikian juga disebut menggunakan norm referenced atau norma kelompok Dasar pemikiran dari penggunaan standar ini adalah adanya asumsi bahwa di setiap populasi yang heterogen tentu terdapat kelompok baik, kelompok sedang, dan kelompok kurang. Dimulai dengan bakat yang dibawa sejak lahir yang dalam hal ini tampak sebagai IQ, maka seluruh populasi tergambar sebagai kurva normal. Apabila anak-anak itu belajar yang diakibatkan itu pun akan tergambar sebagai kurva normal.

Kurva Normal IQ

Kurva Normal preprestasi belajar

Penggunaan penilaian dengan norma kelompok atau norma relative ini untuk pertama kali dikemukakan pada tahun 1908 (cureton 1971), dengan landasan dasar bahwa tingkat pencapaian belajar siswa akan tersebar menurut kurva normal. Dengan demikian maka penilaian berdasarkan kurava normal merupakan hal yang tidak dapat dibantah lagi. Apabila standar relative dan standar mutlak ini dihubungkan dengan pengubahan skor menjadi nilai, maka akan terlihat seperti dibawah ini: a. Dengan standar mutlak 1. Pemberian skor terhadap siswa, didasarkan atas pencapaian siswa terhadap tujuan yang ditentukan. 2. Nilai diperoleh dengan mencari rata-rata langsung dari skor asal (skor mentah) Contoh: Dari ulangan ke-1, memperoleh skor 60 (mencapai 60% tujuan)

Dari ulangan ke-2, memperoleh skor 80 (mencapai 80% tujuan) Dari ulangan ke-3, memperoleh skor 50 (mencapai 50% tujuan) dibulatkan menjadi 63

Maka nilai siswa tersebut b. Dengan standar relative

1. Pemberian skor terhadap siswa didasarkan atas pencapaian siswa terhadap tujuan yang ditentukan 2. Nilai diperoleh dengan 2 cara, yaitu a. Mengubah skor dari tiap-tiap ulangan, lalu diambil rata-ratanya b. Menjumlah skor tiap ulangan, baru diubah ke nilai

POST TEST 1. Berikut ini adalah hal yang perlu diperhatikan dalam menganalisis butir soal, yaitu a. Pola jawaban soal dan checking reliabilitas b. Checking validitas dan daya pembeda c. Taraf kesukaran dan checking validitas d. Daya pembeda dan taraf kesukaran e. pola jawaban soal dan checking validitas

2. Kemampuan sesuatu soal untuk membedakan antara siswa yg berkemampuan tinggi dan yg berkemampuan rendah disebut... a. Indeks Diskriminasi b.Daya Pembeda c. Indeks Kesukaran d. Skoring e. Distraktor

3. Berikut ini pernyataan yg benar adalah, kecuali... a. soal yg baik memiliki daya pembeda sebesar 0,4-0,7

b. soal dengan D bernilai negatif merupakan soal yg tidak baik c. soal yg buruk bila distraktornya dipilih oleh > 5%

d. untuk menentukan D bagi kelompok <100, peserta dibagi 2 kelompok (upper dan lower), masing-masing 50% e. untuk menentukan D bagi kelompok >100, peserta dibagi 2 kelompok, masingmasing 27% dan 27% uraian ! 4. Sebutkan 4 cara untuk menilai hasil tes ? Meneliti secara jujur soal- soal yang sudah disusun. Mengadakan analisis soal (item analysis). Mengadakan checking validitas Mengadakan checking reabilita

5. A memperoleh skor 24, sedangkan skor yang diharapkan adalah 40. tentukan skor yang diperoleh (obtained score, skor sebenarnya (true score), dan skor kesalahan (error score)! skor yang diperoleh (obtained score) = 24, skor sebenarnya (true score) = 40, dan skor kesalahan (error score) = 16 6. Sebutkan tolak ukur yang disarankan dalam keberhasilan tugas (min 2)! Ketepatan waktu penyerahan tugas Bentuk fisik pengerjaan tugas yang menunjukka keseriussan siswa dalam mengerjakan tugas Sistematika yang menunjukan alur keruntutan pikiran Kelengkapan isi menyangkut ketuntasan penyelesaian dan kepadatan isi Mutu hasil tugas, yaitu kesesuaian hasil dengan garis-garis yang sudah ditentukan

BAB 13 dan 14 Menganalisis Hasil Tes dan Menskor Dan Menilai

Disusun oleh kelompok 7 Desi Ayu Triana Esihana Masrimuna Siti Chaerun Nisa 34151014 34151024 34151014

Pendidikan Biologi Reguler 2010 Fakultas Matematika dan Ilmu Pengetahuan Alam Universitas Negeri Jakarta

Anda mungkin juga menyukai