Anda di halaman 1dari 44

BAB I PENDAHULUAN

1.1 Latar Belakang Guru adalah pendidik dan pengajar pada pendidikan anak usia dini jalur sekolah atau pendidikan formal, pendidikan dasar, dan pendidikan menengah. Dalam menjalani perannya sebagai seorang pendidik dan pengajar, guru juga berperan untuk menilai hasil kinerja siswa atau mengolah skor hasil belajar siswa. Dilingkungan sekolah, kita melihat pula bahwa pada waktu-waktu tertentu guru selalu mengadakan evaluasi. Kenyataan yang biasa dilakukan di sekolah-sekolah Indonesia sampai dewasa ini ialah bahwa pada akhir semester guru mengadakan ulangan-ulangan, pada akhir tahun mengadakan ujianujian kenaikan kelas, dan pada akhir kelas tertinggi pada setiap taraf atau level pendidikan, sekolah mengadakan ujian akhir (Evaluasi Belajar Tahap Akhir). Ulangan, ujian kenaikan kelas, dan evaluasi belajar tahap akhir tadi, merupakan contoh tentang evaluasi yang lazim dilaksanakan di setiap institusi pendidikan. Proses penilaian adalah suatu proses membandingkan skor yang diperoleh tiap siswa dengan acuan yang dipakai penilaian aturan patokan atau penilaian aturan normal (PAN atau PAP), yang hasilnya berbentuk nilai dengan skala 0 10 atau A E. Dalam proses tersebut dapat dilihat bahwa penskoran atau scoring adalah pemberian angka-angka terhadap prestasi seseorang sesudah melaksanakan suatu tugas tertentu. Setelah selesai pengukuran yang salah satu alatnya biasa disebut tes, barulah dilakukan perbandingan hasil pengukuran yang berbentuk biji/skor dengan acuan yang dipakai yang dihasilkan nilai tersebut kita kenal dengan pemberian nilai atau granding. Dalam pelaksanaan sehari-hari scoring dan granding disatukan atau tidak mengenal pemisahan; pemberian biji/skor sekaligus berarti pemberian nilai. Sebagai hasilnya ialah bahwa penilaian tersebut tidak comparable dan penafsiran terhadap nilai yang diberikan dapat berbeda-beda. Untuk dapat melakukan evaluasi yang lebih memadai maka kedua kegiatan tersebut harus dipisahkan artinya; granding baru dapat dilaksanakan setelah skoring selesai, sehingga nilai tiap siswa dapat dibandingkan, penafsiran terhadap nilai sama, sifat terbuka dapat terpenuhi, obyektivitas lebih terjamin. Apa yang telah dicapai oleh siswa berupa skor mentah artinya skor i t u belum mempunyai makna apa pun sebelum diolah lebih lanjut. Agar skor siswa bermakna, maka diperlukan pengolahan lebih lanjut sehingga skor siswa dapat bermakna nilai, baik nilai kualitatif 1

maupun nilai kuantitatif. Oleh sebab itu, guru harus dapat memahami dan menguasai lebih mendalam tentang teknik pengolahan skor hasil belajar untuk menunjang proses pembelajaran dan sebagai alat untuk mengetahui sampai sejauh mana guru berhasil dalam menranfer ilmu yang dimilikinya kepada siswa.

1.2 Perumusan Masalah Apa saja jenis pendekatan dalam penilaian? Apa perbedaan antara penilaian formatif dan sumatif? Bagaimana cara mengolah hasil tes formastif dan sumatif? Bagaimana cara menginterpretasikan skor hasil belajar?

1.3 Tujuan Penulisan Dapat menyebutkan dan memahami dua jenis pendekatan dalam penilaian Dapat membedakan penilaian formatif dan sumatif Dapat mengolah hasil tes formatif dan sumatif Dapat menginterpretasikan skor hasil belajar

1.4 Manfaat Penulisan Agar mahasiswa dapat menyebutkan dan memahami dua jenis pendekatan dalam penilaian Agar mahasiswa dapat membedakan penilaian formatif dan sumatif Agar mahasiswa dapat mengolah hasil tes formatif dan sumatif Agar mahasiswa dapat menginterpretasikan skor hasil belajar

BAB II PEMBAHASAN
2.1 Pendekatan Pendekatan Dalam Penilaian Dalam penafsiran hasil tes ada dua pendekatan penilaian yaitu Penilaian Acuan Patokan (PAP) dan Penilaian Acuan Normatif (PAN) 1) Penilaian Acuan Patokan (PAP) Suatu pendekatan penilaian yang memberikan penilaian terhadap hasil belajar peserta didik dengan membandingkan skor yang didapat seorang siswa dengan suatu standar yang sifatnya mutlak. Penilaian Acuan Patokan ini berusaha mengukur tingkat pencapaian tujuan belajar siswa. Siswa yang tidak mencapai tujuan yang telah ditetapkan berarti ia gagal, artinya pengajaran yang diberikan belum berhasil. Jadi, penilaian acuan patokan ini ditujukan sudah atau belumnya siswa mencapai tujuan yang telah ditetapkan. Dengan kata lain penilaian ini lebih mengutamakan apa yang dapat dilakukan oleh siswa, kemampuan apa yang sudah dicapai, setelah mereka menyelesaikan satu bagian kecil dari keseluruhan program. Melalui pendekatan ini, guru dapat mengambil keputusan tindakan pengajaran. Jika hasil belajar siswa belum mencapai tujuan dengan kriteria 85% dari target yang diharapkan, berarti pengajaran itu gagal dan harus diulang kembali. Untuk tes seharusnya dapat menggambarkan keseluruhan bahan pengajaran atau keseruluhan tujuan pengajaran. Sebaiknya penilaian berdasarkan acuan patokan ini seyogyanya jangan digunakan dalam pengolahan dan penentuan nilai hasil tes sumatif seperti pada ulangan umum dalam rangka mengisi raport. Diantara kelemahan dari PAP ini adalah tidak mempertimbangkan kemampuan kelompok, jadi besar kemungkinan ada siswa yang tidak dapat dinyatakan lulus atau naik kelas. Kelemahan yang lain adalah apabila butir-butir soal yang diberikan dalam tes terlalu sukar, maka tes tersebut betapapun pintarnya testee akan memperolah nilai yang rendah, sebaliknya apabila butir soal yang dikeluarkan dalam tes terlalu mudah, maka betapapun bodohnya testee akan berhasil memperoleh nilai yang tinggi sehingga gambaran tingkat kemampuan testee yang sebenarnya tidak dapat diketahui. Batas kelulusan berdasarkan pada PAP yaitu:

Batas Lulus Purposif (BLP) BLP saat ini digunakan pada jenjang pendidikan dasar dan menengah dalam

memberikan nilai pada siswa seperti yang tertera pada ruang lingkup penilaian oleh pendidik yang menyatakan bahwa kegiatan yang dilakukan oleh pendidik pada tahap analisis adalah menganalisis hasil penilaian menggunakan acuan kriteria yaitu

membandingkan hasil penilaian masing-masing peserta didik dengan standar yang telah ditetapkan. Untuk penilaian yang dilakukan oleh pendidik hasil penilaian masing-masing peserta didik dibandingkan dengan Kriteria Ketuntasan Minimal (KKM). Analisis ini dimaksudkan untuk mengetahui kemajuan hasil belajar dan kesulitan belajar peserta didik, serta untuk memperbaiki pembelajaran. Dapat ditarik kesimpulan bahwa angka KKM adalah angka yang dipakai sebagai batas minimum atau batas kelulusan atau batas ketercapaian yang menunjukkan seorang siswa telah menguasai kompetensi yang ada dalam materi tes atau belum pada satu satuan periode tertentu misalnya satu semester. BLP ini secara perhitungan relatif mudah, karena nilai diambil langsung dari nilai mentah kemudian dibandingkan dengan kriteria yang dipakai misalnya KKMmata pelajaran IPS dan lainnya. PAP antara lain dimanfaatkan dalam: Penentuan prestasi siswa dalam mencapai tujuan pengajaran. Meneyeleksi siswa atas dasar kualitas prestasi. Mengukur keefektifan pengajaran (metode, teknik, pemilihan bahan, penggunaan alat, dan sebagainya). Umpan balik bagi perbaikan pengajaran. Mengetahui kelemahan/kesulitan siswa untuk pengajaran remedial. PAP digunakan pada: Tes akhir (sumatif). Tes seleksi dengan acuan diluar kelompok, misalnya patokan tujuan yang harus dicapai (standar tertentu). Tes formatif (tes pembinaan dalam pengajaran), termasuk tes unit, postes ulangan harian/formatif. Tes diagnosis, mengetahui jenis dan penyebab kesulitan belajar siswa. 2) Penilaian Acuan Normatif (PAN) PAN (Penilaian Acuan Patokan) adalah penilaian yang dalam menginterpretasi data hasil pengukuran didasarkan pada pretasi anggota kelompok lainnya. Beberapa teknik analisis 4

yang bisa digunakan untuk mengolah data dengan pendekatan acuan patokan adalah deviasi standar, mean, standar skor, rank, persentil dan sejenisnya. Bentuk acuan tersebut salah satunya yang paling sering dipakai dalam dunia pendidikan adalah batas kelulusan (passing grade). Berdasarkan pada PAN ada dua jenis batas kelulusan yaitu: Batas Lulus Aktual (BLA) BLA didasarkan atas nilai rata-rata aktual atau nilai rata-rata yang dapat dicapai oleh suatu kelompok siswa yang mengikuti tes/ulangan. Batas Lulus Ideal (BLI) BLI hampir sama dengan BLA yaitu menentukan rata-rata ideal dan simpangan baku (SD) ideal. Perbedaannya dalam mencari rata-rata dan SD tidak perlu memakai formula tetapi dipakai ketetapan sebagai berikut: rata-rata ideal (X ideal)=V2 dari skor maksimum yang mungkin dicapai. Simpangan baku (SD) = 1/3 dari rata-rata ideal (X ideal). Suatu cara membandingkan skor yang didapat oleh seorang peserta didik dengan skor yang didapat oleh peserta didik lainnya dalam kelompok tes yang diberikan. Penilaian Acuan Norma (Norm Referenced Evaluation) dikenal pula dengan Standar Relatif atau Norma Kelompok. Pendekatan penilaian ini menafsirkan hasil tes yang diperoleh testee dengan membandingkan dengan hasil tes dari testee lain dalam kelompoknya. Alat pembanding tersebut yang menjadi dasar standar kelulusan dan pemberian nilai ditentukan berdasarkan skor yang diperoleh testee dalam satu kelompok. Dengan demikian, standar kelulusan baru dapat ditentukan setelah diperoleh skor dari para peserta testee. Hal ini berarti setiap kelompok mempunyai standar masing-masing dan standar satu kelompok tidak dapat dipergunakan sebagai standar kelompok yang lain. Standar dari hasil tes sebelumnya pun tidak dapat dipergunakan sebagai standar sehingga setiap memperoleh hasil tes harus dibuat norma yang baru. Dasar pemikiran dari penggunaan standar PAN adalah adanya asumsi bahwa di setiap populasi yang heterogen terdapat siswa dengan kelompok baik, kelompok sedang dan kelompok kurang. Pengolahan skor dengan Penilaian Acuan Norma (PAN) mengharuskan kita menghitung dengan statistik. Cara perhitungan menggunakan statistik yang cukup kompleks dan beberapa kurva normal. Menggunakan perhitungan perentase atau rumus-rumus sederhana. PAN antara lain dimanfaatkan dalam: Mengklasifikasi siswa dalam kelompoknya. Menentukan peringkat siswa dalam grupnya. 5

Menyeleksi siswa berdasarkan prestasi apa adanya dan pembanding anggota kelompoknya. PAN digunakan pada: Tes akhir (sumatif). Tes seleksi dengan acuan intra kelompok (situasi pada kelompok tersebut). Tes prognostik, yang bertujuan membuat ramalan (dasar: apabila seseorang menduduki tempat yang sama, semakin tampaklah tingkat kemampuan orang tersebut). Kelemahan sistem PAN adalah dengan tes apapun dalam kelompok apapun dan dengan dasar prestasi yang bagaimanapun, pemberian nilai dengan sistem ini selalu dapat dilakukan. Karena itu penggunaan sistem PAN dapat dilakukan dengan baik apabila memenuhi syarat yang mendasari kurva normal, yaitu: Skor nilai terpencar atau dapat dianggap terpencar sesuai dengan pencaran kurva normal Jumlah yang dinilai minimal 50 orang atau sebaiknya 100 orang ke atas. Penilaian Acuan Norma ini berdasarkan pada asumsi yaitu: a. Psikologis, artinya semua peserta didik memiliki kemampuan yang sama, adanya perbedaan kemampuan Intelegensi Question, latar belakang pendidikan, dan lain-lain. b. Tujuan penilaian hasil belajar adalah untuk melihat dan menentukan kedudukan seseorang peserta didik dari teman atau kelompoknya, apakah ia berada pada posisi atas di tengah dan di bawah. c. Penilaian ini digunakan apabila pendidik menghadapi kurikulum yang bersifat dinamis, artinya materi pelajaran yang dikembangkan selalu berubah sesuai dengan tuntutan zaman, sehingga peserta didik agak sulit menetapkan kriteria benar atau salah. d. Tujuan pembelajaran tida ditekankan pada penguasaan materi atau keterampilan tertentu, melainkan untuk mengembangkan kreatifitas individual, kemampuan apersepsi, serta kemampuan berkompetensi antar sesama peserta didik. e. Penggunaan acuan ini sangat dependen dengan jenis kelompok, tempat, dan waktu. Kelompok yang homogen akan berbeda dengan yang heterogen, kelompok belajar di kota akan berbeda dengan kelompok belajar di daerah terpencil. Oleh karena itu penilaian acuan norma ini adalah menilai kemampuan rata-rata kelompok, kemudian individu diukur seberapa jauh penyimpangan terhadap rata-rata tersebut. Hal ini 6

berarti tes tersebut dapat memberikan gambaran diskriminatif antara kemampuan peserta didik yang pandai dengan yang bodoh. Perbedaan Pendekatan PAP dan PAN Penilaian dengan pendekatan PAP dan PAN merupakan dua pendekatan yang berbeda atau bertentangan. Adanya perbedaan ini menyebabkan kita harus mengetahui dan memahami karakteristik dari kedua pendekatan tersebut. Tabel Perbedaan PAN dan PAP PAN (Penilaian Acuan Norma) 1. Berfungsi untuk menetapkan PAP (Penilaian Acuan Patokan) 1. Berfungsi menetapkan apakah siswa telah mencapai atau menguasai tujuan yang diharapkan dinyatakan 2. Tujuan pembelajaran harus dinyatakan secara khusus 3. Sangat mengutamakan adanya belajar tuntas 4. Penyusunan soal lebih mengutamakan pada performance dan kemampuan yang harus dikuasai 5. Tidak selalu skor diolah dengan menggunakan statistik 6. Tepat dipakai untuk diagnostik dan tes formatif 7. Hasil penilaian tepat dinyatakan dalam bentuk pernyataan sangat memuaskan, cukup, kurang, dan gagal.

kedudukan relatif seorang siswa di dalam kelas 2. Tujuan pembelajaran

secara umum atau khusus 3. Belajar tuntas tak begitu diutamakan 4. Tes atau pernyataan harus mencakup tingkat kesukaran yang bervariasi dari yang mudah, sedang, dan sulit 5. Skor-skor diolah dengan

menggunakan statistik seperti mean, standar deviasi dan lain-lain 6. Tepat dipakai untuk tes penempatan dan tes sumatif 7. Hasil penilaian tepat ditransformasi dalam skala harus seperti A, B, C, D, dan E 2.2 Penilaian Formatif dan Sumatif Penilaian Formatif

Kata formatif bersal dari kata dalam bahasa Inggris to form yang berarti membentuk. Tes formatif dimaksudkan sebagai tes yang digunakan untuk mengetahui sejauh mana siswa telah terbentuk setelah mengikuti proses belajar mengajar. Setiap program atau pokok bahasan membentuk prilaku tertentu sebagaimana dirumuskan

dalam tujuan pembelajarannya. Tes formatif diujikan untuk mengetahui sejauh mana proses belajar mengajar dalam satu program telah membentuk siswa dalam prilaku menjadi tujuan pembelajaran program tersebut. Setiap akhir program atau pokok bahasan, siswa dievaluasi penguasaan atau perubahan prilakunya dalam pokok bahasan tersebut. Evaluasi dilakukan berdasarkan hasil pengukuran yang dilakukan menggunakan tes formatif. Tes formatif dalam praktik pembelajaran dikenal sebagai ulangan harian. Dalam perencanaan pengajaran, komponen-komponen dan proses pembelajaran untuk satu pokok bahasan direncanakan dalam sebuah satuan pembelajaran. Oleh karenanya dalam satuan pembelajaran termuat komponen-komponen seperti tujuan pembelajaran, materi, metode, strategi pembelajaran, media dan evaluasi. Evaluasi yang direncanakan dalam satuan pembelajaran merupakan evaluasi yang dilakukan berdasarkan tes formatif. Penilaian Formatif, yakni penilaian yang dilakukan pada setiap akhir satuan pelajaran, dan fungsinya untuk memperbaiki proses belajar-mengajar atau memperbaiki program satuan pelajaran. Cara Menilai Tes Formatif Tes formatif adalah tes yang diberikan kepada murid-murid pada setiap akhir program satuan pelajaran. Fungsinya untuk mengetahui sampai di mana pencapaian hasil belajar murid dalam penguasaan bahan atau materi pelajaran yang telah diberikan sesuai dengan tujuan instruksional khusus yang telah dirumuskan di dalam satuan pelajaran tersebut. Dalam penilaian formatif ini, jika tujuan-tujuan instruksional khusus telah dirumuskan dengan tepat, distribusi tingkat kesukaran soal-soal (item tes) dan daya pembeda masingmasing soal (discriminating power of a test item) tidak begitu penting. Yang penting adalah bahwa setiap soal betul-betul mengukur tujuan instruksional yang hendak dicapai yang telah dirumuskan di dalam program satuan pelajaran. Penilaian Sumatif Kata sumatif berasal dari kata dalam bahasa Inggris yaitu sum yang artinya jumlah atau total. Tes sumatif dimaksudkan sebagai tes yang digunakan untuk mengetahui penguasaan siswa atas semua jumlah materi yang disampaikan dalam satuan waktu tertentu seperti caturwulan atau semester. Setelah semua materi selesai disampaikan, maka evaluasi dilakukan atas perubahan perilaku yang terbentuk pada siswa setelah memperoleh semua materi pelajaran. Evaluasi dilakukan berdasarkan hasil pengukuran menggunakan tes sumatif. Dalam praktik pengajaran tes sumatif dikenal sebagai ujian 8

akhir semester atau caturwulan tergantung satuan waktu yang digunakan untuk menyelesaikan materi. Skor hasil pengukuran yang merupakan data hasil belajar yang dikumpulkan dari proses testing belum dapat digunakan untuk membuat pengambilan keputusan. Untuk dapat digunakan sebagai dasar pengambilan keputusan maka skor tersebut harus terlebih dulu diubah menjadi nilai dalam poses penilaian. Nilai merupakan hasil dari proses penilaian. Nilai diperoleh dengan mengubah skor dengan skala dan acuan tertentu. Oleh karena itu, nilai hanya dapat dimaknai dan digunakan sebagai dasar pengambilan keputusan dengan memerhatikan skala dan acuan yang digunakan. Penilaian Sumatif, yakni penilaian yang dilakukan tiap caturwulan atau semester (setelah siswa menyelesaikan suatu unit atau bagian dari mata pelejaran tertentu), berfungsi untuk menentukan angka atau hasil belajar siswa dalam tahap-tahap tertentu. Cara Menilai Tes Sumatif Tes sumatif biasanya diadakan tiap caturwulan sekali atau setiap semester. (Yang baik adalah tiap jangka waktu tertentu bila suatu unit atau bagian bahan pelajaran telah selesai diajarkan melalui satuan-satuan pelajaran). Fungsi tes sumatif ialah untuk menilai prestasi siswa, sampai di mana penguasaan siswa terhadap bahan pelajaran yang telah diajarkan selama jangka waktu tertentu. Kegunaannya antara lain untuk pengisian rapor, penentuan kenaikan kelas, dan penentuan lulus-tidaknya siswa pada ujian akhir sekolah. Pada umumnya jumlah item atau soal-soal tes sumatif lebih banyak daripada item tes formatif, dan bentuk soalnya pun dapat terdiri atas campuran beberapa bentuk item tes (seperti true-false, multiple choice, completion, matching, dan essay). Aspek Tingkah Laku yang Dinilai

Penilaian sumatif diadakan untuk menilai hasil jangka panjang dari suatu proses belajar-mengajar, aspek tingkah laku yang dinilai meliputi aspek kemampuan (pengetahuan, keterampilan) maupun aspek nilai dan sikap yang dipandang sebagai hasil belajar. Namun, tulisan ini lebih menitikberatkan pembahasan mengenai penilaian terhadap hasil belajar dalam bentuk kemampuan penilaiannya dapat dilakukan dengan menggunakan tes buatan guru. Penyusunan Tes Sumatif

Penilaian ini dilakukan pada akhir unit pelajaran yang cukup panjang, tes hendaknya lebih dititikberatkan pada penilaian terhadap aspek kemampuan yang lebih tinggi, 9

disesuaikan dengan tujuan instruksional umum. Bila aspek ingatan masih dirasakan perlu, hendaknya diusahakan agar proporsinya lebih kecil dibandingkan dengan aspekaspek kemampuan yang lebih tinggi (pemahaman dan aplikasi). Bahan Rincian Tes IPA Kelas : ..........

Semester : ..........
R u a n gL in g k u p A s p e k I n g a ta n P e m a h a m a n A p lik a s i JU M L A H T u m b u h a n 4 8 8 2 0 H e wa n 3 6 6 1 5 U d a ra 5 8 7 2 0 K e s e h a ta n 2 4 4 1 0 A ir 4 6 8 1 8 Ju m la h 1 8 3 2 3 3 8 3

Untuk menjamin agar ruang lingkup bahan (daerah cukup) dan berbagai aspek kemampuan dapat terangkum dalam tes sumatif, dalam merencanakan tes perlu dibuat bahan rincian (layout) seperti di atas.

Aspek Ingatan

Uraian Kemampuan untuk mengingat

Contoh soal tes (matematika)

dan menyatakan kembali apa- Sebutkan apa yang telah

unsur-unsur

yang

dipelajari terdapat di dalam suatu grafik.

sebelumnya. Pemahaman Kemampuan untuk

menangkap arti suatu bahan Di bawah ini tercantum sebuah yang telah dipelajari yang grafik terlihat antara lain yang menggambarkan

dalam laju pertambahan penduduk dari

kemampuan menafsirkan meramalkan

seseorang tahun ke tahun. Coba buatlah informasi, tafsiran singkat mengenai data akibat suatu yang digambarkan oleh grafik

peristiwa, dan kemampuan- tersebut. kemampuan lain yang sejenis. Aplikasi Kemampuan pengetahuan menggunakan Di bawah ini terdapat jumlah yang telah penduduk pada setiap tahun,

dimiliki dalam memecahkan dari tahun 1965 sampai dengan persoalan atau situasi yang 1970. Coba buatlah grafik

10

baru.

pertambahan berdasarkan tersebut.

penduduk angka-angka

Angka-angka di dalam kotak-kotak di atas menunjukkan jumlah soal yang direncanakan untuk tes sumatif. Mengingatwaktu yang disediakan untuk melaksanakan tes terbatas, jumlah soal tersebut di atas dapat dikurangi dengan jalan mengambil cuplikan (sampel) dari setiap kotak sedemikian rupa sehingga proporsi antara berbagai aspek dan ruang lingkup tetap. Dalam tes sumatif, distribusi tingkat kesukaran soal-soal tes dan daya pembeda masing-masing soal penting untuk diperhatikan, sebab, semakin bervariasi hasil tes sumatif, semakin baik ditinjau dari fungsinya untuk pemberian angka, penentuan kenaikan kelas, dan sebagainya. Perlu dipikirkan kemungkinan untuk mengembangkan tes sumatif dalam bentuk tugas. Dengan memberikan sejumlah data, siswa ditugasi untuk menyusun suatu program sederhana mengenai suatu topik tertentu yang mendorongnya menerapkan berbagai pengetahuan yang dimilikinya dalam menghadapi tugas tersebut. 2.3 Pengolahan Hasil Tes Formatif dan Sumatif Cara Mengolah Hasil Tes Formatif 1) Standar dan Cara Mengolah Hasil tes Karena hasil penilaian formatif akan dijadikan dasar bagi penyempurnaan proses belajar-mengajar, maka standar yang dipergunakan dalam mengolah hasil tes tersebut adalah standar mutlak (criterion-refernced test). Tes ini bertujuan untuk mengetahui sejauh mana tujuan-tujuan instruksional khusus telah dicapai oleh siswa, dan bukan untuk mengetahui status setiap siswa dibandingkan dengan siswa-siswa lainnya dalam kelas yang sama. Ada dua jenis pengolahan yang diperlukan di dalam penilaian formatif ini, yaitu: a) Pengolahan untuk mendapat angka presentase siswa yang gagal dalam setiap soal, misalnya:
Soal Nomor 1 2 3 dan sebagainya % siswa yang gagal 30% 85% 60% dan seterusnya

11

Untuk soal bentuk uraian, pengertian siswa yang gagal di atas diartikan sebagai siswa yang jawabannya terhadap suatu soal dipandang kurang memuaskan. b) Pengolahan untuk mendapat hasil yang dicapai setiap siswa dalam tes secara keseluruhan ditinjau dari presentase jawaban yang memuaskan, misalnya:
Nama Siswa 1. Hamid 2. Suwarni 3. Basiran dan seterusnya Hasil yang dicapai (% jawaban yang memuaskan) 90% 50% 75%

Sebagai contoh, bila skor maksimum yang harus dicapai dalam suatu tes adalah 60, angka yang dicapai Basiran dalam tes tersebut adalah: x 100% = 75% Cara menilai tes formatif dilakukan dengan precentages correction (hasil yang dicapai setiap siswa dihitung dari presentase jawaban yang benar). Rumusnya adalah sebagai berikut: S= x 100 Keterangan: S R N : nilai yang diharapkan (dicari) : jumlah skor dari item atau soal yang dijawab benar : skor maksimum dari tes tersebut

2) Penggunaan Hasil tes a. Implikasi hasil pengolahan setiap soal Dengan mempertimbangkan hasil-hasil penelitian yang pernah dilakukan dalam mengembangkan tes formatif, untuk menetapkan hasil pengolahan setiap soal hendaknya diikuti ketentuan-ketentuan sebagai berikut: Bila mayoritas siswa (sekitar 60% atau lebih) gagal dalam mengerjakan suatu soal tertentu, perlu diulang kembali pengajaran mengenai bahan yang berhubungan dengan soal atau item tersebut, bagi seluruh kelas. Bila kurang dari 60% siswa yang gagal mengerjakan suatu soal atau item tertentu, pengulangan kembali bahan yang berhubungan dengan soal tersebut dapat dilakukan sendiri-sendiri oleh siswa yang bersangkutan dengan petunjuk dan pengarahan dari guru. 12

Catatan: Bila presentase siswa yang gagal 60% atau lebih (seperti dikemukakan dalam butir 1 di atas), untuk tahun berikutnya perlu pula dipertimbangkan penggunaan cara yang lebih baik dalam mengerjakan bahan yang bersangkutan. b. Implikasi hasil pengolahan setiap siswa Dengan mempertimbangkan hasil-hasil penelitian yang telah dilakukan dalam bidang mastery learning, untuk menetapkan hasil pengolahan setiap siswa dipergunakan ketentuan-ketentuan sebagai berikut: Bila hasil yang dicapai oleh siswa dalam tes adalah 75% atau lebih, siswa tersebut dipandang telah menguasai bahan pelajaran yang bersangkutan dan siap untuk mengikuti program atau satuan pelajaran berikutnya. Bila hasil yang dicapai siswa kurang dari 75%, siswa tersebut masih dapat diizinkan untuk mengikuti program atau satuan pelajaran berikutnya, tetapi kepada siswa tersebut perlu diberikan perhatian atau bantuan khusus sehubungan dengan kesulitan-kesulitan yang masih dialaminya. Dari uraian di atas dapat disimpulkan bagaimana pentingnya peran penilaian formatif (pada akhir setiap program atau satuan pelajaran) bagi penyempurnaan proses belajar-mengajar untuk para siswa. Cara Mengolah Hasil Tes Sumatif Standar dan Cara Mengolah Hasil Tes Sumatif a. Standar yang dipakai Meskipun penilaian sumatif dapat menggunakan standar yang mutlak (criterionreferenced), biasanya orang lebih cenderung untuk menggunakan norma yang relatif (norm-referenced). Dengan menggunakan norma yang relatif, hasil yang dicapai siswa lebih menggambarkan statusnya dibandingkan dengan teman-teman sekelasnya. Untuk pengisian rapor, ijazah, dan sebagainya, norma yang relatif ini dipandang lebih sesuai untuk digunakan. b. Cara mengolah hasil tes sumatif Untuk mengolah hasil tes dengan menggunakan norma yang relatif digunakan nilai-nilai standar (standard scores) seperti nilai berskala 1-10, nilai Z (skor standar Z), atau persentile.

13

Untuk keseragaman penilaian di sekolah-sekolah yang menjalankan sistem pengajaran PPSI, dalam menentukan nilai akhir untuk rapor dan ujian akhir sekolah dianjurkan untuk menggunkan nilai berskala 1-10. Proses pengolahan dari skor mentah (raw score) ke dalam nilai berskala 1-10 dilakukan dengan menyusun distribusi frekuensi, mencari atau menghitung angka rata-rata (mean) dan deviasi standar (DS), dan kemudian mentransformasikan skor-skor mentah tersebut ke dalam nilai berskala 1-10. Jika tes sumatif terdiri atas beberapa bentuk item tes objektif (true-false, multiple choice, matching, essay, dan sebagainya), untuk menskornya harus menggunakan rumus-rumus penskoran yang berlaku untuk tiap bentuk item. True-False, S = R-W; S=R ;

Multiple choice,

Fill in, completion, dan matching, S = R Essay, dengan pembobotan (weighting) untuk tiap item Keterangan: S : skor yang diharapkan atau dicari R : jumlah item yang dijawab betul (Right) W : jumlah item yang dijawab salah (Wrong) n : jumlah option (alternatif jawaban) 1 : bilangan tetap. Skor mentah yang diperoleh seorang siswa dari suatu tes sumatif yang terdiri atas beberapa macam bentuk tes merupakan jumlah skor dari tiap-tiap bentuk tes tersebut yang telah dihitung menurut rumus masing-masing. Skor mentah inilah yang kemudian ditransformasikan ke dalam nilai skala 1-10 dengan menyusun tabel distribusi frekuensi seperti yang telah dikemukakan.

Mengolah skor mentah (raw score) menjadi nilai huruf dan beberapa skor standar dengan urutan uraian sebagai berikut: 1. Mengolah skor mentah menjadi nilai huruf Pengolahan skor mentah menjadi nilai huruf pun menggunakan sifat-sifat yang terdapat pada kurva normal atau distribusi normal sebagai dasar perhitungan. Adapun ciri-ciri atau sifat-sifat distribusi normal adalah: 14

a. Memiliki jumlah atau kepadatan frekuensi yang tetap pada jarak deviasi-deviasi tertentu b. Pada distribusi normal, mean, median, dan mode berimpit (sama besar), terletak tepat di tengah kurva dan membagi dua sama besar jarak deviasi antara 3 DS dan + DS Berdasarkan sifat-sifat distribusi itulah maka penjabaran skor mentah menjadi nilai huruf dipergunakan mean dan DS. i. Mengolah Skor Mentah Menjadi Nilai Huruf dengan Menggunakan Mean (M) dan Deviasi Standar (DS) Mencari mean (M) dan deviasi standar (DS) dalam rangka mengolah skor mentah menjadi nilai huruf dapat dilakukan dengan dua cara yaitu jika banyaknya skor yang diolah kurang dari 30 digunakan tabel distribusi frekuensi tunggal, jika banyaknya skor yang diolah lebih dari 30 sebaiknya digunakan tabel distribusi frekuensi bergolong. Misalnya seorang dosen memperoleh skor mentah dari hasil tes yang telah diberikan kepada 20 orang mahasiswanya sebagai berikut: 73, 70, 68, 68, 67, 67, 65, 65, 63, 62 60, 59, 59, 58, 58, 56, 52, 50, 41, 40 Skor mentah itu akan diolah menjadi nilai huruf A, B, C, D, TL dengan menggunakan M dan DS. Untuk itu kita akan membuat tabel sebagai berikut: Langkah-langkah menyusun tabel: Masukkan nama siswa (kedalam kolom 1) dan skor masing-masing siswa (ke dalam kolom 2) kemudian jumlahkan akan memperoleh X. Hitung mean (M) dengan membagi jumlah skor itu (X) dengan N (banyaknya mahasiswa yang dites). Jadi rumus untuk mencari M adalah M= Isi kolom 3 dengan selisih (deviasi) tiap skor dari mean (X-M) Isi kolom 4 dengan menguadratkan angka-angka dari kolom 3. Kemudian jumlahkan sehngga akan memperoleh (X-M)2 Hitung mean dan DS dengan rumus berikut:

15

M=

DS =

atau DS =

TABEL UNTUK MENGHITUNG MEAN DAN DS Nama Siswa 1 Amrin Dahron Mardi Popon Jamilah Sarman Ronald Nursam Marnah Kamerun Djufri Rajiman Jugil Bonteng Pairah Gurita Marlopo Karmin Nirmala Brutal Jumlah Skor Mentah (X) 2 73 70 68 68 67 67 65 65 63 62 60 59 59 58 58 56 52 50 41 40 1201 (X) (X-M) atau (d) 3 13 10 8 8 7 7 5 5 3 2 0 -1 -1 -2 -2 -4 -8 -10 -19 -20 (X-M)2 atau (d)2 4 169 100 64 64 49 49 25 25 9 4 0 1 1 4 4 16 64 100 361 400 1509 (X-M)2

Dari tabel tersebut kemudian dicari mean dan DS: M= DS = = = 60,05 dibulatkan = 60 = = = 8,69

16

Penjabaran Menjadi Nilai Huruf: Dari perhitungan tersebut diperoleh mean (M) = 60 dan DS = 8,69. Selanjutnya langkah-langkah penjabaran skor mentah menjadi nilai huruf adalah: Tentukan besarnya skala unit deviasi (SUD). Misalnya, menggunakan seluruh jarak range dari kurva normal yaitu antara -3 DS s. d. +3 DS = 6 DS. Karena nilai huruf yang akan digunakan adalah A B C D TL yang berarti = 4 unit, SUD nya = 6 DS : 4 = 1,5 DS. Jadi, SUD = 1,5 x 8, 69 = 13, 035, dibulatkan menjadi 13 Titik tengah nilai C terletak pada mean = 60 karena C merupakan nilai tengah pada skala penilaian A B C D TL Tentukan batas bawah (lower limit) dan batas atas (upper limit) dari masingmasing nilai huruf Karena titik tengah C = M = 60, maka Batas bawah C = M 0,5 SUD = 60 0,5 (13) = 53,5 Batas atas C = M + 0,5 SUD = 60 + 0,5 (13) = 66,5 Batas bawah D = M 1,5 SUD = 60 1,5 (13) = 34 Skor bawah 34 = TL Batas atas B = M + 1,5 SUD = 60 + 1,5 (13) = 79,5 Skor diatas 79,5 = A Berdasarkan hasil perhitungan pada langkah diatas, skor mentah dari 20 orang mahasiswa ke dalam nilai huruf adalah: Skor 80 keatas = A = tidak ada Skor 67 s. d. 79,5 = B = 6 orang Skor 54 s. d. 66,5 = C = 10 orang Skor 34 s. d. 53,5 = D = 4 orang Skor dibawah 34 = TL = tidak ada ii. Mengolah Skor Mentah Menjadi Nilai Huruf dengan Batas Lulus = Mean Cara lain untuk mengolah skor mentah menjadi nilai huruf ialah dnegan menggunakan mean dan DS yang diperoleh dengan membuat tabel frekuensi. Misalnya seorang dosen memperoleh skor dari hasil ujian semester dari 50 mahasiswa: 97, 93, 92, 90, 87, 86, 86, 83, 81, 80, 17

80, 78, 76, 76, 75, 74, 73, 72, 72, 71, 69, 67, 67, 67, 64, 63, 63, 62, 62, 60, 58, 57, 57, 56, 56, 54, 52, 50, 47, 45, 43, 39, 36, 36, 32, 29, 27, 26, 20, 16. Skor mentah ini akan diolah menjadi nilai huruf A, B, C, D, dan TL. Untuk mencari mean dan DS susun skor mentah tersebut ke dalam tabel frekuensi. Cari terlebih dahulu range untuk menentukan besarnya interval dan kelas interval. Range = 97 16 = 81 Kelas interval = Jadi dengan menentukan besarnya interval = 10, kelas intervalnya = 9. TABEL DISTRIBUSI FREKUENSI Kelas 1 2 3 4 5 6 7 8 9 Interval 96 105 86 95 76 85 66 75 56 65 46 55 36 45 26 35 16 - 25 f 1 6 7 10 11 4 5 3 3 50 (N) d +4 +3 +2 +1 0 -1 -2 -3 -4 Fd +4 +18 +14 +10 0 -4 -10 -9 -12 +11 (fd) fd2 16 54 28 10 0 4 20 27 48 207 (fd2)

Dari tabel tersebut, meannya adalah: M = M + i Keterangan: M M = mean sebenarnya yang akan dicari = mean dugaan dalam tabel = i = interval = 10 18

fd

= jumlah dari kolom fd = +11

Maka, M = M + i =60,5 + 10 ( = 60,5 + 2,2 = 62,7 dibulatkan = 63 Cara mencari deviasi standar (DS) adalah: DS = i DS = 10 DS = 10 = 10 = 10 x 1,9 = 19

Selanjutnya, cara mengubah skor mentah yang diperoleh dosen itu menjadi nilai huruf A, B, C, D, dan TL dengan batas lulus = mean adalah: Telah ditentukan bahwa batas lulus = mean = 63. Jadi skor mentah dari 63 keatas dibagi menjadi nilai huruf A, B, C, D, dan skor dibawah 63 dinyatakan TL. SUD = 0,75; DS = 0,75 x 19 = 14,25. Dengan demikian, selanjutnya akan dapat menghitung dengan mudah batas atas dan batas bawah dari masingmasing nilai huruf sebagai berikut: Batas bawah D atau batas lulus = mean = 63 Skor dibawah 63 = TL Batas atas D = M + 1 SUD = M + 0,75 DS = 63 + 14,25 = 77 Batas atas C = M + 2 SUD = M + 1,5 DS = 63 + 28,5 = 92 Batas atas B = M + 3 SUD = M + 2,25 DS = 63 + 42,75 = 106 Skor diatas 106 = A

Dengan perhitungan tersebut maka hasil kelulusan dari 50 mahasiswa adalah: Yang tidak lulus (TL), skor dibawah 63 Yang mendapat nilai D, skor 63 77 Yang mendapat nilai C, skor 78 92 Yang mendapat nilai B, skor 93 106 Yang mendapat nilai A, skor diatas 106 19 = 23 orang = 15 orang = 10 orang = 2 orang = tidak ada

Jika dibandingkan dengan cara penjabaran terdahulu, maka cara yang terakhir ini ternyata lebih mahal. Dari 50 mahasiswa yang ujian, ternyata sebanyak 23 orang tidak lulus (hampir 50 persen). Akan tetapi jika cara yang terakhir dibandingkan dengan pengubahan skor mentah menjadi nilai 1 10 ternyata lebih mudah. Jika skor mentah yang diperoleh 50 mahasiswa dijabarkan menjadi nilai 1 10 dengan menggunakan mean dan DS aktual dengan batas lulus M + 0,25 DS = 63 + 4,75 = 68, maka yang dapat dinyatakan lulus = 21 orang dan yang tidak lulus = 29 orang. iii. Mengolah Skor Mentah Menjadi Nilai Huruf dengan Menggunakan Mean Ideal dan DS Ideal Jika skor maksimum ideal dari tes yang diberikan kepada 50 mahasiswa tersebut = 120, maka mean ideal = x skor maksimum ideal = x 120 = 60 dan

DS ideal dari tes tersebut = x 60 = 20 Dengan cara menjabarkan yang telah diuraikan, yakni dengan ketentuan batas lulus = mean dan dengan demikian 1 SUD = 0,75 DS, maka: Batas bawah D atau batas lulus = mean = 60 Skor dibawah 60 = TL Batas atas D = M + 1 SUD = M + 0,75 DS = 60 + (0,75 x 20) = 60 + 15 = 75 Batas atas C = M + 2 SUD = M + 1,5 DS = 60 + (1,5 x 20) = 60 + 30 = 90 Batas atas B = M + 3 SUD = M + 2,25 DS = 60 + (2,25 x 20) = 60 +45 = 105 Skor diatas 105 = A Dengan perhitungan tersebut maka hasil kelulusan dari 50 orang mahasiswa adalah: Yang tidak lulus (TL), skor dibawah 60 Yang mendapat nilai D, skor 60 75 Yang mendapat nilai C, skor 76 90 Yang mendapat nilai B, skor 91 105 Yang mendapat nilai A, skor diatas 105 = 20 orang = 16 orang = 11 orang = 3 orang tidak ada

Jika dibandingkan hasil perhitungan tersebut dengan hasil perhitungan yang lalu, ternyata bahwa hasil kelulusan berimbang atau hampir sama. Yang tidak lulus hanya selisih 3 orang dan kedua-duanya tidak ada yang memperoleh nilai A. Hal 20

ini antara lain adalah karena skor maksimum ideal dari tes yang diolah adalah 120 sedangkan nilai maksimum aktual (nilai tertinggi dari kelompok yang dites) adalah 97, yang berarti masih jauh dibawah nilai maksimum ideal 120. Akan tetapi jika nilai maksimum ideal dari tes itu 100 misalnya maka mean ideal ideal = 50 dan DS

= 16,7 dibulaykan = 17. Dengan demikian mungkin ada beberapa orang

mahasiswa yang memperoleh nilai A dan yang tidak lulus pun jumlahnya berkurang. 2. Mengolah skor mentah menjadi skor standar 1-10 Untuk mengolah skor mentah menjadi nilai 1-10, kita perlu mencari mean (rata-rata) dan DS. Untuk itu skor mentah harus disusun ke dalam tabel distribusi frekuensi. Langkah-langkah menyusun tabel distribusi adalah: a. Kita tentukan dulu banyaknya kelas interval dengan cara: b. Mengisi kolom 2 (kolom interval) di dalam tabel yang telah tersedia, mulailah dari skor minimum berturut-turut dengan interval yang telah ditemukan dan sejumlah kelas yang ditentukan pada langkah pertama. c. Membuat tally pada kolom 3 (menabulasikan tiap-tiap skor ke dalam kelasnya d. Mengisikan angka (jumlah) tally ke dalam kolom 4 (lajur frekuensi = f) e. Menentukan deviasi pada lajur d dengan menetapkan letak mean dugaan (M) dengan angka nol pada kelas tertentu. Untuk menduga letaknol tersebut dapat kita pilih kelas yang mengandung frekuensi yang paling tinggi. Selanjutnya kita letakkan angka-angka deviasi itu dari nol ke atas dan ke bawah. Angkaangka diatas nol kita beri tanda + (plus) dan angka-angka dibawah nol diberi tanda (minus) f. Mengisi lajur fd dengan mengalikan angka-angka pada lajur f dan d. Kemudian hasilnya dijumlahkan pada bagian bawah dari tabel ( = fd). Sampai dengan kolom 6 ini (lajur fd) kita telah dapat menghitung besarnya mean yang sebenarnya dari table tersebut. Akan tetapi, karena kita masih memerlukan mencari DS (deviasi standar), kita perlu menambah satu kolom lagi untuk mencari fd2 g. Mengisi lajur fd2, kemudian dijumlahkan pula pada bagian bawah dari tabel sehingga kita peroleh fd2 yang diperlukan dalam rumus untuk mencari DS.

21

Umpamakan seorang guru memperoleh skor mentah sari hasil ulangan sejarah di kelas III SMP yang berjumlah 50 siswa: 16 64 87 36 65 42 43 54 47 51 77 55 68 42 40 47 42 46 45 50 20 57 28 7 44 51 40 39 39 57

28 39 21 48 46 37 41 43 49 71 29 44 34 50 45 35 44 52 56 45 Dari skor mentah hasil ulangan sejarah tersebut kita dapat menyusun tabel distribusi frekuensi seperti berikut: Skor maksimum Skor minimum Range Banyaknya kelas interval: = 87 = 7 = 87 7 = 80

Jadi, interval (i) = 8; kelas interval = 11 fd2 36 0 32 27 16 11 0 4 12 27 16

Kelas Interval 1 2 3 4 5 6 7 8 9 10 11 87-94 79-86 71-78 63-70 55-62 47-54 39-46 31-38 23-30 15-22 7-14

Tally I II III IIII IIII IIII I IIII IIII IIII III IIII III III I

f 1 0 2 3 4 11 18 4 3 3 1

fd

+6 6 +5 0 +4 8 +3 9 +2 8 +1 11 0 -1 -2 -3 -4 0 -4 -6 -9 -4

N = 50

+19

181

(fd) (fd2)

22

Sekarang kita cari angka rata-rataa (mean) dari tabel di atas Rumus mean Dengan melihat pada tabel distribusi frekuensi maka: ( )

Mean dugaan (M) sebesar 42,5 adalah nilai titik tengah dari kelas interval 39 46, yaitu kelas interval yang kita duga tempat letaknya mean. Cara menghitung:

Dari tabel itu juga searang kita mencari DS Rumusnya: DS = i Dengan menggunakan rumus tersebut maka: DS =8 =8 =8 = 8 x 1,89 = 15,12 dibulatkan = 15 Setelah ditemukan besarnya mean dan DS (mean = 45,54 dan DS = 15), langkah selanjutnya adalah menjabarkan skor mentah yang diperoleh dari ulangan sejarah ke dalam nilai 1-10 dengan menggunakan rumus penjabaran sebagai berikut: Rumus penjabaran: M + 2,25 DS = 10 M + 1,75 DS = 9 M + 1,25 DS = 8 M + 0,75 DS = 7 M + 0,25 DS = 6 M - 0,25 DS = 5 M - 0,75 DS = 4 M - 1,25 DS = 3 M - 1,75 DS = 2 M - 2,25 DS = 1 ( )

23

Hasil perhitungan: 45,54 + (2,25 x 15) = 79,29 dibulatkan = 79 Skor 45,54 + (1,75 x 15) = 71,79 dibulatkan = 72 45,54 + (1,25 x 15) = 64,29 dibulatkan = 64 45,54 + (0,75 x 15) = 56,79 dibulatkan = 57 45,54 + (0,25 x 15) = 49,29 dibulatkan = 49 45,54 (0,25 x 15) = 41,79 dibulatkan = 42 45,54 (0,75 x 15) = 34,29 dibulatkan = 34 45,54 (1,25 x 15) = 26,79 dibulatkan = 27 45,54 (1,75 x 15) = 19,29 dibulatkan = 19 45,54 (2,25 x 15) = 11,79 dibulatkan = 12

Penjabarannya: 79 keatas 72 s. d. 78 64 s. d. 71 57 s. d. 63 49 s. d. 56 42 s. d. 48 34 s. d. 41 27 s. d. 33 19 s. d. 26 12 s. d. 18 = 10 =9 =8 =7 =6 =5 =4 =3 =2 =1

11 ke bawah = 0 Dengan pedoman penjabaran tersebut, sekarang guru tinggal mentransfer atau mengubah skor mentah yang diperoleh setiap siswa ke dalam nilai 1-10. Dengan penjabaran secara statistik, dengan membuat tabel distribusi frekuensi dan menggunakan mean dan DS aktual, yaitu mean dan DS yang diperoleh dari perhitungan skor mentah yang benar-benar dicapai oleh kelompok siswa yang dites, bagaimanapun hasil tes yang kita peroleh akan menghasilkan nilai diantara 1-10 atau antara 0-10. Dengan kata lain,akan selalu terdapat anak yang memperoleh nilai tinggi dan nilai yang terendah karena dalam penyusunan tabel yang menjadi dasar perhitungan menggunakan skor maksimum dan skor minimum yang benar-benar dicapai oleh kelompok siswa yang dites. Dengan demikian, nilai-nilai yang diperoleh siswa masing-masing menunjukkan status kepandaian siswa tersebut dibandingkan dengan teman-teman yang lain didalam kelompok itu. Kebaikan sistem penskoran seperti ini ialah bahwa nilai-nilai yang diperoleh siswa benar-benar mencerminkan kapasitas kelompok. Akan tetapi, kelemahannya ialah bahwa nilai-nilai yang diperoleh sistem tersebut belum mencerminkan sampai dimana pencapaian scope bahan pelajaran yang diteskan. Oleh karena itu, untuk mengurangi kelemahan ini kita juga melakukan sistem penskoran tersebut dengan menggunakan mean ideal dan DS ideal. Caranya adalah sebagai berikut: Misalkan tes yang dipergunakan untuk ulangan sejarah tersebut memiliki skor maksimum ideal = 100

24

Mean ideal DS ideal

= =

= 50

Dengan menggunakan rumus penjabaran, maka: 50 + (2,25 x 16,6) = 87,35 dibulatkan = 87 10 50 + (1,75 x 16,6) = 79,05 dibulatkan = 79 9 50 + (1,25 x 16,6) = 70,75 dibulatkan = 71 8 50 + (0,75 x 16,6) = 62,45 dibulatkan = 62 7 50 + (0,25 x 16,6) = 54,15 dibulatkan = 54 6 50 (0,25 x 16,6) = 45,85 dibulatkan = 46 5 50 (0,75 x 16,6) = 37,55 dibulatkan = 38 4 50 (1,25 x 16,6) = 29,25 dibulatkan = 29 3 50 (1,75 x 16,6) = 20,95 dibulatkan = 21 2 50 (2,25 x 16,6) = 12,65 dibulatkan = 13 1 Dengan menggunakan mean ideal dan DS ideal, ternyata bahwa hasilnya menjadi berlainan. Siswa yang mendapat nilai 10 adalah siswa yang memperoleh skor mentah 87 keatas dan bukan 79 keatas seperti hasil perhitungan dengan menggunakan mean dan DS aktual. Juga yang mendapat nilai 6 adalah siswa yang memperoleh skor mentah 54 s. d. 61 dan bukan 49 s.d. 56 seperti perhitungan yang lalu. Perubahan skor mentah menjadi nilai 1-10 dengan menggunakan mean ideal dan DS ideal lebih mudah dan praktis karena kita tidak perlu menyusun tabel distribusi frekuensi. Untuk menghitung mean ideal dan DS ideal kita hanya memerlukan skor maksimum ideal dari tes yang kita laksanakan. Yang dimaksud dengan skor maksimum ideal adalah skor tertinggi yang seharusnya dicapai jika tes tersebut dikerjakan dengan betul semua. Dengan demikian, besarnya skor maksimum pada jumlah item dan pembobotan dalam tes yang dipergunakan. PENILAIAN DENGAN PERSEN Cara menilai lain yang dapat juga kita lakukan ialah dengan menggunakan persen atau yang disebut presentages correction. Nilai yang diperoleh siswa benarbenar merupakan nilai dan bukan lagi skor. Rumus penilaian adalah sebagai berikut: NP = x 100

25

Keterangan: NP R SM 100 : nilai persen yang dicari atau diharapkan : skor mentah yang diperoleh siswa : skor maksimum ideal dari tes yang bersangkutan : bilangan tetap

Beberapa contoh sebagai penjelasan Siswa A memperoleh skor 64 dari tes matematika yang memiliki skor maksimum ideal = 80.Maka nilai A yang sebenarnya adalah x 100 = 80.

Siswa B memperoleh skor 64 dari tes bahasa Indonesia yang memiliki skor maksimum ideal = 100. Maka nilai B = 64. Cara menilai dengan persen seperti di atas banyak dilakukan oleh guru-guru dan para dosen. Hal ini adalah karena dianggap lebih mudah dan praktis. Suatu perguruan tinggi mempunyai pedoman penilaian sebagai berikut:
T in g k a tP e n g u a s a a n 8 6 -1 0 0% 7 6 -8 5% 6 0 -7 5% 5 5 -5 9% 5 4% N ila iH u ru f B o b o t P re d ik a t A 4S a n g a tB a ik B 3B a ik C 2C u k u p D 1K u ra n g T L 0K u ra n gS e k a li

Jika nilai si A dan si B pada contoh yang baru lalu akan ditransfer ke dalam nilai huruf menurut pedoman penilaian tersebut di atas, maka nilai si A = 80 = B, nilai si B = 64 = C. Demikian pula jika nilai-nilai persen itu akan diubah menjadi nilai dengan skala 1-10, tinggal membagi nilai itu dengan angka 10, kemudian dibulatkan menurut ketentuan pembulatan angka desimal. Sebagai contoh, nilai si A = 80 menjadi nilai 8 (pada skal 1-10); nilai si B = 64 menjadi 6,4 dan dibulatkan menjadi 6. 3. Mengolah Skor Mentah Menjadi Skor Standar Z Yang dimaksud dengan Z skor adalah skor yang penjabarannya didasarkan atas unit deviasi standar dari mean. Dalam hal ini mean dinyatakan 0 (nol). Pengolahan skor mentah menjadi skor Z ini sering kali dirasakan perlunya karena dengan hanya melihat skor mentah saja kita belum dapat memberikan tafsiran yang baik dan tepat. Atau dengan kata lain, dengan hanya mengetahui skor mentah saja dapat menimbulkan tafsiran yang salah mengenai kecakapan seseorang. 26

Misalkan kita melihat hasil tes (ujian SD) dari seorang anak bernama Umar sebagai berikut: Bahasa Indonesia = 65 Matematika IPS = 55 = 70

Untuk dapat lebih mengetahui bagaimana kecakapan Umar itu sebenarnya jika dibandingkan dengan teman-teman sekelasnya, kita perlu mengetahui besarnya mean dan DS dari skor yang diperoleh Umar itu sebagai berikut: Mata Pelajaran Bahasa Indonesia Matematika IPS Skor 65 55 70 Mean 60 45 75 DS 4.0 4.0 5.0

Dengan membandingkan skor yang dicapai Umar itu dengan mean-nya masingmasing, sepintas lalu kita telah melihat bahwa Umar bukan sangat pandai dalam IPS, malah ia lebih baik dalam matematika dan bahasa Indonesia jika dibandingkan dengan rata-rata kelas (teman-temannya). Untuk dapat mengetahui bagaimana kedudukan Umar yang sebenarnya di dalam kelompok teman-temannya itu, di samping mean perlu pula kita mengetahui DS dari tiap mata pelajaran itu. Dengan mempergunakan mean dan DS itulah kita dapat menjabarkan atau mengubah skor-skor yang diperoleh Umar itu menjadi skor Z. Rumusnya :
Skor Z =

Dengan menggunakan rumus tersebut kita dapat mengubah skor yang dicapai Umar tadi ke dalam skor Z sebagai berikut: Bahasa Indonesia = Matematika IPS = = = = = = +1,25 = +2,5 = -1,0

Melihat hasil skor Z di atas kita dapat mengatakan bahwa kedudukan Umar dalam bahsa Indonesia adalah 1,25 DS di atas mean, untuk matematika 2,5 DS di atas mean, sedangkan IPS 1,0 DS di bawah mean.Dengan demikian, justru umar kurang pandai

27

dalam IPS dibandingkan dengan teman- teman sekelasnya, dan jauh lebih pandai dalam matematika dan bahasa Indonesia. Disamping itu, skor Z sering pula dipergunakan untuk membandingkan prestasi anak dengan anak yang lain dalam beberapa matapelajaran. Misalnya, teman umar tadi bernama basir hasil tes yang dicapai oleh basir: Bahasa Indonesia Matematika IPS 70 60 60

Pertanyaan yang timbul pada kita ialah: siapa diantara kedua anak tersebut yang sebenarnya lebih baik prestasinya? Umar atau basir? Jika kita hanya melihat sepintas lalu atau hanya melihatnya dari hasil rata- rata dari kedua hasil tes masing- masing, tentu kita akan mengatakan umar sama pandai dengan basir karena jumlah skor umar 65 + 55 + 70 = 190, dan jumlah skor basir 70 + 60 + 60 = 190. Akan tetapi, kesimpulan kita itu belum tentu benar. Dengan menggunakan skor standar (skor Z) kita dapat mengetahui siapa sebenarnya lebih baik atau lebih tinggi prestasinya. Dalam hal ini perlu diingat mean dan DS untuk tiap mata pelajaran yang dicapai oleh kedua anak itu sama.
Skor Z Umar: Bahasa Indonesia: = = +1,25 Skor Z Basir: Bahasa Indonesia: = = +2,5

Matematika: = IPS: = = +1,0 = +2,5

Matematika: = IPS: = = -3,25 = +3,75

Jumlah + 2,75

Jumlah + 3,25

Dengan melihat hasil tersebut diatas, dapat diambil kesimpulan bahwa prestasi basir ternyata lebih baik daripada umar.

28

4. Mengolah Skor Mentah Menjadi Skor Standar T Dengan bersumber pada skor Z seperti telah dibicarakan di muka, banyak pula dikembangkan skor- skor standar lainnya yang dikenal orang sebagai angka skala. Jenis skor standar yang merupakan angka skala yang telah banyak dikenal orang antara lain ialah skor T. Yang dimaksud dengan skor T ialah angka skala yang menggunakan dasar mean = 50 dan jarak tiap deviasi standar (DS) = 10. Di dalam range 3 DS, T tersebar dari 20 s.d. 80, tanpa bilangan-bilangan minus. Penjabaran skor mentah ke dalam skor T ini pun sering kali kita perlukan untuk mengetahui bagaimana kedudukan seorang anak yang memperoleh skor tersebut dibandingkan dengan kelompoknya di dalam suatu hasil tes. Selesai itu, dengan penjabaran ke dalam skor T ini, hasil-hasil tes (skor mentah) yang diperoleh dari beberapa mata pelajaran yang memiliki mean dan DS yang berbeda-beda dapat diubah menjadi skor- skor standar dengan satu skala unit deviasi. Dengan demikian, suatu panitia ujian sekolah, misalnya, dapat menentukan batas lulus dari berbagai mata pelajaran dengan kedudukan nilai skor yang sama setelah setiap skor dari mata pelajaran-mata pelajaran tersebut dijabarkan kedalam skor T. Rumusnya: Skor T = ( )10 + 50 atau skor T = 10z + 50

Jika skor- skor yang diperoleh umar tadi kita jabarkan ke dalam Skor T, akan kita peroleh seperti berikut: Bahasa Indonesia =( Matematika =( IPS =( )x 10 + 50 =(-1,0)x 10 +50 = 40,0 )x 10 + 50 = (+2,5)x 10 +50 = 75,0 ) x 10 + 50 = (+1,25)x 10 + 50 =62,5

Dengan melihat hasil penjabaran ke dalam skor T di atas, secara cepat kita dapat mengatakan bahwa umar memiliki prestasi yang cukup baik dalam matematika dibandingkan dengan teman- teman sekelompoknya, dan kurang baik prestasinya dalam IPS. Ingat bahwa dengan menjabarkan kedalam skor T itu kita telah menyamakan besarnya mean dari ketiga mata pelajaran tersebut, yaitu mean = 50.

29

-1,0 +1,25 Skor Z B. ind Mtk IPS -3 48 33 60 -2 52 37 65 30 -1 56 41 70 40 0 60 45 75 50 +1 64 49 80 60 65 +2,5 +2 68 53 85 70 55 +3 72 57 90 70

Skor T 20

Jika skorskor yang diperoleh umar tadi kita letakkan di dalam skala skor T yang disejajarkan dengan skor Z, akan kita lihat seperti terlukis pada gambar diatas. Dengan memperhatikan gambar itu, jelas kiranya bagaimana kedudukan skor- skor yang diperoleh umar dibandingkan dengan rata- rata kelompoknya. Perhatikan skorskor yang dicetak miring pada gambar, dan skor Z-nya yang terletak diatas dasar kurva. 2.4 Interpretasi Skor 1) Pengertian Interpretasi Interpretasi adalah suatu proses untuk menyederhanakan ide-ide atau issu-issu yang rumit dan kemudian membaginya dengan masyarakat awam/umum. Suatu interpretasi yang baik adalah suatu interpretasi yang dapat membangun hubungan antara audiens dengan obyek interpretasi. Apabila dilakukan secara efektif, interpretasi dapat digunakan untuk meyakinkan orang lain, dapat mendorong orang lain untuk merubah cara berpikir dan tingkah laku mereka. Interpretasi (penafsiran) merupakan suatu analisa seseorang terhadap suatu kejadian atau peristiwa tentang obyektif atau subyektif. Leon H. Levy dalam buku yang berjudul Psychological Interpretation (1963) menyatakan bahwa interpretasi adalah suatu kegiatan yang dilakukan apabila ada suatu keadaan yang sulit untuk dipahami secara biasa atau secara langsung. Pada dasarnya interpretasi terdiri dari kegiatan memberikan suatu kerangka referensi yang lain atau mengemukakan suatu bahasa lain bagi sejumlah 30

observasi atau tingkah laku, dengan tujuan agar hal ini dapat dipergunakan. Interpretasi atau penafsiran hasil tes bertujuan untuk menerjemahkan dan memberi makna terhadap skor yang diperoleh testee (orang yang diuji). 2) Jenis Interpretasi Ada dua jenis interpretasi yaitu interpretasi kelompok dan interpretasi individual. Interpretasi kelompok adalah penafsiran yang dilakukan untuk mengetahui karakteristik kelompok berdasarkan data hasil evaluasi, antara lain prestasi kelompok, rata-rata kelompok, sikap kelompok terhadap guru dan mata pelajaran yang diberikan, dan distribusi nilai kelompok. Tujuan utamanya adalah sebagai persiapan untuk melakukan penafsiran kelompok, untuk mengetahui sifat-sifat tertentu pada suatu kelompok, dan untuk mengadakan perbandingan antarkelompok. Interpretasi individual adalah penafsiran yang hanya tertuju kepada individu saja. Misalnya, dalam kegiatan bimbingan dan penyuluhan atau situasi klinis lainnya. Tujuan utamanya adalah untuk melihat tingkat kesiapan siswa (readiness), pertumbuhan dan kemajuan, serta kesulitan-kesulitan yang dihadapinya. 3) Analisis dan Interpretasi Soal Tes Objektif Setelah diuraikan dengan agak panjang tentang bagaimana menganalisis soal tes dengan menghitung taraf kesukaran dan daya pembedanya, dan

menginterpretasikannya dengan menggunakan rumus- rumus tertentu, dalam uraian berikut ini akan dibicarakan cara menganalisis dan mengiterpretasikan soal- soal tes objektif, khususnya soal tes yang berbentuk pilihan ganda (multiple choice). Uraian ini kami adaptasikan dari buku Measurement and Evaluation in Psychology and Education karangan R.L. Throndike dan E.P. Hagen (1977) halaman 251-255, dengan perubahan pada isi soal- soalnya. Berlainan dengan cara menganalisis yang telah diuraikan terdahulu, cara analisis yang dilakukan oleh Throndike dan Hagen ini kelihatan lebih praktis dan sekaligus diikuti bagaimana menginterpretasikannya, dengan demikian, penganalisis dapat mengetahui di mana atau pada bagian mana dari soal tersebut yang masih lemah dan perlu mendapat perbaikan. Suatu cara yang sederhana untuk menyiapkan pencatatan jawaban- jawaban dari tiap item dapat dibuat dalam bentuk kartu- kartu seperti dibawah ini. 31

Soal no. . . . Hasil perkebunan di daerah lampung yang terbesar adalah: A. Karet B. Lada C. Kelapa sawit D. Kopi Alternatif jawaban Alt Jawaban kelompok Upper 25 % Middle 50 % Lower 25 % 1 10 17 5 1 1 2 3 A B C D E Kosong

Kartu semacam itu dapat digunakan untuk soal-soal pilihan ganda (multiple choice) yang mempunyai alternatif jawaban sampai dengan lima buah, tetapi dapat pula digunakan untuk tes benar-salah (true-false) yang hanya mempunyai dua alternative jawaban. Tiap kartu dipergunakan untuk satu soal. Kemudian kartu- kartu yang berisi keterangan tentang soal itu dapat disusun dalam suatu file soal yang permanen, dan sewaktu- waktu dapat dipergunakan bilamana diperlukan. Contoh Analisa Soal (Item Analysis) Misalkan 100 orang murid dites dengan tes pilihan ganda yang berjumlah 95 soal. Hasil tes menunjukkan skor tertinggi 85 dan terendah 14. Dari hasil tes itu kita ambil 25 orang (25 %) yang tergolong upper group, dan 25 orang (25 %) yang tergolong lower group.cara mengambil kelompok upper group dan lower group adalah sebagai berikut: mula-mula kita susun lembaran hasil tes itu dari lembaran yang memiliki skor tertinggi (85) berturut-turut sampai kepada lembaran yang memiliki skor terendah (14). Kemudian kita ambil 25 lembar dari atas, dan inilah kelompok upper group ;dan 25 lembar dari bawah, inilah kelompok lower group. Misalkan dari kelompok upper group yang kita ambil terdapat skor dari 59 s.d. 85, dan dari kelompok lower group

32

terdapat skor 14 s.d. 34. Kelompok sedang (middle group) yang berjumlah 50 lembar (50%) kita biarkan. Jawaban- jawaban dari kedua kelompok upper group dan lower group itulah yang kemudian kita tabulasikan dan kita analisis. Berikut ini beberapa contoh Soal no. 1 hasilnya sebagai berikut: 1) Penyebar agama Islam yang mula- mula dijawa barat ialah: Upper A. B. C. D. Sultan Hasanuddin Fatahillah Untung Surapati Sunan Kalijaga 0 25 0 0 0 Lower 2 20 0 1 0

Dikosongkan Interpretasi:

Soal ini mudah karena semua (25) orang dari kelompok upper group dan 20 orang dari lower group dapat menjawab soal itu dengan benar. Namun, soal ini termasuk baik karena dapat membedakan arah yang diinginkan : ternyata jawaban- jawaban yang salah terdapat pada kelompok lower group. Dua atau tiga soal semacam ini baik digunakan sebagai permulaan suatu tes. Soal no. 2 hasilnya sebagai berikut: 2) Kegembiraan kerja bagi guru- guru di sekolah dapat tercapai apabila: Upper A. Guru- guru menerima tugas pembagian kerja yang sama beratnya. B. C. Tidak pernah ada kecaman dari kepala sekolah. Kepala sekolah memperhatikan dan menghargai tiap usaha guruu yang dilakukan dengan rasa tanggung jawab. D. Kepala sekolah memperhatikan penghidupan guruguru. Di kosongkan Interpretasi: Soal ini sukar, tetapi sangat efektif. Bahwa soal tersebut tergolong sukar dapat dilihat hanya 13 dari 50 orang yang dapat menjawab soal itu dengan benar. Bahwa soal itu 33 0 0 0 0 13 5 3 9 5 15 lower

dikatakan efektif dapat dilihat dari kenyataan bahwa ke 13 orang yang menjawab benar itu semua terdapat pada kelompok upper group yang sejumlahnya lebih besar dari pada kelompok upper group yang menjawab salah. Sepintas lalu soal semacam ini menunjukkan betapa sulit untuk menjawabnya secara menerka dengan membabi buta saja. Sebagian besar dari kelompok lower group memusatkan perhatiannya pada satu alternatif jawaban yang salah yang seolah- olah benar atau dapat diterima. Soal no. 3 mendapat hasil sebagai berikut: 3) Maksud pemerintah mengadakan ikatan dinas bagi siswa- siswa SPG ialah: Upper A. Untuk menarik para lulusan SLP agar mau masuk ke sekolah guru B. Membatasi lulusan SPG yang akan melanjutkan pelajarannya ke sekolah yang lebih tinggi. C. Membantu para siswa yang kurang mampu dalam melanjutkan pelajarannya. D. 2 6 4 6 15 6 Lower

Karena yang masuk SPG kebanyakan anak- anak orang yang miskin Dikosongkan 4 0 7 0

Interpretasi Soal ini tidak baik karena: pertama, soal ini terlalu sukar, hanya 8 dari 50, atau 16 % saja dari murid, yang dapat menjawab benar. Keedua, soal tersebut kurang mempunyai daya pembeda (discriminating power); ternyata dari jawaban yang benar itun banyak terdapat pada lower group ,dan bukan pada upper group. Dalam hal ini ada dua keterangan yang mungkin untuk data analisis soal tersebut: (1) soal tersebut bersifat ambiguous (mempunyai dua arti), terutama bagi siswa- siswa yang mengetahui banyak tentang hal yang ditanyakan, atau (2) para siswa belum pernah mempelajari hal- hal seperti yang ditanyakan. Soal no. 4 hasilnya sebagai berikut: 4) Danau yang terbesar di pulau sumatra ialah: Upper A. B. C. D. Danau Toba Danau Poso Danau Batur Danau Kerinci 34 21 0 0 4 Lower 17 0 0 8

Dikosongkan Interpretasi:

Soal ini menunjukkan beberapa diskriminasi pada arah atau tujuan yang diingini (21 lawan 17), tetapi perbedaan itu tidak begitu tajam. Pola respons adalah satu dang terlalu umum. Hanya dua dari empat alternatif jawaban yang berfungsi atau dipilih oleh siswa. Jika soal ini akan diperbaiki maka yang perlu diubah atau diganti adalah alternatif jawaban B dan C. Mungkin kedua alternatif jawaban tersebut tidak dipilih oleh siswa karena mereka mengetahui bahwa danau poso dan danau batur itu tidak ada di pulau sumatra, tetapi di pulau sulawesi dan bali. Maka untuk menggantinya sebaiknya dicarikan nama danau lain yang ada dipulau sumatera, misalnya danau ranau dan danau maninjau. Analisis soal (item analysis) seperti tersebut diatas, kecuali berguna bagi perbaikan penyusunan kembali soal- soal tes, juga berguna untuk melihat atau meneliti materimateri mana dari bahan pelajaran yang belum dikuasai siswa (soal atau item yang sukar) untuk selanjutnya kita dapat mengulang kembali atau memperbaiki proses belajar- mengajarnya. Soal atau item yang sukar bagi keseluruhan kelas berguna untuk pembimbingan ke arah eksplorasi yang lebih luas. Soal- soal yang ternyata sukar itu dapat didiskusikan bersama kelas sehingga, dsamping memperluas pengetahuan siswa, juga mnghilangkan salah pengertian pada mereka. 4) Prosedur Analisis Item yang Lebih Sederhana untuk Norm-Referenced Test Ada beberapa prosedur analisis item yang dapat dilakukan terhadap norma refereced test (Throndike, 1971). Bagi tes- tes hasil belajar yang informal yang digunakan dalam pengajaran, agaknya diperlukan prosedur yang sederhana saja. Langkahlangkah berikut merupakan prosedur yang simpel, tetapi efektif. Misalkan kita akan menganalisis 32 lembar jawaban tes multiple choice dengan 5 option. Maka langkah- langkahnya adalah sebagai berikut: 1. Susunlah 32 lembar jawaban tes tersebut pada skor yang paling tinggi sampai

kepada skor yang paling rendah. 2. Ambil + sepertiga dari jumlah lembar jawaban tes itu yang mendapat skor

tinggi, dan sebutlah ini upper group (10 lembar). Dan ambil pula + sepertiga dari jumlah lembar jawaban tes yang memperoleh skor rendah, dan sebutlah lower group (10 lembar pula). Pisahkan yang selebihnya, yaitu yang termasuk middle group (12 lembar). Meskipun lembaran middle group ini dapat dimasukan kedalam analisis, 35

penggunaan upper dan lower group saja sudah cukup menyederhanakan prosedur pengolahan (analisis). 3. Untuk tiap item, hitunglah jumlah siswa dari upper group yang memilih tiap

alternatif (option), kemudian kerjakan. Begitu juga pada lower group. 4. Catatlah jumlah dari langkah 3 tersebut di dalam catatan tes dalam kolom dimana alternatif itu dipilih. Atau untuk ini gunakanlah kartu item yang terpisah seperti berikut: Item no 1 Alternatif A B* C D E

Upper 10 Lower 10 *jawaban yang benar 5.

0 3

6 2

3 2

1 3

0 0

Taksirlah tingkat kesukaran soal (item dificully) dengan menghitung

persentase siswa yang menjawab item itu dengan benar. Prosedur sederhana ini adalah untuk mendasarkan penaksiran itu hanya pada siswa- siswa yang termasuk didalam kelompok analisis item itu. Dengan demikian, jumlah siswa dalam upper dan lower group (10+10 =20) yang memilih jawaban benar pada item no. 1 diatas adalah 6 + 2 = 8. Dari situ kita dapat menghitung indeks kesukaran soal sebagai berikut: Index of item difficulty = x 100 = 40 %

Meskipun perhitungan kita hanya didasarkan atas kelompok upper dan lower, hasilnya akan menyediakan suatu taksiran mendekati kebenaran yang berlaku untuk jumlah kelompok seluruhnya. Ini berarti bahwa indeks kesukaran soal no.1 sebesar 40% itu berlaku untuk kelompok (32 orang) yang mengerjakan tes itu. Dengan demikian, karena tingkat kesukaran itu menunjukkan persentase jawaban item yang benar, maka makin kecil persentase menunjukkan makin sulit item itu. Rumus untuk menghitung item difficulty adalah sebagai berikut: P= x 100

36

Keterangan: P = persentase yang menjawab item itu dengan benar R = jumlah yang menjawab item itu dengan benar. T = jumlah total (siswa) yang mencoba menjawab item itu 6. Taksirlah daya pembeda (discriminating power) item itu dengan

membandingkan jumlah siswa dalam upper group yang menjawab item dengan benar. Dari contoh di atas ternyata bahwa 6 siswa pada upper group dan 2 siswa pada lower group menjawab dengan benar. Ini menunjukkan daya pembeda yang positif karena item itu dapat membedakan siswa yang pandai (upper) dan siswa yang kurang (lower); yang menjawab benar dari upper group jumlahnya lebih banyak daripada yang menjawab benar dari lower group. Dari item no. 1 kita dapat menghitung besarnya daya pembeda item itu sebagai berikut: Index of item discriminating power = Rumus daya pembeda; DP= DP U L 1/2T = daya pembeda atau discriminating power yang dicari = jumlah jawaban yang benar dari upper-group = jumlah jawaban yang benar dari lower-group = setengah dari jumlah upper dan lower-group = 0,40

Daya pembeda dari suatu item dinyatakan dengan pecahan desimal dan indeks maksimum daya pembeda yang positif = 1,00 Angka1,00 ini diperoleh dari: jika hanya siswa upper group yang dapat menjawab item itu dengan benar, sedangkan dari siswa lower-group tidak seorang pun yang dapat menjawab item itu dengan benar. Dari tes tersebut di muka mungkin terdapat suatu item yang DP-nya sebagai berikut: DP = = 1,00

Perlu dicatat disini bahwa item itu berada pada tingkat 50 persen dari tingkat kesukaran (10 upper menjawabnya dengan benar, 10 lower menjawabnya salah). Hal ini menjelaskan kepada kita ,mengapa pembuat tes memberanikan diri untuk menyiapkan items untuk tes- tes norm- referenced pada tingkat kesukaran 50 persen. Hanya pada tingkat inilah maksimum daya pembeda dimungkinkan. Daya pembeda nol (0,00) diperoleh jika jumlah siswa yang sama pada kedua kelompok (upper dan lower) menjawab item itu dengan benar. 37

Jadi: DP = = 0,00

Daya pembeda negatif diperoleh jika yang menjawab benar suatu item pada lower group jumlahnya lebih besar ketimbang pada upper group. Jadi: DP = = -0,40

Jika dari hasil analisis suatu item diperoleh DP = 0 (nol) atau DP = - (minus), item yang bersangkutan harus dibuang atau diganti dengan yang baru. 7. Tentukan keefektifan distruktornya dengan membandingkan jumlah siswa

pada upper group dan lower group yang memilih tiap alternatif yang salah. Distruktor yaang baik akan memikat lebih banyak siswa dari lower group ketimbang dari upper group. Dengan melihat contoh pada langkah 4 di muka, dapat kita lihat bahwa alternatif A dan D berfungsi secara efektif, alternatif C kurang baik karena ia menarik lebih banyak dari siswa upper group, dan alternatif E sama sekali tidak efektif karena ia tidak memikat seorang pun dari kedua kelompok itu. Analisis seperti ini sangat berguna untuk mengevaluasi suatu item tes, dan jika dikombinasikan dengan maksud untuk memeriksa item itu sendiri, hasil analisis itu memberikan informasi yang sangat berguna bagi pengembangan item itu. Langkahlangkah penganalisisan soal seperti telah diuraikan diatas dapat dimodifikasi menurut kebutuhan dan situasi tertentu. Juga dalam penetapan jumlah upper dan lower group dapat digunakan 25% upper dan 25% lower jika jumlah kelompok besar, atau bahkan 50% upper dan 50% lower jika jumlah kelompok itu kecil. Yang penting disini adalah menggunakan sebesar mungkin pecahan kelompok itu sehingga kita memperoleh informasi yang berguna. Penggunaan angka 27% untuk upper dan 27% untuk lower, seperti dianjurkan dalam beberapa buku yang biasanya didasarkan atas analisis statistik, untuk penganalisisan tes pencapaian belajar dalam kelas (classroom achievement test) tidak merupakan jaminan atau keharusan yang mutlak. 5) Interpretasi Data Analisis Item Tes Norm-Referenced Jika kita menggunakan jumlah siswa yang relatif kecil dalam menganalisa item tes hasil belajar kelas, informasi analisisJika kita menggunakan jumlah siswa yang relatif kecil dalam menganalisa item tes hasil belajar kelas, informasi analisis item hendaknya diinterpretasikan dengan sangat berhati- hati. Baik tingkat kesukaran 38

maupun daya pembeda suatu item dapat berubah- ubah atau berbeda- beda antara kelompok yang satu dengan kelompok yang lain. Dengan demikian, tidaklah bijaksana menentukan suatu tingkat minimum dari daya pembeda untuk pemilihan item, atau membeda- bedakan items berdasarkan perbedaan yang kecil dalam indeksindeks diskriminasinya. Oleh karena itu, kita hendaknya lebih memperhatikan items yang memiliki daya pembeda yang tertinggi. Namun, sifat tentatif dari data yang kita peroleh memberikan kelonggaran yang besar pada kita untuk berbuat kesalahan. Jika suatu item menunjukkan indeks positif dalam diskriminasi, jika semua alternatifnya berfungsi secara efektif, dan jika item itu mengukur secara pedagogis hasil yang signifikan, item itu hendaknya dipertahankan dan disimpen dalam file item untuk digunakan pada waktu yang akan datang. Jika item itu disimpan dalam file dan digunakan kembali sesudah beberapa saat tertentu, data hasil analisis item itu sebaiknya dicatat pada kartu setiap saat item itu digunakan. Kumpulan data semacam itu akan memperlihatkan variabilitas dalam indeks kesukaran item dan daya pembedanya dan dengan demikian informasi itu lebih interpretable. 6) Prosedur Analisis Item untuk Criterion Referenced Test Dasar pemikiran dalam mengevaluasi items dalam test penguasaan criterionrefrerenced adalah sampai sejauh mana tiap item dapat mengukur hasil pengajaran (effects of instruction), jika suatu item dapat dijawab dengan benar oleh semua siswa, baik sebelum maupun sesudah diajari, jelaslah bahwa item itu tidak mengukur hasil pengajaran. Demikian juga, jika suatu item dijawab salah oleh semua siswa, baik sebelum maupun sesudah siswa mendapat pelajaran, item tersebut tidak berfungsi sebagai alat evaluasi kedua-duanya merupakan contoh ekstrem; namun, kedua contoh tersebut memberikan petunjuk penting bagi pencapaian pengukur hasil pengajaran sebagai satu dasar bagi penentuan kwalitas item. Untuk memperoleh ukuran keefektifan item berdasarkan hasil pengajaran, guru harus memberikan tes yang sama sebelum dan sesudah mengajar. Item yang efektif akan dijawab oleh sejumlah lebih besar siswa sesudah pengajaran dari pada sebelum pengajaran. Indeks sensitifitas bagi keberhasilan pengajaran (sensitifity of instructional effect) (s) dapat dihitung dengan menggunakan rumus berikut: S= 39

Keterangan: S =sensitifitas keberhasilan yang dicari. =jumlah siswa yang menjawab benar item itu sesudah pengajaran RB =jumlah siswa yang menjawab benar item itu sebelum pengajaran. T =jumlah total jawaban item itu yang benar kedua- duanya, sebelum dan

sesudah pengajaran Misalkan suatu item dijawab salah oleh semua siswa (32 orang) sebelum pengajaran, dan dijawab benar oleh semua siswa sesudah pengajaran. Dengan menggunakan rumus diatas akan kita peroleh sebagai berikut: S= = 1,00

Jadi maksimum sensitifitas keberhasilan pengajaran dinyatakan dengan indeks 1,00. Indeks items yang efektif akan berada diantara 0,00 dan 1,00, dan makin besar nilai positif yang diperoleh menunjukkan bahwa item itu sensitifitas keberhasilan pengajarannya makin besar pula. Dengan kata lain, makin besar angka indeks yang diperoleh, makin besar pula sensitifitas keberhasilan pengajarannya. Ada beberapa pembatasan dan penggunaan indeks sensitifitas itu. Pertama, guru harus memberikan tes itu 2 kali untuk menghitung indeks. Kedua, suatu indeks yang rendah tidak selalu benar menunjukkan item yang tidak efektif atau pengajaran yang tidak efektif. Ketiga, respons para siswa terhadap item-item itu sesudah menerima pelajaran, mungkin sedikit-banyak dipengaruhi oleh pengerjaan mereka pada tes yang sama yang telah dilakukan pada waktu sebelum menerima pelajaran. Pembatasan yang terakhir ini akan lebih terlihat dan dirasakan siswa jika pengajaran itu diberikan dalam waktu yang singkat. Meskipun ada pembatasan-pembatasan seperti tersebut diatas, indeks sensitifitas itu tetap mengandung arti yang penting bagi penilaian keefektifan item didalam tes penguasaan criterion-referenced. Item tes akan mempunyai nilai yang kecil bagi pengukuran hasil pengajaran yang diharapkan jika item itu tidak atau kurang memiliki sensitifitas terhadap hasil pengajaran.

40

BAB III Penutup


3.1 Kesimpulan Dari penjelasan di atas dapat disimpulkan bahwa pemberian skor ini sangat penting untuk mendapatkan hasil pengolahan belajar siswa dan mahasiswa sehingga kita dapat mengetahui seberapa jauh pemahaman dan penerimaan siswa terhadap materi pelajaran yang diberikan. Penskoran merupakan langkah pertama dalam proses pengolahan hasil tes pekerjaan siswa atau mahasiswa. Penskoran adalah suatu proses pengubahan jawabanjawaban tes menjadi angka-angka (mengadakan kuantifikasi). Angka-angka hasil penskoran itu kemudian diubah menjadi nilai-nilai melalui suatu proses pengolahan tertentu. Untuk penilaian yang dilakukan oleh pendidik hasil penilaian masing-masing peserta didik harus dibandingkan dengan Kriteria Ketuntasan Minimal (KKM). Analisis ini dimaksudkan untuk mengetahui kemajuan hasil belajar dan kesulitan belajar peserta didik, serta untuk memperbaiki pembelajaran. Hal yang paling mengandung kemungkinan penyalahgunaan tes adalah

penginterpretasian hasil tes secara salah. Oleh karena itu maka interpretasi hasil tes harus diikuti tanggung jawab professional. Bila hasil tes diinterpretasi secara tidak patut, dalam jangka panjang akan dapat membahayakan kehidupan peserta tes. Suatu interpretasi dapat merupakan bagian dari suatu presentasi atau penggambaran informasi yang diubah untuk menyesuaikan dengan suatu kumpulan simbol spesifik. Informasi itu dapat berupa lisan, tulisan, gambar, matematika, atau berbagai bentuk bahasa lainnya. Makna yang kompleks dapat timbul sewaktu penafsir baik secara sadar ataupun tidak melakukan rujukan silang terhadap suatu objek dengan menempatkannya pada kerangka pengalaman dan pengetahuan yang lebih luas. 3.2 Saran Untuk tes seharusnya dapat menggambarkan keseluruhan bahan pengajaran atau keseruluhan tujuan pengajaran. Sebaiknya penilaian berdasarkan acuan patokan ini seyogyanya jangan digunakan dalam pengolahan dan penentuan nilai hasil tes sumatif seperti pada ulangan umum dalam rangka mengisi raport, ini tidak mempertimbangkan kemampuan kelompok, jadi besar kemungkinan ada siswa yang tidak dapat dinyatakan 41

lulus atau naik kelas. setiap kelompok mempunyai standar masing-masing dan standar satu kelompok tidak dapat dipergunakan sebagai standar kelompok yang lain. Standar dari hasil tes sebelumnya pun tidak dapat dipergunakan sebagai standar sehingga setiap memperoleh hasil tes harus dibuat norma yang baru.Kelemahan yang lain adalah apabila butir-butir soal yang diberikan dalam tes terlalu sukar, maka tes tersebut betapapun pintarnya testee akan memperolah nilai yang rendah, sebaliknya apabila butir soal yang dikeluarkan dalam tes terlalu mudah, maka betapapun bodohnya testee akan berhasil memperoleh nilai yang tinggi sehingga gambaran tingkat kemampuan testee yang sebenarnya tidak dapat diketahui.

42

DAFTAR PUSTAKA
Andartari, dkk. 2009. Buku Ajar Evaluasi Pendidikan. Jakarta: Universitas Negeri Jakarta. Arikunto, Suharsimi. 2007. Dasar-dasar Evaluasi Pendidikan. Jakarta: Bina Aksara. Fijra, TEKNIK PENGOLAHAN HASIL BELAJAR, matahariku-

fijra.blogspot.com/2011/06/teknik-pengolahan-hasil-belajar.html, 9 September 2012. Purwanto, Ngalim. 2002. Prinsip-prinsip dan Teknik Evaluasi Pengajaran. Bandung: Rosdakarya. Purwanto. 2011. Evaluasi Hasil Belajar.Yogyakarta: Pustaka Pelajar. Sudijono, Anas. 2011. Pengantar Evaluasi Pendidikan. Jakarta: PT RajaGrafindo Persada.

43

LAMPIRAN-LAMPIRAN
1. Power Point (PPT) Makalah Teknik Pengolahan Skor Hasil Belajar.

44