Anda di halaman 1dari 2

Nama : Afifah Yumna Novinta

NIM : 18728251002
Kelas : Pendidikan Kimia A

TUGAS
PENGEMBANGAN PENILAIAN DAN EVALUASI PEMBELAJARAN KIMIA

Daya pembeda butir soal (D) merupakan kemampuan suatu butir soal dapat membedakan antara
peserta didik yang pandai (berkemampuan tinggi) dengan peserta didik yang kurang pandai
(berkemampuan rendah). Suatu perangkat soal objektif yang baik harus dapat membedakan antara
peserta didik yang pandai, rata-rata, dan kurang pandai karena umumnya suatu kelas terdiri dari ketiga
kelompok tersebut. Oleh karena itu, hasil evaluasi yang diperoleh haruslah berdistribusi normal. Dalam
suatu kelas, idealnya terdapat peserta didik yang mendapat nilai baik dan peserta didik yang mendapat
nilai kurang meskipun jumlahnya sedikit. Bagian terbesar jumlah berada pada peserta didik yang
mendapat nilai cukup.
Pada umumnya dalam menentukan daya pembeda apabila testee berjumlah lebih dari 100,
dilakukan dengan cara yang berbeda. Hal penting yang menjadi perhatian adalah penggunaan sampel
kelompok atas dan kelompok bawah dalam jumlah yang sedikit akan menghasilkan diferensiasi yang
tajam. Penggunaan jumlah sampel yang sedikit akan mengurangi keakuratan hasil. Titik optimal
dimana terjadi keseimbangan antara jumlah sampel kelompok atas dan jumlah sampel kelompok
bawah sehingga diperoleh distribusi normal adalah 27%.
Para pakar evaluasi banyak yang mengambil sampel itu sebesar 27% untuk kelompok peserta
didik pandai (higher group) dan 27% kelompok peserta didik kurang pandai (lower group), sehingga
seluruh sampel yang terambil sebanyak 54% dari populasi. Bagian terbesar pada kurva adalah 46%
yang menunjukkan kelompok peserta didik cukup pandai. Kurva distribusi normal yang terbentuk
ditunjukkan seperti gambar berikut ini.

Nilai Kurang Nilai Baik

46%

27% 27%
Proses penentuan kelompok atas dan kelompok bawah ini dilakukan dengan cara mengurutkan skor
setiap testee, dari skor tertinggi hingga skor terendah. Penggunaan persentase 27% ini berdasarkan
oleh bukti-bukti empirik yang menunjukkan bahwa pengambilan subjek sebanyak 27% testee
kelompok atas dan 27% testee kelompok bawah itu telah menunjukkan kesensitifannya, atau dengan
kata lain cukup dapat diandalkan. Hal ini disebabkan oleh persentase 27% diperoleh dari hasil
penambahan 2% dari 25% untuk mengantisipasi tingkat error yang mungkin terjadi.

Sumber Referensi:
http://www.nwlink.com/~donclark/hrd/isd/test_item_analysis.html
Sudijono, A. 2009. Pengantar evaluasi pendidikan. Jakarta: Rajagrafindo