DAFTAR ISI
DAFTAR ISI............................................................................................................................................ 1
BAB I ....................................................................................................................................................... 2
KAJIAN TEORI ..................................................................................................................................... 2
A. Penilaian, Asesmen, Pengukuran Dan Tes................................................................................... 2
1. Pengertian, Tujuan dan Fungsi Penilaian ................................................................................. 2
2. Pengertian, Bentuk, Jenis, Proses dan Teknik Asesmen .......................................................... 5
3. Pengertian Pengukuran ............................................................................................................ 9
4. Pengertian Testing ................................................................................................................... 9
B. Validitas, Reliabilitas ................................................................................................................. 10
1. Validitas ................................................................................................................................. 10
2. Reliabilitas ............................................................................................................................. 12
C. Bias dan Standar Error ............................................................................................................... 18
1. Bias ......................................................................................................................................... 18
2. Standart Error Measurement ................................................................................................. 18
BAB II.................................................................................................................................................... 20
PEMBAHASAN .................................................................................................................................... 20
A. Matrik Perbedaan Penilaian Assesmen, Pengukuran, dan Testing ............................................ 20
B. Matriks Perbandingan Validitas, Reliabilitas, Bias, Standar Error ............................................ 26
DAFTAR PUSTAKA ............................................................................................................................ 31
2
BAB I
KAJIAN TEORI
b. Tujuan Penilaian
Pelaksanaan penilaian hasil belajar pada proses belajar mengajar bertujuan untuk:
1) Mengetahui kemajuan belajar siswa, baik sebagai individu maupun anggota
kelompok/kelas setelah siswa mengikuti pendidikan dan pembelajaran dalam jangka
waktu yang telah ditentukan.
2) Mengetahui tingkat efektifitas dan efisiensi berbagai komponen pembelajaran yang
dipergunakan guru dalam jangka waktu tertentu. Komponen pembelajaran itu misalnya
menyangkut perumusan materi pembelajaran, pemilihan metode pembelajaran, media,
sumber belajar, dan rancangan sistem penilaian yang dipilih.
3) Menentukan tindak lanjut pembelajaran bagi siswa, dan
4) Membantu siswa untuk memilih sekolah, pekerjaan, dan jabatan yang sesuai dengan
bakat, minat, perhatian, dan kemampuannya.
Dengan mengetahui tercapai tidaknya tujuan pembelajaran, dapat diambil tindakan
perbaikan proses pembelajaran dan perbaikan siswa yang bersangkutan. Dengan kata lain, hasil
penilaian tidak hanya bermanfaat untuk mengetahui tercapai tidaknya perubahan tingkah laku
siswa, tetapi juga sebagai umpan balik bagi upaya memperbaiki proses pembelajaran. Dalam
penilaian ini dilihat sejauh mana keefektifan proses pebelajaran dalam mengupayakan perubahan
tingkah laku siswa. Oleh sebab itu, penilaian hasil dan proses belajar saling berkaitan satu sama
lain sebab hasil belajar yang dicapai siswa merupakan akibat dari proses pembelajaran yang
ditempuhnya (pengalaman belajarnya).
c. Fungsi Penilaian
Penilaian merupakan salah satu bagian yang penting dalam kegiatan pembelajaran.
Dikatakan bagian penting, karena kegiatan ini akan menjadi cermin untuk melihat perkembangan
atau kemajuan belajar siswa dari waktu ke waktu. Secara umum, fungsi penilaian adalah sebagai
berikut:
1) Alat untuk mengetahui tercapai-tidaknya tujuan pembelajaran. Dengan fungsi ini maka
penilaian harus mengacu pada rumusan-rumusan tujuan pembelajaran sebagai penjabaran
dari kompetensi mata pelajaran
2) Umpan balik bagi perbaikan proses belajar-mengajar. Perbaikan mungkin dilakukan dalam
hal tujuan pembelajaran, kegiatan atau pengalaman belajar siswa, strategi pembelajaran
yang digunakan guru, media pembelajaran, dan lain-lain.
4
3) Dasar dalam menyusun laporan kemajuan belajar siswa kepada para orang tuanya. Dalam
laporan tersebut dikemukakan kemampuan dan kecakapan pelajar siswa dalam berbagai
bidang studi atau mata pelajaran dalam bentuk nilai-nilai prestasi yang dicapainya.
Selain ketiga fungsi diatas, penilaian juga mempunyai fungsi sebagai berikut:
1) Penilaian berfungsi selektif
Dengan cara mengadakan penilaian, guru mempunyai cara untuk mengadakan seleksi atau
penilaian terhadap siswanya. Penilaian itu sendiri mempunyai berbagai tujuan, antara lain:
a) untuk memilih siswa yang dapat diterima di sekolah tertentu.
b) untuk memilih siswa yang dapat naik ke kelas atau tingkat berikutnya.
c) untuk memilih siswa yang seharusnya mendapat beasiswa.
d) untuk memilih siswa yang sudah berhak meninggalkan sekolah, dan sebagainya.
2) Penilaian berfungsi diagnostic
Apabila alat yang digunakan dalam penilaian cukup memenuhi persyaratan, maka dengan
melihat hasilnya, guru akan mengetahui kelemahan siswa. Di samping itu, diketahui pula
sebab-musabab kelemahan itu. Jadi, dengan mengadakan penilaian, sebenarnya guru
mengadakan diagnosis kepada siswa tentang kebaikan dan kelemahannya.
3) Penilaian berfungsi sebagai penempatan
Sistem baru yang kini banyak dipopulerkan di negara barat, adalah sistem belajar sendiri.
Belajar sendiri dapat dilakukan dengan cara mempelajari sebuah paket belajar, baik itu
berbentuk modul maupun paket belajar yang lain. Sebagai alasan dari timbulnya sistem ini
adalah adanya pengakuan yang besar terhadap kemampuan individual. Setiap siswa sejak
lahirnya telah membawa bakat sendiri-sendiri sehingga pelajaran akan lebih efektif apabila
disesuaikan dengan pembawaan yang ada. Akan tetapi disebabkan karena keterbatasan sarana
dan tenaga, pendidikan yang bersifat individual kadang-kadang sukar sekali dilaksanakan.
Pendekatan yang lebih bersifat melayani perbedaan kemampuan, adalah pengajaran secara
kelompok. untuk dapat menentukan dengan pasti di kelompok mana seorang siswa harus
ditempatkan, digunakan suatu penilaian.
4) Penilaian berfungsi sebagai pengukur keberhasilan
Fungsi keempat dari penilaian ini dimaksudkan untuk mengetahui sejauh mana suatu
program berhasil diterapkan. Keberhasilan program ditentukan oleh beberapa faktor yaitu
faktor guru, metode mengajar, kurikulum, sarana, dan sistem administrasi.
5
3) Asesmen Otentik. Salah satu bentuk asesmen alternatif yang teknik pengukurannya
meminta siswa untuk mengaplikasikan pengetahuan atau menunjukkan keterampilan
sebagaimana pengetahuan atau keterampilan itu dipakai dalam dunia nyata.
4) Asesmen Kinerja. Bentuk asesmen alternatif lain yang teknik pengukurannya
memberikan kesempatan kepada siswa untuk menciptakan berbagai situasi untuk
siswa atau menciptakan berbagai situasi agar siswa dapat menunjukkan
kemampuannya dalam mengaplikasikan pengetahuan dan keterampilannya dalam
berbagai situasi (Marzano, 1992).
c. Jenis-jenis Assesment
Jenis-jenis assesment yang digunakan antara lain sebagai berikut:
1) Evaluasi Formatif, yakni penilaian yang dilaksanakan pada setiap akhir pokok
bahasan, tujuannya untuk mengetahui tingkat penguasaan siswa terhadap pokok
bahasan tertentu.
2) Evaluasi Sumatif, yaitu penilaian yang dilakukan pada akhir satuan program tertentu,
(catur wulan, semester atau tahun ajaran), tujuannya untuk melihat prestasi yang
dicapai peserta didik selama satu program.
3) Evaluasi Diagnostik, yaitu penilaian yang dilakukan untuk melihat kelemahan siswa
dan faktor-faktor yang diduga menjadi penyebab, dilakukan untuk keperluan
pemberian bimbingan belajar dan pengajaran remidial.\
4) Evaluasi penempatan (placement), yaitu penilaian yang ditujukan untuk menempatkan
siswa sesuai dengan bakat, minat, dan kemampuannya, misalnya dalam pemilihan
jurusan atau menempatkan anak pada kerja kelompok dan pemilihan kegiatan
tambahan.
5) Evaluasi Seleksi, yakni penilaian yang ditujukan untuk menyaring atau memilih orang
yang paling tepat pada kedudukan atau posisi tertentu. Evaluasi ini dilakukan kapan
saja diperlukan.
d. Proses Asesment
Dalam Peraturan Pemerintah Nomor 19, Tahun 2005 (PP No. 19/2005), penilaian
pendidikan pada jenjang pendidikan dasar dan menengah terdiri atas:
7
1) Teknik tes adalah seperangkat tugas yang harus dikerjakan oleh orang yang dites, dan
berdasarkan hasil menunaikan tugas-tugas tersebut, akan dapat ditarik kesimpulan tentang
8
aspek tertentu pada orang tersebut. Tes dapat berupa tes tertulis, tes lisan, dan tes praktik
atau tes kinerja.
i. Tes tertulis adalah tes yang menuntut peserta tes memberi jawaban secara tertulis
berupa uraian ataupun objektif. Tes uraian yaitu pertanyaan yang menuntut jawaban
dalam bentuk uraian dengan menggunakan bahasa sendiri. Tes Tertulis Uraian ada
dua yaitu tes Terbatas/tertutup/terstruktur dan tes Bebas terbuka. Tes objektif berupa
Pilihan Ganda yaitu pertanyaan dengan beberapa pilihan jawaban dimana salah
satunya benar; Benar–Salah yaitu pertanyaan dengan dua pilihan jawaban seperti
benar dan salah, setuju dan tidak setuju, ya dan tidak, dan lain sebagainya;
Menjodohkan dengan cara memilih yaitu dua kelompok pertanyaan yang paralel dan
dijawab dengan menjodohkan pertanyaan di kelompok satu dengan pertanyaan di
kelompok lain; Isian singkat, Isian panjang, dan Isian klosur dengan cara Mengisi.
ii. Tes lisan adalah tes yang dilaksanakan melalui komunikasi langsung (tatap muka)
antara peserta didik dengan pendidik. Pertanyaan dan jawaban diberikan secara lisan.
iii. Tes praktik (kinerja) adalah tes yang meminta peserta didik melakukan
perbuatan/mendemonstasikan/ menampilkan keterampilan.
2) Teknik nontes dapat dilakukan dengan observasi baik secara langsung ataupun tak
langsung, angket ataupun wawancara, skala sikap, daftar periksa (cek-lis), kuisioner,
catatan anekdotal, portofolio, catatan sekolah, jurnal, cuplikan kerja. Teknik non tes ini
digunakan sebagai pelengkap dan digunakan sebagai pertimbangan tambahan dalam
pengambilan keputusan penentuan kualitas hasil belajar, teknik ini dapat bersifat lebih
menyeluruh pada semua aspek kehidupan anak.
f. Standar-Standar Assesment
3. Pengertian Pengukuran
Menurut Cangelosi (1995) dalam Ana (2012) yang dimaksud dengan pengukuran
(Measurement) adalah suatu proses pengumpulan data melalui pengamatan empiris untuk
mengumpulkan informasi yang relevan dengan tujuan yang telah ditentukan. Dalam hal ini guru
menaksir prestasi siswa dengan membaca atau mengamati apa saja yang dilakukan siswa,
mengamati kinerja mereka, mendengar apa yang mereka katakan, dan menggunakan indera
mereka seperti melihat, mendengar, menyentuh, mencium, dan merasakan. Menurut Zainul dan
Nasution (2001) dalam Ana (2012) pengukuran memiliki dua karakteristik utama yaitu: 1)
penggunaan angka atau skala tertentu; 2) menurut suatu aturan atau formula tertentu.
Measurement (pengukuran) merupakan proses yang mendeskripsikan performance siswa
dengan menggunakan suatu skala kuantitatif (system angka) sedemikian rupa sehingga sifat
kualitatif dari performance siswa tersebut dinyatakan dengan angka-angka (Alwasilah et al.1996
dalam Ana, 2012). Pernyataan tersebut diperkuat dengan pendapat yang menyatakan bahwa
pengukuran merupakan pemberian angka terhadap suatu atribut atau karakter tertentu yang
dimiliki oleh seseorang, atau suatu obyek tertentu yang mengacu pada aturan dan formulasi yang
jelas. Aturan atau formulasi tersebut harus disepakati secara umum oleh para ahli (Zainul &
Nasution, 2001 dalam Ana, 2012). Dengan demikian, pengukuran dalam bidang pendidikan
berarti mengukur atribut atau karakteristik peserta didik tertentu. Dalam hal ini yang diukur
bukan peserta didik tersebut, akan tetapi karakteristik atau atributnya. Senada dengan pendapat
tersebut, Secara lebih ringkas, Arikunto dan Jabar (2004) menyatakan pengertian pengukuran
(measurement) sebagai kegiatan membandingkan suatu hal dengan satuan ukuran tertentu
sehingga sifatnya menjadi kuantitatif.
Measurement dapat dilakukan dengan cara tes atau non-tes. Amalia (2003) dalam Ana
(2012) mengungkapkan bahwa tes terdiri atas tes tertulis (paper and pencil test) dan tes lisan.
Sementara itu alat ukur non-tes terdiri atas pengumpulan kerja siswa (portofolio), hasil karya
siswa (produk), penugasan (proyek), dan kinerja (performance).
4. Pengertian Testing
Tes (test) merupakan suatu alat penilaian dalam bentuk tulisan untuk mencatat atau
mengamati prestasi siswa yang sejalan dengan target penilaian (Alwasilah, 1996 dalam Ana
2012)). Jawaban yang diharapkan dalam tes menurut Sudjana dan Ibrahim (2001) dapat secara
tertulis, lisan, atau perbuatan. Menurut Zainul dan Nasution (2001) tes didefinisikan sebagai
10
pertanyaan atau tugas atau seperangkat tugas yang direncanakan untuk memperoleh informasi
tentang suatu atribut pendidikan atau suatu atribut psikologis tertentu. Setiap butir pertanyaan
atau tugas tersebut mempunyai jawaban atau ketentuan yang dianggap benar. Dengan demikian
apabila suatu tugas atau pertanyaan menuntut harus dikerjakan oleh seseorang, tetapi tidak ada
jawaban atau cara pengerjaan yang benar dan salah maka tugas atau pertanyaan tersebut
bukanlah tes.
Tes merupakan salah satu upaya pengukuran terencana yang digunakan oleh guru untuk
mencoba menciptakan kesempatan bagi siswa dalam memperlihatkan prestasi mereka yang
berkaitan dengan tujuan yang telah ditentukan (Calongesi, 1995 dalam Ana, 2012). Tes terdiri
atas sejumlah soal yang harus dikerjakan siswa. Setiap soal dalam tes menghadapkan siswa pada
suatu tugas dan menyediakan kondisi bagi siswa untuk menanggapi tugas atau soal tersebut. Tes
menurut Arikunto dan Jabar (2004) merupakan alat atau prosedur yang digunakan untuk
mengetahui atau mengukur sesuatu dengan menggunakan cara atau aturan yang telah ditentukan.
Dalam hal ini harus dibedakan pengertian antara tes, testing, testee, tester. Testing adalah saat
pada waktu tes tersebut dilaksanakan (saat pengambilan tes). Sementara itu Gabel (1993)
menyatakan bahwa testing menunjukkan proses pelaksanaan tes. Testee adalah responden yang
mengerjakan tes. Mereka inilah yang akan dinilai atau diukur kemampuannya. Sedangkan Tester
adalah seseorang yang diserahi tugas untuk melaksanakan pengambilan tes kepada responden.
(dalam Ana, 2012)
B. Validitas, Reliabilitas
1. Validitas
Validitas ini untuk mengetahui apakah tes yang diberikan itu sesuai dengan tujuan yang
telah dirumuskan seperti yang dikatakan Suharsimi Arikunto bahwa penilaian harus sesuai
dengan keadaan yang dipenilaian. Validitas sebuah tes dapat diketahui dari hasil pemikiran
logical validity dan validitas empiris empirical validity. Validitas adalah suatu ukuran yang
menunjukkan tingkat-tingkat kevalidan atau kesahihan suatu instrumen. (Suharsimi Arikunto,
2005: 144) . Ada tiga jenis validitas antara lain:
1. Congruent validity :
korelasi hasil tes dari :
a. mata pelajaran yang sama
b. sampel yang sama
c. Waktu berbeda
11
2. Congcurent validity
Korelasi hasil tes dari :
a. mata pelajaran berbeda
b. sampel sama
c. waktu sama atau berbeda
3. Predictive validity
Korelasi hasil tes dengan hasil tes selanjutnya dengan sampel yang sama pada tingkat lebih
lanjut.
Untuk menghitung validitas instrumen yaitu dengan cara menghitung koefisien validitas,
menggunakan rumus :
N XY ( X)( Y)
rXY
N X X N Y
2 2 2
( Y) 2
rxy = Koefisien korelasi antara variabel X dan variabel Y
X = Skor tiap item dari responden uji coba variabel X
Y = Skor tiap item dari responden uji coba variabel Y
N = Jumlah responden
Nilai koefisien korelasi yang didapatkan diinterpretasi untuk menentukan validitas tes,
seperti terdapat pada Tabel 2
Tabel 3.5 Makna Koefisien Korelasi Product Moment
No Besarnya nilai r Interpretasi
1 0,80 - 1,00 Sangat tinggi
2 0,60 - 0,80 Tinggi
3 0,40 - 0,60 Cukup
4 0,20 - 0,40 Rendah
5 0,00 - 0,20 Sangat rendah
Sumarna Surapranata (2004:59)
Setelah diketahui koefisien korelasi (r), kemudian dilanjutkan dengan taraf signifikansi
korelasi dengan menggunakan rumus distribusi tstudent, yaitu :
𝑟√𝑛 − 2
𝑡=
√1 − 𝑟 2
dimana : r = koefisien korelasi dan n = jumlah responden yang diujicoba
12
Kemudian jika thitung>ttabel pada taraf signifikansi = 0,05, maka dapat disimpulkan
item soal tersebut valid pada taraf yang ditentukan.
2. Reliabilitas
Uji reliabilitas bertujuan untuk menguji ketepatan atau keajegan alat dalam mengukur apa
yang akan diukur. Menurut Nasution, S (2000: 104), “Reliabilitas dari alat ukur adalah penting,
karena apabila alat ukur yang digunakan tidak reliabel dengan sendirinya tidak valid”. Jadi tes
reliabel jika tes/alat itu dipercaya, konsisten atau stabil dan produktif.
1. Dengan metoda dua tes yang parallel dan setaraf (ekuivalen) diberikan kepada sekolompok
siswa. Hasil dari kedua tes tersebut kemudian dicari korelasinya. (metoda Pearson atau
metoda spearmen)
2. Dengan metoda satu tes sebuah tes diberikan 2 x kepada sekolompok siswa yang sama
tetapi dalam waktu yang berbeda. Kedua hasil tes itu kemudian dicari korelasinya
3. Metoda :Split –half suatu tes dibagi menjadi dua bagian yang sama tingkat kesukaranya,
sama isi dan bentuknya. Kemudian dilihat skor masing-masing bagian perubahan paruhan
tersebut
Pengujian reliabilitas instrumen penelitian dapat dilakukan secara eksternal maupun
internal.Secara eksternal pengujian dapat dilakukan dengan test-retest (stability), equivalent, dan
gabungan keduanya.Secara internal, reliabilitas instrumen dapat diuji dengan menganalisis
konsistensi butir-butir yang ada pada instrumen dengan teknik tertentu.
a. Test-retest
Pengujian ini dilakukan dengan cara mencobakan instrumen beberapa kali pada
koresponden. Jadi dalam hal ini instrumennya sama, responden sama, dan waktu yang
berbeda. Reliabiitas diukur dari koefisien korelasi antara percobaan pertama dengan yang
berikutnya.Bila koefisien korelasi positif dan signifikan maka instrumen tersebut sudah
dinyatakan reliabel.
b. Ekuivalen
Instrumen yang ekuivalen adalah pernyataan yang secara bahasa berbeda, tetapi maksudnya
sama. Pengujian dengan cra ini cukup dilakukan sekali, tetai instrumennya dua, pada
responden yangsama, waktu yang juga sama, dan instrumen berbeda.
c. Gabungan
13
Pengujian reliabilitas ini dilakukan dengan cara mencobakan dua instrumen yang ekuivalen
itu beberapa kali ke responden yang sama. Reliabilitas instrumen dilakukan dengan
mengkorelasikan dua instrumen, setelah itu dikorelasikan pada penguian kedua, dan
selanjutnya dikorelasikan secara silang.
d. Internal consistency
Pengujian dengan cara ini dilakukan dengan cara mencobakan instrumen sekali saja.
Kemudian data yang diperoleh dianalisis dengan teknik tertentu.Hasil analisis dapat
digunakan untuk memprediksi reliabilitas instrumen. Berikut rumus-rumus untuk uji
relianilitas instrumen.
Rumus Spearman Brown:
2𝑟𝑏
ri = 1+𝑟𝑏
di mana:
ri = reliabilitas insternal seluruh instrument
rb = korelasi product moment antara belahan pertama dan kedua
Rumus KR. 20 (Kuder Richardson)
𝑘 𝑠𝑡2 − 𝛴𝑝𝑖𝑞𝑖
Ri = (𝑘−1) { }
𝑠𝑡2
Di mana:
K = jumlah item dalam instrumen
Pi = proporsi banyaknya subyek yang menjawab pada item 1
Q1 = 1 – pi
𝑠12 = varians total
Rumus KR 21
𝑘 𝑀(𝐾− 𝛴𝑀
Ri = (𝑘−1) {1 − }
𝑘𝑠𝑡2
Di mana:
K = jumlah item dalam instrumen
M = mean skor total
𝑠12 = varians total
Analisis Varian Hoyt (Anova Hoyt)
𝑀𝐾𝑒
Ri= 1 – 𝑀𝐾𝑠
14
Di mana:
MKs = mean kuadrat antara obyek
MKe = mean kuadrat kesalahan
Ri = reliabilitas instrument
Rumus Alpha
𝑛 𝑏 2
r = (𝑛−1) (1 − )
2 𝑡
dengan
(𝑥)2
𝑥 2 − 𝑁
2 = 𝑁
Dimana
r adalah reliabilitas tes secara keseluruhan,
n adalah jumlah butir instrumen,
b2 adalah jumlah varians butir instrumen,
2t adalah varians total,
x adalah jumlah skor peserta,
(x)2 adalah jumlah kuadrat skor peserta, dan
N adalah jumlah peserta
Klasifikasi indeks reliabilitas soal dapat dilihat pada Tabel 3.8.
Tabel 3. Klasifikasi Indeks Reliabilitas Instrument
No Indeks Reliabilitas Klasifikasi
1 0,00-0,20 Sangat rendah
2 0,20-0,40 Rendah
3 0,40-0,60 Sedang
4 0,60-0,80 Tinggi
5 0,80-1,00 Sangat tinggi
Slameto (2011:215)
Selain validitas dan realibilitas asesmen ada juga yang dinamakan daya beda dan indeks
kesukaran :
15
Soal yang baik adalah soal yang tidak terlalu mudah atau tidak terlalu sulit. Bilangan
yang menunjukkan sukar atau mudahnya soal disebut Indeks Kesukaran (difficult index). Tingkat
kesukaran ini dapat digunakan sebagai suatu indikator untuk menentukan adanya perbedaan
kemampuan peserta tes.
Prosedur yang dilakukan untuk menentukan indeks kesukaran soal menurut Slameto
(1999: 218) adalah:
a) Mengumpulkan tes uji coba yang dikerjakan oleh siswa.
b) Menganalisis tes yang dikerjakan siswa.
c) Mengurutkan skor yang diperoleh siswa dari skor tertinggi sampai terendah.
d) Mengambil atau menetapkan 27% siswa kelompok tertinggi dan 27% siswa kelompok
terendah.
e) Menghitung jawaban benar untuk setiap soal baik dari kelompok atas ataupun kelompok
bawah.
f) Menghitung indeks kesukaran soal memakai program Microsoft Excel dengan menggunakan
rumus yang dikemukan oleh Arikunto (2002):
𝐵
𝑃=
𝐽𝑠
Keterangan :
P = proporsi menjawab benar atau tingkat kesukaran
B= Banyak siswa yang menjawab benar
Js = Jumlah siswa
Indeks kesukaran dapat diklasifikasikan dalam Tabel 2.
Tabel 2. Klasifikasi Tingkat Kesukaran Soal (p)
No. Tingkat Kesukaran (p) Keterangan
1. p < 0,3 Sukar
2. 0,3 ≤ p ≤ 0,7 Sedang
3. p > 0,7 Mudah
Sumber : Suryabrata (2004: 21)
Arikunto (2010 : 211) menyatakan bahwa “daya pembeda soal adalah kemampuan soal
untuk membedakan siswa yang berkemampuan tinggi dengan yang berkemampuan rendah”.
Indeks yang digunakan dalam membedakannya adalah indeks daya pembeda (item
discrimination).
Untuk menghitung daya beda soal, seluruh skor hasil tes diurut mulai dari yang tertinggi
sampai yang terendah, kemudian diambil dua kelompok sama besar, yaitu 27% kelompok atas
dan 27% kelompok bawah. Jadi dari 32 orang siswa dibagi 8 orang kelompok atas dan 8 orang
kelompok bawah.
Keterangan :
D = Indeks daya pembeda
∑ 𝐴 = jumlah jawaban benar dari kelompok atas
∑ 𝐵 = jumlah jawaban benar dari kelompok bawah
nA = jumlah siswa yang termasuk kelompok atas
nB = jumlah siswa yang termasuk kelompok bawah
Klasifikasi indeks daya beda soal dapat dilihat pada Tabel 3.
Tabel 3. Klasifikasi Indeks Daya Beda Soal
Pada tes pilihan ganda ada beberapa option/alternatif jawaban yang sengaja dimasukkan
sebagai pengecoh (distraktor). Butir soal yang baik, pengecohnya akan dipilih secara merata oleh
siswa-siswa yang menjawab salah. Sebaliknya, butir soal yang buruk, pengecohnya akan dipilih
secara tidak merata. Pengecoh dianggap baik bila jumlah siswa yang memilih pengecoh itu sama
atau mendekati jumlah ideal.
Indeks pengecoh dihitung dengan rumus yang dikemukakan dalam panduan anates (2003)
𝒏𝑷𝒄
𝑰𝑷𝒄 = 𝒙 𝟏𝟎𝟎%
(𝑵 − 𝒏𝑩)/(𝑨𝒍𝒕 − 𝟏)
Dengan
IPc = Indeks Pengecoh/Distraktor
nPc = Jumlah siswa yang memilih pengecoh itu
N = Jumlah seluruh subyek yang ikut tes
nB = Jumlah subyek yang menjawab benar pada butir soal itu
Alt = Banyak alternatif jawaban/option (3, 4, atau 5)
3. Mana distribusi probabilitas tidak diketahui, hubungan seperti Chebyshev 's atau
ketidaksetaraan Vysochanskiï-Petunin dapat digunakan untuk menghitung interval
keyakinan konservatif
4. Sebagai ukuran sampel yang cenderung tak terhingga teorema limit sentral menjamin
bahwa distribusi sampling mean asimtotik normal.
Rumus yang diberikan di atas untuk standard error mengasumsikan bahwa ukuran sampel
jauh lebih kecil daripada ukuran populasi, sehingga populasi dapat dianggap efektif dalam
ukuran tak terbatas. Ketika sampling fraksi besar (sekitar sebesar 5% atau lebih), perkiraan
kesalahan harus dikoreksi menggunakan "populasi terbatas koreksi" menjelaskan tambahan
diperoleh presisi sampling dekat dengan persentase yang lebih besar dari populasi. Efek dari FPC
adalah bahwa kesalahan menjadi nol ketika ukuran sampel n adalah sama dengan ukuran
populasi N.
20
BAB II
PEMBAHASAN
Proses asesment
1. Penilaian Hasil Belajar oleh
Pendidik
Penilaian hasil belajar oleh pendidik
dilakukan secara berkesinambungan
untuk memantau proses, kemajuan,
perbaikan hasil dalam bentuk ulangan
harian, ulangan tengah semester,
ulangan akhir semester, dan ulangan
kenaikan kelas.
2. Penilaian Hasil Belajar oleh
Satuan Pendidikan
Penilaian hasil belajar oleh satuan
pendidikan bertujuan menilai
pencapaian standar kompetensi lulusan
untuk semua mata pelajaran. Penilaian
hasil belajar ini berlaku untuk mata
pelajaran pada kelompok mata
pelajaran agama dan akhlak mulia,
kelompok mata pelajaran
kewarganegaraan dan kepribadian,
kelompok mata pelajaran estetika, dan
kelompok mata pelajaran jasmani,
olah raga, dan kesehatan.
3. Penilaian Hasil Belajar oleh
24
2
0,60<r11 0,80 Tinggi
5
0,00<r11 0,20 Sangat rendah
materi pelajaran yang
dievaluasi.
Sumber: Slameto (1998: 215)
2. validitas konstruksi sebuah
instrumen yang berkaitan
dengan fenomena dan objek
yang abstrak, tetapi
gejalanya dapat diamati.
b. Validitas Empiris
Istilah validitas memuat kata
empiris yang artinya
pengalaman. Sebuah Instrumen
dapat dikatakan memiliki
validitas empiris apabila sudah
diuji dari pengalaman. Ada dua
29
Keterangan:
Keterangan:
Sumber:DimodifiksaiSurapranat
a (2005: 59)
31
DAFTAR PUSTAKA
Ana, Ratna Wulan. Pengertian Dan Esensi Konsep Evaluasi, Asesmen, Tes, Dan Pengukuran.
Tersedia online di
http://file.upi.edu/Direktori/SPS/PRODI.PENDIDIKAN_IPA/197404171999032-
ANA_RATNAWULAN/pengertian_asesmen.pdf. diakses pada 13 Februari 2016.
Frey, Barbara A., and Susan W. Alman. (2003). Formative Evaluation Through Online Focus
Groups, in Developing Faculty to use Technology, David G. Brown (ed.), Anker
Publishing Company: Bolton, MA
Kizlik, Bob. 2012. Measurement, Assessment, and Evaluation in Education. Online
http://www.adprima.com/measurement.htm (diakses tanggal 13 februari 2016)
Mardapi, Djemari. 2003. Desain Penilaian dan Pembelajaran Mahasiswa. Makalah Disajikan
dalam Lokakarya Sistem Penjaminan Mutu Proses Pembelajaran tanggal 19 Juni 2003 di
Universitas Gadjah Mada Yogyakarta
Zainul, Asmawi dan Noehi Nasution. 2001. Penilaian Hasil Belajar. Jakarta: Departemen
Pendidikan Nasional
Suharsimi Arikunto,. 2002. Dasar-dasar Evaluasi Pendidikan (edisi Revisi). PT Bumi Aksara:
Jakarta.
Suharsimi, A & Jabar. 2004. Evaluasi Program Pendidikan. Jakarta: Bumi Aksara
Sutarman, Adi. 2013. Pengertian Pengukuran, Asesmen, Penilaian, dan Evaluasi. http://melajah-
online.blogspot.com/2013/09/pengertian-pengukuran-asesmen-penilaian.html.
Surapranata, Sumarna. 2005. Analisis validitas, Reliabilitas, dan Interpretasi Hasil Tes. Bandung:
Remaja Rosdakarya.