Makalah Evaluasi Pembelajaran (AutoRecovered) Fix

MAKALAH
EVALUASI PEMBELAJARAN
Oleh kelompok 4:
Sasmita sari (E1Q021043)
Lailatulfitri (E1Q021031)
Muhammad thoriq Hidayatullah (E1Q021035)
PROGRAM STUDI PENDIDIKAN FISIKA
FAKULTAS KEGURUAN DAN ILMU PENDIDIKAN
UNIVERSITAS MATARAM
2023
KATA PENGANTAR
Puji syukur Kehadirat Tuhan Yang Maha Esa yang telah melimpahkan rahmat, hidayah
dan inayah-Nya, sehingga dapat menyelesaikan Makalah Evaluasi Pembelajaran Fisika. Makalah
ini disusun dengan maksimal dan mendapat bantuan dari berbagai sumber dan ibu Ni Nyoman
Sri Putu Verawati S.Pd M.Pd selaku dosen Evaluasi Pembelajaran Fisika sehingga dapat
memperlancar pembuatan maklah ini. Untuk itu kami ucapkan terima kasih.
Terlepas dari semua itu, kami sadar banyak kekurangan dalam penyusunan maupun
isinya untuk itu kami mengharapkan saran dan tanggapan yang membangun pada makalah ini.
Demikian laporan ini kami susun agar dapat diterima dan bermanfaat bagi pembacanya.
Mataram, 18 maret 20023

DAFTAR ISI
Kata Pengantar
DAFTAR ISI
BAB II : PEMBAHASAN
2.1 VALIDITAS
2.2 REABILITAS
2.3 TINGKAT KESUKARAN SOAL
2.4 DAYA PEMBEDA SOAL
DAFTAR PUSTAKA
BAB I
PEMBAHASAN
VALIDITAS
A. PENGERTIAN
Ketentuan penting dalam validitas adalah bahwa hasilnya harus sesuai dengan
keadaan yang dievaluasi. Data evalusasi yang baik sesuai dnegan kenyataan disebut data
valid. Instrument evaluasi dipersyaratkan valid agar hasil yang diperoleh dari kegiatan
evaluasi valid.
1. Macam-macam validitas
Di dalam buku Encyclopedia ofEducational Evaluation yang ditulis oleh Scarvia
B. Anderson dan kawan-kawan disebutkan “a test is valid if it measures what it purpose
to measure.” Atau diartikan lebih kurang demikian : sebuah tes dikatakan valid apabila
tes tersebut mengukur apa yang hendak diukur. Dalam Bahasa Indonesia “valid” disebut
dengan istilah “sahih.”
Sebenarnya pembicaraan validitas ini bukan ditekankan pada tes itu sendiri tetapi pada
hasil pengetesan atau skornya.
Contoh :
Skor yang diperoleh dari hasil mengukur kemampuan mekanik akan
menunjukkan kemampuan seseorang dalam memegang dan memperbaiki mobil, bukan
pengetahuan orang tersebut dalam hal yang berkaitan dengan mobil. Tes yang mengukur
pengetahuan tentang mobil bukanlah tes yang sahih untuk mekanik.
Secara garis besar ada dua macam validitas, yaitu validitas logis dan validitas
empiris.
a. Validitas logis
Istilah “validitas logis” mengandung kata “logis” yang berasal dari kata
“logika”, yang berarti penalaran. Validitas logis untuk sebuah instrument
evaluasi menunjuk pada kondisi bagi sebuah instrument yang memenuhi
persyaratan valid berdasarkan hasil penalaran.
Validitas logis dapat dicapai apabila instrument disusun mengikuti
ketentuan yang ada. Validitas logis tidak perlu diuji kondisinya, tetapi
langusng diperoleh sesudah instrument tersebut selesai disusun. Ada dua
macam validitas logis yang dapat dicapai oleh sebuah instrument, yaitu :
validitas isi dan validitas konstrak (construct validity). Validitas isi
menunjuk suatu kondisi sebuah instrument yang disusun berdasarkan isi
materi pelajaran yang dievaluasi. Validitas konstrak menunjuk suatu kondisi
sebuah instrument yang disusun berdasarkan konstrak aspek-aspek kejiwaan
yang seharusnya dievaluasi.
b. Validitas Empiris
Istilah “validitas empiris” memuat kata “empiris” yang artinya “pengalaman”.
Contoh : seseorang dapat dikatakan kreatif apabila dari pengalaman
dibuktikan bahwa orang tersebut sudah banyak menghasilkan ide-ide baru
yang diakui berbeda dari hal-hal yang sudah ada. Dari contoh tersebut bahwa
validitas empiris tidak dapat diperoleh hanya dengan menyusun instrumenn
berdasarkan ketentuan seperti halnya validitas logis, tetapi harus dibuktikan
melalui pengalaman.
Secara keseluruhan kita mengenal adanya empat validitas, yaitu :
1) Validitas isi ( content validity )
Sebuah tes dikatakan memiliki validitas isi apabila mengukur tujuan
khusus tertentu yang sejajar dengan materi atau isi pelajaran yang
diberikan.
2) Validitas konstruksi ( construct validity )
Sebuah tes dikatakan memiliki validitas konstruksi apabila butir-butir soal
yang menbangun tes tersebut mengukur setiap aspek berpikir seperti yang
disebutkan dalam Tujuan Instruksional Khusus.
3) Validitas “ada sekarang” ( concurrent validity )
Validitas ini lebih umum dikenal dengan validitas empiris. Sebuah tes
dikatakan memiliki validitas empiris jika hasilnya sesuai dengan
pengalaman. Jika ada istilah “sesuai” tentu ada dua hal yang dipasangkan.
Dalam membandingkan hasil sebuah tes maka diperlukan suatu kriterium
atau alat banding. Maka hasil tes merupakan sesuatu yang dibandingkan.
4) Validitas Prediksi
Memprediksi artinya meramal, sebuah tes dikatakan memiliki validitas
ramalan apabila mempunyai kemampuan untuk meramalkan apa yang
akan terjadi pada masa yang akan datang. Misalnya, tes masuk Perguruan
Tinggi adalah sebuah tes yang diperkirakan mampu meramalkan
keberhasilan peserta tes dalam mengikuti kuliah di masa yang akan
datang. Sebagai alat pembanding validitas prediksi adalah nilai-nilai
yang diperoleh setelah peserta tes. Jika ternyata siapa yang memiliki nilai
tes lebih tinggi gagal dalam ujian semester 1 dibandingkan dengan yang
dahulu nilai tesnya lebih rendah, maka tes masuk yang diamskud tidak
memiliki validitas prediksi.
2. Cara Mengetahui Validitas Alat Ukur
Teknik yang digunakan untuk mengetahui kesejajaran adalah teknik korelasi product
moment yang dikemukakan oleh Pearson. Rumus korelasi product moment ada 2 macam,
yaitu :
a. Korelasi product moment dengan simpangan
b. Korelasi product moment dengan angka kasar
Rumus korelasi product moment dengan simpangan :
∑𝑥𝑦
𝑟𝑥𝑦 = (∑2)(∑2)
√
𝑥 𝑦
Dimana :
rxy = koefisien korelasi antara variable X dan Y, duia variable yang dikorelasikan ( x = X – dan y
=Y
∑xy = jumlah perkalian x dan y
X2 = kuadrat dari x
Rumus korelasi product

𝑁∑𝑋𝑌 − (𝛴𝑥)(𝛴𝑌)
𝑟𝑋𝑦 =
√{𝑁∑𝑋2 − (∑𝑋)2}{𝑁∑𝑌2 − (𝛴𝑌)2}
Dengan rumus simpangan dalam mengerjakan perkalian atau penjumlahan jika diperoleh 3
atau angka di belakang koma dilakukan pembulatan ke atas. Perbedaa ini snagat kecil
sehingga dapat diabaikan. Berikut keterangannya terkait penjelasan diatas :
- Korelasi positif menunjukkan adanya hubungan sejajar antara dua hal. Misalnya, hal
pertama nilainya naik, hal kedua ikut naik, sebaliknya jika hal pertama turun, yang
kedua ikut turun.
- Korelasi negative menunjukkan adanya hubungan kebalikanantara dua hal. Misalnya
hal pertama nilainya naik, justru yang kedua turun. Sebaliknya jika yang pertama turun,
yang kedua naik.
Penafsiran harga koefisien korelasi ada 2 cara, yaitu :
- Dengan melihat harga r dan diinterpretasikan misalnya korelasi tinggi, cukup, dann
sebaginya.
- Dengan berkonsultasi ke tabel harga kritik r product moment sehingga dapat diketahui
signifikan tidaknya korelasi tersebut. Jika harga r lebih kecil dari harga kritik dalam
tabel, maka korelasi tersebut tidak signifikan. Begitu juga arti sebaliknya.
3. Validitas butir soal atau validitas item
Validitas item adalah sebuah item yang mempunyai dukungan yang besar terhdap skor
total. Item memiliki validitas yang tinggi jika skor pada item memounyai kesejajaran
dengan skor total.
Untuk soal-soal bentuk objektif skor untuk item biasa diberikan dengan 1 ( bagi item
yang dijawab benar ) dan 0 ( item yang dijawab salah ), sedangkan skor total selanjutnya
merupakan jumlah dari skor untuk semua item yang membangun soal tersebut.
Rumus korelasi product moment dengan angka kasar :
𝑁𝛴 × 𝑌 − (𝛴𝑋)(𝛴𝑌)
𝑟𝑋𝑦 =
√{𝑁∑𝑋2 − (𝛴𝑥)2}{𝑁𝛴𝑌−2(𝛴𝑌)2}
Cara-cara lain untuk menghitung validitas item dengan menggunakan rumus ypb , yaitu :
𝛾𝑝𝑏𝑖 = 𝑀𝑝 − 𝑝
𝑀1 √
𝑞
𝑠𝑡
4. Tes Terstandar sebagai kriterium dalam menentukan validitas

Tes terstandar adalah tes yang telah dicobakan berkali-kali sehingga dapat dijamin
kebaikannya. Cara menentukan validitas soal yang menggunakan tes terstandar sebagai
kriterium dilakukan dengan mengalikan koefisien validitas yang diperleh dengan
koefisien validitas tes terstandar tersebut.
5. Evaluasi Faktor
Setiap keseluruhan materi pelajaran terdiri dari pokok-pokok bahasan atau mungkin
sekelompok pokok bahasan yang merupakan satu kesatuan. Validitas faktor dikatakan
valid apabila mempunyai dukungan yang besar terhadap soal-soal secara keseluruhan,
yakni apabila jumlah skor untuk butir-butir faktor tersebut menunjukkan adanya
kesejajaran dengan skor total.
RELIABILITAS
A. PENGERTIAN
1. Arti Realibilitas bagi sebuah tes
Suatu tes dapat dikatakan mempunyai taraf kepercayaan yang tinggi jika tes tersebut
dapat memberikan hasil yang tetap. Atau seandainya hasilnya berubah-ubah, perubahan
yang terjadi dapat dikatakan tidak berarti. Jika validitas terkait dengan ketetapan objek
yang tidak lain adalah tidak menyimpangnya data dari kenyataan, artinya bahwa data
tersebut benar, maka konsep realibilitas terkait dengan pemotretan berkali-kali.
Intstrumen yang baik adalah instrument yang dapat dengan ajeg memberikan data yang
sesuai dengan kenyataan.
Beberapa hal yang sedikit banyak memengaruhi hasil tes dikelompokkan menjadi 3,
sebagai berikut :
a. Halyang berhubungan dengan Tes itu sendiri, yaitu Panjang Tes dan Kualitas Butir-
Butir Soalnya
Tes yang terdiri dari banyak butir, tentu saja lebih valid dibandingkan dengan tes
yang hnya terdiri dari beberapa butir soal. Tinggi rendahnya validitas menunjukkan
tinggi rendahnya reliabilitas tes. Dengan demikian maka semakin panjang tes, aka
reliabilitasnya semakin tinggi. Dalam menghitung besarnya realibilitas dapat dihitung
menggunakan rumus Spearman-Brown.
………….rumus beserta keteranngan halaman 102……..
b. Hal yang berhubungan dengan Tercoba ( testee )
Suatu tes yang dicobakan kepada kelompok yang terdiri dari banyak siswa akan
mencerminkan keragaman hasil yang menggambarkan besar kecilnya reliabilitas tes.
Tes yang dicobakan kepada bukan kelompok terpilih, akan menunjukkan reliabilitas
yanglebih besar daripada yang dicobakan pada kelompok tertentu yang diambil secara
dipilih.
c. Hal yang berhubungan dengan Penyelenggara Tes
Sudah disebutkan bahwa faktor penyelenggara tes yang bersifat administrative, sangat
menentukan hasil tes. Adanya hal-hal yang memengaruhi hasil tes ini smeua, secara
langsung akan ememngaruhi reliabilitas soal tes.
2. Cara-cara Mencari Besarnya Reliabilitas
a. Metode Bnetuk Pararel ( Equivalent )
Tes pararel atau tes ekuivalen adalah dua buah tes yang mempunyai kesamaan
tujuan, tingkat kesukaran, dan susunan, tetapi butir-butir soalnya berbeda. Dalam
menggunakan metode tes pararel ini pengetes harus menyiapkan dua buah tes, dan
masing-masing dicobakan pada kelompok siswa yang sama. Oleh karena itu, ada
orang menyebutkab sebagai double tes-double-trial. Kelemahan dari metode ini
adalah pengetes pekerjaannya berat karena harus menyusun duaseri tes. Lagi pula
harus tersedia waktu yang lama untuk mencobakan dua kali tes.
b. Metode Tes Ulang ( Test-retest Method )
Metode tes ulang dilakukan orang untuk menghindari penyusunan dua seri tes.
Dalam menggunakan teknik atau meotde ini pengetes hanya memiliki satu seri
tes, tetapi dicobakan dua kali. Oleh karena tesnya hanya satu dan dicobakan dua
kali, maka meotde ini dapat disebut dengan single-test-double-trial method.
c. Metode Belah Dua atau Split-half Method
Dalam menggunakan metode ini pengetes hanya menggunakan sebuah tes dan
dicobakan satu kali. Oleh karena itu, disebut juga single-tes-single-trial method.
Berbeda dengan metode pertama dan kedua yang setelah ditemukannya koefisien
korelasi langsung ditafsirkan itulah koefisien reliabilitas, maka dengann metode
ketiga ini tidak dapat demikian. Untuk mengetahui reliabilitas selurus tes harus
digunakan rumus Spearman-Brown sebagai berikut :
2𝑟1⁄ 1⁄
𝑟11 = (1 + 𝑟2 2
1⁄ 1⁄ )
2 2
Dimana:
𝑟1⁄ 1⁄ = korelasi antara skor-sekor setiap belahan tes
2 2
𝑟11 = koefisien realibilitas yang sudah disesuaikan
1. Membelah atas item genap dan item ganjil yang selanjutnya disebut belahan
ganjil-genap.
2. Membelah atas item awal dan item akhir yaitu separo jumlah pada nomor-
nomor awl dam separo nomor-nomor akhir yang selanjutnya disebut belahan
awal-akhir.
Untuk mencari reliabilitas suatu soal dilakukan dengan langkah-langkah sebagai berikut :
Langkah 1. Mencari jumlah kuadrat responden dengan rumus :
∑𝐵2 (𝛴𝑥𝑡)2
𝐽𝑘 = −
𝑁 𝑘×𝑁
Keterangan:
𝐽𝑘(𝑟) = 𝑗𝑢𝑚𝑙𝑎ℎ 𝑘𝑜𝑑𝑟𝑎𝑡 𝑟𝑒𝑠𝑝𝑜𝑛𝑑𝑒𝑛
𝑥𝑡 = 𝑠𝑘𝑜𝑟 𝑡𝑜𝑡𝑎𝑙 𝑡𝑖𝑎𝑝 𝑟𝑒𝑠𝑝𝑜𝑛𝑑𝑒𝑛
𝑘 = 𝑏𝑎𝑛𝑦𝑎𝑘 𝑖𝑡𝑒𝑚
𝑁 = 𝑏𝑎𝑛𝑦𝑎𝑘 𝑟𝑒𝑠𝑝𝑜𝑛 𝑎𝑡𝑎𝑢 𝑠𝑢𝑏𝑗𝑒𝑘
Langkah 2. Mencari jumlah kuadrat item dengan rumus :

𝛴𝑥𝑡2 (𝛴𝑥𝑡)2
𝐽𝐾 = −
𝑘 𝑘×𝑁
Keterangan:
𝐽𝑘(𝑖) = 𝑗𝑢𝑚𝑙𝑎ℎ 𝑘𝑢𝑎𝑑𝑟𝑎𝑡 𝑖𝑡𝑒𝑚
𝛴𝐵2 = 𝑗𝑢𝑚𝑙𝑎ℎ 𝑘𝑢𝑎𝑑𝑟𝑎𝑡 𝑗𝑎𝑤𝑎𝑏 𝑏𝑒𝑛𝑎𝑟 𝑠𝑒𝑙𝑢𝑟𝑢ℎ 𝑖𝑡𝑒𝑚
[𝛴𝑥𝑡]2 = 𝑘𝑢𝑎𝑑𝑟𝑎𝑡 𝑑𝑎𝑟𝑖 𝑗𝑢𝑚𝑙𝑎ℎ 𝑠𝑘𝑜𝑟 𝑡𝑜𝑡𝑎𝑙
Langkah 3. Mencari jumlah kuadrat total dengan rumus :

(∑𝐵)(∑𝑥𝑡)
𝐽𝑘(𝑡) =
(𝛴𝐵) + (∑𝑆)
Keterangan:
𝐽𝑘(𝑡) = 𝑗𝑢𝑚𝑙𝑎ℎ 𝑘𝑢𝑎𝑑𝑟𝑎𝑡 𝑡𝑜𝑡𝑎𝑙
𝛴𝐵 = 𝑗𝑢𝑚𝑙𝑎ℎ 𝑗𝑎𝑤𝑎𝑏 𝑏𝑒𝑛𝑎𝑟 𝑠𝑒𝑙𝑢𝑟𝑢ℎ 𝑖𝑡𝑒𝑚
𝛴𝐵 = 𝑗𝑢𝑚𝑙𝑎ℎ 𝑗𝑎𝑤𝑎𝑏 𝑠𝑎𝑙𝑎ℎ 𝑠𝑒𝑙𝑢𝑟𝑢ℎ 𝑖𝑡𝑒𝑚
Langkah 4. Mencari jumlah kuadrat sisa, dengan rumus :
𝐽𝑘(𝑠) = 𝐽𝑘(𝑡) − 𝐽𝑘(𝑟) − 𝐽(𝑖)
Langkah 5. Mencari varians respnden dan varians sisa dengan tabel F.
Dalam mencari varians ini di perlukan d.b (derajat kebebasan))dari masing-masing

sumber varians kemudian d.b ini di gunakan sebagai penyebut terhadap setiap jumlah
kuadrat untuk memperoleh variasi.
d.b = banyaknya N seriap sumber variasi di kurangi 1.

𝑘𝑢𝑎𝑑𝑟𝑎𝑡
Jadi, 𝑉𝑎𝑟𝑖𝑎𝑠𝑖 = 𝑗𝑢𝑚𝑙𝑎ℎ
𝑑.𝑏
Langkah 6. Memasukkan ke dalam rumus r11
dengan menggunakan tabel analisis item yang di gunakan untuk mencari relibilitas tengan
rumus dapat di cari realibilitas dengan rumus hoyt.
Mencari reliabilitas tes bentuk uraian
Rumus yang digunakan adalah rumus Alpha sebagai berikut :

𝑛 ∑𝜎𝑖
𝑟11 = ( ) (1 )
2
−
𝑛−1 𝜎𝑡
Di mana:
r11 = reabilitas yang di cari
𝛴𝜎𝑖2 = 𝑗𝑢𝑚𝑙𝑎ℎ 𝑣𝑎𝑟𝑖𝑎𝑛𝑠 𝑠𝑠𝑘𝑜𝑟 𝑡𝑖𝑎𝑝 − 𝑡𝑖𝑎𝑝 𝑖𝑡𝑒𝑚
𝜎𝑖2 = variants total

TINGKAT KESUKARAN SOAL
PENGERTIAN
Tingkat kesukaran butir soal adalah proporsi antara banyaknya peserta tes yang
menjawab butir soal dengan benar dengan banyaknya peserta tes. Hal ini berarti makin
banyak peserta tes yang menjawab butir soal dengan benar maka makin besar indeks
tingkat kesukaran, yang berarti makin mudah butir soal itu. Sebaliknya makin sedikit
peserta tes yang menjawab butir soal dengan benar maka soal tersebut makin sukar
(Azwar, 2006 :129).
Tinggi rendahnya tingkat kesukaran suatu butir soal dapat disebabkan oleh kerumitan
pokok soal dan kondisi pilihan jawaban yang disediakan. Dalam arti keluasan pertanyaan
soal sering membingungkan peserta tes dan alternatif jawaban yang homogen atau
kalimat soal sulit dipahami atau mempunyai pengertian ganda bagi peserta tes (Sirait,
2009 : 301).
Tingkat kesukaran soal berkaitan dengan persentase peserta yang menjawab soal
dengan benar. Semakin mudah butir soal, makin besarlah persentasenya. Jika tingkat
kesukaran 70 % (p=0,70), soal tersebut dianggap lebih mudah dibandingkan jika tingkat
kesukaran soalnya 15 % (p=0,15).yang paling baik adalah soal yang mempunyai tingkat
kesukaran 0,50 ( Anastasi dan Susan Urbina, 2007 : 128).
Berdasarkan teori-teori yang telah dikemukakan, tingkat kesulitan soal adalah

seberapa mudah dan seberapa sulitnya suatu soal bagi siswa. Tingkat kesukaran
dinyatakan dengan persentase siswa yang menjawab soal dengan benar. Makin besar
persentase siswa yang menjawab soal dengan benar, makin mudah soal itu. Sebaliknya
makin kecil persentase siswa yang menjawab soal dengan benar, makin sukar soal itu.
Dengan demikian soal yang dijawab benar oleh 85 % siswa, dinyatakan mempunyai
tingkat kesukaran 0,85, tentunya soal ini lebih mudah dari soal yang mempunyai tingkat
kesukaran 20 % (0,20).
Contoh soal Tingkat Kesukaran Pra Tindakan
Menganalisis jawaban siswa pada tiap butir soal pra tindakan dengan rumus sebagai berikut :
No Jumlah siswa yang Tingkat Keterangan

Soal menjawab dengan benar Kesukaran
1 22 0,667 sedang
2 21 0,636 sedang
3 22 0,667 sedang
4 23 0,697 sedang
5 20 0,606 sedang
6 20 0,606 sedang
7 23 0,697 sedang
8 27 0,818 mudah
9 24 0,727 mudah
10 21 0,636 sedang
11 25 0,758 mudah
12 22 0,667 sedang
13 9 0,273 sukar
14 23 0,697 sedang
15 24 0,727 mudah
16 21 0,636 sedang
17 8 0,242 sukar
18 9 0,273 sukar
19 26 0,788 mudah
20 24 0,727 mudah
Berikut tabel yang menunjukkan jumlah soal yang masuk ke dalam kategori soal mudah, sedang,
dan sukar.
Jumlah Soal Kategori Soal

Mudah Sedang Sukar
20 6 11 3
Presentase 30% 55% 15%
DAYA PEMBEDA SOAL
PENGERTIAN
Daya pembeda soal adalah kemampuan soal dengan skornya dapat membedakan
peserta tes dari kelompok tinggi dan kelompok rendah. Dengan kata lain makin tinggi
daya pembeda soal makin banyak peserta dari kelompok tinggi yang dapat menjawab
soal dengan benar dan makin sedikit peserta tes dari kelompok rendah yang dapat
menjawab soal dengan benar. Agar dapat diterima maka nilai D (discrimination: daya
pembeda soal) adalah 0,30 atau lebih. Sedangkan untuk dapat dinyatakan cukup
memuaskan adalah 0,40 ke atas (Dali S. Naga, 2002 : 67).
Indeks daya pembeda soal mengukur bagaimana baiknya sebuah soal

membedakan tingkat kemampuan siswa. Indeks daya pembeda soal bernilai – 1,00
sampai +1,00. Makin tinggi nilai D sebuah soal, makin baik soal tersebut membedakan
siswa yang berkemampuan tinggi dari siswa yang berkemampuan rendah. Soal yang
mempunyai nilai D = 0,40 dianggap sangat efektif dalam membedakan siswa yang
berkemampuan tinggi dan berkemampuan rendah. Soal yang mempunyai nilai D antara
0,20 sampai 0,39 dianggap memuaskan. Soal yang mempunyai nilai D lebih rendah dari
0,39 harus diperbaiki (Charles D. Hopkins dan Richard L. Antes (1999 : 159).
Berdasarkan pendapat-pendapat yang telah dikemukakan di atas, daya pembeda

soal adalah kemampuan soal untuk membedakan kelompok peserta tes berkemampuan
tinggi dan kelompok peserta tes yang berkemampuan rendah. Nilai daya pembeda
dinyatakan melalui indeks daya pembeda. Makin tinggi atau makin besar indeks daya
pembeda soal, makin besar soal tersebut dapat membedakan antara kelompok tinggi dan
kelompok rendah. Untuk menghitung daya pembeda soal mengambil dari 27 % kelompok
tinggi dan 27 % dari kelompok rendah. Nilai indeks daya pembeda soal berkisar antara –
1 sampai +1. Jika siswa kelompok tinggi dapat menjawab soal dengan benar lebih besar
dari siswa kelompok rendah maka indeks daya pembeda positif. Jika siswa kelompok
tinggi dan rendah sama-sama dapat menjawab soal dengan benar maka soal tersebut
mempunyai daya pembeda nol. Jika siswa kelompok rendah dapat menjwab soal dengan
benar lebih besar dari kelompok tinggi maka soal tersebut mempunyai daya pembeda
negatif. Soal yang mempunyai indeks daya pembeda negatif dan nol, dibuang karena soal
tersebut tidak dapat membedakan siswa yang mempunyai kemampuan tinggi dan rendah.
Contoh soal Daya Pembeda Soal Pra Tindakan
1. Menentukan jumlah siswa yang masuk kelompok atas dan kelompok bawah jumlah
siswa kelompok atas dan bawah adalah 27 % x jumlah siswa.
No Nama Skor Keterangan

1 Aprilianto Pamungkas Soleh 17 Atas
2 Firohmad 17 Atas
3 Ikhsanudin Fitrianto 17 Atas
4 Fredy Agus Pratama 16 Atas
5 Dwi Putra Novianto 15 Atas
6 Muhammad Rosyid Dwi Putra 15 Atas
7 Rizal Ardiansyah 15 Atas
8 Arif Hidayat 14 Atas
9 Wakhid Sirojuddin 14 Atas
10 Dimas Nurudin 11 Bawah
11 Riyan Nur Irawan 11 Bawah
12 Yogha Nagata Putra 11 Bawah
13 Anggoro Dwi Nugroho 10 Bawah
14 Aprilino Ahcmad Muzzi 10 Bawah
15 Pida Febri Rahayu 10 Bawah
16 Stevanus Nurma Indrawan 10 Bawah
17 Wahyu Tri Wibowo 10 Bawah
18 Jarudin 9 Bawah
2. Menganalisis daya pembeda pada tiap butir soal pada pra tindakanm dengan rumus
sebagai berikut :
No. Jumlah siswa yang Jumlah siswa yang Daya Keterangan

Soal benar kelompok benar kelompok Pembeda
atas atas
1 9 4 0,56 Baik
2 7 5 0,22 Cukup
3 7 5 0,22 Cukup
4 9 5 0,44 Baik
5 5 5 0 Buruk
6 9 4 0,56 Baik
7 8 6 0,22 Cukup
8 8 7 011 Buruk
9 8 6 0,22 Cukup
10 7 3 0,44 Baik
11 8 4 0,44 Baik
12 7 5 0,22 Cukup
13 5 1 0,44 Baik
14 8 7 0,11 Buruk
15 7 5 0,22 Cukup
16 5 4 0,11 Buruk
17 3 1 0,22 Cukup
18 3 2 0,11 Buruk
19 9 7 0,22 Cukup
20 8 6 0,22 Cukup
Maka, jumlah soal yang termasuk kategori daya pembeda baik sekali, baik,cukup,
dan buruk adalah sebagai berikut:
Jumlah Kategori Daya Pembeda
Soal Baik Sekali Baik Cukup Buruk
20 - 6 9 5
Presentase - 30% 45% 25%
DAYA PEMBEDA SOAL SIKLUS I
1. Menentukan jumlah siswa yang masuk kelompok atas dan kelompok bawah
jumlah siswa kelompok atas dan bawah adalah 27% x jumlah siswa.

7 Firohmad 15 Atas
9 Rizal Ardiansyah 14 Atas
13 Yogha Nagata Putra 10 Bawah
16 Ilham Bayu Wicaksono 9 Bawah
2. Menganalisis daya pembeda pada tiap butir soal pada siklus I dengan rumus
sebagai berikut :

atas Atas
1 9 7 0,22 Cukup
2 6 4 0,22 Cukup
3 5 1 0,44 Baik
4 8 5 0,33 Cukup
5 7 2 0,56 Baik
6 5 1 0,44 Baik
7 8 3 0,56 Baik
8 7 3 0,44 Baik
9 7 6 0,11 Buruk
10 6 1 0,56 Baik
11 7 7 0 Buruk
12 7 4 0,33 Cukup
13 4 1 0,33 Cukup
14 9 8 0,11 Buruk
15 9 6 0,33 Cukup
16 8 4 0,44 Baik
17 7 6 0,11 Buruk
18 7 7 0 Buruk
19 7 3 0,44 Baik
20 8 6 0,22 Cukup
20 - 7 9 4
Presentase - 35% 45% 20%
DAYA PEMBEDA SOAL SIKLUS II
1. Menentukan jumlah siswa yang masuk kelompok atas dan kelompok bawah
jumlah siswa kelompok atas dan bawah adalah 27% x jumlah siswa.

1 Firohmad 17 Atas
3 Rizakdi Hendra R 16 Atas
13 Ilham Bayu Wicaksono 10 Bawah
14 Nanang Dwi Ramadhan 9 Bawah
2. Menganalisis daya pembeda pada tiap butir soal pada siklus II dengan rumus
sebagai berikut :

atas Atas
1 3 1 0,22 Cukup
2 8 5 0,33 Cukup
3 9 5 0,44 Baik
4 4 2 0,22 Cukup
5 8 7 0,11 Buruk
6 8 6 0,22 Cukup
7 3 2 0,11 Buruk
8 7 3 0,44 Baik
9 8 3 0,56 Baik
10 4 3 0,11 Buruk
11 8 3 0,56 Baik
12 9 9 0 Buruk
13 7 3 0,44 Baik
14 5 2 0,33 Cukup
15 9 7 0,22 Cukup
16 8 3 0,56 Baik
17 9 2 0,78 Baik Sekali
18 9 7 0,22 Cukup
19 4 2 0,22 Cukup
20 9 7 0,22 Cukup
20 1 6 9 4
Presentase 5% 30% 45% 20%
DAFTAR PUSTAKA
Arikunto, S. (2016). Dasar-dasar Evaluasi Pendidikan. Jakarta : PT Bumi Aksara
Hanifah, N. 2014. Perbandingan Tingkat Kesukaran, Daya Pembeda butir Soal dan
Reliabilitas Tes bentuk Pilihan Ganda Biasa dan Pilihan Ganda Asosiasi Mata
Pelajaran Ekonomi. Jurnal Universitas Indraprasta PGRI 6 (1): 46-47.

Makalah Evaluasi Pembelajaran (AutoRecovered) Fix

Diunggah oleh

Informasi Dokumen

Judul Asli

Hak Cipta

Format Tersedia

Bagikan dokumen Ini

Bagikan atau Tanam Dokumen

Opsi Berbagi

Apakah menurut Anda dokumen ini bermanfaat?

Apakah konten ini tidak pantas?

Hak Cipta:

Format Tersedia

Makalah Evaluasi Pembelajaran (AutoRecovered) Fix

Diunggah oleh

Hak Cipta:

Format Tersedia

MAKALAH

Sasmita sari (E1Q021043)

Muhammad thoriq Hidayatullah (E1Q021035)

PROGRAM STUDI PENDIDIKAN FISIKA

FAKULTAS KEGURUAN DAN ILMU PENDIDIKAN

Mataram, 18 maret 20023

∑xy = jumlah perkalian x dan y

Rumus korelasi product

4. Tes Terstandar sebagai kriterium dalam menentukan validitas

Langkah 1. Mencari jumlah kuadrat responden dengan rumus :

𝐽𝑘(𝑟) = 𝑗𝑢𝑚𝑙𝑎ℎ 𝑘𝑜𝑑𝑟𝑎𝑡 𝑟𝑒𝑠𝑝𝑜𝑛𝑑𝑒𝑛

𝑥𝑡 = 𝑠𝑘𝑜𝑟 𝑡𝑜𝑡𝑎𝑙 𝑡𝑖𝑎𝑝 𝑟𝑒𝑠𝑝𝑜𝑛𝑑𝑒𝑛

𝑁 = 𝑏𝑎𝑛𝑦𝑎𝑘 𝑟𝑒𝑠𝑝𝑜𝑛 𝑎𝑡𝑎𝑢 𝑠𝑢𝑏𝑗𝑒𝑘

Langkah 2. Mencari jumlah kuadrat item dengan rumus :

𝐽𝑘(𝑖) = 𝑗𝑢𝑚𝑙𝑎ℎ 𝑘𝑢𝑎𝑑𝑟𝑎𝑡 𝑖𝑡𝑒𝑚

𝛴𝐵2 = 𝑗𝑢𝑚𝑙𝑎ℎ 𝑘𝑢𝑎𝑑𝑟𝑎𝑡 𝑗𝑎𝑤𝑎𝑏 𝑏𝑒𝑛𝑎𝑟 𝑠𝑒𝑙𝑢𝑟𝑢ℎ 𝑖𝑡𝑒𝑚

[𝛴𝑥𝑡]2 = 𝑘𝑢𝑎𝑑𝑟𝑎𝑡 𝑑𝑎𝑟𝑖 𝑗𝑢𝑚𝑙𝑎ℎ 𝑠𝑘𝑜𝑟 𝑡𝑜𝑡𝑎𝑙

Langkah 3. Mencari jumlah kuadrat total dengan rumus :

𝐽𝑘(𝑡) = 𝑗𝑢𝑚𝑙𝑎ℎ 𝑘𝑢𝑎𝑑𝑟𝑎𝑡 𝑡𝑜𝑡𝑎𝑙

𝛴𝐵 = 𝑗𝑢𝑚𝑙𝑎ℎ 𝑗𝑎𝑤𝑎𝑏 𝑏𝑒𝑛𝑎𝑟 𝑠𝑒𝑙𝑢𝑟𝑢ℎ 𝑖𝑡𝑒𝑚

𝛴𝐵 = 𝑗𝑢𝑚𝑙𝑎ℎ 𝑗𝑎𝑤𝑎𝑏 𝑠𝑎𝑙𝑎ℎ 𝑠𝑒𝑙𝑢𝑟𝑢ℎ 𝑖𝑡𝑒𝑚

Langkah 4. Mencari jumlah kuadrat sisa, dengan rumus :

𝐽𝑘(𝑠) = 𝐽𝑘(𝑡) − 𝐽𝑘(𝑟) − 𝐽(𝑖)

Langkah 5. Mencari varians respnden dan varians sisa dengan tabel F.

Dalam mencari varians ini di perlukan d.b (derajat kebebasan))dari masing-masing

d.b = banyaknya N seriap sumber variasi di kurangi 1.

Langkah 6. Memasukkan ke dalam rumus r11

Mencari reliabilitas tes bentuk uraian

Rumus yang digunakan adalah rumus Alpha sebagai berikut :

r11 = reabilitas yang di cari

𝛴𝜎𝑖2 = 𝑗𝑢𝑚𝑙𝑎ℎ 𝑣𝑎𝑟𝑖𝑎𝑛𝑠 𝑠𝑠𝑘𝑜𝑟 𝑡𝑖𝑎𝑝 − 𝑡𝑖𝑎𝑝 𝑖𝑡𝑒𝑚

𝜎𝑖2 = variants total

Berdasarkan teori-teori yang telah dikemukakan, tingkat kesulitan soal adalah

No Jumlah siswa yang Tingkat Keterangan

Jumlah Soal Kategori Soal

Indeks daya pembeda soal mengukur bagaimana baiknya sebuah soal

Berdasarkan pendapat-pendapat yang telah dikemukakan di atas, daya pembeda

No Nama Skor Keterangan

No. Jumlah siswa yang Jumlah siswa yang Daya Keterangan

No Nama Skor Keterangan

No. Jumlah siswa yang Jumlah siswa yang Daya Keterangan

No Nama Skor Keterangan

No. Jumlah siswa yang Jumlah siswa yang Daya Keterangan

Arikunto, S. (2016). Dasar-dasar Evaluasi Pendidikan. Jakarta : PT Bumi Aksara

Anda mungkin juga menyukai