Anda di halaman 1dari 14

TUGAS

EVALUASI PEMBELAJARAN

OLEH

NAMA :NURFADHILAH NADIYAH

NIM : E1A017051

KELAS : B/V

PROGRAM STUDI PENDIDIKAN BIOLOGI

FAKULTAS KEGURUAN DAN ILMU PENDIDIKAN

UNIVERSITAS MATARAM

2019
Soal

1. Bagaimana melakukan analisis test dan butir soal.


2. Cirri-ciri tes yang baik.
3. Macam-macam validitas (isi, bahasa, konstruk).
4. Cara menentukan validitas test dan butir soal.
5. Cara menentukan reliable test dan butir soal.
6. Analisis homogenitas.
7. Analisis kesukaran.
8. Analisis daya beda.
9. Analisis pengecoh.
10. Efektivitas fungsi option.

Jawaban

1). Analisis soal dilakukan untuk mengetahui berfungsi atau tidaknya sebuah soal. Analisis
pada umumnya dilakukan melalui dua cara, yaitu analisis kualitatif (qualitatif control)
dan analisis kuantitatif (quantitatif control).
a. Analisis Butir Soal Secara Kualitatif
Pada prinsipnya analisis butir soal secara kualitatif dilaksanakan
berdasarkan kaidah penulisan soal (tes tertulis, perbuatan, dan sikap). Penelaahan
ini biasanya dilakukan sebelum soal digunakan atau diujikan. Aspek yang
diperhatikan dalam penelaahan secara kualitatif mencakup aspek materi,
konstruksi, bahasa atau budaya, dan kunci jawaban. Ada beberapa teknik yang
digunakan untuk menganalisis butir soal secara kualitatif, yaitu teknik moderator
dan teknik panel. Teknik moderator merupakan teknik berdiskusi yang
didalamnya terdapat satu orang sebagai penengah. Berdasarkan teknik ini, setiap
butir soal didiskusikan secara bersama-sama dengan beberapa ahli. Sedangkan
teknik panel adalah teknik menelaah butir soal berdasarkan kaidah penulisan butir
soal. Kaidah itu diantaranya adalah materi, kontruksi, bahasa atau budaya,
kebenaran kunci jawaban. Caranya beberapa penelaah diberikan beberapa butir
soal yang akan ditelaah, format penelaahan, dan pedoman penelaahan. Dalam
menganalisis butir soal secara kualitatif penggunaan format penelaahan soal akan
membantu dan mempermudah prosedur pelaksanaannya. Format penelaahan soal
digunakan sebagai dasar untuk menganalisis setiap butir soal.
b. Analisis Butir Soal Secara Kuantitatif
Penelaahan soal secara kuantitatif adalah penelaahan butir soal didasarkan
pada bukti empirik. Salah satu tujuan utama pengujian butir-butir soal secara
emperik adalah untuk mengetahui sejauh mana masing-masing butir soal
membedakan antara mereka yang tinggi kemampuannya dalam hal yang
didefinisikan oleh kriteria dari mereka yang rendah kemampuannya. Data empirik
ini diperoleh dari soal yang telah diujikan. Ada dua pendekatan dalam analisis
secara kuantitatif yaitu pendekatan secara klasik dan modern. Analisis butir soal
secara klasik adalah proses penelaahan butir soal melalui informasi dari jawaban
peserta tes guna meningkatkan mutu butir soal yang bersangkutan dengan
menggunakan teori tes klasik. Pada teori tes klasik, analisis item tes dilakukan
dengan memperhitungkan kedudukan item dalam suatu kelas atau kelompok.
Karakteristik atau kualitas item sangat tergantung pada kelompok dimana
diujicobakan sehingga kualitas item terikat pada sampel responden atau peserta
tes yang memberikan respons (sample bounded). Ada beberapa kelebihan analisis
butir soal secara klasik adalah murah, sederhana, familiar, dapat dilaksanakan
sehari-hari dengan cepat menggunakan komputer dan dapat menggunakan
beberapa data dari peserta tes. Analisis butir soal secara modern adalah
penelaahan butir soal dengan menggunakan teori respon butir atau item response
theory. Teori ini merupakan suatu teori yang menggunakan fungsi matematika
untuk menghubungkan antara peluang menjawab benar suatu butir dengan
kemampuan siswa.
Teori ini muncul karena adanya beberapa keterbatasan pada analisis secara
klasik, yaitu:
a. Tingkat kemampuan dalam teori klasik adalah true score. Artinya,
jika suatu tes sulit maka tingkat kemampuan peserta tes akan rendah.sebaiknya,
jika suatu tes mudah maka tingkat kemampuan peserta tes tinggi.
b. Tingkat kesukaran butir soal didefinisikan sebagai proporsi peserta
tes yang menjawab benar. Mudah atau sulitnya butir soal tergantung pada
kemampuan peserta tes.
c. Daya pembeda, reliabilitas, dan validitas tes tergantung pada
kondisi peserta tes.

2). Ciri-ciri Tes Yang Baik

Suharsimi Arikunto (1997: 51-61) menyebutkan bahwa suatu tes dikatakan


sebagai alat pengukur yang baik harus memiliki validitas, reliabilitas, objektivitas,
praktikabilitas, dan ekonomis.

a. Validitas

Sebuah tes dikatakan memiliki validitas apabila tes itu dapat tepat mengukur apa
yang hendak diukur. Artinya tes yang hendak diberikan kepada peserta didik harus dapat
menjadi alat ukur terhadap tujuan yang sudah ditentukan.

b. Reliabilitas

Realibilitas berasal dari kata reliability, reliable yang artinya dapat dipercaya,
berketepatan. Sebuah tes dikatakan memiliki reliabilitas apabila hasil-hasil tes tersebut
menunjukkan ketetapan. Artinya, jika peserta didik diberikan tes yang sama pada waktu
yang berlainan, maka setiap siswa akan tetap berada pada urutan yang sama dalam
kelompoknya.

c. Objektivitas

Objektivitas dalam pengertian sehari-hari berarti tidak mengandung unsur pribadi.


Kebalikanya adalah subyektivitas, yang berarti terdapat unsur pribadi. Jadi, sebah tes
dikatakan objektif apabila tes itu dilaksanakan dengan tidak ada faktor pribadi yang
mempengaruhi, terutama pada sistem scoring.

d. Praktikabilitas
Sebuah tes dikatakan memiliki praktikabilitas yang tinggi apabila tes tersebut
bersifat praktis. Artinya, tes itu mudah dilaksanakan, mudah pemeriksaanya, dan di
lengkapi petunjuk yang jelas sehingga dapat diberikan atau diawali oleh orang lain dan
juga mudah dalam membuat administrasinya.

e. Ekonomis

Tes memiliki sebutan ekonomis apabila pelaksanaan tes itu tidak membutuhkan
ongkos atau biaya yang mahal, tenaga yang banyak, dan waktu yang lama.

3). Menurut Sukardi (2008) secara metodologis validitas suatu tes dapat dibedakan menjadi
empat macam, yaitu validitas isi, validitas konstruk, validitas konkruen dan validitas prediksi.
Macam-macam validitas tersebut akan diuraikan sebagai berikut:

a) Validitas isi

Yang dimaksud validitas isi ialah derajat dimana sebuah tes evaluasi mengukur
cakupan substansi yang ingin diukur. Untuk mendapatkan validitas isi memerlukan dua spek
penting, yaitu valid isi dan valid teknik sampling.Valid isi mencakup khususnya, hal-hal yang
berkaitan dengan apakah item-item evaluasi menggambarkan pengukuran dalam cakupan
yang ingin diukur. Sedangkan validitas teknik sampling pada umunya berkaitan dengan
bagaimanakah baiknya suatu sampel tes mempresentasikan total cakupan isi (Sukardi, 2008).

Sedangkan Arikunto (1997: 64) sebuah tes dikatakan memiliki validitas isi apabila
mengukur tujuan khusus tertentu yang sejajar dengan materi atau isi pelajaran yang diberikan.
Oleh karena materi yang diberikan tertera dalam kurikulum maka validitas isi juga disebut
validitas kurikuler.

b) Validitas Konstruk

Validitas konstruk merupakan derajat yang menunjukkan suatu tes mengukur sebuah
konstruk sementara atau Hyptotetical construct. Secara definitife, konstruk merupakan suatu
sifat yang tidak dapat diobservasi, tetapi kita dapat merasakan pengaruhnya melalui salah satu
atau dua indera kita (Sukardi, 2008).
Sedangkan Arikunto(1997: 64) sebuah tes dikatakan memiliki validitas konstruksi
apabila butir-butir soal yang membangun tes tersebut mengukur setiap aspek berfikir seperti
disebutkan dalam tujuan instruksional khusus. Dengan kata lain jika butir-butir soal mengukur
aspek berfikir tersebut sudah sesuai dengan aspek berfikir yang menjadi tujuan instruksional.

c) Validitas Rupa

Validitas rupa tidak menunjukkan apakah alat pengukur dalam mengukur apa yang
akan diukur, Tetapi hanya menunjukkan dari segi rupa suatu alat ukur tampaknya mengukur
apa yang akan diukur.

Validitas rupa ini sangat penting dalam segi pengukur dari kemampuan individu,
Misalnya seperti dalam pengukuran kecerdasan, bakat atau kemampuan serta keterampilan.
Hal seperti ini dikarenakan dalam pengukuran aspek kemampuan seperti itu faktor rupa alat
ukur dapat menentukan bagaimana minat seseorang dalam menjawab pertanyaan dalam alat
ukur.

4). Untuk menguji validitas setiap butir soal maka skor-skor yang ada pada butir yang
dimaksud dikorelasikan dengan skor totalnya. Skor tiap butir soal dinyatakan skor X dan skor
total dinyatakan sebagai skor Y, dengan diperolehnya indeks validitas setiap butir soal, dapat
diketahui butir-butir soal manakah yang memenuhi syarat dilihat dari indeks validitasnya
(Arikunto, 1999:78).

Tentukan koefisien korelasi antara skor hasil tes yang akan diuji validitasnya dengan
hasil tes yang terstandar yang dimiliki oleh orang yang sama dengan menggunakan rumus
korelasi produk momen di bawah ini:
Hitung koefisien validitas instrumen yang diuji (r-hitung), yang nilainya sama
dengan korelasi korelasi hasil langkah sebelumnya dikali koefisien validitas instrumen
terstandar.

Bandingkan nilai koefisien validitas dengan nilai koefisien korelasi Pearson /


tabel Pearson (r-tabel) pada taraf signifikansi a (biasanya dipilih 0,05) dan n = banyaknya
data yang sesuai.

Kriterianya adalah :

a. Instrumen valid, jika r-hitung = r-tabel


b. Instrumen tidak valid, jika r-hitung < r-tabel

Tentukan kategori dari validitas instrument yang mengacu pada pengklasifikasian


validitas yang dikemukakan oleh Guilford (1956:145) sebagai berikut:

0,80 < rxy 1,00 validitas sangat tinggi (sangat baik)

0,40 < rxy 0,60 validitas sedang (cukup)

0,20 < rxy 0,40 validitas rendah (kurang)

0,00 < rxy 0,20 validitas sangat rendah (jelek)

rxy 0,00 tidak valid


5). Cara menentukan reliable test dan butir soal yaitu:

a. Reliabilitas Tes Tunggal

Pada bahasan kali ini, kita hanya akan membahas tentang Reliabilitas Tes
Tunggal (Internal Consistency Reliability)

Tes tunggal adalah tes yang terdiri dari satu set yang diberikan terhadap
sekelompok subjek dalam satu kali pengetesan, sehingga dari hasil pengetesan hanya
diperoleh satu kelompok data. Ada dua teknik untuk perhitungan reliabilitas tes, yaitu:

b. Rumus Uji Reliabilitas Teknik Belah Dua (Split-Half Technique)

Rumus Uji Reliabilitas Teknik Belah Dua dilakukan dengan cara membagi tes
menjadi dua bagian yang relatif sama (banyaknya soal sama), sehingga masing-masing
test mempunyai dua macam skor, yaitu skor belahan pertama (awal / soal nomor ganjil)
dan skor belahan kedua (akhir / soal nomor genap). Koefisien reliabilitas belahan tes
dinotasikan dengan r1/2 1/2 dan dapat dihitung dengan menggunakan rumus yaitu
korelasi angka kasar Pearson. Selanjutnya koefisien reliabilitas keseluruhan tes dihitung
menggunakan formula Spearman-Brown, yaitu:

Kategori koefisien reliabilitas (Guilford, 1956: 145) adalah sebagai berikut:

0,80 < r11 1,00 reliabilitas sangat tinggi

0,60 < r11 0,80 reliabilitas tinggi

0,40 < r11 0,60 reliabilitas sedang

0,20 < r11 0,40 reliabilitas rendah.

-1,00 r11 0,20 reliabilitas sangat rendah (tidak reliable).


0,60 < rxy 0,80 validitas tinggi (baik)

Rumus Uji Reliabilitas Teknik Non Belah Dua (Non Split-Half Technique).
Rumus uji Reliabilitas teknik non belah dua: Salah satu kelemahan perhitungan
koefisien reliabilitas dengan menggunakan teknik belah dua adalah (1) banyaknya butir
soal harus genap, dan (2) dapat dilakukan dengan cara yang berbeda sehingga
menghasilkan nilai yang berbeda pula seperti terlihat pada contoh c.1 dan contoh c.2.
Untuk mengatasi masalah tersebut dapat dilakukan dengan menggunakan teknik non
belah dua. Untuk perhitungan koefisien reliabilitas dapat dilakukan dengan menggunakan
rumus Kuder-Richardson (KR-20) dan Kuder-Richardson (KR-21). Pada Bahasan kali ini
kita tidak membahas lebih lanjut tentang Rumus KR ini, karena akan dijelaskan pada
postingan artikel berikutnya: KR 20.

Uji Reliabilitas Tes Uraian


Untuk menghitung uji reliabilitas tes bentuk uraian dapat dilakukan dengan
menggunakan rumus Cronbach-Alpha, yaitu:

6). Uji homogenitas adalah pengujian mengenai sama tidaknya variansi-variansi dua buah
distribusi atau lebih. Uji homogenitas yang akan dibahas dalam tulisan ini adalah Uji
Homogenitas Variansi dan Uji Bartlett. Uji homogenitas dilakukan untuk mengetahui apakah
data dalam variabel X dan Y bersifat homogen atau tidak.

a. Mencari Varians/Standar deviasi Variabel X dan Y, dengan rumus :


b. Mencari F hitung dengan dari varians X dan Y, dengan rumus :

Catatan:

Pembilang: S besar artinya Variance dari kelompok dengan variance terbesar


(lebih banyak)

Penyebut: S kecil artinya Variance dari kelompok dengan variance terkecil (lebih
sedikit)

Jika variance sama pada kedua kelompok, maka bebas tentukan pembilang dan
penyebut.

c. Membandingkan F hitung dengan Tabel F: F Tabel dalam Excel pada tabel distribusi F,
dengan:

 Untuk varians dari kelompok dengan variance terbesar adalah dk pembilang n-1
 Untuk varians dari kelompok dengan variance terkecil adalah dk penyebut n-1
 Jika F hitung < Tabel F: F Tabel dalam Excel, berarti homogen
 Jika F hitung > Tabel F: F Tabel dalam Excel, berarti tidak homogen

Contoh :

Data tentang hubungan antara Penguasaan kosakata(X) dan kemampuan membaca


(Y):
Kemudian dilakukan penghitungan, dengan rumus yang ada:

Kemudian dicari F hitung :

Dari penghitungan diatas diperoleh F hitung 2.81 dan dari grafik daftar distribusi F
dengan dk pembilang = 10-1 = 9. Dk penyebut = 10-1 = 9. Dan α = 0.05 dan F tabel =
3.18. Tampak bahwa F hitung < Tabel F: F Tabel dalam Excel. Hal ini berarti data
variabel X dan Y homogen.

7). Tingkat Kesukaran Soal

Analisis tingkat kesukaran dimaksudkan untuk mengetahui apakah soal tersebut


tergolong mudah atau sukar. Tingkat kesukaran adalah bilangan yang menunjukan sukar
atau mudahnya sesuatu soal. (Arikunto, 1999: 207).

Menentukan taraf kesukaran (TK) digunakan rumus sebagai berikut:

Dimana:

P= B/JS
P = Indeks kesukaran

B = Banyaknya siswa yang menjawab soal dengan betul

JS = Jumlah seluruh siswa peserta tes

Dengan Interprestasi Tingkat Kesukaran sebagaimana terdapat dalam Tabel berikut:

Tingkat Kesukaran (TK) Interprestasi atau Penafsiran TK

TK < 0,30 Sukar

0,30 ≤ TK ≤ 0,70 Sedang

TK > 0,70 Mudah

8). Daya pembeda soal adalah kemampuan suatu soal untuk membedakan antara siswa yang
berkemampuan tinggi dengan siswa yang berkemampuan rendah (Arikunto, 1999 : 211).

Menentukan daya pembeda (DP) digunakan rumus sebagai berikut.

Dimana:

DP= BA/JA-BB/JB= PA-PB

J = Jumlah peserta tes

JA = Banyaknya peserta kelompok atas


JB = Banyaknya peserta kelompok bawah
BA = Banyaknya peserta kelompok atas yang menjawab soal dengan benar
BB = Banyaknya peserta kelompok bawah yang menjawab soal dengan benar

PA= BA/JA = Proporsi peserta kelompok atas yang menjawab benar

PB= BB/JB = Proporsi peserta kelompok bawah yang menjawab benar


Dengan interprestasi DP sebagaimana terdapat dalam Tabel berikut.

Daya Pembeda (DP) Interprestasi atau penafsiran DP

DP ≥ 0,70 Baik sekali (digunakan)

0,40 ≤ DP < 0,70 Baik (digunakan)

0,20 ≤ DP < 0,40 Cukup

DP < 0,20 Jelek

9). Menganalisis fungsi pengecoh (distractor) dikenal dengan istilah menganalisis pola
penyebaran jawaban butir soal pada soal bentuk pilihan ganda. Pola tersebut diperoleh dengan
menghitung banyaknya testee yang memilih pilihan jawaban butir soal atau yang tidak memilih
pilihan manapun (blangko). Dari pola penyebaran jawaban butir soal dapat ditentukan apakah
pengecoh berfungsi dengan baik atau tidak. Suatu pengecoh dapat dikatakan berfungsi dengan
baik jika paling sedikit dipilih oleh 5 % pengikut tes.
CARA MELAKUKAN ANALISIS PENGECOH
Pertimbangan terhadap analisis pengecoh: a. Diterima, karena sudah baik b. Ditolak,
karena tidak baik c. Ditulis kembali, karena kurang baik Sebuah pengecoh dikatakan berfungsi
baik jika paling sedikit dipilih oleh 5% pengikut tes.
PILIHAN A B C D E O JUMLAH
JAWABAN
KELOMPOK 5 7 15 3 3 0 33
ATAS
KELOMPOK 8 8 6 5 7 3 37
BAWAH
JUMLAH 13 15 21 8 10 3 70
O = Omitted (tidak menjawab), C* = kunci jawaban
Pengecoh A : 13/70 x 100% > 5% , berfungsi
B : 15/70 x 100% > 5% , berfungsi
D : 8/70 x 100% > 5% , berfungsi
E : 10/70 x 100% > 5% . berfungsi
Untuk tes pilihan ganda dengan 5 alternatif jawaban dan P = 0,8, dilihat dari segi
Omitted (O), sebuah butir soal dikatakan baik jika persentase O-nya ≤ 10%.
10). Option adalah kemungkinan jawaban yang disediakan pada butir soal (tes) tipe obyektif
bentuk pilihan ganda atau memasangkan untuk dipilih oleh peserta tes, sesuai dengan petunjuk
yang diberikan. Suatu option disebut efektif jika memenuhi fungsinya atau tujuan disajikannya
option tersebut tercapai. Hal ini berarti bahwa setiap option yang disajikan masing-masing
mempunyai kemungkinan yang sama untuk dipilih, jika testi menjawab soal itu dengan menerka-
nerka (spekulasi).

Option yang merupakan jawaban yang benar disebut option kunci, sedangkan option
lainnya disebut option pengecoh. Agar suatu option yang disajikan efektif harus diusahakan
homogen (serupa), baik dari segi isi (materi), notasi, maupun panjangpendeknya kalimat pada
option tersebut.

Berdasarkan distribusi pilihan pada setiap optin untuk siswa kelompok atas dan
kelompok bawah, dapat ditentukan option yang berfungsi efektif atau tidak. Kriteria option yang
berfungsi efektif adalah:

1) Untuk option kunci

a. Jumlah pemilih kelompok atas harus lebih banyak daripada jumlah pemilih kelompok
bawah. b. Jumlah pemilih kelompok atas dan kelompok bawah lebih dari 0,25 tetapi tidak
lebih dari 0,75 dari seluruh siswa kelompok atas dan kelompok bawah.

2) Untuk option pengecoh

a. Jumlah pemilih kelompok atas lebih sedikit daripada jumlah pemilih kelompok bawah.

b. Jumlah pemilih kelompok atas dan kelompok bawah minimal sebanyak 0,25 dari
seperdua jumlah option pengecoh kali jumlah kelompok atas dan kelompok bawah.

c. Jika peserta tes mengabaikan semua option (tidak memilih) disebut omit. Option
disebut efektif jika omit ini jumlahnya tidak lebih dari 10% jumlah siswa pada kelompok atas
dan kelompok bawah.

Anda mungkin juga menyukai