Anda di halaman 1dari 18

ANALISIS HASIL EVALUASI PEMBELAJARAN MELIPUTI DAYA

BEDA, TINGKAT KESULITAN, RELIABILITAS, DAN


KEBERFUNGSIAN DISTRAKTOR DENGAN SOFTWARE ITEMAN

MAKALAH
UNTUK MEMENUHI TUGAS MATAKULIAH
Evaluasi Pendidikan
yang dibina oleh bapak Dr. Edi Sutadji, M.Pd

oleh
Okky Rachmadilla Soepriyanto

140511600421

UNIVERSITAS NEGERI MALANG


FAKULTAS TEKNIK
JURUSAN TEKNIK MESIN
PROGRAM STUDI S1 PENDIDIKAN TEKNIK MESIN
April 2016

BAB I
PENDAHULUAN
1.1

Latar Belakang
Dalam dunia pendidikan, evaluasi memegang peranan yang sangat penting.

Dari evaluasi tersebut, para pengambil keputusan pendidikan mendasarkan diri


dalam memutuskan apakah seorang siswa dapat dinyatakan lulus atau tidak serta
layak diberikan sertifikasi atau tidak. Tanpa evaluasi, kita tidak tahu sejauh manna
keluaran pendidikan telah sesuai atau bahkan menyimpang dari tujuan awal yang
telah dicanangkan. Evaluasi yang dilakukan secara benar akan banyak manfaatnya
karena dari hasil evaluasi itu akan diperoleh umpan balik yang berharga bagi
masukan maupun proses pendidikan.
Salah satu cara untuk memperbaiki proses belajar mengajar yang paling
efektif adalah dengan mengevaluasi hasil belajar yang diperoleh dari
pembelajaran itu sendiri. Dalam proses pembelajaran akan selalu terkandung
unsur didalamnya penilaian. Yang mana sebelum dilakukan penilaian perlu adanya
analisis soal dengan tujuan untuk memperoleh informasi dalam menentukan
kesimpulan kualitas soal tes tersebut.
Dengan melalui analisis butir soal, maka dapat diperoleh informasi tentang
ketidak layakan sebuah soal dan petunjuk dalam mengadakan perbaikannya. Ada
beberapa analisis butir soal, yaitu analisis validitas soal, reliabilitas soal, tingkat
kesukaran, daya pembeda, dan fungsi pengecoh. Menganalisis tingkat kesukaran
soal artinya mengkaji soal dari segi kesulitannya sehingga dapat diperoleh soal
mana yang termasuk mudah, sedang dan sukar. Sedangkan menganalisis daya
pembeda artinya mengkaji soal dari segi kesanggupan soal tersebut dalam
membedakan siswa yang termasuk tinggi prestasinya.
Sedangkan validitas dan realibilitas mengkaji kelayakan soal dalam
menentukan aspek mana yang harus diukur dan konsistensi soal. Agar peserta tes
atau peserta didik tidak dianggap gagal karena butir soal sulit dipahami dan
tingkat validitas dan reliabilitasnya rendah maka harus dilakukan analisis butir
soal terhadap perangkat tes. Analisis butir soal memiliki beberapa manfaat
diantaranya adalah (1) mendukung butir soal yang efektif (2) secara materi dapat

memperbaiki tes yang digunakan, (3) meningkatkan validitas dan reliabilitas soal
(Anatasia dan Urbina, 1997:172).
Analisis butir soal sebagai usaha untuk mengetahui kualitas soal
hendaknya perlu dilakukan. Ini dikarenakan untuk mengetahui kualitas dari soal
tersebut supaya tepat manfaatnya dan dapat digunakan sebagai bahan
pertimbangan untuk meningkatkan kualitas pendidikan di negeri ini. Meskipun
soal tersebut hanya berfungsi sebagai bahan pertimbangan saja, akan tetapi lebih
baik kalau tetap dianalisis kualitasnya.
1.1 Rumusan Masalah
1. Apa pengertian Iteman?
2. Apa sajakah fungsi program Iteman?
3. Apa sajakah kekurangan dan kelebihan program iteman?
4. Bagaimana langakh-langkah menjalankan program Iteman?
5. Bagaimana analisis dan interpretasi hasil program Iteman?
1.3 Tujuan
1. Menjelaskan pengertian program Iteman
2. Menjelaskan fungsi program Iteman
3. Menjelaskan kekurangan dan kelebihan program iteman
4. Mendeskripsikan langkah-langkah menjalankan program Iteman
5. Mendeskripsikan analisis dan interpretasi hasil program Iteman

BAB II
PEMBAHASAN

2.1 Program ITEMAN


Item And Test Analysis Program (ITEMAN) merupakan salah satu
software yang tersedia untuk melakukan analisis terhadap butir-butir soal.
Sebagaimana RASCAL, ASCAL dan BIGSTEPS, bahasa pemrograman yang
dapat dipahami oleh program-program ini adalah bahasa yang diformat dalam
bentuk ASCII. ITEMAN berguna dalam melakukan analisis statistik untuk
menentukan kualitas butir soal mencakup informasi mengenai tingkat kesukaran,
daya pembeda soal dan statistik sebaran jawaban berdasarkan pendekatan teori tes
klasik (classical test theory).
Program ini termasuk satu paket program dalam MicroCATn yang
dikembangkan oleh Assessment Systems Corporation mulai tahun 1982 dan
mengalami revisi pada tahun 1984, 1986, 1988, dan 1993; mulai dari versi 2.00
sampai dengan versi 4.30 (seperti yang saat ini digunakan yaitu versi 4.30).
Alamatnya adalah Assessment Systems Corporation, 2233 University Avenue,
Suite 400, St Paul, Minesota 55114, United States of America.
Program ini dapat digunakan untuk: (1) menganalisis data file (format
ASCII) jawaban butir soal yang dihasilkan melalui manual entri data atau dari
mesin scanner; (2) menskor dan menganalisis data soal pilihan ganda dan skala
Likert untuk 30.000 siswa dan 250 butir soal; (3) menganalisis sebuah tes yang
terdiri dari 10 skala (subtes) dan memberikan informasi tentang validitas setiap
butir (daya pembeda, tingkat kesukaran, proporsi jawaban pada setiap option),
reliabilitas (KR-20/Alpha), standar error of measurement, mean, variance, standar
deviasi, skew, kurtosis untuk jumlah skor pada jawaban benar, skor minimum dan
maksimum, skor median, dan frekuensi distribusi skor.
Untuk mengoperasikankan program ITEMAN, buku manual/ buku
petunjuk memiliki peran yang sangat penting untuk bisa mengoperasikan program
ini dengan baik. Sebagai contoh, tahap awal adalah membuat "file data" (control
file) yang berisi 5 komponen utama.
1
2
3

Baris pertama adalah baris pengontrol yang mendeskripsikan data.


Baris kedua adalah daftar kunci jawaban setiap butir soal.
Baris ketiga adalah daftar jumlah option untuk setiap butir soal.

Baris keempat adalah daftar butir soal yang hendak dianalisis (jika butir yang

akan dianalisis diberi tanda Y (yes), jika tidak diikutkan dalam analisis diberi
tanda N (no).
5 Baris kelima dan seterusnya adalah data siswa dan pilihan jawaban siswa.
Setiap pilihan jawaban siswa (untuk soal bentuk pilihan ganda) diketik
dengan menggunakan huruf, misal ABCD atau angka 1234 untuk 4 pilihan
jawaban atau ABCDE atau 12345 untuk 5 pilihan jawaban.
2.2

Fungsi Iteman
Secara umum fungsi dari program ITEMAN ini ialah untuk menganalisis

butir soal. Untuk analisis di sini berbeda dengan program ANATES yang telah kita
pelajari sebelumnya. Dalam software ITEMAN ini hanya dapat digunakan untuk
menganalisis soal jenis pilihan ganda. Untuk yang di uji dalam ITEMAN ini
adalah daya pembeda
a. Validitas:
1 Daya pembeda,
2 Tingkat kesukaran,
3 Proporsi jawaban pada setiap option.
b. Reliabilitas.
Selain informasi yang dihasilkan diatas, kita juga dapat mengetahui
tentang statistik tes, kesalahan pengukuran (standard error of measurement),
kurtosis, skewness, standar deviasi serta distribusi skor. Karenanya informasi yang
terdapat dari hasil analysis ITEMAN akan sangat membantu dalam melihat
kualitas sebuah tes secara kuantitatif.
2.3
a.
-

Kelebihan Dan Kekurangan Iteman


Kelebihan ITEMAN
Beberapa kelebihan dari program ITEMAN ialah sebagai berikut:
Dapat menganalisis data file (format ASCII) jawaban butir soal yang

dihasilkan melalui manual entry data atau dari mesin scanner


- Dapat menskor dan menganalisis data soal pilihan ganda dan skala Likert
sampai jumlah untuk 30.000 siswa dan 250 butir soal
- Dapat menganalisis sebuah tes yang terdiri dari 10 skala (subtes) dan
memberikan informasi tentang validitas setiap butir (daya pembeda, tingkat
kesukaran, proporsi jawaban pada setiap option), reliabilitas (KR-20/Alpha),
standar error of measurement, mean, variance, standar deviasi, skew, kurtosis

untuk jumlah skor pada jawaban benar, skor minimum dan maksimum, skor
median, dan frekuensi distribusi skor.
b.
Kekurangan ITEMAN adalah:
- Hanya dapat digunakan untuk menganalisis soal dalam bentuk pilihan ganda
(soal bentuk esai tidak dapat dianalisis dengan ITEMAN)
- Untuk orang awam dengan pemahaman bahasa inggris yang kurang sangat
sulit untuk menggunakan program ini, karena program menggunakan bahasa
inggris. Orang awam lebih mudah menggunakan ANATES yang bahasanya
dengan bahasa indonesia.
2.4

Item-Item Yang Dianalisis


Dalam analisis butir soal dengan menggunakan program ITEMAN item-

item (hal-hal) yang dianalisis antara lain adalah berikut ini:


a. Tingkat Kesulitan/Kesukaran Soal (Prop Corect)
Menurut Asmawi Zainul, dkk (1997) tingkat kesukaran butir soal
adalah proporsi peserta tes menjawab benar terhadap butir soal tersebut.
Tingkat kesukaran butir soal biasanya dilambangkan dengan p. Makin
besar nilai p yang berarti makin besar proporsi yang menjawab benar
terhadap butir soal tersebut, makin rendah tingkat kesukaran butir soal itu.
Hal ini mengandung arti bahwa soal itu makin mudah, demikian pula
sebaliknya.
Soal yang baik adalah soal yang tidak terlalu mudah atau tidak terlalu
sukar. Soal yang terlalu mudah tidak merangsang siswa untuk
mempertinggi usaha memecahkannya. Sebaliknya soal yang terlalu sukar
akan menyebabkan mahasiswa menjadi putus asa dan tidak mempunyai
semangat untuk mencoba lagi karena di luar jangkauannya (Suharsimi
Arikunto : 2001).
Tingkat kesukaran butir soal tidaklah menunjukkan bahwa butir soal
itu baik atau tidak. Tingkat kesukaran butir hanya menunjukkan bahwa
butir soal itu sukar atau mudah untuk kelompok peserta tes tertentu. Butir
soal hasil belajar yang terlalu sukar atau terlalu mudah tidak banyak
memberi informasi tentang butir soal atau peserta tes (Asmawi Zainul, dkk
: 1997).

Untuk menyusun suatu naskah ujian sebaiknya digunakan butir soal


yang mempunyai tingkat kesukaran berimbang, yaitu : soal berkategori
sukar sebanyak 25%, kategori sedang 50% dan kategori mudah 25%, atau
biasa disebut dengan tingkat kesukaran menunjukkan kurva normal.
Dalam penggunaan butir soal dengan komposisi seperti di atas, maka
dapat diterapkan penilaian berdasar acuan norma atau acuan patokan. Bila
komposisi butir soal dalam suatu naskah ujian tidak berimbang, maka
penggunaan penilaian acuan norma tidaklah tepat, karena informasi
kemampuan yang dihasilkan tidaklah akan berdistribusi normal.
Namun demikian menurut Suharsimi Arikunto (2001) soal-soal yang
terlalu mudah atau terlalu sukar tidak berarti tidak boleh digunakan. Hal
ini tergantung dari tujuan penggunaannya. Jika dari peserta tes banyak,
padahal yang dikehendaki lulus hanya sedikit maka diambil peserta yang
terbaik, untuk itu diambilkan butir soal tes yang sukar. Demikian
sebaliknya jika kekurangan peserta tes, maka dipilihkan soal-soal yang
mudah. Selain itu, soal-soal yang sukar akan menambah motivasi belajar
bagi siswa-siswa yang pandai, sedangkan soal-soal yang mudah akan
membangkitkan semangat kepada siswa yang lemah.
b.

Daya Beda (Point Biserial)


Daya beda butir soal ialah indeks yang menunjukkan tingkat

kemampuan butir soal membedakan kelompok yang berprestasi tinggi


(kelompok atas) dari kelompok yang berprstasi rendah (kelompok bawah)
diantara para peserta tes (Asmawi Zainul, dkk : 1997). Suryabrata (1999)
menyatakan tujuan pokok mencari daya beda adalah untuk menentukan
apakah butir soal tersebut memiliki kemampuan membedakan kelompok
dalam aspek yang diukur, sesuai dengan perbedaan yang ada pada
kelompok itu.
Daya beda butir soal yang sering digunakan dalam tes hasil belajar
adalah dengan menggunakan indeks korelasi antara skor butir dengan skor
totalnya. Daya beda dengan cara ini sering disebut validitas internal,
karena nilai korelasi diperoleh dari dalam tes itu sendiri. Daya beda dapat

dilihat dari besarnya koefisien korelasi biserial maupun koefesien korelasi


point biserial.
c. Proporsi Jawaban (Prop Endorsing)
Dilihat dari konstruksi butir soal terdiri dari dua bagian, yaitu pokok
soal dan alternatif jawaban. Alternatif jawaban juga terdiri dari dua bagian,
yaitu kunci jawaban dan pengecoh. Pengecoh dikatakan berfungsi apabila
semakin rendah tingkat kemampuan peserta tes semakin banyak memilih
pengecoh, atau makin tinggi tingkat kemampuan peserta tes akan semakin
sedikit memilih pengecoh.
Selain memperhatikan fungsi daya tarik untuk dipilih oleh peserta tes,
pengecoh soal juga perlu memperhatikan daya beda (koefisien korelasi)
yang ditunjukkan oleh masing-masing alternatif jawaban. Setiap pengecoh
diharapkan memiliki daya beda negatif, artinya suatu pengecoh diharapkan
lebih sedikit dipilih oleh kelompok tinggi dibandingkan dengan kelompok
bawah. Atau daya beda pengecoh tidak lebih besar dari daya beda kunci
jawaban setiap butir soal.
Dalam program ITEMAN ini untuk distraktor/pengecoh pada hasil
analisis yang disjikan adalah dengan bentuk proporsi jawaban.
2.5

Menafsirkan Hasil Analisis


Setelah kita melakukan anaalisis dari butir soal, maka akan menunjukkan

hasil analisis dari soal. Selanjutnya kita perlu melakukan suatu tindakan
berdasarkan anaalisis yang telah kita lakukan.
Beberapa tokoh evaluasi, yaitu: Sumadi Suryabrata, (1987); Dali S. Naga,
(1992); Suharsimi Arikunto, (1993); dan Saifuddin Azwar, (1996); telah
menetapkan suatu kriteria mutu soal, yang satu dengan lainnya relatif sama, yaitu
seperti berikut:
a. Kriteria Kualitas Butir Soal
Kriteria dari kualitas butir soal dapat dilihat dalam tabel di bawah ini.
Kriteria

Indeks

Prop Corect (Taraf Sukar Soal / p) 0,000 - 0,250

Klasifikasi
Sukar

Point Biserial (Daya beda / D)

Prop Endorsing (Proporsi


jawaban)

Alpha (Reliabilitas soal)

0,251 - 0,750

Sedang

0,751 - 1,000

Mudah

D 0,199

Sangat Rendah

0,200 - 0,299

Rendah

0,300 - 0,399

Sedang

D 0,400

Tinggi

0,000 - 0,010

Kurang

0,011 - 0,050

Cukup

0,051 - 1,000

Baik

0,000 - 0,400

Rendah

0,401 - 0,700

Sedang

0,701 - 1,000

Tinggi

b. Kriteria Kualitas Soal untuk Kepentingan Pemilahan Butir


Kriteria untuk menentukan tindakan dalam pemilihan soal dapat di lihat
pada tabel di bawah ini.
Kriteria

Indeks
0,000 - 0,099

Tingkat kesukaran
(p)

Daya beda ( D )

Klasifikasi

Penafsiran

Sangat

Dibuang / perlu revisi

Sukar

total

0,100 - 0,299

Sukar

Perlu direvisi

0,300 - 0,700

Sedang

Baik

0,701 - 0,900

Mudah

Perlu direvisi

0,901 - 1,000

Sangat

Dibuang

Mudah

direvisi total

Sangat

Dibuang

Rendah

direvisi total

Rendah

Perlu direvisi

D 0,199

0,200 - 0,299

perlu

perlu

0,300 - 0,399

Sedang

Sedikit

atau

tanpa

revisi
D 0,400

Tinggi

Bagus Sekali

0,000 - 0,010

Kurang

Dibuang

perlu

direvisi
Proporsi jawaban

Reliabilitas soal

2.6

0,011 - 0,050

Cukup

Baik

0,051 - 1,000

Baik

Baik sekali

0,000 - 0,400

Rendah

Kurang baik

0,401 - 0,700

Sedang

Cukup

0,701 - 1,000

Tinggi

Baik

Langkah-Langkah Mengoperasikan Program ITEMAN


1. Buatlah data yang berisi jawaban ujian siswa dan kunci jawabannya pada
Notepad, contohnya sebagai berikut.

2. Simpan file kedua file dengan nama bebas, misalnya KUNCI


JAWABAN.txt

dan

JAWABAN

SISWA.txt

untuk

memudahkan

memasukkannya nanti pada program ITEMAN.


3. Setelah file NOTEPAD sudah siap, selanjutnya buka program ITEMAN

4. Selanjutnya isikan nama file pada ketiga kolom, langkahnya dapat tekan
botton browse-pilih file yang akan diolah. Untuk kolom paling atas Data
matrix file diisi dengan data jawaban siswa, sedangkan kolom Item

control file, merupakan kunci jawaban, dan Output file merupakan file
dimana nantinya hasil anaisis dapat disimpan. Usahakan jadikan satu
folder.

5.
6.
7.
8.
9.

Run title diisi dengan nama operator ITEMAN.


Selanjutnya langsung saja klik botton
Analisis tengah berlangsung.
Dari tahap ini, program Iteman sudah
selesai digunakan.
Output analisis dengan menggunakan program ini berupa tiga file (misal
output file berjudul HASIL ANALISIS)
D:\Semester IV\Evaluasi Pendidikan\ITEMAN \HASIL ANALISIS.rtf
D:\Semester IV\Evaluasi Pendidikan\ITEMAN \ HASIL ANALISIS.csv
D:\Semester IV\Evaluasi Pendidikan\ITEMAN \ HASIL ANALISIS
Scores.csv

2.6

Interpretasi Analisis Butir Soal


Soal yang dianalisis merupakan soal buatan guru untuk ulangan harian
di SMKN 8 Malang pada mata pelajaran Bahasa Inggris untuk kelas X SMK
Jurusan Mekatronika
a. Reliabilitas

Score

Alpha

Scored items 0.201

SEM

Split-Half Split-Half
Split-Half
S-B
(Random) (First-Last) (Odd-Even) Random

S-B FirstLast

S-B OddEven

0.912

0.518

0.000

0.648

0.000

0.479

0.683

Dilihat dari tabel reliabilitas diatas nilai Alpha menunjukkan 0.201


jika dibandingkan dengan kriteria reliabilitas maka soal dapat dinyatakan soal
tersebut memiliki reliabilitas yang rendah.
b. Interpretasi Tiap Butir Soal

Item information
Seq. ID

Key

Scored Num Options Domain Flags

Yes

item01

K, LR

Item statistics
N

Total
Rpbis

Total Rbis Alpha w/o

25

0.760

-0.033

-0.046

0.262

Option statistics
Option

Prop.

Rpbis

Rbis

Mean

SD

Color

0.000

--

--

--

--

Maroon

0.000

--

--

--

--

Green

0.160

0.350

0.527

2.000

0.816

Blue

0.080

-0.420

-0.766

0.000

0.000

Olive

19

0.760

-0.033

-0.046

2.263

1.348

Gray

Omit

Not Admin 0

Quantile plot data

**KEY**

Option

0-20%

20-40% 40-60% 60-80% 80-100% Color

0.000

0.000

0.000

0.000

0.000

Maroon

0.000

0.000

0.000

0.000

0.000

Green

0.000

0.250

0.000

0.167

0.143

Blue

1.000

0.000

0.000

0.000

0.000

Olive

19

0.000

0.750

0.000

0.833

0.857

Gray

**KEY**

Soal nomor 1, kunci jawabannya adalah E, penafsirannya:

Tingkat kesukaran butir soal (Prop.Corrrect) = 0,760 ; artinya butir soal


ini dalam kategori mudah (0,751-1,000) karena 76% dari peserta tes
menjawab benar soal ini.

Daya bedanya (Point Biserial) = -0.033; artinya butir soal ini mempunyai
daya beda dalam kategori sangat rendah.

Dapat dilihat distribusi jawaban pada kolom Prop Endorsing, masingmasing respon jawaban A, B, C, D dan E yaitu 0%, 0%, 16%, 8% dan 76%
distraktor tergolong kurang baik. Hanya pilihan C yang memiliki
distraktor yang baik karena siswa cenderung memilih jawaban C.

Jadi soal nomor 1 ini harus dibuang dan diganti.

Item information
Seq. ID

Key

Scored Num Options Domain Flags

Yes

item06

Item statistics
N

Total
Rpbis

Total Rbis Alpha w/o

25

0.720

0.402

0.536

-0.151

Option statistics
Option

Prop.

Rpbis

Rbis

Mean

SD

Color

0.200

-0.084

-0.119

1.200

0.447

Maroon

0.000

--

--

--

--

Green

0.040

-0.375

-0.853

0.000

0.000

Blue

18

0.720

0.402

0.536

2.500

1.249

Olive

0.040

-0.375

-0.853

0.000

0.000

Gray

Omit

**KEY**

Not Admin 0

Quantile plot data


Option

0-20%

20-40% 40-60% 60-80% 80-100% Color

0.000

1.000

0.000

0.083

0.000

Maroon

0.000

0.000

0.000

0.000

0.000

Green

0.500

0.000

0.000

0.000

0.000

Blue

18

0.000

0.000

0.000

0.917

1.000

Olive

0.500

0.000

0.000

0.000

0.000

Gray

**KEY**

Soal nomor 4, kunci jawabannya adalah D, penafsirannya:

Tingkat kesukaran butir soal (Prop.Corrrect) = 0,720 ; artinya butir soal


ini dalam kategori sedang (0,251 - 0,75) karena 72 % dari peserta tes
menjawab benar soal ini.

Daya bedanya (Point Biserial) = 0.402; artinya butir soal ini mempunyai
daya beda dalam kategori tinggi.

Dapat dilihat distribusi jawaban pada kolom Prop Endorsing, masingmasing respon jawaban A, B, C, D dan E yaitu 2%, 0 %, 4%, 72 % dan 4%
distraktor tergolong kurang baik.

Jadi soal nomor 4 sudah cukup baik.

Item information
Seq. ID

Key

Scored Num Options Domain Flags

Yes

item08

Item statistics
N

Total
Rpbis

Total Rbis Alpha w/o

25

0.200

0.093

0.133

0.164

Option statistics
Option

Prop.

Rpbis

Rbis

Mean

SD

Color

0.000

--

--

--

--

Maroon

0.040

0.038

0.086

2.000

0.000

Green

0.080

0.055

0.100

2.000

1.414

Blue

0.200

0.093

0.133

3.000

1.323

Olive

17

0.680

-0.127

-0.166

1.765

0.970

Gray

Omit

**KEY**

Not Admin 0

Quantile plot data


Option

0-20%

20-40% 40-60% 60-80% 80-100% Color

0.000

0.000

0.000

0.000

0.000

Maroon

0.000

0.000

0.000

0.083

0.000

Green

0.000

0.250

0.000

0.000

0.143

Blue

0.000

0.000

0.000

0.083

0.571

Olive

17

1.000

0.750

0.000

0.833

0.286

Gray

**KEY**

Soal nomor 8, kunci jawabannya adalah D, penafsirannya:

Tingkat kesukaran butir soal (Prop.Corrrect) = 0,200 ; artinya butir soal

ini dalam kategori sukar (0,000 - 0,250) karena hanya 20 % dari peserta
tes menjawab benar soal ini.

Daya bedanya (Point Biserial) = 0,093; artinya butir soal ini mempunyai
daya beda dalam kategori sangat rendah.

Dapat dilihat distribusi jawaban pada kolom Prop Endorsing, masingmasing respon jawaban A, B, C, D dan E yaitu 0%, 4%, 8%, 20% dan 68%
distraktor tergolong kurang baik. Hanya pilihan E yang memiliki distraktor
yang baik karena siswa cenderung memilih jawaban E.

Jadi soal nomor 1 ini harus dibuang dan diganti.

BAB III
PENUTUP
3.1

Kesimpulan
Salah satu cara untuk memperbaiki proses belajar mengajar yang paling

efektif adalah dengan jalan mengevaluasi tes hasil belajar yang diperoleh dari
proses belajar mengajar. Pengolahan tes hasil belajar dalam rangka memperbaiki
proses belajar mengajar dapat dilakukan antara lain dengan melakukan analisis
soal. Tujuan khusus dari analisis butir soal ialah mencari soal tes mana yang
baik dan mana yang tidak baik, dan mengapa item atau soal itu dikatakan
baik atau tidak baik. Soal dapat di analisis dengan menggunakan analisis
kualitatif (teoritis) dan kuantitatif (empiris). Salah satu cara analisis butir soal
secara kuantitatif dapat dilakukan dengan menggunakan program komputer,
seperti ITEMAN, SPSS, SPS, Statpro, Microsat, Bigstep, Anates dll
Program ini dibuat dengan pendekatan teori tes klasik yang berguna untuk
menentukan kualitas butir soal dan tes berdasarkan data empiris hasil uji coba.
Hasil analisis butir soal mencakup informasi mengenai validitas setiap butir (daya

pembeda, tingkat kesukaran, proporsi jawaban pada setiap option), reliabilitas


(Alpha). Program ini memberikan output skor untuk setiap peserta tes.
Program iteman digunakan untuk menganalisis soal pilihan ganda dan juga
dapat menghitung dan mencatat skor tes yang dibuat melalui bahasa pemograman
komputer serta dibuat khusus untuk analisis butir soal. Hasil analisis meliputi
tingkat kesukaran butir soal, daya pembeda soal, statistik sebaran jawaban berupa
mean, variance, standar deviasi, skew, kurtosis untuk jumlah skor pada jawaban
benar, skor minimum dan maksimum, reliabilitas tes, kesalahan pengukurran
(standard error) distribusi skor serta skor setiap peserta tes.

DAFTAR REFERENSI
Arikunto. (2009). Dasar-dasar Evaluasi, Jakarta : PT. Bumi Aksara.
Anonim. (t.t). Panduan Analisis Butir Soal. Diakses dari
http://gurupembaharu.com/home/download/panduan-analisis-butirsoal.pdf pada
19 Mei 2015, pukul 13.06 WIB
BSNP. (2010). Standar Isi Untuk Satuan Pendidikan Dasar dan Menengah,
Standar Kompetensi dan Kompetensi Dasar. Jakarta: Kementrian Pendidikan
Nasional
Hidayati, Kana. (2013). Gambaran Umum Iteman. Diakses dari
http://staffuny.ac.id/sites/default/files/pengabdian/kana-hidayatimpd/gambaranumum-iteman.pdf pada 15 Mei 2015, pukul 13.30 WIB.
Urbina, Anne & Anastasia. (1997). Tes Psikologi, Jakarta: Prehalindo

Anda mungkin juga menyukai