Anda di halaman 1dari 8

BAB I

PENDAHULUAN

A. Latar Belakang Masalah


Evaluasi pembelajaran adalah sistem. Artinya suatu rangkaian kegiatan yang melibatkan berbagai
unsur sebagai satu kesatuan. Masing-masing unsur mempunyai fungsi dan peran tersendiri dan perubahan dalam
salah satu unsur akan berpengaruh pada unsur yang lainnya. Dalam dunia pendidikan, evaluasi merupakan suatu
kegiatan yang tak terpisahkan dan sama pentingnya dengan proses pembelajaran.
Pembelajaran tanpa kegiatan evaluasi akan kehilangan makna. Sebab guru tidak akan memperoleh
informasi penting tentang tingkat pencapaian tujuan, tingkat penguasaan materi belajar, kekuatan, kelemahan siswa
dalam belajar, serta kekuatan-kelemahan guru dalam proses pembelajaran yang dikembangkan. Walaupun evaluasi
dianggap penting dan sudah merupakan pekerjaan rutin guru, namun dalam kenyataan sehari-hari di lapangan
sistem evaluasi dalam pembelajaran bukan berarti tanpa persoalan. Berdasar pengamatan sepintas di lapangan,
beberapa persoalan tersebut paling tidak berkaitan dengan pemahaman konsep dasar evaluasi, pelaksanaan dan
pemanfaatannya, serta evaluasi program pengajaran.
Dalam proses pembelajaran ada tiga komponen utama yang merupakan satu kesatuan, yaitu tujuan
pembelajaran, proses pembelajaran, dan evaluasi hasil belajar. Masing-masing komponen dalam proses
pembelajaran tersebut saling bergantung. Oleh karena itu ketiga komponen harus senantiasa sesuai satu sama
lainnya.
Dalam melakukan evaluasi terhadap alat pengukur yang telah digunakan untuk mengukur keberhasilan
belajar dari para peserta didiknya (muridnya, siswa, mahasiswa dan lain-lain). Alat pengukur dimaksud adalah tes
hasil belajar, yang sebagai mana telah kita maklumi, batang tubuhnya terdiri dari kumpulan butir-butir soal (=item,
tes). Dalam aplikasinya mempunyai fungsi dan peranan yang sangat penting dalam hal untuk mengetahui tujuan
yang ingin dicapai.
Dan dari uraian di atas maka penulis akan memaparkan makalah yang berjudul “Analisis Butir Soal”.

B. Rumusan Masalah
Dari uraian latar belakang di atas maka dapat kita rumuskan masalah sebagai berikut:
1. Apa pengertian analisis butir soal?
2. Apa Tujuannya?
3. Bagaimana penganalisisan terhadap butir soal?

C. Tujuan Penulisan
1. Mengetahui pengertian analisis butir soal
2. Mengetahui tujuan penganalisisan
3. Mengetahui bagaimana penganalisisan terhadap butir soal

BAB II
PEMBAHASAN

A. Pengertian Analisis Butir Soal


Analisis butir soal merupakan suatu prosedur yang sistematis, yang akan memberikan informasi-
informasi yang sangat khusus terhadap butir tes yang akan kita susun. Analisis butir soal pada dasarnya bertujuan
untuk mengetahui apakah setiap item soal benar-benar baik, sehingga diperlukan analisis terhadapnya.
Analisis item soal terutama dapat dilakukan untuk tes objektif. Dimana tes objektif merupakan alat
evaluasi (hasil belajar mengajar) yang mengukur kepada objek-objeknya. Hal ini tidak berarti bahwa tes uraian tidak
dapat di analisis, akan tetapi memang dalam menganalisis butir tes uraian belum ada pedoman secara standar.
Tentang kegunaan analisis terhadap item soal pada umumnya dilakukan terhadap beberapa hal yaitu:
1. Seberapa besar tingkat kesukaran pada butir/item soal
2. Apakah butir item itu mampu membedakan kemampuan antara siswa pandai dan kurang pandai.
3. Apakah butir item tersebut menggunakan distraktor yang baik atau belum.
Maka dari itu dengan analisis item soal dapat diperoleh informasi tentang kejelekan sebuah soal dan
petunjuk untuk mengadakan perbaikan.

B. Tujuan Analisis
Analisis butir tes merupakan kegiatan penting dalam upaya memperoleh instrument yang berkategori
baik. Analisis ini meliputi:
1. Menentukan validitas dan reliabilitas tes, dan
2. Analisis butir tes.
Menurut Thorndike & Hagen, analisis terhadap butir tes yang telah dijawab siswa suatu kelas
mempunyai dua tujuan, yakni:
1. Jawaban-jawaban soal-soal tersebut merupakan informasi diagnosis untuk meneliti pelajaran dari kelas itu dan
kegagalan-kegagalan belajarnya, serta selanjutnya untuk membimbing kea rah cara belajar yang baik, dan
2. Jawaban terhadap soal-soal dan perbaikan soal-soal yang didasarkan atas jawaban-jawaban tersebut merupakan
dasar bagi penyiapan tes-tes yang lebih baik.
Analisis butir tes bertujuan untuk mengidentifikasi butir-butir manakah yang termasuk dalam kategori
baik, kurang baik, dan jelek. Analisis butir tes memungkinkan kita memperoleh informasi mengenai baik tidaknya
suatu butir, sekaligus memperoleh petunjuk untuk melakukan perbaikan. Dengan melakukan analisis butir setidaknya
kita dapat mengetahui empat hal penting, yaitu:
1. Bagaimana taraf kesukaran setiap butir tes?
2. Apakah setiap soal memiliki daya pembeda baik?
3. Apakah semua alternative jawaban dapat berfungsi secara baik?
4. Sejauh mana tiap butir tes dapat mengukur hasil pembelajaran?

C. Penganalisaan terhadap Butir Soal


1. Teknik Analisa Derajat Kesukaran Item
Analisis tingkat kesukaran soal yaitu mengkaji soal-soal tes dari segi kesulitannya sehingga dapat
diperoleh soal-soal mana yang termasuk mudah, sedang, dan sukar. Tingkat kesukaran soal dipandang dari
kesanggupan atau kemampuan siswa dalam menjawab, bukan dilihat dari sudut guru sebagai pembuat soal.
Persoalan yang penting dalam melakukan analisis tingkat kesukaran soal adalah penentuan proporsi dan kriteria soal
yang termasuk mudah, sedang dan sukar. Tingkat kesukaran soal adalah peluang untuk menjawab benar suatu soal
pada tingkat kemampuan tertentu yang biasanya dinyatakan dalam bentuk indeks.
Bermutu atau tidaknya butir-butir item tes hasil belajar pertama-tama dapat diketahui dari derajat
kesukaran atau taraf kesulitan yang dimiliki oleh masing-masing butir item tersebut. Butir-butir item tes hasil belajar
dapat dinyatakan sebagai butir-butir item yang baik apabila butir-butir item tersebut tidak terlalu sukar dan tidak pula
terlalu mudah dengan kata lain derajat kesukaran item itu adalah sedang atau cukup. Bertitik tolak dari pernyataan
tersebut di atas maka butir-butir item hasil belajar di mana seluruh testee tidak dapat menjawab dengan betul (karena
terlalu sukar) tidak dapat disebut sebagai item yang baik. Demikian pula sebaliknya, butir-butir item tes hasil belajar
dimana seluruh testee dapat menjawab dengan betul (karena terlalu mudah) juga tidak dapat dimasukkan dalam
kategori item yang baik. Pertanyaan yang akan segera muncul adalah: “Bagaimana cara yang dapat ditempuh untuk
mengetahui butir-butir item tes hasil belajar tertentu yang dapat dikatakan adalah memiliki derajat kesukaran yang
memadai?” Dalam hubungan ini, Witherington dalam bukunya yang berjudul Psychological Education (hlm. 87)
mengatakan, bahwa sudah atau belum memadainya derajat kesukaran item tes hasil belajar dapat diketahui dari
besar kecilnya angka yang melambangkan tingkat kesulitan dari item tersebut. Angka-angka yang dapat memberikan
petunjuk mengenai tingkat kesulitan item itu dikenal dengan istilah difficulty index (=angka indeks kesukaran item),
yang dalam dunia evaluasi hasil belajar umumnya dilambangkan dengan huruf P, yaitu singkatan dari kata proportion
(proporsi =proporsa).
Menurut Witherington, angka indeks kesukaran item itu besarnya berkisar antara 0,00 sampai dengan
1,00. Artinya, angka indeks kesukaran itu paling rendah adalah 0,00 dan paling tinggi adalah 1,00. Angka indeks
kesukaran sebesar 0,00 (P = 0,00) merupakan petunjuk bagi tester bahwa butir item termasuk dalam kategori item
yang terlalu sukar, sebab disini seluruh tastee tidak dapat menjawab item dengan betul (yang dapat menjawab
dengan betul = 0). Sebaliknya, apabila angka indeks kesukaran item itu adalah 1,00 (P = 1,00) hal ini mengandung
makna bahwa butir item yang bersangkutan adalah termasuk dalam kategori item yang terlalu mudah, sebab disini
seluruh testee dapat menjawab dengan betul butir item yang bersangkutan (yang dapat menjawab dengan butir =
100% = 100 : 100 = 1,00).
Angka indeks kesukaran item itu dapat diperoleh dengan rumus yang dikemukakan oleh Du Bois, yaitu
P = Angka indeks kesukaran item
Np = Banyaknya testee yang dapat menjawab dengan betul terhadap butir item yang bersangkutan.
N = Jumlah testee yang mengikuti tes hasil belajar
Mengenai bagaimana cara memberikan penafsiran (interpretasi) terhadap angka indeks kesukaran
item, Robert L. Thorndike dan Elizabeth Hagen dalam bukunya berjudul Measurement and Evaluation in Psychology
and Education mengemukakan sebagai berikut:
Besarnya P Interpretasi
Kurang dari 0,30 Terlalu sukar
0,30 – 0,70 Cukup (Sedang)
Lebih dari 0,70 Terlalu Mudah

Sedangkan menurut Witherington dalam bukunya berjudul Psychology Education adalah sebagai
berikut:
Besarnya P Interpretasi
Kurang dari 0,25 Terlalu sukar
0,25 – 0,70 Cukup (Sedang)
Lebih dari 0,70 Terlalu Mudah

Soal dikatakan baik apabila soal tersebut tidak terlalu sukar atau terlalu mudah. Soal yang terlalu
mudah, yakni semua anak dapat mengerjakan dengan benar, adalah tidak baik. Demikian juga soal yang terlalu
sukar, yaitu semua anak tidak dapat mengerjakan soal dengan benar, juga merupakan soal yang tidak baik. Hal itu
disebabkan karena soal yang terlalu mudah tidak merangsang peserta didik untuk mempertinggi usaha
memecahkannya. Dan soal yang terlalu sukar menyebabkan peserta didik putus asa serta menjadi tidak mempunyai
semangat untuk mencoba lagi karena diluar jangkauannya.
Ada beberapa dasar pertimbangan dalam menentukan proporsi jumlah soal kategori mudah, sedang,
dan sukar. Pertimbangan pertama adalah adanya keseimbangan, yakni jumlah soal sama untuk ketiga kategori
tersebut. Artinya, soal mudah, sedang, dan sukar jumlahnya seimbang. Persoalan lain adalah menentukan kriteria
soal, yaitu ukuran untuk menentukan apakah soal tersebut termasuk mudah, sedang atau sukar. Dalam menentukan
kriteria ini digunakan judgment dari guru berdasarkan pertimbangan-pertimbangan tertentu. Pertimbangan tersebut
antara lain adalah :
a. Abilitas yang diukur dalam pertanyaan tersebut
b. Sifat materi yang diujikan atau ditanyakan
c. Isi bahan yang ditanyakan sesuai dengan bidang keilmuannya, baik luasnya maupun kedalamannya
d. Bentuk soal
Dalam kaitannya dengan hasil analisis item dari segi derajat kesukarannya seperti telah dikemukakan
di atas, maka tindak lanjut yang perlu dikemukakan oleh tester adalah sebagai berikut:
Pertama, untuk butir-butir item yang berdasarkan hasil analisis termasuk dalam kategori baik (dalam
arti derajat kesukaran itemnya cukup atau sedang), seyogyanya butir item tersebut segera dicatat dalam buku bank
soal.
Kedua, untuk butir-butir item yang termasuk dalam kategori terlalu sukar, ada tiga kemungkinan tindak
lanjut, (1) butir soal tersebut dibuang/didrop, (2) diteliti ulang, dilacak dan ditelusuri sehingga dapat diketahui faktor
yang menyebabkan butir item yang bersangkutan sulit dijawab oleh testee, (3) Haruslah dipahami bahwa tidak setiap
butir item yang termasuk dalam kategori terlalu sukar itu sama sekali tidak memiliki kegunaan.
Ketiga, untuk butir-butir item yang termasuk dalam kategori terlalu mudah, juga ada tiga kemungkinan
tindak lanjutnya. Yaitu (1) butir soal tersebut dibuang/didrop, (2) diteliti ulang, dilacak dan ditelusuri sehingga dapat
diketahui faktor yang menyebabkan butir item yang bersangkutan mudah dijawab oleh testee, (3) Seperti halnya
butir-butir yang terlalu sukar, butir-butir item yang terlalu mudah juga masih mengandung manfaat, yaitu bahwa butir-
butir item yang termasuk dalam kategori ini dapat dimanfaatkan pada tes-tes (terutama tes seleksi) yang sifatnya
longgar.

2. Teknik Analisis Daya Pembeda Item


Daya pembeda item adalah kemampuan suatu butir item tes hasil belajar untuk dapat membedakan
(mendiskriminasi) antara kemampuan tinggi dan rendah. Daya pembeda item itu penting sekali bagi salah satu dasar
untuk menyusun butir item tes hasil belajar adalah adanya anggapan.

Tes dikatakan tidak memiliki daya pembeda apabila tes tersebut, jika diujikan kepada anak berprestasi
tinggi, hasilnya rendah tetapi bila diberikan kepada anak yang lemah hasilnya lebih tinggi. Atau bila diberikan kepada
kedua kategori siswa tersebut hasilnya sama saja.
Dengan demikian, tes yang tidak memiliki daya pembeda, tidak akan menghasilkan gambaran hasil
yang sesuai dengan kemampuan siswa yang sebenarnya. Akan terlihat aneh apabila anak pandai tidak lulus tetapi
anak bodoh lulus dengan baik tanpa dilakukan manipulasi oleh tester (si penilai) atau di luar faktor kebetulan.
Angka yang menunjukkan besarnya daya pembeda disebut indeks daya pembeda (item discrimination)
disingkat D (d besar). Indeks daya pembeda didefinisikan sebagai selisih antara proporsi jawaban benar pada
kelompok atas (peserta didik tes yang mampu/pandai) dengan proporsi jawaban benar pada kelompok bawah
(peserta didik tes yang kurang mampu/pandai). Umumnya, para ahli tes membagi kelompok ini menjadi 27% atau
33% kelompok atas dan 27% atau 33% kelompok bawah (Cureton, 1957).
Contoh: Pembagian Kelompok 27%
Responden SKOR BUTIR SOAL SETIAP NOMOR SOAL Total Skor
1 2 3 4 5 6 7 8 9 10
1 1 1 1 1 0 1 1 1 1 1 9
2 1 1 1 1 1 0 1 1 1 1 9
3 1 1 1 1 1 1 0 0 1 1 8
4 1 1 0 1 1 1 0 1 1 0 7
5 0 1 1 1 1 1 0 1 0 1 7
6 0 1 1 1 1 1 0 1 1 0 7
7 1 0 1 0 1 1 0 1 0 1 6
8 1 1 1 1 1 0 0 1 0 0 6
9 0 1 1 1 1 0 0 0 1 1 6
10 0 1 0 1 1 1 0 0 1 1 6
11 0 1 0 1 1 1 0 1 0 1 6
12 0 1 1 0 1 1 0 1 0 0 5
13 1 1 0 1 0 1 1 0 0 0 5
14 0 0 1 0 1 0 0 1 1 1 5
15 0 1 0 1 0 1 0 1 1 0 5
16 1 1 0 1 0 1 0 0 0 1 5
17 1 0 0 1 0 1 0 1 0 1 5
18 0 0 1 0 0 1 0 1 0 1 4
19 1 0 1 0 0 0 0 1 0 0 3
20 0 0 1 0 1 0 0 0 1 0 3
Indeks daya pembeda berkisar antara -1,00 sampai 1,00. Tanda negatif menunjukkan bahwa peserta
didik tes yang kemampuannya rendah dapat menjawab benar sedangkan peserta didik tes yang kemampuannya
tinggi menjawab salah. Dengan demikian, soal yang indeks daya pembedanya negatif menunjukkan terbaliknya
kualitas peserta didik tes. Indeks daya pembeda dapat dicari dengan menggunakan rumus sebagai berikut ini.
D = indeks daya pembeda
A = jumlah peserta didik tes yang menjawab benar pada kelompok atas
B = jumlah peserta didik tes yang menjawab benar pada kelompok bawah
nA = jumlah peserta didik tes kelompok atas
nB = jumlah peserta didik tes kelompok bawah
Pada kebanyakan kasus, jumlah peserta didik tes kelompok atas sama dengan jumlah peserta didik
tes kelompok bawah, nA = nB = n. Dengan demikian maka rumus daya pembeda menjadi:
Kriteria indeks daya pembeda berdasarkan Crocker dan Algina (1986) adalah sebagai berikut :
Daya Pembeda Kualifikasi
0,00 – 0,19 soal tidak dipakai/dibuang
0,20 – 0,29 soal diperbaiki
0,30 – 0,39 soal diterima tapi perlu diperbaiki
0,40 – 1,00 soal diterima/baik

Contoh:
Tingkat Kesukaran 27% kelompok atas (5 orang dari 20 peserta didik tes)
Responden SKOR BUTIR SOAL SETIAP NOMOR SOAL Total
1 2 3 4 5 6 7 8 9 10 Skor
1 1 1 1 1 0 1 1 1 1 1 9
2 1 1 1 1 1 0 1 1 1 1 9
3 1 1 1 1 1 1 0 0 1 1 8
4 1 1 0 1 1 1 0 1 1 0 7
5 0 1 1 1 1 1 0 1 0 1 7
Xatas 4 5 4 5 4 4 2 4 4 4
Skor maks 1 1 1 1 1 1 1 1 1 1
Kel. Atas 5 5 5 5 5 5 5 5 5 5
(P) kel. Atas 0.8 1.0 0.8 1.0 0.8 0.8 0.4 0.8 0.8 0.8

Tingkat Kesukaran 27% kelompok bawah (5 orang dari 20 peserta didik tes)
Responden SKOR BUTIR SOAL SETIAP NOMOR SOAL Total
1 2 3 4 5 6 7 8 9 10 Skor
16 1 1 0 1 0 1 0 0 0 1 5
17 1 0 0 1 0 1 0 1 0 1 5
18 0 0 1 0 0 1 0 1 0 1 4
19 1 0 1 0 0 0 0 1 0 0 3
20 0 0 1 0 1 0 0 0 1 0 3
Xatas 3 1 3 2 1 3 0 3 1 3
Skor maks 1 1 1 1 1 1 1 1 1 1
Kel. Bawah 5 5 5 5 5 5 5 5 5 5
(P) kel. bawah 0.6 0.2 0.6 0.4 0.2 0.6 0 0.6 0.2 0.6
Untuk mengetahui besar kecilnya angka indeks diskriminasi item dapat dipergunakan rumus berikut ini:
D = Discriminatory power (angka indeks diskriminasi item)
PA = Proporsi testee kelompok atas yang dapat menjawab dengan betul butir item yang bersangkutan
PB = Proporsi testee kelompok bawah yang dapat menjawab dengan betul butir item yang bersangkutan
Tabel berikut menunjukkan daya pembeda soal nomor 1 sampai dengan nomor 10 berdasarkan perbedaan
27% kelompok atas dan 27% kelompok bawah.
Daya Pembeda Soal
Soal Tingkat kesukaran Tingkat kesukaran Daya pembeda Soal (D)
kelompok atas kelompok bawah
1 0.80 0.60 0.20
2 1.00 0.20 0.80
3 0.80 0.60 0.20
4 1.00 0.40 0.60
5 0.80 0.20 0.60
6 0.80 0.60 0.20
7 0.40 0 0.40
8 0.80 0.60 0.20
9 0.80 0.20 0.60
10 0.80 0.60 0.20

Soal nomor 1, 3, 6, 8, dan 10 berdaya pembeda 0.20. Hal ini berarti kelompok lima soal tersebut
mempunyai kualifikasi soal yang harus diperbaiki. Hal ini sesuai dengan pengklasifikasian daya pembeda oleh
Crocker dan Algina yang telah dijelaskan di atas.
Dalam hubungan ini, patokan yang pada umumnya dipegangi adalah sebagai berikut:
Besarnya Angka Indeks
Klasifikasi Interpretasi
Diskriminasi Item
Butir item yang bersangkutan daya
Kurang dari 0,20 Poor pembedanya lemah sekali (jelek), dianggap
tidak memiliki daya pembeda yang baik
Butir yang bersangkutan telah memiliki daya
0,20-0,40 Satisfactory
pembeda yang cukup (sedang)
Butir yang bersangkutan telah memiliki daya
0,40-0,70 Good
pembeda yang baik
Butir item yang bersangkutan telah memiliki
0,70-1,00 Excellent
daya pembeda yang baik sekali
Butir item yang bersangkutan daya
Bertanda negatif -
pembedanya negative (jelek sekali)

3. Teknik Analisis Fungsi Distraktor


Distraktor adalah pengecoh, jawaban-jawaban yang mengecoh. Ini bertujuan menarik untuk
menjawabnya padahal itu salah. Sebagai tindak lanjut atas hasil penganalisaan terhadap fungsi distraktor tersebut
maka distraktor yang sudah menjalankan fungsinya dengan baik dapat dipakai lagi pada tesnya.
Tujuan utama pemasangan distraktor pada setiap butir itu adalah, agar dari sekian banyak testee yang
mengikuti tes hasil belajar ada yang tertarik atau terangsang untuk memilihnya, sebab mereka menyangka bahwa
distraktor yang mereka pilih itu merupakan jawaban yang betul.
Suatu kemungkinan dapat terjadi, yaitu bahwa dari keseluruhan alternative yang dipasang pada butir
item tertentu, sama sekali tidak dipilih oleh testee. Dengan kata lain, testee menyatakan “blangko”. Pernyataan
blangko ini sering dikenal dengan istilah oniet dan biasa diberi lambing dengan huruf O.

BAB III
PENUTUP
A. Simpulan
Analisis butir soal merupakan suatu prosedur yang sistematis, yang akan memberikan informasi-
informasi yang sangat khusus terhadap butir tes yang akan kita susun. Analisis butir soal pada dasarnya bertujuan
untuk mengetahui apakah setiap item soal benar-benar baik, sehingga diperlukan analisis terhadapnya.
Analisis butir tes bertujuan untuk mengidentifikasi butir-butir manakah yang termasuk dalam kategori
baik, kurang baik, dan jelek. Analisis butir tes memungkinkan kita memperoleh informasi mengenai baik tidaknya
suatu butir, sekaligus memperoleh petunjuk untuk melakukan perbaikan.
Penganalisisan terhadap butir-butir soal dapat dilakukan dari tiga segi yaitu:
1. Teknik analisis kesukaran item soal
Analisis tingkat kesukaran soal yaitu mengkaji soal-soal tes dari segi kesulitannya sehingga dapat
diperoleh soal-soal mana yang termasuk mudah, sedang, dan sukar. Tingkat kesukaran soal dipandang dari
kesanggupan atau kemampuan siswa dalam menjawab, bukan dilihat dari sudut guru sebagai pembuat soal.
Angka indeks kesukaran item ini dapat diperoleh dengan menggunakan rumus yang dikemukakan oleh
Dubois yaitu:
2. Teknik analisis daya pembeda
Daya pembeda item adalah kemampuan suatu butir item tes hasil belajar untuk dapat membedakan
(mendiskriminasi) antara kemampuan tinggi dan rendah. Daya pembeda item itu penting sekali bagi salah satu dasar
untuk menyusun butir item tes hasil belajar.
Rumus untuk menentukan indeks diskriminasi adalah:

3. Teknik analisis fungsi distraktor


Distraktor adalah pengecoh, jawaban-jawaban yang mengecoh. Ini bertujuan menarik untuk
menjawabnya padahal itu salah. Sebagai tindak lanjut atas hasil penganalisaan terhadap fungsi distraktor tersebut
maka distraktor yang sudah menjalankan fungsinya dengan baik dapat dipakai lagi pada tesnya.

B. Saran
Analisis butir soal hendaknya kita lakukan untuk dapat mengidentifikasi butir-butir tes secara baik dan
tepat dan dapat memahami informasi yang diperoleh untuk melakukan perbaikan.

DAFTAR PUSTAKA

Arikunto, Suharsimi. 2007. Dasar-dasar Evaluasi Pendidikan. Jakarta: PT Bumi Aksara


Crocker, Linda & James Algina. 1986. Introduction to Classical & Modern Test Theory. Chicago: Holt, Rinehart and Winton, Inc
Mudjiji, M.Pd. Drs. Tt. Tes Hasil Belajar, Jakarta: Bumi Aksara.
Nur, Mohammad. 1987. Pengantar teori tes. Jakarta: P2LPTK Ditjen Diti Depdikbud
Prof. H.M. Sukardi, MS., Ph.D, 2008. Evaluasi Pendidikan Prinsip dan Operasinya. Jogjakarta: PT. Bumi Aksara
Purwanto, Ngalim. 2010. Prinsip-prinsip dan Teknil Evaluasi Pembelajaran. Bandung: PT Remaja Rosda Karya
Rafi’i, Suryatna. 1990. Teknik Evaluasi. Bandung: Penerbit Angkasa
Rosnita. 2007. Evaluasi Pendidikan. Bandung: Cita Pustaka Setia
Sudijono, Anas. 2009. Pengantar Evaluasi Pendidikan. Jakarta: Rajawali Pers
Sudjana, Nana. tt. Penilaian Hasil Proses Belajar Mengajar. Bandung: PT Remaja Rosda Karya.
Suherman, Herman. 1990. Petunjuk Praktis Untuk Melaksanakan Evaluasi Pendidian Matematika. Bandung: Wijaya Kusumah
Surapranata, Dr. Sumarna. 2004. Panduan Penulisan Tes Tertulis Implementasi Kurikulum, Bandung: Rosdakarya
Thoha, M.A. Drs. M. Chabib, 2001. Teknik Evaluasi Pendidikan. Cet. 4 Jakarta: PT Raja Garfindo Persada
Witherington, C.H. 1952. Educational Psychology. Boston: Ginn & Co

Anda mungkin juga menyukai