Anda di halaman 1dari 33

MAKALAH ITEM WRITING AND ITEM SELECTING

Nama : Daniel Samosir (8236172009)


Kania Utari (8236172010)
Kelas : C PPs Pendidikan Matematika
Mata Kuliah : Evaluasi Pembelajaran Matematika
Dosen Pengampu : Dr. Kms. M. Amin Fauzi, M.Pd

PROGRAM STUDI PENDIDIKAN MATEMATIKA


FAKULTAS PASCASARJANA
UNIVERSITAS NEGERI MEDAN
2023
KATA PENGANTAR

Puji dan syukur kami panjatkan ke hadirat Tuhan Yang Maha Esa yang telah
melimpahkan rahmat dan hidayahnya kepada kami sehingga kami dapat menyelesaikan tugas
makalah ini.
Kami menyadari bahwa dalam penulisan makalah ini masih banyak kekurangan dan
ketidaksempurnaan baik dari segi materi maupun teknik penyajiannya, mengingat masih
kurangnya pengetahuan dan pengalaman kami. Untuk itu, kami mengharapkan kritik dan saran
dari para pembaca yang bersifat membangun sehingga makalah ini menjadi lebih baik lagi
untuk kedepannya.
Kami berharap penyusunan makalah ini dapat memberikan manfaat dan dapat
menambah wawasan para pembaca. Kami meminta maaf apabila terdapat kesalahan dan kata-
kata yang tidak berkenan dalam penulisan makalah ini.

Medan, Oktober 2023


Penyusun,

Kelompok 5

i
DAFTAR ISI

KATA PENGANTAR .................................................................................................................. i

DAFTAR ISI............................................................................................................................... ii

BAB I PENDAHULUAN ......................................................................................................... .1

A. LATAR BELAKANG...................................................................................................... 1

B. RUMUSAN MASALAH ................................................................................................ 1

C. TUJUAN.......................................................................................................................... 1

BAB II PEMBAHASAN ........................................................................................................... 2

2.1. Menentukan Tujuan Tes ............................................................................................... 2

2.2. Pembatasan Materi ....................................................................................................... 5

2.3. Perumusan Konsep Dasar ............................................................................................ 5

2.4. Perumusan Indikator Keberhasilan Belajar ............................................................... 12

2.5. Tabel Spesifikasi atau Kisi-Kisi ................................................................................. 13

2.6. Penulisan Butir-Butir Tes atau Soal ........................................................................... 15

2.7. Validitas ..................................................................................................................... 16

2.8. Reliabilitas ................................................................................................................. 21

2.9. Analisis Butir Soal ..................................................................................................... 26

BAB III PENUTUP ................................................................................................................. 28

A. KESIMPULAN ............................................................................................................. 28

B. SARAN.......................................................................................................................... 28

DAFTAR PUSTAKA ............................................................................................................... 29

ii
BAB I
PENDAHULUAN

1.1 Latar Belakang


Dalam kegiatan pembelajaran kegiatan yang paling penting adalah melakukan
tes, karena dengan melakukan tes, seorang guru dapat mengetahui sejauh mana
kemampuan siswa dalam memahami materi yang telah dipelajari.
Dalam penyusunan soal-soal tes terkadang guru mengalami kesulitan, karena
dalam pembuatan soal tersebut diperlukan berbagai pertimbangan agar soal yang di
buat tidak terlalu sulit, terlalu mudah dan membingungkan peserta didik ketika
hendak menjawab soal-soal tersebut
Dalam penyusunan tes prestasi hal yang paling penting yang harus dimiliki yaitu
validitas soal-soal yang akan diujikan kepada peserta didik.

1.2 Rumusan Masalah


1. Apakah tujuan dari test?
2. Bagaimana cara dalam pembatasan materi?
3. Bagaimana cara perumusan konsep dasar?
4. Bagaimana cara perumusan indikator keberhasilan?
5. Bagaimana cara penyusunan tabel spesifikasi atau kisi-kisi?
6. Bagaimana cara penulisan butir-butir tes atau soal?
7. Bagaimana cara menguji validitas dan reliabilitas suatu soal?
8. Bagaimana cara menganalisis butir soal?

1.3 Tujuan Penulisan


1. Untuk mengetahui tujuan dari test.
2. Untuk mengetahui cara dalam pembatasan materi.
3. Untuk mengetahui cara perumusan konsep dasar.
4. Untuk mengetahui cara perumusan indikator keberhasilan.
5. Untuk mengetahui cara penyusunan tabel spesifikasi atau kisi-kisi.
6. Untuk mengetahui cara penulisan butir-butir tes atau soal.
7. Untuk mengetahui cara menguji validitas dan reliabilitas suatu soal.
8. Untuk mengetahui cara menganalisis butir soal.

1
BAB II
PEMBAHASAN

2.1 Menentukan Tujuan Tes

Tujuan test adalah suatu hal yang ingin dicapai pada hasil test tersebut tujuan ini
dapat berupa tujuan khusus, contoh : untuk mengetahui penguasaan materi, tes
diagnostik, atau tes seleksi; dan tujuan umum, misal untuk mengetahui pengetahuan
umum dari sekelompok responden atau sekelompok orang. Dalam kesempatan ini,
tujuan pemberian tes adalah untuk mengetahui penguasaan peserta didik pada
kompetensi/sub kompetensi tertentu setelah diajarkan. Penguasaan ini dapat
diartikan, sejauh mana peserta didik memahami atau mungkin menganalisis materi
tertentu yang telah dibahas di ruang kelas. Dengan kata lain, pada tingkat kognitif
mana mereka menguasai materi yang telah diberikan, ditugaskan, atau dibahas, yang
biasanya direncanakan dalam bentuk blue print. Tujuan tes harus jelas agar arah dan
ruang lingkup pengembangan tes selanjutnya juga jelas.
A. Teknik Tes
Istilah tes berasal dari bahas latin “testum” yang berarti sebuah piring atau
jambangan dari tanah liat. Istilah tes ini kemudian dipergunakan dalam
apangan psikologi dan selanjutnya hanya dibatasi sampai metode psikoogi
dan selanjutnya hanya dibatasi sampai metode psikologi, yaitu cara untuk
menyelidiki seseorang. Sax (1980:13) bahwa “a test maybe defined as a task
or of task used to obtain systematic observation presumed to be
representative of educational or phychological traits or attributes” (tes
dapat didefenisikaan sebagai tugas atau sistematis yang dianggap mewakili
ciri atau atribut pendidikan atau psikologis).
Sementara itu, S. Hamid Hasan (1988:7) menjelaskan bahwa “Tes adalah alat
pengumpulan data yang dirancang secara khusus. Kekhususan tes dapat
dilihat dari konstruksi butir (soal) yang dipergunakan”. Dengan demikian,
tes pada hakikatnya adalah suatu alat yang berisi serangkaian tugas yang
harus dijawab oleh siswa untuk mengukur suatu aspek prilaku tertentu.
Artinya, fungsi tes adalah sebagai alat ukur. Dalam tes prestasi hasil belajar,
aspek prilaku yang hendak diukur adalah tingkat kemampuan siswa dalam
menguasai materi Pelajaran yang telah disampaikan. Heaton (1988:77)
membagi tes menjadi empat yaitu tes prestasi belajar (achievement test), tes
penguasaan (proficiency test), tes bakat (aptitude test), dan tes diagnostic
(diagnostic). Sedangkan dalam psikologi, tes dapat diklasifikasikan menjadi
empat bagian, yaitu:
1) Tes Intelegensia Umum, yaitu tes untuk mengukur kemampuan umum seseorang.
2) Tes Kemamampuan Khusus, yaitu tes untuk mengukur kemampuan potensial
bidang tertentu.
3) Tes Prestasi Belajar, yaitu tes untuk mengukur kemampuan actual sebagai hasil
2
belajar.
4) Tes Kepribadian, yaitu tes untuk mengukur karakteristik pribadi seseorang.
Dilihat dari cara penyusunannya, tes dapat dibedakan menjadi dua jenis yaitu:
1) Tes buatan guru
Tes buatan guru adalah tes yang disusun sendiri oleh guru yang akan menggunakan tes
tersebut. Tes ini biasanya digunakan untuk ulangan harian, foramtif, dan ulangan
umum (sumatif). Tujuan tes ini adalah untuk engukur tingkat penguasaan siswa
terhadap materi Pelajaran yang sudah disampaikan. Tes buatan guru bersifat
temporer, artinya hanya berlaku pada saat tertentu dan situasi tertentu pula.
2) Tes yang dibakukan
Tes baku adalah tes yang sudah memiliki derajat validitas dan realibilitas yang tinggi
berdasarkan percobaan-percobaan terhadap sampe yang cukup besar dan
representative. Tes baku adalah tes yang dikaji berulang-ulang kepada kelompok
besar siswa, dan item-itemnya relevan serta mempunyai daya pembeda yang tinggi.
Tes baku diklasifikasikan sesuai dengan tingkat usia dan kelasnya. Tes baku
biasanya telah dianalisis secara statistik dan diuji secara emiris oleh para ahli
(pakar), karena itu dapat dinyatakan sahih (valid) untuk digunakan secara umum.
Tes baku bertujuan untuk mengetahui kelebihan dan kekurangan siswa dalam
menguasai materi Pelajaran tertentu secara luas.

Berdasarkan aspek pengetahuan dan keterampilan, maka tes dapat dibagi menjadi dua
jenis, yaitu:
1) Tes kemampuan (power test)
Tes ini memiliki prinsip tidak adanya Batasan waktu dalam mengerjakan tes. Skor
yang dihasilkan bukan menggambarkan kemampuan sisw yang paling lambat
harus ditunggu sampai selesai. Tes kemampuan menghendaki agar Sebagian
siswa dapat menyelesaikan tes dalam waktu yang disediakan. Impilaksinya
adalah guru harus menghitung waktu pelaksanaan tes yang logis, rasional, dan
proposional ketikamenyusun kisi-kisi.
2) Tes kecepatan (speed test)
Aspek yang diukur dalam tes kecepatan adalah kecepatan siswa dalam mengerjakan
sesuatu pada waktu atau periode teretentu.
Dilihat dari bentuk jawaban siswa, maka tes dapat dibagi menjadi tiga jenis,
yaitu tes tertulis, tes lisan, dan tes perbuatan.
1) Tes tertulis, yaitu tes yang menuntut jawaban dari siswa dalam bentuk tertulis.
Tes tertulis ada yang bersifat formal dan nonformal. Tes bersifat formal
meliputi jumlah testi yang cukup besar yang diselenggarakan oleh suatu
panitia resmi yang diangkat oleh pemerintah. Tes formal mempunyai tujuan
yang lebih luas dan didasarkan atas standar tertentu yang berlaku umum dan
memiliki kecenderungan untuk melihat seluruh kemampuan dari testi untuk
suatu hasil yang lebih besar. Sedangkan tes non formal berlaku untuk tujuan
tertentu dan lingkungan terbatas yang diselenggarakan langsung oleh pihak-
pihak pelaksana dalam situasi setengah resmi tanpa melalui institusi resmi.
Tes tertulis terbagi atas dua yaitu:
a. Tes bentuk uraian

3
Bentuk uraian dapat digunakan untuk mengukur kegiatan-kegiatan belajar yang
sulit diukur oleh bentuk objektif. Disebut bentuk uraian, karena menuntut
siswa untuk menguraikan, mengorganisasikan dan menyatakan jawaban
dengan kata-katanya sendiri dalamm bentuk, teknik, dan gaya berbeda satu
dengan lainnya. Tes urain disebut juga sebagai bentuk subjektif, karena
dalam pelaksanaannya sering dipengaruhi oleh factor subjektifitas guru.
Dilihat dari luas sempitnya materi yang ditanyakan, maka tes uraian terbagi
atas dua yaitu:
• Uraian terbatas, yaitu siswa harus mengemukakan hal-hal tertentu
sebagai batas-batasnya. Walaupun kalimat jawaban siswa
benaraneka ragam, namun tetap ada pokok-pokok penting yang
terdapat dalam jawabnnya: Contoh soal: Jelaskan bagaimana
masuknya Islam di Indonesia dilihat dari segi ekonomi dan
politik!
• Uraian bebas, yaitusiswa menjawab soal dengan sistematikanya
sendiri. Siswa bebas mengemukakan pendapat tanpa ada
pembatasan jawaban. Contoh soal: Jelaskan bagaimana masuknya
Islam di Indonesia!
Dari kedua bentuk di atas, Depdikbud sering menyebutnya dengan
istilah BUO (Bentuk Uraian Objektif) dan BUNO (Bentuk Uraian
Non-Objektif).
• Bentuk Uraian Objektif (BUO)
Bentuk uraian seperti ini memiliki sehimpun jawaban dengan
rumusan yang relative lebih pasti, sehingga dapat dilakukan
penskoran secara objektif. Anthony J. Nitko (1996:79)
menjelaskan bentuk uraian terbatas dapat digunakan untuk
melihat hasil belajar yang kompleks. Dalam penskoran bentuk
soal uraian objektif, skor hanya dimungkinkan menggunakan
dua kategori, yaitu benar atau salah.
Adapun Langkah-Langkah pemberian skor soal bentuk uraian
objektif adalah:
1. Tuliskansemua kata kunci atau kemungkinan jawaban benar
secara jelas untuk setiap soal
2. Setiap kata kunci yang benar diberi skor 1 jika salah 0
3. Jika satu pertanyaan memeiliki beberapa sub pertanyan,
maka rincikanlah kunci dari jawaban soal tersebut
4. Jumlahkan skor semua kata kunci yang telah ditetapkan pada
soal tersebut
• Bentuk Uraian Non-Objektif (BUNO)
Bentuk soal ini sama dengan rumusan jawaban uraian
bebas, yaitu menuntut siswa untuk mengingat dan
mengorganisasikan gagasan-gagasan pribadi atau hal-hal yang
telah dipelajarinya dengan cara mengemukakan atau
mengekspresikan gagasan tersebut dalam bentuk uraian tertulis

4
sehingga dalam penskoran sangat memungkinkan adanya unsur
subjektifitas. Dalam penyekoran soal bentuk ini, skor dijabarka
dalam rentang. Besaranya ditetapkan oleh kompleksitas jawaban
seperti 0-2, 0-4, 0-6, 0-8, 0-10, dan lain-lain.
2.2 Pembatasan Materi
Pembatasan materi adalah usaha yang dilakukan untuk menetapkan batasan dari
materi tes yang akan dibuat. Batasan materi ini bertujuan untuk mengidentifikasi apa
saja yang termasuk dalam ruang lingkup materi tes dan faktor mana saja yang tidak
termasuk dalam ruang lingkup materi tes yang akan dibuat. Dengan adanya
pembatasan materi ini dapat menyebabkan fokus materi yang diambil semakin jelas,
sehingga materi tesnya dapat dibuat dengan jelas juga.Sampai sejauh mana materi
tes itu dibatasi biasanya ditentukan oleh pembuat tesitu sendiri, maupun orang yang
termasuk dalam pembuatan tes tersebut.
2.3 Perumusan Konsep Dasar
Kosep dasar dalam menulis tes biasanya terdiri dari definisi, tujuan, tahapan dan
lain sebagainya yang berkaitan dengan penulisan tes, seperti pendapat-pendapat para
ahli tentang menulis tes. Seperti yang kita ketahui tes adalah salah satu alat ukur
yang paling banyak digunakan untuk mengetahui hasil belajar seseorang dalam
proses belajar mengajar atau suatu program pendidikan, karena sedemikian banyak
tes itu digunakan dalam dunia pendidikan, maka ada baiknya bila kita mengetahui
kelemahan dan kekurangan tes sebagai alat ukur hasil belajar. Kelemahan itu antara
lain:

5
1. Hampir semua tes hanya dapat mengukur hasil belajar yang bersifat kognitif
dan keterampilan sederhana. Kalaupun ia dapat mengukur hasil belajar yang
esensial, maka kontruksi tesnya membutuhkan waktu dan keterampilan yang
tinggi. Misal, dalam pelajaran agama. Tes hasil belajar sangat sukar untuk
dapat mengukur tingkat keimanan
2. Hasil tes acapkali disalahgunakan. Hasil tes kerap dianggap sebagai
gambaran yang sahih dari kemampuan dan pengetuan seseorang. Sedangkan
butir soal tes hanya mengukur suatu serpihan pengetahuan atau keterampilan
yang sangat kecil dari suatu keutuhan pengetahuan dan keterampilan
seseorang. Disamping itu hasil tes acapkali dianggap sebagai suatu yang
permanen. Sedagkan sesungguhnya hasil tes selalu berubah, dapat
berkembang atau berkurang. Karena memang pada hakikatnya hasil tes itu
selalu berubah.
3. Dalam proses pelaksanaannya, tes selalu menimbulkan kecemasan.
Sungguhpun kadar kecemasan yang timbul pada setiap orang tidak sama.,
namun tetap saja kecemasan tersebut dapat mengakibatkan hasil tes yang
diperoleh dalam tes menyimpang dari kenyataan yang ada dalam diri peserta
tes.
Adapun dalam perumusan konsep dasar pada tes, kita juga harus mengetahui
dasar-dasar dalam penyusunan tes hasil belajar , antara lain:
1. Tes hasil belajar harus dapat mengukur hasil belajar yang diperoleh setelah
proses balajar-mengajar sesuai dengan tujuan instruksional yang tercantum
dalam kurikulum.
2. Butir tes hasil belajar harus disusun sedemikian rupa sehingga perangkat tes
yang terbentuk benar-benar mewakili keseluruhan bahan yang tekah
dipelajari.
3. Perangkat tes hasil belajar hendaknya mengukur keseluruhan aspek
kompetensi yang diharapkan dan keseluruhan tingkat kemampuan hasil
belajar yang diharapkan.
4. Perangkat tes hasil belajar hendaknya disusun dari berbagai bentuk dan tipe
butir soal sesuai dengan hakikat hasil belajar yang diharapkan.
5. Interpretasi hasil belajar disesuaikan degan pendekatan pengukuran yang
dianut apakah mengacu pada norma kelompok (norm reference) ataukah
mengacu pada patokan criteria tertentu (criterion reference)

6
6. Hasil tes hasil belajar hendaknya dapat digunakan untuk memperbaiki proses
belajar-mengajar.
Setelah anda memahami dasar-dasar penyusunan tes, selanjutnya Anda harus
memahami bentuk dan bagaimana penulisan butir soal. Secara garis besar bentuk
tes dibagi dalam dua kelompok besar yaitu tes uraian dan tes objektif.
a. Tes Uraian/esai
Pengertian tes uraian adalah butiran soal yang mengandung pertanyaan
atau tugas yang jawaban atau pengerjaan soal tersebut harus dilakukan dengan
cara mengekspresikan pikiran peserta tes secara naratif. Ciri khas tes uraian
ialah jawaban terhadap soal tersebut tidak disediakan oleh orang yang
mengkontruksi butir soal, tetapi dipasok oleh peserta tes. Peserta tes bebas untuk
menjawab pertanyaan yang diajukan. Setiap peserta tes dapat memilih,
menghubungkan, dan atau menyampaikan gagasan dengan menggunakan kata-
katanya sendiri. Jadi perbedaan utama tes objektif dan uraian dalah siapa yang
menyediakan jawaban atau alternative jawaban sudah disediakan oleh pembuat
soal. Dengan pengertian diatas maka pemberian skor terhadap soal uraian tidak
mungkin dilakukan secara objektif.
Setiap bentuk butir soal memiliki kelebihan dan kekurangan. Adapun
kelebihan soal uraian adalah :
1. Tes uraian dapat dengan baik mengukur hasil belajar yang kompleks.
Hasil belajar yang kompleks artinya hasil belajar yang tidak sederhana.
Hasil belajar yang kompleks tidak hanya membedakan yang benar dari
yang salah, tetapi juga dapat mengekspresikan pemikiran peserta tesserta
pemilihan kata yang dapat memberi arti yang spesifik pada suatu
pemahaman tertentu. Apabila yang diukur adalah kemampuan hasil
bekajar yang sederhana, yaitu memilih suatu yang lebih benar atau yang
lebih tepat, maka sebaiknya menggunakan tes objektif.
2. Tes bentuk uraian terutama menekankan kepada pengukuran kemampuan
dan kemampuan mengintegrasikan berbagi buah pikiran dan sumber
informasi kedalam suatu pola berpikir tertentu, yang disertai dengan
keterampilan pemecahan masalah. Integrasi buah pikiran itu
membutuhkan dukungan kemampuan untuk mengekspresikannya. Tanpa
dukungan kemampuan mengekspresikan buah pikiran secara teratur dan
taat asas, maka kemampuan tidak terlihat secara utuh. Bahkan

7
kemampuan itu secara sederhana sudah akan dapat kelihatan dengan
jelas dalam pemilihan kata, penyusunan kalimat, penggunaan tanda baca,
penyusunan paragraf dan susunan rangkain paragraf dalam suatu keutuhan
pikiran.
3. Bentuk tes uraian lebih meningkatkan motivasi peserta didik untuk
melahirkan kepribadiannya dan watak sendiri, sesuai dengan sifat tes
uraian yang menuntut kemampuan siswa untuk mengekspresikan jawaban
dalam kata-kata sendiri. Untuk dapat mengekspresikan pemahaman dan
penguasaan bahan dalam jawaban tes, maka bentuk tes uraian menuntut
penguasaan bahan secara utuh. Penguasaan bahan yang tanggung atau
parsial dapat dideteksi dengan mudah. Karena itu untuk menjawab tes
uraian dengan baik peserta tes akan berusaha menguasai bahan yang
diperkirakannya akan diujikan dalam tes secara tuntas. Seorang peserta tes
yang mengerjakan tes uraian dengan penguasaan bahan parsial akan tidak
mampu menjawab soal dengan benar atau akan berusaha dengan cara
membual.
4. Kelebihan lain tes uraian ialah memudahkan guru untuk menusun butir
soal. Kemudahan ini terutama disebabkan oleh dua hal, yaitu pertama,
jumlah butir soal tidak perlu banyak dan kedua, guru tidak selalu harus
memasok jawaban atau kemungkinan jawaban yang benar sehingga akan
sangat menghemat waktu konstruksi soal. Tetapi hal ini tidak berarti
butir soal uraian dapat dikontruksikan secara asal-asalan. Kaidah
penyusunan tes uraian tidaklah lebih sederhana dari kaidah penyusunan
tes objektif.
5. Tes uraian sangat menekankan kemampuan menulis. Hal ini merupakn
kebaikan sekaligus kelemahannya. Dalam arti yang positif tes uraian akan
sangat mendorong siswa dan guru untuk belajar dan mengajar, serta
menyatakan pikiran secara tertulis. Dengan demikian diharapkan
kemampuan para peserta didik dalam menyatakan pikiran secara tertulis
akan meningkat. Tetapi dilihat dari segi lain, penekanan yang berlebihan
terhadap penggunaan tes uraian yang sangat menekankan kepada
kemampuan menyatakan pikiran dalam bentuk tulisan yang dapat
menjadikan tes sebagai alat ukur yang tidak adil dan tidak reliable. Bagi
siswa yang tidak mempunyai kemampuan menulis, akan menjadi beban.

8
Tes uraian di samping memiliki kelebihan terdapat pula kelemahan-
kelemahannya, yaitu :
1. Reliabilitasnya rendah artinya skor yang dicapai oleh peserta tes tidak
konsisten bila tes yang sama atau tes yang parallel yang diuji ulang
beberapa kali. Menurut Robert L. Ebel A. Frisbie (1986 : 129) terdapat
tiga hal yang menyebabkan tes uraian realibilitasnya rendah yaitu pertama
keterbatasan sampel bahan yang tercakup dalam soal tes. Kedua, batas-
bayastugas yang harus dikerjakan oleh peserta tes sangat longgar,
walaupun telah diusahakan untuk menentukan batasan-batasan yang
cukup ketat. Ketiga, subjektifitas penskoran yang dilakukan oleh
pemeriksa tes.
2. Untuk menyelesaikan tes uraian guru dan siswa membutuhkan waktu
yang banyak.
3. Jawaban peserta tes kadang-kadang disertai bualan-bualan.
4. Kemampuan menyatakan pikiran secara tertulis menjadi hal yang paling
membedakan prestasi belajar siswa.
Setelah Anda memahami kelemahan dan kelebihan bentuk tes uraian.
Anda harus mempertimbangkan bagaimana tes uraian digunakan. Sebaiknya tes
uraian digunakan apabila :
1. Jumlah siswa atau peserta tes terbatas.
2. Waktu yang dipunyai guru untuk mempersiapkan soal sangat terbatas.
3. Tujuan instruksional yang ingin dicapai adalah kemampuan
mengekspresikan pikiran dalam bentuk tertulis, menguji kemampuan
dengan baik, atau penggunaan kemampuan penggunaan bahasa secara
tertib.
4. Guru ingin memperoleh informasi yang tidak tertulis secara langsung di
dalam soal ujian tetapi dapat disimpulkan sari tulisan peserta tes, seperti
: sikap, nilai, atau pendapat. Soal uraian dapat digunakan untuk
memperoleh informasi langsung tersebut, tetapi harus digunakan dengan
sangat hati-hati oleh guru.
5. Guru ingin memperoleh hasil pengalaman belajar siswanya.
Bentuk tes uraian dapat diklasifikasi ke dalam dua tipe yaitu tes uraian
bebas (extended response) dan tes uraian terbatas (restricted response).

9
Pembedaan kedua tipe tes uraian ini adalah atas dasar besarnya kebebasan yang
yang diberikan kepada peserta tes untuk mengorganisasikan, menulis dan
menyatakan pikiran dan gagasannya.
Selanjutnya akan dijelaskan kedua tipe tes uraian tersebut. Sebagaimana
telah dikemukakan, perbedaan utama antara tes uraian bebas dan uraian terbatas
tergantung kepada kebebasan memberikan jawaban. Jawaban yang diberikan
oleh peserta tes dalam tes uraian bebas hampir-hampir tidak ada pembatasan.
Peserta tes memiliki kebebasan yang luas sekali untuk mengorganisasikan dan
mengekspresikan pikiran dan gagasannya dalam menjawab soal tersebut. Jadi
jawaban siswa bersifat terbuka, fleksibel, dan tidak tersrtuktur. Contoh uraian
bebas :
Uraikanlah perlawanan-perlawanan yang dilakukan oleh bangsa
Indonesia terhadap penjajah Belanda pada masa sebelum abad ke-20. Dalam
uraian ini Anda hendaknya disertai dengan latar belakang dan contoh para
pemimpinnya. Uraian anda hendaknya tidak melebihi 2 halaman folio.
Untuk menjawab contoh soal tersebut dibutuhkan kemampuan belajar
siswa yang kompleks. Dalam menjawab soal tersebut siswa diberikan kebebasan
untuk menjawab. Jawaban yang diberikan oleh siswa mulai pengetahuan fakta
sampai mengevaluasi terhadap fakta-fakta yang diketahuinya, kemudian
mengorganisasikan dalam pikiran dan bahasanya sendiri kedalam bentuk yang
logis dan argumentative dalam bentuk narasi. Kemampuan membuat narasi
dengan kata-katanya sendiri merupakan kemampuan dalam kategori jenjang
yang tinggi. Dengan demikian kompleksitas jawaban pada soal uraian bebas
terletak pada tercakupnya berbagai jenjang kemampuan. Pembatasan jawaban
hanya terletak pada banyaknya uraian yang harus dibuat untuk
mempertimbangkan waktu yang digunakan dalam tes.
b. Tes Objektif
Pengertian tes objektif adalah tes atau butir soal yang telah mengandung
kemungkinan jawaban yang harus dipilih atau dikerjakan oleh peserta tes.
Peserta tes hanya harus memilih jawaban dari alternatif jawaban yang
disediakan.
Bentuk tes objektif secara umum memiliki 3 tipe yaitu
a. Benar-salah (true false)

10
b. Mejodohkan (matching)
c. Pilihan ganda (multiple choice)
Tipe butir soal benar-salah adalah butir soal yang terdiri dari pernyataan
yang disertai dengan alternative menyatakan pernyataan tersebut salah atau
benar, atau keharusan memilih satu dari dua alternatif jawaban lainnya.
Butir soal benar-salah memiliki kekuatan antara lain :
1. Mudah dikontruksi.
2. Perangkat soal dapat mewakili seluruh pokok bahasan.
3. Mudah diskor.
4. Alat yang baik untuk mengukur fakta dan hasil belajar langsung
terutama berkenaan dengan ingatan.
Adapun kelemahan butir soal tipe benar-salah adalah :
1. Mendorong peserta tes untuk menebak jawaban.
2. Terlalu menekankan kepada ingatan.
3. Peserta tes harus selalu memberikan penilaian absolut.
Beberapa petunjuk yang merupakan persyaratan dalam penulisan butir
soal benar-salah yaitu :
1. Setiap butir soal harus menguji atau mengukur hasil belajar peserta tes
yang penting dan bermakna, tidak menanyakan hal yang remeh (trivial).
2. Setiap soal haruslah menguji pemahaman, tidak hanya pengukuran
terhadap daya ingat. Butir soal tidaklah dianjurkan untuk menguji
kemampuan mengingat kata atau frase yang terdapat dalam buku ajar atau
bacaan lainya.
3. Kunci jawaban yang ditentukan haruslah benar.
4. Butir soal yang baik haruslah jelas bagi seseorang peserta tes yang belajar
dan jawaban yang salah kelihatan seakan-akan benar bagi pesertates yang
tidak belajar dengan baik.
5. Pernyataan dalam butir soal harus dinyatakan secara jelas dan
menggunakan bahasa yang baik dan benar.
Butir soal benar-salah dapat dimodifikasi sehingga dapat meningkatkan
daya bedanya dan mengurangi kelemahan utamanya yaitu mendorong
penerkaan.

11
2.4 Perumusan Indikator Keberhasilan Belajar
Keberhasilan belajar merupakan prestasi peserta didik yang dicapai dalam proses
belajar mengajar. Untuk mengatahui keberhasilan belajar tersebut terdapat beberapa
indikator yang dapat dijasikan petunjuk bahwa proses belajar mengajar tersebut
dianggap berhasil atau tidak.
Indikator memiliki kedudukan yang sangat strategis dalam mengembangkan
pencapaian kompetensi berdasarkan SK-KD. Indikator berfungsi sebagai berikut:
1. Pedoman dalam mengembangkan materi pembelajaran.
Pengembangan materi pembelajaran harus sesuai dengan indikator yang
dikembangkan. Indikator yang dirumuskan secara cermat dapat memberikan
arah dalam pengembangan materi pembelajaran yang efektif sesuai dengan
karakteristik mata pelajaran, potensi dan kebutuhan peserta didik, sekolah,
serta lingkungan.
2. Pedoman dalam mendesain kegiatan pembelajaran.
Desain pembelajaran perlu dirancang secara efektif agar kompetensidapat
dicapai secara maksimal. Pengembangan desain pembelajaran hendaknya
sesuai dengan indikator yang dikembangkan, karena indikator dapat
memberikan gambaran kegiatan pembelajaran yang efektif untuk mencapai
kompetensi. Indikator yang menuntut kompetensi dominan pada aspek
prosedural menunjukkan agar kegiatan pembelajaran dilakukan tidak dengan
strategi ekspositori melainkan lebih tepat dengan strategi discovery- inquiry.
3. Pedoman dalam mengembangkan bahan ajar.
Bahan ajar perlu dikembangkan oleh guru guna menunjang pencapaian
kompetensi peserta didik. Pemilihan bahan ajar yang efektif harus sesuai
tuntutan indikator sehingga dapat meningkatkan pencapaian kompetensi
secara maksimal.
4. Pedoman dalam merancang dan melaksanakan penilaian hasil belajar.
Indikator menjadi pedoman dalam merancang, melaksanakan, serta
mengevaluasi hasil belajar, Rancangan penilaian memberikan acuan dalam
menentukan bentuk dan jenis penilaian, serta pengembangan indikator
penilaian. Pengembangan indikator penilaian harus mengacu pada indikator
pencapaian yang dikembangkan sesuai dengan tuntutan SK dan KD.

12
Dalam merumuskan indikator perlu diperhatikan beberapa ketentuan sebagai
berikut:
1. Setiap KD dikembangkan sekurang-kurangnya menjadi tiga indikator
2. Keseluruhan indikator memenuhi tuntutan kompetensi yang tertuang
dalam kata kerja yang digunakan dalam SK dan KD. Indikator harus
mencapai tingkat kompetensi minimal KD dan dapat dikembangkan
melebihi kompetensi minimal sesuai dengan potensi dan kebutuhan peserta
didik.
3. Indikator yang dikembangkan harus menggambarkan hirarki kompetensi.
4. Rumusan indikator sekurang-kurangnya mencakup dua aspek, yaitu
tingkat kompetensi dan materi pembelajaran.
5. Indikator harus dapat mengakomodir karakteristik mata pelajaran
sehingga menggunakan kata kerja operasional yang sesuai.
6. Rumusan indikator dapat dikembangkan menjadi beberapa indikator
penilaian yang mencakup ranah kognitif, afektif, dan/atau psikomotorik.

2.5 Tabel Spesifikasi atau Kisi-Kisi


Kisi-kisi adalah suatu format berbentuk matriks yang memuat informasi
untukdijadikan pedoman dalam menulis soal atau merakit soal menjadi tes.
Penyusunan kisi-kisi merupakan langkah penting yang harus dilakukan sebelum
penulisan soal. Kisi-kisi disusun berdasarkan tujuan penggunaan tes. Dengan
demikian dapatdiperoleh berbagai macam kisi-kisi. Kisi-kisi tes yang dimaksudkan
untukmenyusun soal diagnosis kesukaran belajar peserta didik berbeda dengankisi-
kisites yang dimaksudkan untuk menyusun soal prestasi belajar. Kisi-kisi yang
dimaksudkan untuk menyusun tes penempatan juga berbeda dengan kisi-kisi
yangdimaksudkan untuk menyusun tes kompetisi. Kisi-kisi yang dimaksudkan
untukmenyusun tes ulangan umum juga beerbeda dengan kisi-kisi yang digunakan
untuk menyusun tes ujian akhir nasional. Hal yang harus diperhatikan adalah tidak
ada satupun kisi-kisi yang dapat digunakan untuk semua tujuan semua
tes.(Surapranata, 2005 : 50). Dalam konteks penilaian hasil belajar, kisi-kisi disusun
berdasarkan silabus pada setiap mata Pelajaran, jadi hal yang harus dilakukan adalah
sebagai berikut:

Analisis Menyusun
Membuat Soal
Silabus Kisi-kisi

Menyusun Menyusun
Membuat
Pedoman lembar
kunci jawaban
Penyekoran jawaban

Gambar 1. Langkah membuat kisi-kisi

13
Contoh:
Nama Sekolah : ………………………………………….
Mata Pelajaran : ………………………………………….
Jurusan/Program Studi : ………………………………………….
Kurikulum Waktu : ………………………………………….
Alokasi Waktu : ………………………………………….
Jumah Soal : ………………………………………….
Standar Kompetensi : ………………………………………….

No Kompetensi Materi Indikator Jenjang Bentuk Nomor


Dasar Kemampuan Soal Soal

Tingkat kesukaran soal juga harus diperhatikan agar dapat mengetahui dan
menetapkan berapa jumlah soal yang termasuk sukar, sedang, dan mudah.
Biasanya, jumlah soal sedang lebih banyak daripada jumlah soal mudah dan sukar,
sedangkan jumlah soal mudah dan sukar sama banyaknya.
Contoh:
Nama Sekolah : ………………………………………….
Mata Pelajaran : ………………………………………….
Jurusan/Program Studi : ………………………………………….
Kurikulum Waktu : ………………………………………….
Alokasi Waktu : ………………………………………….
Jumah Soal : ………………………………………….
Standar Kompetensi : ………………………………………….

14
BS 50 PG 30 M 20
Materi Peng Pem Ap Peng Pem Ap Peng Pem Ap
30% 30% 40% Jlh 30% 30% 40% Jlh 30% 30% 40% Jlh
A
40% 6 6 8 20 3 4 5 12 2 2 4 8
B
40% 6 6 8 20 3 4 5 12 2 2 4 8
C
20% 3 3 4 10 2 2 2 6 1 1 2 4
Jlh 15 15 20 50 8 10 12 30 5 5 10 20

2.6 Penulisan Butir-Butir Tes atau Soal


Penulisan butir-butir soal merupakan langkah penting dalam upaya
pengembangan alat ukur kemampuan atau tes yang baik. Penulisan soal adalah
penjabaran indikator jenis dan tingkat perilaku yang hendak diukur menjadi
pertanyaan-pertanyaan yang karakteristiknya sesuai dengan perinciannya dalamkisi-
kisi. Butir soal merupakan jabaran atau dapat juga wujud dari indikator, Dengan
demikian setiap pernyataan atau butir soal perlu dibuat sedemikian rupa sehingga
jelas apa yang ditanyakan dan jelas pula jawaban yang diminta. Mutu setiap butir
soal akan menentukan mutu soal tes secara keseluruhan. Butir-butirsoal harus
memiliki tingkat penalaran tinggi atau memiliki Higher Order Thinking Skill
(HOTS).
1. Soal ingatan
Hampir tidak ada kesulitan bagi para guru untuk membuat item mengenai
ingatan, baik bagi soal bentuk uraian maupun objektif. Pertanyaan ingatan adalah
pertanyaan yang jawabannya dapat dicari dengan mudh pada catatan atau buku.
Pertanyaan ingatan biasanya dimulai dengan kata-kata mendefinisikan,
mendeskripsikan, mengidentifikasikan, mendaftar, menjodohkan, menyebutkan,
menyatakan, mereproduksikan.
2. Soal pemahaman
Untuk menjawab pertanyaan pemahaman siswa dituntut hafal sesuatu
pengertian kemudian menjelaskan dengan kalimat sendiri. Atau siswa memahami
dua pengertian atau lebih kemudian memahami dan menyebutkan hubungannya.
Dalam menjawab pertanyaan pemahaman siswa selain harus mengingat juga
berpikir. Pertanyaan pemahaman lebih tinggi daripada ingatan. Pertanyaan
pemahaman biasanya menggunakan kata-kata perbedaan, perbandingan, menduga,
menggeneralisasikan, memberikan contoh, menuliskan kembali, memperkirakan.
3. Soal aplikasi
Soal aplikasi adalah soal yang mengukur kemampuan siswa dalam
mengaplikasikan pengetahuannya untuk memecahkan masalah sehari-hari atau
persoalan yang dikemukakan oleh pembuat soal. Soal aplikasi selalu dimulai

15
dengan kasus atau persoalan yang dikarang oleh penyusun soal. Bukanketerangan
yang terdapat dalam buku atau pelajaran yang dicatat.
Kata-kata yang digunakan dalam soal aplikasi atau kemampuan yang di tuntut
antara lain mengubah, menghitung, mendemonstrasikan, menemukan,
memanipulasikan, memodifikasikan, menghubungkan, menunjukan,
menggunakan.
4. Soal Analisis
Soal analisis adalah soal yang menuntut kemampuan siswa untuk menganalisis
atau menguraikan sesuatu persoalan untuk diketahui bagian- bagiannya. Dalam
hierarki taksonomi, analisis lebih tinggi dari aplikasi. Soal analisis harus dimulai
dengan kasus yang dikarang sendiri oleh guru, bukanmengambil uraian dari buku
atau catatan pelajaran
Kata-kata yang digunakan atau kemampuan yang dituntut antara lain meliputi:
memerinci, menyusun diagram, membedakan,mengilustrasikan, menyimpulkan,
memilih, memisahkan, membagi.
5. Soal Evaluasi
Soal evaluasi adalah soal yang berhubungan dengan menilai, mengambil
kesimpulan, membandingkan , mempertentangkan, mengkritik, mendeskripsikan,
membedakan, menerangkan, memutuskan, menafsirkan.
Soal evaluasi selau didahului dengan kasus yang ditelaah oleh siswa dengan
teropong hukum, dalil, prinsip, kemudian mereka mengadakan penilaian baik atau
tidak didasarkan atas benar atau salah. (Sudijono, 2001:87)

2.7 Validitas

2.7.1 Pengertian Validitas

Validitas merupakan syarat yang terpenting dalam suatu alat evaluasi. Validitas berasal
dari kata validity yang mempunyai arti sejauhmana ketepatan dan kecermatan suatu intrumen
pengukuran dalam melaksanakan fungsi ukurnya. Suatu alat evaluasi (tes) dikatakan
mempunyai validitas yang tinggi (disebut valid) jika alat evaluasi atau tes itu dapat mengukur
apa yang sebenarnya akan diukur atau memberikan hasil ukur yang tepat dan akurat sesuai
dengan maksud dikenakannya tes tersebut. Sedangkan suatu tes yang menghasilkan data yang
tidak relevan dengan tujuan diadakannya pengukuran dikatakan sebagai tes yang memiliki
validitas rendah.
Sisi lain yang sangat penting dalam konsep validitas adalah kecermatan pengukuran.
Suatu tes yang validitasnya tinggi tidak saja akan menjalankan fungsi ukurnya dengan Tepat
akan tetapi juga dengan kecermatan tinggi, yaitu kecermatan dalam mendeteksi perbedaan
perbedaan yang ada pada atribut yang diukurnya.
Pengertian validitas sangat erat berkaitan dengan tujuan pengukuran. Tidak ada
validitas yang berlaku secara umum untuk semua tujuan pengukuran. Suatu teks hanya
menghasilkan ukuran yang sangat valid untuk satu tujuan pengukuran saja yang spesifik. Oleh
karena itu, suatu tes yang valid guna pengambilan suatu keputusan dapat saja tidak valid sama
sekali guna mengambil keputusan yang lain.
16
2.7.2 Macam-macam Validitas

Secara garis besar ada dua macam validitas, yaitu validitas logis dan validitas empiris.
a. Validitas Logis
Istilah “validitas logis” mengandung kata “logis” berasal dari kata “logika” atau
validitas logis sering juga disebut sebagai analisis kualitatif yaitu berupa penalaran atau
penelaahan. Dengan makna demikian maka validitas logis untuk sebuah instrumen yang
memenuhi persyaratan valid berdasarkan hasil penalaran. Kondisi valid tersebut dipandang
terpenuhi karena instrumen yang bersangkutan sudah dirancang secara baik, mengikuti teori
dan ketentuan yang ada. Sebagaimana pelaksanaan tugas lain misalnya membuat sebuah
karangan, jika penulisan sudah mengikuti aturan mengarang, tentu secara logis karangannya
sudah baik. Berdasarkan penjelasan tersebut maka instrumen yang sudah disusun berdasarkan
teori penyusunan instrumen, secara logis sudah valid. Dari penjelasan tersebut dapat dipahami
bahwa validitas logis dapat dicapai apabila instrumen disusun mengikuti ketentuan yang ada.
Dengan demikian, dapat disimpulkan bahwa validitas logis tidak perlu diuji kondisinya tetapi
langsung diperoleh sesudah instrumen tersebut selesai disusun.
b. Validitas Empiris
Istilah "validitas empiris" memuat kata 'empiris" yang artinya "pengalaman". Sebuah
instrumen dapat dikatakan memiliki validitas empiris apabila sudah diuji dari pengalaman.
Sebagai contoh sehari-hari, seseorang dapat diakui jujur oleh masyarakat apabila dalam
pengalaman dibuktikan bahwa orang tersebut memang jujur. Contoh lain, seseorang dapat
dikatakan kreatif apabila dari pengalaman dibuktikan bahwa orang tersebut sudah banyak
menghasilkan ide-ide baru yang diakui berbeda dari hal-hal yang sudah ada. Dari penjelasan
dan contoh-contoh tersebut diketahui bahwa validitas empiris tidak dapat diperoleh hanya
dengan menyusun instrumen berdasarkan ketentuan seperti halnya validitas logis, tetapi harus
dibuktikan melalui pengalaman.
Ada dua macam validitas empiris, yakni ada dua cara yang dapat dilakukan untuk
menguji bahwa sebuah instrumen memang valid. Pengujian tersebut dilakukan dengan
membandingkan kondisi instrumen yang bersangkutan dengan kriterium atau sebuah ukuran.
Kriterium yang digunakan sebagai pembanding kondisi instrumen dimaksud ada dua,
yaitu: yang sudah tersedia dan yang belum ada tetapi akan terjadi di waktu yang akan datang.
Bagi instrumen yang kondisinya sesuai dengan kriterium yang sudah tersedia, yang sudah ada,
disebut memiliki validitas "ada sekarang", yang dalam istilah bahasa Inggris disebut memiliki
concurrent validity. Selanjutnya instrumen yang kondisinya sesuai dengan kriterium yang
diramalkan akan terjadi, disebut memiliki validitas ramalan atau validitas prediksi, yang dalam
istilah bahasa Inggris disebut memiliki predictive validity.
Dan uraian adanya dua jenis validitas, yakni validitas logis yang ada dua macam, dan
validitas empiris, yang juga ada dua macam, maka secara keseluruhan kita mengenal adanya
empat validitas, yaitu:
1) Validitas isi,
2) Validitas konstrak,
3) Validitas "ada sekarang", dan
4) Validitas prediktif (Suharsimi Arikunto, 2008).
Dua yang pertama, yakni (1) dan (2) dicapai melalui penyusunan berdasarkan ketentuan atau
17
teori, sedangkan dua berikutnya, yakni (3) dan (4) dicapai atau diketahui sesudah dibuktikan
melalui pengalaman. Adapun penjelasan nasing-masing validitas adalah:
1) Validitas Isi (Content Validity)
Sebuah tes dikatakan memiliki validitas isi apabila mengukur tujuan khusus tertentu
yang sejajar dengan materi atau isi pelajaran yang diberikan. Oleh karena materi yang diajarkan
tertera dalam kurikulum maka validitas isi ini sering juga disebut validitas kurikuler. Validitas
isi dapat diusahakan tercapainya sejak saat penyusunan dengan cara memerinci materi
kurikulum atau materi buku pelajaran. Bagaimana cara memerinci materi untuk kepentingan
diperolehnya validitas isi sebuah tes akan dibicarakan secara lebih mendalam pada waktu
menjelaskan cara penyusunan tes.
2) Validitas Konstruksi (Contruct Validity)
Sebuah tes dikatakan memiliki validitas konstruksi apabila butir-butir soal yang
membangun tes tersebut mengukur setiap aspek berpikir seperti yang disebutkan dalam Tujuan
Instruksional Khusus. Dengan kata lain jika butir-butir soal mengukur aspek berpikir tersebut
sudah sesuai dengan aspek berpikir yang menjadi tujuan instruksional. Sebagai contoh jika
rumsan Tujuan Instruksional Khusus (TIK): "Murid dapat membandingkan antara efek
biologis dan efek psikologis", maka butir soal pada tes merupakan perintah agar murid
membedakan antara dua efek tersebut.
"Konstruksi" dalam pengertian ini bukanlah "susunan" seperti yang sering dijumpai
dalam teknik, tetapi merupakan rekaan psikologis yaitu suatu rekaan yang dibuat oleh para ahli
Ilmu Jiwa yang dengan suatu cara tertentu "memerinci" isi jiwa atas beberapa aspek seperti:
ingatan (pengetahuan), pemahaman, aplikasi, dan seterusnya. Dalam hal ini, mereka
menganggap seolah-olah jiwa dapat dibagi-bagi. Tetapi sebenarnya tidak demikian.
Pembagian ini hanya merupakan tindakan sementara untuk mempermudah mempelajari.
Seperti halnya validitas isi, validitas konstruksi dapat diketahui dengan cara memerinci
dan memasangkan setiap butir soal dengan setiap aspek dalam TIK. Pengerjaannya dilakukan
berdasarkan logika, bukan pengalaman. Dalam pembicaraan mengenai penyusunan tes hal ini
akan disinggung lagi.
3) Validitas "ada sekarang" (concurrent validity)
Validitas ini lebih umum dikenal dengan validitas empiris. Sebuah tes dikatakan
memiliki validitas empiris jika hasilnya sesuai dengan pengalaman. Jika ada istilah "sesuai"
tentu ada dua hal yang dipasangkan. Dalam hal ini hasil tes dipasangkan dengan hasil
pengalaman. Pengalaman selalu mengenai hal yang telah lampau sehingga data pengalaman
tersebut sekarang sudah ada (ada sekarang, concurrent).
Dalam membandingkan hasil sebuah tes maka diperlukan suatu kriterium atau alat
banding. Maka hasil tes merupakan sesuatu yang dibandingkan. Untuk jelasnya di bawah ini
dikemukakan sebuah contoh. Misalnya seorang guru ingin mengetahui apakah tes sumatif yang
disusun sudah valid atau belum. Untuk ini diperlukan sebuah kriterium masa lalu yang
sekarang datanya dimiliki. Misalnya nilai ulangan harian atau nilai ulangan sumatif yang lalu.
4) Validitas prediksi (predictive validity)
Memprediksi artinya meramal, dengan meramal selalu mengenai hal yang akan datang
jadi sekarang belum terjadi. Sebuah tes dikatakan memiliki validitas prediksi atau validitas
ramalan apabila mempunyai kemampuan untuk meramalkan apa yang akan terjadi pada masa
yang akan datang. Misalnya tes masuk Perguruan Tinggi adalah sebuah tes yang diperkirakan

18
mampu meramalkan keberhasilan peserta tes dalam mengikuti kuliah di masa yang akan
datang. Calon yang tersaring berdasarkan hasil tes diharapkan mencerminkan tinggi-rendahnya
kemampuan mengikuti kuliah. Jika nilai tesnya tinggi tentu menjamin keberhasilannya kelak.
Sebaliknya seorang calon dikatakan tidak lulus tes karena memiliki nilai tes yang rendah jadi
diperkirakan akan tidak mampu mengkuti perkuliahan yang akan datang.
Sebagai alat pembanding validitas prediksi adalah nilai-nilai yang diperoleh setelah peserta
tes mengikuti pelajaran di Perguruan Tinggi. Jika ternyata siapa yang memiliki nilai tes lebih
tinggi gagal dalam ujian semester I dibandingkan dengan yang dahulu nilai tesnya lebih rendah
maka tes masuk yang dimaksud tidak memiliki validitas prediksi.

2.7.3 Cara Mengetahui Validitas Alat Ukur


Sebuah tes dikatakan memiliki validitas jika hasilnya sesuai dengan kriterium, dalam arti
memiliki kesejajaran antara hasil tes tersebut dengan kriterium. Teknik yang digunakan untuk
mengetahui kesejajaran adalah teknik kolerasi product momen yang dikemukakan oleh
Pearson.
Rumus kolerasi product moment ada dua macam, yaitu:
a. Korelasi product moment dengan simpangan, dan
b. Korelasi product moment dengan angka kasar.
Rumus korelasi product moment dengan simpangan:
∑ 𝑥𝑦
𝑟𝑋𝑌 =
√(∑𝑥 2)(∑𝑦 2)
Keterangan:
rxy = koefisien dan kolerasi antara variabel X dan variabel Y, dua variabel yang
dikorelasikan (x=X-X dan y=Y-Y).
∑ 𝑥𝑦 = jumlah perkalian x dan y
𝑥2 = kuadrat dari x
2
𝑦 = kuadrat dari y

Rumus korelasi Product Moment dengan Angka Kasar


𝑁 ∑ 𝑋𝑌 − (∑ 𝑋)(∑ 𝑌)
𝑟𝑥𝑦 =
√{𝑁 ∑ 𝑋 2 − (∑ 𝑋)2 }{𝑁 ∑ 𝑌 2 − (∑ 𝑌)2 }

Contoh perhitungan:

Tabel Persiapan Untuk Mencari Validitas Tes Prestasi Matematika


No Nama X Y 𝑋2 𝑌2 XY
1. Siswa 1 6,5 6,3
2. Siswa 2 7 6,8
3. Siswa 3 7,5 7,2
4. Siswa 4 7 6,8
5. Siswa 5 6 7
6. Siswa 6 6 6,2
7. Siswa 7 5,5 5,1

19
8. Siswa 8 6,5 6
9. Siswa 9 7 6,5
10. Siswa 10 6 5,9
Jumlah 65,0 63,8

Koefisien korelasi selalu terdapat antara -1,00 sampai +1,00. Apabila r = -1 artinya
korelasinya negative sempurna; r = 0 artinya tidak ada korelasi dan r = 1 berarti
korelasinya sangat kuat. Sedangkan arti r diiterpretasikan sebagai berikut:

Tabel interpretasi koefisien korelasi nilai r


Interval Koefisien Tingkat Hubungan
0,80-1,00 Sangat Kuat
0,60-0,79 Kuat
0,40-0,59 Cukup Kuat
0,20-0,39 Rendah
0,00-0,19 Sangat Rendah

3 Faktor-Faktor yang Mempengaruhi Validitas


Banyak faktor yang dapat mempengaruhi hasil tes evaluasi tidak valid. Beberapa faktor
tersebut secara garis besar dapat dibedakan menurut sumbernya, yaitu faktor internal dari tes,
faktor eksternal tes, dan faktor yang berasal dari siswa yang bersangkutan.
1) Faktor yang berasal dari dalam tes
Beberapa sumber yang pada umumnya berasal dari faktor internal tes evaluasi
diantaranya sebagai berikut.
a. Arahan tes yang disusun dengan makna tidak jelas sehingga dapat mengurangi validitas
tes.
b. Kata-kata yang digunakan dalam struktur instrumen evaluasi, terlalu sulit.
c. Item-item tes dikontruksi dengan jelek.
d. Tingkat kesulitan item tes tidak tepat dengan materi pembelajaran yang diterima siswa.
e. Waktu yang dialokasikan tidak tepat, hal ini termasuk kemungkinan terlalu kurang atau
terlalu longgar.
f. Jumlah item tes terlalu sedikit sehingga tidak mewakili sampel materi pembelajaran.
g. Jawaban masing-masing item evaluasi bisa diprediksi siswa.
2) Faktor yang berasal dari administrasi dan skor
Faktor ini dapat menguangi validitas interpretasi tes evaluasi, khususnya tes evaluasi
yang dibuat olehguru. Berikut beberapa faktor yang sumbernya berasal dari administrasi
dan skor.
a. Waktu pengerjaan tidak cukup sehingga siswa dalam memberikan jawaban dalam
situasi yang tergesa-gesa.
b. Adanya kecurangan dalam tes sehingga tidak bisa membedakan antara siswa yang
belajar dengan yang melakuakan kecurangan.
c. Pemberian petunjuk dari pengawas yang tidak dapat dilakukan oleh semua siswa.
d. Teknik pemberian skor yang tidak konsisten, misalnya pada tes esai, juga dapat
mengurangi validitas tes evaluasi.
20
e. Siswa tidak dapat mengikuti arahan yang diberikan dala tes baku.
f. Adanya joki (orang lain bukan siswa) yang masuk dalam menjawab item tes yang
diberikan.
3) Faktor-faktor yang berasal dari jawaban siswa
Seringkali terjadi bahwa interpretasi terhadap item-item tes evaluasi tidak valid,
karena dipengaruhi oleh jawaban siswa dari padainterpretasi item-item pada
tes evaluasi. Sebagai contoh, sebelum tes para siswa menjadi tegang karena
guru pengampu mata pelajaran dikenal “killer”, galak, dan sebagainya
sehingga siswa yang ikut tes banyak yang gagal. Contoh lain, ketika siswa
melakukan tes penampilan keterampilan, rauangan terlalu ramai atau gaduh
sehingga para siswa tidak dapat konsentrasi dengan baik. Ini semua dapat
mengurangi nilai validitas instrumen evaluasi.

2.8 Reliabilitas

2.8.1 Pengertian Reliabilitas


Reliabilitas mengarah kepada keakuratan dan ketepatan dari suatu alat ukur dalam
suatu prosedur pengukuran. Koefisien reliabilitas mengindikasikan adanya stabilitas skor yang
didapatkan oleh individu, yang merefleksikan adanya proses reproduksi skor. Skor disebut
stabil bila skor yang didapat pada suatu waktu dan pada waktu yang lain hasilnya relatif sama.
Makna lain reliabilitas dalam terminologi stabilitas adalah subjek yang dikenai pengukuran
akan menempati ranking yang relatif sama pada testing yang terpisah dengan alat tes yang
ekuivalen (Singh, 1986; Thorndike, 1991).
Dari segi bahasa, reliabilitas merupakan penerjemahan dari kata reliabilit yang
mempunyai asal kata rely dan ability. Bila digabungkan, kedua kata tersebut akan mengerucut
kepada pemahaman tentang kemampuan alat ukur untuk dapat dipercaya dan menjadi
sandaran pengambilan keputusan. Oleh Anastasi dan Urbina (1997), dalam konteks ini
reliabilitas alat tes akan menunjuk kepada sejauh mana perbedaan-perbedaan individual dalam
skor tes dapat dianggap disebabkan oleh perbedaan-perbedaan sesungguhnya dalam
karakteristik yang dipertimbangkan dan sejauhmana dapat dianggap disebabkan oleh
kesalahan peluang. Senada dengan pendapat tersebut, Suryabrata (2000) menyatakan bahwa
dalam arti yang paling luas, reliabilitas alat ukur menunjuk kepada sejauh mana perbedaan-
perbedaan skor perolehan mencerminkan perbedaan atribut yang sebenarnya.
Reliabilitas alat ukur yang juga menunjukkan derajad kekeliruan pengukuran tidak
dapat ditentukan dengan pasti melainkan hanya dapat diestimasi (Suryabrata, 2000). Estimasi
reliabilitas alat ukur dapat dicapai dengan menggunakan tiga metode. Ketiga metode yang
dimaksud adalah, metode “retest” atau tes ulang, metode “alternate form” atau tes paralel dan
metode “split-half” atau metode konsistensi internal (Guilford, 1954;Thorndike, 1997; Azwar,
2000; Suryabrata, 2000).
Metode konsistensi internal dilakukan dengan cara memberikan satu bentuk tes yang
hanya diberikan sekali kepada sekelompok subjek (single trial administration) dengan tujuan
untuk menghindari kelemahan pada dua metode terdahulu. Untuk estimasi reliabilitas, dapat
dilihat melalui konsistensi antar aitem atau antar bagian tes itu sendiri yang sudah dibelah
sebelumnya, dengan menggunakan teknik komputasi tertentu.

21
Konsep reliabilitas dalam Teori Skor murni Klasik dapat difahami dari beberapa
interpretasi. Suatu tes dikatakan sebagai memiliki reliabilitas yang tinggi apabila, misalnya skr
tampak tes itu berkorelasi tinggi dengan skor murninya sendiri. Reliabilitas dapat pula
ditafsirkan sebagai seberapa tingginya korelasi antara skr tampak pada dua tes yang paralel.

2.8.2 Jenis-Jenis Reliabilitas


Dibawah ini adalah berbagai jenis reliabilitas yang biasanya digunakan dalam tes acuan
norma (TAN) antara lain adalah sebagai berikut:
a. Reliabilitas antar-pemeriksa (inter rate reliability) Reliabilitas jenis ini terlihat jika
pemeriksa yang berbeda memeriksa hasil tes yang hasilnya mirip atau sedikit berbeda
variasinya. Dua cara terkait penggunaan reliabilitas antar pemeriksa adalah, a) menguki
bagaimana kemiripan pemeriksa dalam mengkategorisasikan butir soal. B) menguji
bagainama kemiripan pemeriksa dalam memberi skor butir soal. Reliabilitas jenis ini
juga disebut inter observaser reliability atau intrcoder.
b. Reliabilitas tes-tes ulang (test-retest reliabiity) Reliabilitas jenis ini terlihat jika
pemeriksa yang sama pada saat yangb berlainan memperoleh hasil tes yang mirip.
Reliabiitas dapat bervariasi karena pengaruh berbagai faktor, antara lain disebabkan
bagaimana tanggapan seseorang terhadap suasana hatinya, adanya interupsi. Waktu
pengambilan tes dan sebagainya.pada umumnya, semakin lama penundaan pemberian
tes yang kedua. Semakin besar variasi hasil tes. Suatu tes yang baik dapat menangani
masalah seperti itu sehingga hanya menghasilkan sedikit perbedaan pada hasilnya.
Dengan kata lain, selang waktu pemberian tes tidak berpengaruh pada hasil tes.
c. Reliabilitas bentuk paralel (parallel form reliability) Reliabilitas bentuk paralel dapat
dilihat tatkala pada saat yang sama, pemeriksaan-pemeriksaan yang berbeda
melaksanakan pengujian tes yang bberbeda, dengan hasil yang mirip. Jenis-jenis
pertanyaan pada tes berbeda tetapi memiliki konstruksi tes yang sama. Reliabilitas jenis
ini digunakan untuk menilai hasil dari dua buah tes yang memiiki kosntruksi yang
sama.penilaian bentuk paralel ini dapat dilaksanakan dalam kombinasi dengan metode
lain misalanya metode belah dua.metode belah dua membagi dua sejumlah butir-butir
soal yang konstruksinya sama dan dilaksanakan pada kelompok siswa yang sama.

2.8.3 Cara-Cara Mencari Besarnya Reliabilitas


Sekali lagi reliabilitas adalah ketetapan suatu tes apabila diteskan kepada subjek yang
sama untuk mengetahui ketetapan ini pada dasarnya dilihat kesejajaran hasil Seperti halnya
beberapa teknik juga menggunakan rumus korelasi product momen untuk mengetahui
validitas, kesejajaran hasil dalam reliabitas les. Kriterium yang digunakan untuk mengetahui
ketetapan ada yang berada di luar tes (consistency external) dan pada tes itu sendiri
(consistency Internal).
a. Metode bentuk paralel (equivalent)
Tes paralel atau tes ekuivalen adalah dua buah tes yang mempunyai kesamaan tujuan,
tingkat kesukaran. dan susunan. tetapi butir-bulir soalnya berbeda. Dalam Istilah bahasa
Inggris disebut alternate-forms method (parallel forms).
Dengan metode bentuk paralel ini, dua buah tes yang paralel,misalnya Matematika Seri
A yang akan dicari reliabilitasnyadan tes Seri B diteskan kepada sekelompok siswa yang sama,

22
kemudian hasilnya dikorelasikan. Koefisien korelasi dari kedua hasil tes inilah yang
menunjukkan koefisien reliabilitas tes Seri A. Jika koefisiennya tinggi maka tes tersebut sudah
reliabel dan dapat digunakan sebagal alat pengetes yang terandalkan.
Dalam menggunakan metode tes paralel ini pengetes harus menyiapkankan dua buah
tes, dan masing-masing dicobakan pada kelompok siswa yang sama. Oleh karena itu, ada
orang menyebutkan sebagai double test double-trial-metodh. Penggunaan metode ini baik
karena siswa dihadapkan kepada dua macam tes sehingga tidak ada faktor "masih ingat
soalnya" yang dalam evaluasi dlsebut adanya practice-effect dan carry-over effect , artinya
ada faktor yang dibawa oleh pengikut tes karena sudah mengerjakan soal tersebut.
Kelemahan dan metode ini adalah bahwa pengetes pekerjaannya berat karena harus
menyusun dua seri tes. Lagi pula harus tersedia waktu yang lama untuk mencobakan dua kali
tes.
b. Metode tes ulang (test retest method)
Metode tes ulang dilakukan orang untuk menghindari penyusunan dua seri tes. Dalam
menggunakan teknik atau metode ini pengetes hanya memiliki satu seri tes tetapi dicobakan
dua kali. Oleh karena tasnya hanya satu dan dicobakan dua kali, maka metode ini dapat disebut
dengan single-test-double trial method. Kemudian hasil dari kedua kali tes tersebut dihitung
korelasinya. Untuk tes yang banyak mengungkap pengetahuan (ingatan) dan pemahaman. cara
ini kurang mengena karena tercoba akan masih ingat akan butir-butir soalnya. Oleh karena itu,
tenggang waktu antara pemberian tes pertama dengan kedua menjadi pemasalahan tersendiri.
Jika tenggang waktu terlalu sempit, siswa masih banyak ingat materi. Sebaliknya kalau
tenggang waktu terlalu lama, maka faktor-faktor atau kondsi tes sudah akan berbeda, dan siswa
sendiri barangkali sudah mempelajari sesuatu. Tentu saja faktor-faktor ini akan berpengaruh
pula terhadap reliabilitas.
Untuk tes yang banyak mengungkap pengetahuan (ingatan) dan pemahaman, cara ini
kurang mengena karena tercoba akan masih ingat akan butir-butir soalnya. Oleh karena
tenggang waktu akan pemberian tes pertama dengan kedua menjadi permasalahan tersendiri.
jika tenggang waktu terlalu sempit, siswa masih banyak ingat materi. Sebaliknya kalau
tenggang waktu terlalu lama, maka faktor-faktor atau kondisi tes sudah akan berbeda, dan
siswa sendiri barangkali sudah mempelajari sesuatu. Tentu saja faktor-faktor ini akan
berpengaruh pula terhadap reliabilitas.
Pada umumnya hasil tes yang kedua cenderung lebih baik daripada hasil tes pertama.
Hal ini tidak mengapa karena pengetes harus sadar akan adanya pragtice effect dan carry over
effect. Yang penting adalah adanya kesejajaran hasil atau ketetapan hasil yang ditunjukkan oleh
koefisien korelasi yang tinggi.
Tes pertama Tes kedua
Siswa Skor Rangking Skor Rangking
A 15 3 20 3
B 20 1 25 1
C 9 5 15 5
D 18 2 23 2
E 12 4 18 4

Walaupun tampak skornya naik, akan tetapi kenaikan dialami semua siswa. Metode ini juga
23
disebut self coleration metodh (kolerasi diri sendiri) karena mengkolerasikan dari hasil tes yang
sama.
c. metode belah dua atau spilt-half metodh
Kelemahan penggunaan metode dua tes dua kali percobaan dan satu tes dua kali
percobaan diatasi dengan motode ketiga ini yaitu metode belah dua. Dalam menggunakan
metode ini pengetes hanya menggunakan sebuah tes yang dicibakan satu kali. Oleh karena itu
juga disebut singel test singel trial metodh.
Berbeda dengan metode bentuk paralel dan tes ulang, metode belah dua hanya
menggunakan sebuah tes dan dicobakan satu kali. Metode ini disebut juga single-test-trial-
method. Untuk mengetahui reliabelitas seluruh tes harus digunakan rumus Spearman-Brown
Ada dua cara membelah butir soal, yaitu:
2𝑟1/2
𝑟11 =
1 + 𝑟1/2
Dimana:
𝑟1/2 ; korelasi antara skor-skor setiap belahan tes
𝑟11 : koefisien realibilitas yang sudah disesuaikan
a. Membelah item-item genap dan item-item ganjil yang selanjutnya disebut belahan
ganjil-genap.
b. Membelah item-item awal dan item-item akhir yaitu separuh jumlah pada nomor-nomor
awal dan separuh jumlah nomor-nomor akhir.
Contoh
No Nama Nomor Item Skor 1,3,5,7 2,4,6,8 1,2,3,4 5,6,7,8
1 2 3 4 5 6 7 8 Total Ganjil Genap Awal Akhir
1 Fatih 1 1 0 1 0 0 1 1 5 2 3 3 2
2 Aditya 1 1 1 1 1 1 1 0 7 4 3 4 3
3 Zahra 1 1 0 0 1 0 1 0 4 3 1 2 2
4 Abbas 1 0 0 1 1 0 1 1 5 3 2 2 3
5 Adela 1 1 1 0 1 1 1 0 6 4 2 3 3
Pembelahannya hanya memilih salah satu saja, kemudian dihitung dengan korelasi product
moment.
a. Pembelahan ganjil-genap.
No Nama 1,3,5,7 2,4,6,8 Ʃxy 1,3,5,7 2,4,6,8
Ganjil Genap Ganjil Genap
(x) (y) (x2) (y2)

1 Fatih 2 3 6 4 9
2 Aditya 4 3 12 16 9
3 Zahra 3 1 3 9 1
4 Abbas 3 2 6 9 4
5 Adela 4 2 8 16 4
Ʃ 16 11 35 53 27

Selanjutnya dihitung dengan rumus korelasi product moment.

24
Setelah dihitung dengan rumus korelasi product moment dengan angka kasar diketahui bahwa
rxy = -0,479. Nilai tersebut baru menunjukkan reliabilitas separuh tes. Oleh karena itu,
kemudian dihitung reliabilitas instrumen dengan rumus Spearman-Brown.[3]
2𝑟𝑥𝑦
r11 = 1+ 𝑟𝑥𝑦
2(−0,479)
r11 = 1−(−0,479)
−0,958
= 1,479
= 0,676

b. Pembelahan awal-akhir.
Menggunakan rumus Flanagan
Sebelum menggunakan rumus Flanagan, kita harus menganalisis butir dengan teknik belah
dua.
𝑉1−𝑉2
r11 = 2 (1 - )
𝑉𝑡
r11 = reliabilitas instrumen
V1 = varians belahan pertama
V2 = varians belahan kedua
Vt = varians skor total
Untuk semua varians rumusnya adalah : 𝑆 2 (∑ 𝑋)2
∑ 𝑋2 −
= 𝑁
𝑁

Dengan menggunakan tabel analisis butir yang disajikan untuk perhitungan dengan rumus
Spearman-Brown diketahui harga:
V1 = 3,6399
V2 = 4,8099
V3 = 7, 4899
Maka data tersebut dimasukkan ke rumus
2(1−3,6399−4,8099)
r11 =
7,4899
= 2 x 1,1483
= 0,2966

Apabilah harga r11 ini dikonsultasikan dengan tabel product moment ternyata hasilnya lebih
kecil dari harga rt yang diharapkan, maka dapat disimpulkan bahwa instrumen tersebut tidak
reliabel.

2.8.4 Faktor -Faktor yang Mempengaruhi Reliabilitas

Koefisien reliabilitas dapat dipengaruhi di antaranya oleh waktu penyelenggaraan tes-


retes. Interval penyelenggaraan yang terlalu dekat atau terlalu jauh, akan memengaruhi
koefisien rehabilitas. Faktor-faktor lain yang juga mempengaruhi reliabilitas instrumen
evaluasi di antaranya sebagai berikut.
a. Panjang tes; semakin panjang suatu tes evaluasi, semakin banyak jumlah item materi
pembelajaran diukur. Ini menunjukkan dua kemungkinan, yaitu a) tes semakin

25
mendekati kebenaran, dan b) dalam mengikuti tes. semakin kecil siswa menebak.
Berani akan semakin tinggi nilai kersien reliabililas.
b. Penyebaran skor; koefisien reliabilitas secara langsung dipengamhi oleh bentuk
sebaran skor dalam kelompok siswa yang diukur. Semakin tinggi sebaran, semakin
tinggi estimasi koefisien reliabilitas (Gronlund 1990: 94). Hal ini terjadi karena posisi
skor siswa secara individual mempunyai kedudukan sama pada tes-retes lain, sebagai
acuan.
c. Kesuliatan tes: tes normatif yang terlalu mudah atau terlalu sulit untuk siswa,
cenderung menghasilkan skor reliabialitas rendah. Fenomema tersebut, akan
menghasilkan sebaran skor yang cenderung terbatas pada salah satu sisi. Untuk tes yang
terlalu mudah skor jawaban siswa akan mengumpul pada sisi atas, misalnya 9 atau 10.
Untuk tes yang terlalu sulit, skor. Jawaban siswa akan cenderung mengumpul pasa
ujung sebaliknya, atau rendah. Dua gejala tersebut mempunyai kesamaan yaitu bahwa
perbedaan di antara individu adalah kecil dan cenderung tidak relevan.
d. Objektifitas; yang dimaksud dengan objektif yaitu derajat dimana siswa dengan
kompetensi sama, mencapai hasil sama. Ketika prosedur tes memiliki objektifitas
tinggi, maka relibilitas hasil tes tidak di pengaruhi oleh prosedur teknik penskroan. Item
tes skor objektif yang di hasilkan tidak di pengaruhi pertimbangan atau opini dari
seorang evaluator.

2.9 Analisis Butir Soal

2.9.1 Taraf Kesukaran

Bilangan yang menunjukkan sukar dan mudahnya suatu soal disebut indeks
kesukaran (difficulty index). Besarnya indeks kesukaran antara 0,0 sampai 1,0.
Indeks kesukaran ini menunjukkan kesukaran soal. Soal dengan kesukaran 0,0
menunjukkan bahwa soal itu terlalu sukar, sebaliksnya indeks 1,0 menunjukkan
soalnya terlalu mudah. Di dalam istilah evaluasi, indeks kesukaran diberi symbol P
𝐵
singkatan dari proporsi. Rumus mencari P adalah: 𝑃 = 𝐽𝑆
Dimana:
P = indeks kesukaran
B = Banyaknya siswa menjawab soal dengan benar
JS = Jumlah seluruh siswa yang mengikuti tes

2.9.2 Daya Pembeda


Daya pembeda soal adalah kemampuan suatu soal untuk membedakan antara
siswa yang pandai (berkemampuan tinggi) dengan siswa yang bodoh
(berkemampuan rendah). Angka yang menunjukkan besarnya daya pembeda disebut
indeks diskriminasi, disingkat dengan D. Seperti halnya indeks kesukaran, indeks
diskriminasi (daya pembeda) ini berkisar antara 0,00 sampai 1,00. Hanya bedanya,
indeks kesukaran tidak mengenal tanda negative, sedabngkan pada indeks
diskrimanasi ada tanda negative. Tanda negative pada indeks diskriminasi digunakan
jika suatu soal “terbalik” menunjukkan kualitas test.
26
Jika suatu soal dapat dijawab benar oleh siswa pandai maupun yang bodoh,
maka soal itu tidak baik karena tidak mempunyai daya pembeda dan kebalikannya.
Cara menentukan daya pembeda yaitu:
• Untuk kelompok kecil
Seluruh kelompok test dibagi dua sama besar, 50% kelompok atas dan
50% kelompok bawah. Dengan terlebih dahulu Menyusun nilai para siswa
dari yang paling besar sampai paling kecil untuk mendapatkan proporsi.
• Untuk kelompok besar
Mengingat biaya dan waktu untuk menganalisis, maka untuk kelompok
besar biasnaya hanya diambil kedua kutubnya saja, yaitu 27% skor teratas
sebagai kelompok atas (𝐽𝐴 ) dan 27% skor terbawah sebagai kelompok
bawah 𝐽𝐵 Rumus untuk menentukan indeks diskriminasi adalah:
𝐵𝐴 𝐵𝐵
𝐷= − = 𝑃𝐴 − 𝑃𝐵
𝐽𝐴 𝐽𝐵
Dimana:
𝐽 = jumlah peserta tes
𝐽𝐴 = banyaknya pesrta kelompok atas
𝐽𝐵 = banyaknya peserta kelompok bawah
𝐵𝐴 = banyaknya peserta kelompok atas yang menjawab benar
𝐵𝐵 = banyaknya peserta kelompok bawah yang menjawab benar
𝑃𝐴 = Indeks kesukaran soal peserta kelompok atas yang menjawab benar
𝑃𝐵 = indeks kesukaran soal peserta kelompok bawah yang menjawab benar
Menurut ketentuannya yang sering diikuti, indeks daya pembeda sering
diklasifikasikan sebagai berikut:
• 0.0 ≤ 𝐷 ≤ 0.20 : Jelek
• 0.21 ≤ 𝐷 ≤ 0.40 : Cukup
• 0.41 ≤ 𝐷 ≤ 0.70 : Baik
• 0.71 ≤ 𝐷 ≤ 1.00 : Sangat Baik

27
BAB III
PENUTUP

3.1 Kesimpulan
Tujuan pemberian tes adalah untuk mengetahui penguasaan peserta didik pada
kompetensi/sub kompetensi tertentu setelah diajarkan.
Pembatasan materi adalah usaha yang dilakukan untuk menetapkan batasan dari
materi tes yang akan dibuat. Batasan materi ini bertujuan untuk mengidentifikasi apa
saja yang termasuk dalam ruang lingkup materi tes dan faktor mana saja yang tidak
termasuk dalam ruang lingkup materi tes yang akan dibuat. Kosep dasar dalam
menulis tes biasanya terdiri dari definisi, tujuan, tahapan dan lain sebagainya yang
berkaitan dengan penulisan tes, seperti pendapat-pendapat para ahli tentang menulis
tes.
Untuk mengatahui keberhasilan belajar tersebut terdapat beberapa indikatoryang
dapat dijasikan petunjuk bahwa proses belajar mengajar tersebut dianggap berhasil
atau tidak.
Kisi-kisi adalah suatu format berbentuk matriks yang memuat informasi
untukdijadikan pedoman dalam menulis soal atau merakit soal menjadi tes.
Penyusunan kisi-kisi merupakan langkah penting yang harus dilakukan sebelum
penulisan soal. Kisi-kisi disusun berdasarkan tujuan penggunaan tes.
Penulisan butir-butir soal merupakan langkah penting dalam upaya
pengembangan alat ukur kemampuan atau tes yang baik. Penulisan soal adalah
penjabaran indikator jenis dan tingkat perilaku yang hendak diukur menjadi
pertanyaan-pertanyaan yang karakteristiknya sesuai dengan perinciannya dalamkisi-
kisi.

3.2 Saran
Demikian makalah yang dapat kami susun , semoga bermanfaat dan memberikan
tambahan pengetahuan kita sebagai calon pendidik agar dapat memahami arti dan
manfaat perencanaan dalam pendidikan.

28
DAFTAR PUSTAKA

A. Frisbie, L. Ebel Robert. 1991. Essentials of Educational Measurement. Prentice Hall:


Michigan University
Arikunto, S. (2010). Dasar-Dasar Evaluasi Pendidikan. Jakarta: Bumi Aksara.

Azwar, S. (2012). Reliabilitas dan Validitas. Yogyakarta: Pustaka Pelajar.

Diponegoro, U. (2006). Jurnal Psikologi. Jurnal Psikologi, 1.

Mulyadi. (2010). Evaluasi Pendidikan. Malang: UIN-Maliki Press.

Sukardi. (2012). Evaluasi Pendidikan Prinsip dan Operasionalnya. Jakarta: Bumi Aksara

Surapranata, Sumarna. 2005. Panduan Penulisan Tes Tertulis Implementasi Kurikukum 2004.
Bandung: Remaja Rosdakarya.

Sudijono, Anas. 2001. Pengantar Evaluasi Pendidikan. Jakarta: Raja Grafindo Jaya.

29
30

Anda mungkin juga menyukai