Anda di halaman 1dari 17

Kata Pengantar

Makalah ini disusun sebagai tugas mata kuliah Assesment dan Evaluasi
Pendidikan.Mata Kuliah ini diampu oleh Prof.Dr.Syafri Anwar, M.Pd, Dr Khairani,
M.Pd dan Dr. Ishak Aziz, M.Pd .
Adapun tujuan dari makalah ini, di samping memberikan pehamanan kepada
kami sebagai penyaji, juga sebagai bahan diskusi bagi teman teman di Lokal B pada
Hari Selasa Pukul 13.20, yang didampingi oleh Dosen sehingga arahan dan
bimbingan dalam topik ini bisa lebih dipahami.
Tes adalah salah satu instrument dalam menentukan penilaian.Sehingga hal hal
yang berada dalam ruang lingkup tes ini menjadi perlu dipahami. Salah satunya ialah
tentang apa ciri butir tes itu? dan bagaimana analisis dan korelasi butir tersebut?
Menjawab tiga pertanyaan di atas, akan disajikan pada Bab II Pembahasan. Di
mana pada bagian Bab II itu, akan dirinci atas tiga sub bab yang masing masingnya
menguraikan tentang topik makalah ini.Semoga bermanfaat untuk kita semua.Amin.

Padang, 14 November 2017


Penyusun

1
I. PENDAHULUAN

Tes sebenarnya adalah salah satu wahana program penelitian pendidikan.


Sebagai salah salah satu alat penilaianyang biasanya didefenisikan sebagai
kumpulan butir soal yang jawabannya dapat dinyatakan dengan benar salah. Apabila
tes itu sudah dipersiapkan dan dilaksanakan dengan secermat dan sebaik mungkin,
maka informasi yang dihasilkannya dapat menunjukkan sejauh mana tujuan-tujuan
intruksional yang telah ditetapkan itu tercapai.
Informasi dan data dari pelaksanaan tes tersebut, juga dapat menunjukkan
beberapa karakteristik perilaku peserta didik, dalam arti apa yang telah mereka
kuasai dan apa yang belum mereka kuasai. Selain itu informasi tersebut dapat di
jadikan balikan untuk meningkatkan dan menyempurnakan proses belajar-mengajar
yang telah dilakukan, serta mempertimbangkan tindakan apa yang selanjutnya akan
dilakukan.
Secara teoritis, siswa dalam satu kelas merupakan populasi atau kelompok
yang keadaanya heterogen. Dengan demikian maka apabila dikenai sebuah tes akan
tercermin hasilnya dalam suatu kurva normal. Sebagian besar siswa berada didaerah
sedang, sebagian kecil berada di ekor kiri, kurva dan sebagian kecil yang lain berada
di sekor kanan.
Apabila keadaan setelah hasil tes dianalisa tidak seperti yang diharapkan dalam
kurva normal, maka tentu ada apa-apa dengan soal tesnya.Seterusnya apabila hampir
seluruh siswa memperoleh skor jelek, berarti bahwa tes yang disusun mungkin
terlalu sukar.Sebaliknya jika seluruh siswa memperoleh skor baik, dapat diartikan
bahwa tesnya terlalu mudah. Tentu saja interpretasi terhadap soal tes akan lain
seandainya tes itu sudah disusun sebaik-baiknya sehingga memenuhi persyaratan tes.
Dengan demikian kita memperoleh keterangan tentang hasil tes, akan membantu kita
dalam penilaian secara obyektif terhadap tes yang kita susun

2
II. PEMBAHASAN

A. Ciri Butir Tes


Bermutu tidaknya sebuah penilaian akan sangat tergantung dari tes.
Selanjutnya, bermutu tidaknya sebuah tes juga sangat ditentukan oleh mutu butir tes
itu sendiri.
Ada ciri utama yang harus dimiliki oleh suatu tes, yaitu (1) valid, (2) reliable
dan (3) usable.Valid berarti butiran soal tersebut benar benar akurat untuk maksud
yang ingin dicapai. Selanjutnya, reliable ialah bagaimana suatu tes mampu
menunjukan konsiten hasil pengukuran yang terlihat dalam taraf ketetapan dan
ketelitian hasil dan usable ialah menjawab pertanyaan apakah butir itu bisa
digunakan atau tidak (Masidjo, 1995 : 205)
Tes yang baik harus memenuhi beberapa persyaratan, dan ini bisa menjadikan
cirri terhadap suatu tes yang berimplikasi pada mutu penilaian. Beberapa hal itu
ialah :
(1) Efisien (parsimony);
(2) Harus baku (standardize);
(3) Mempunyai norma;
(4) Objektif;
(5) Valid (sahih); dan
(6) Reliabel (andal).

Untuk mengukur masing masing item di atas, dilakukan beberapa metode


yang dalam pelaksanaan itu, disebut dengan analisis butir. Pada bagian berikut akan
disajikan sub bab analisis butir.

3
B. Analisis Butir
Yang dimaksud analisis butir soal ini adalah suatu kegiatan yang dapat
membantu meningkatkan kebaikan suatu tes.Kita mencoba menganalisis tingkat
kebaikan suatu tes dengan melihat tingkat kebaikan tiap-tiap butir soalnya.
Suatu tes yang baik berarti tes tersebut memiliki butir-butir soal yang baik
pula. Tujuan utama analisis butir soal ini adalah untuk meningkatkan validitas dan
reliabilitas tes itu sendiri secara keseluruhan, sebab validitas dan reliabilitas suatu tes
tergantung kepada ciri-ciri butir-butir soalnya.
Analisis tes dapat dilakukan dengan jalan menentukan/menghitung:
1. Validitas butir tes (r butir);
2. Indeks kesukaran/tingkat kesulitan;
3. Daya pembeda;
4. Pengecoh (distractor);
5. Validitas tes; dan
6. Reliabilitas tes.
Butir soal merupakan perangkat utama dalam sistem penilaian terhadap siswa
di sekolah.Untuk itu sangat penting menentukan mana soal-soal yang cacat atau tidak
berfungsi penggunaannya. Pendidik perlu meningkatkan kualitas butir soal melalui
analisis terhadap tiga komponen utama yang meliputi
(1) Ttingkat kesukaran,
(2) Daya pembeda, dan
(3) Pengecoh soal.

Kegiatan menganalisis butir soal merupakan proses pengumpulan,


peringkasan dan penggunaan informasi dari jawaban siswa untuk membuat
keputusan tentang setiap penilaian (Nitko, 1996). Adapun tujuan analisis butir soal
itu dapat diuraikan sebagai berikut :
Mengkaji dan menelaah setiap butir soal agar diperoleh soal yang bermutu
sebelum digunakan.

4
Membantu meningkatkan kualitas tes melalui revisi atau membuang soal
yang tidak efektif
Mengetahui informasi diagnostik pada siswa, sudahkan mereka memahami
materi yang telah diajarkan
Manfaat analisis butir soal :
Membantu para pengguna tes dalam evaluasi atas tes yang digunakan
Sangat relevan bagi penyusunan tes informal dan lokal (seperti tes yang
disiapkan guru di kelas)
Mendukung penulisan butir soal yang efektif
Secara materi dapat memperbaiki tes di kelas
Meningkatkan validitas dan reliabilitas soal
Menentukan apakah suatu fungsi butir soal sesuai dengan yang diharapkan
Memberi masukan kepada siswa tentang kemampuan dan sebagian dasar
untuk bahan diskusi di kelas
Memberi masukan kepada guru tentang kesulitan siswa
Memberi masukan pada aspek tertentu untuk pengembangan kurikulum
Merevisi materi yang dinilai atau diukur
Meningkatkan keterampilan penulisan soal
Ada dua jenis analisis butir soal yang dapat pendidik laksanakan, yaitu :
1. Analisis secara kualitatif, prosedur peningkatan secara judgement, terkait
dengan isi dan bentuk soal
2. Analisis secara kuantitatif, prosedur peningkatan secara empirik, terkait
dengan ciri-ciri statistiknya

Analisis Secara Kualitatif


Pengertian
Penelaahan ini biasanya dilakukan sebelum soal digunakan/diujikan (tes
tertulis, perbuatan, dan sikap)

5
Aspek yang ditelaah : segi materi, konstruksi, bahasa/budaya, dan kunci
jawaban/pedoman penskorannya
Bahan penunjang : bahan-bahan penunjang seperti: (1) kisi-kisi tes, (2)
kurikulum yang digunakan, (3) buku sumber, dan (4) kamus bahasa
Indonesia.

Teknik analisis
1. Teknik moderator merupakan teknik berdiskusi yang di dalamnya terdapat
satu orang sebagai penengah. Berdasarkan teknik ini, setiap butir soal
didiskusikan secara bersama-sama dengan beberapa ahli dan dimoderatori
oleh satu orang.

Kelebihan : Setiap butir soal dapat dituntaskan secara bersama-sama,


perbaikannya seperti apa

Kelemahan : Teknik ini adalah memerlukan waktu lama untuk rnendiskusikan


setiap satu butir soal.

2. Teknik panel merupakan suatu teknik menelaah butir soal yang setiap butir
soalnya ditelaah berdasarkan kaidah penulisan butir soal. Para penelaah
dipersilakan memperbaiki langsung pada teks soal dan memberikan
komentarnya serta memberikan nilai pada setiap butir soalnya yang
kriterianya adalah: baik, diperbaiki, atau diganti.

Prosedur analisis
Untuk mempermudah prosedur pelaksanaan dapat menggunakan format
penelahaan soal yang digunakan sebagai dasar untuk menganalisis setiap butir soal.

6
Analisis Secara Kuantitatif
Pengertian
Penelaahan butir soal didasarkan pada data empirik dari butir soal terkait yang telah
diujikan.
Pendekatan analisis

Klasik
Analisis butir soal secara klasik adalah proses penelaahan butir soal melalui
informasi dari jawaban peserta didik guna meningkatkan mutu butir soal yang
bersangkutan dengan menggunakan teori tes klasik.

Kelebihan : mudah, murah, sederhana, familier digunakan guru-guru,dapat


menggunakan data sampel kecil.

Kelemahan :
(1) Tingkat kemampuan dalam teori klasik adalah true score. Jika tes sulit
artinya tingkat kemampuan peserta didik mudah.Jika tes mudah artinya
tingkat kemampuan peserta didik tinggi.
(2) Tingkat kesukaran soal didefinisikan sebagai proporsi peserta didik dalam
grup yang menjawab benar soal. Mudah/sulitnya butir soal tergantung pada
kemampuan peserta didik yang dites dan kemampuan tes yang diberikan.
(3) Daya pembeda, reliabilitas, dan validitas soal/tes didefinisikan berdasarkan
grup peserta didik.

Modern
Penelaahan butir soal dengan menggunakan Item Response Theory (IRT) atau
teori jawaban butir soal.Teori ini merupakan suatu teori yang menggunakan fungsi
matematika untuk menghubungkan antara peluang menjawab benar suatu soal
dengan kemampuan siswa.

7
IRT merupakan hubungan antara probabilitas jawaban suatu butir soal yang
benar dan kemampuan siswa atau tingkatan/level prestasi siswa.
Kelebihan :
(1) asumsi banyak soal yang diukur pada trait yang sama, perkiraan tingkat
kemampuan peserta didik adalah independen;
(2) asumsi pada populasi tingkat kesukaran, daya pembeda merupakan
independen sampel yang menggambarkan untuk tujuan kalibrasi soal;
(3) statistik yang digunakan untuk menghitung tingkat kemampuan siswa
diperkirakan dapat terlaksana
Kelemahan : prosesnya cukup rumit dan sulit

1. Taraf Kesukaran Butir Soal.


Proporsi tingkat kesukaran butir soal yang mudah, sedang dan sukar masing-
masing adalah 27%, 46% dan 27%.Makin sukar atau semakin mudah suatu butir soal
hendaknya merupakan bagian yang makin sedikit jumlahnya. Secara tentatif dapat
dikatakan bahwa salah satu ciri butir soal yang baik adalah bahwa ia tidak terlalu
sukar dan tidak terlalu mudah untuk kelompok tertentu yang akan di tes.
Soal yang mudah tidak merangsang siswa untuk mempertinggi usaha untuk
memecahkannya.Sebaliknya soal yang terlalu sukar akan menyebabkan siswa
menjadi putus asa dan tidak mempunyai semangat untuk mencoba lagi karena diluar
jangkauannya.
Tingkat kesukaran butir soal dapat pula diuji secara rasional, yakni dengan
melihat kawasan atau domain yang diukur oleh butir soal yang bersangkutan. Secara
rasional, suatu butir soal dapat dipandang mudah bila mengukur fakta-fakta atau
bersifat recall, dapat dipandang sedang kalau butir soal tersebut menanyakan atau
mengukur aspek pemahaman (comprehension), dan jika menanyakan atau menuntut
siswa menerapkan prinsip-prinsip, dalil-dalil dan kemampuan yang lebih tinggi maka
butir soal tersebut dapat dipandang sukar.

8
Analisis rasional seperti ini akan menghadapi kesulitan dalam menentukan
butir-butir soal mana yang mengukur atau mengungkapkan kawasan-kawasan
dimaksud, oleh karena itu akan sulit menentukan butir soal mana yang mudah,
sedang atau sukar untuk kelompok tertentu. Namun demikian, analisis semacam ini
sangat membantu dalam menentukan tingkat kesukaran butir soal, terutama pada
tahap perencanaan dan penyusunan tes hasil belajar, sebelum diujicobakan.
Bilangan yang menunjukan sukar dan mudahnya suatu soal disebut Indeks
Kesukaran (difficulty index).Besarnya indeks kesukaran antara 0,00 0,01. Indeks
kesukaran ini menunjukan taraf kesukaran soal 0,0 0,1.
Di dalam istilah evaluasi, indeks kesukaran ini diberi simbol P (p besar) yang
merupakan singkatan dari proporsi. Dengan demikian maka soal dengan P = 0,70
lebih mudah jika dibandingkan dengan P = 0,20.
Rumus mencari P adalah:
P = B/JS
Keterangan:
P = Indeks kesukaran
B = Banyaknya siswa yang menjawab soal itu dengan betul.
JS = Jumlah seluruh siswa peserta tes.
Menurut ketentuan yang sering diikuti, indeks kesukaran sering
diklasifikasikan sebagai berikut :
Soal dengan P 1,00 sampai 0,30 adalah soal sukar.
Soal dengan P 0,30 sampai 0,70 adalah soal sedang.
Soal dengan P 0,70 sampai 1,00 adalah soal mudah.

2. Daya Pembeda Butir Soal.


Ciri lain dari butir soal yang baik adalah bahwa butir soal itu dapat
membedakan antara siswa yang pandai dan yang kurang pandai antara kaitannya
dengan butir-butir soal lainnya yang terdapat pada tes yang bersangkutan, atau
dengan tolak ukur lainnya.

9
Hal ini dikenal dengan daya pembeda butir soal atau validitas butir soal.Angka
yang menunjukan besarnya daya pembeda disebut indeks diskriminasi, disingkat D
(d besar).
-1.00 0,00 1,00
Tanda negatif pada indeks diskriminasi digunakan jika suattu soal terbalik
menunjukan kualitas test. Yaitu anak pandai disebut bodoh dan sebaliknya.Bagi
suatu soal yang dapat dijawab benar oleh siswa pandai maupun siswa bodoh, maka
soal itu tidak baik karena tidak mempunyai daya pembeda.Begitupun sebaliknya jika
siswa tidak dapat menjawab dengan benar.
Soal yang baik adalah soal yang dapat dijawab benar oleh siswa-siwa yang
pandai saja.Seluruh pengikut tes dikelompokkan menjadi 2 kelompok yaitu
kelompok pandai atau kelompok atas (upper group) dan kelompok bodoh atau
kelompok bawah (lower group).
Nilai D 1,00 = kelompok atas menjawab soal dengan benar dan kelompok
bawah menjawab salah

Nilai D -1,00 = Merupakan kebalikan nilai D 1,00


Nilai D 0,00= Jika sama-sama tidak bisa menjawab dengan
benar, karena tidak mempunyai daya pembeda
sama sekali.
Cara menetukan daya pembeda (nilai D)
Untuk ini perlu dibedakan antara kelompok kecil (kurang dari 100) dan
kelompok besar (100 orang keatas).
Untuk kelompok kecil
Seluruh kelompok testee dibagi 2 sama besar, 50% kelompok bawah dan 50%
kelompok atas.
Untuk kelompok besar.

10
Mengingat biaya dan waktu untuk menganalisa, maka untuk kelompok besar
biasanya hanya diambil kedua kutubnya saja, yaitu 27% skor teratas sebagai
kelompok atas (JA) dan 27% terbawah sebagai kelompok terbawah (JB).
Rumus mencari D :

D =B/JA-BB/JB=PA-PB

J = jumlah peserta tes.


JA = banyaknya peserta kelompok atas.
JB = banyaknya peserta kelompok bawah
BA = banyaknya peserta kelompok atas yang menjawab soal itu dengan benar.
BB = banyaknya peserta kelompok bawah yang menjawab soal itu dengan benar
PA = BA/JA = proporsi peserta kelompok atas yang menjawab benar (ingat, P
sebagai indeks kesukaran)
PB = BB/JB = proporsi peserta kelompok bawah yang menjawab benar.

3. Fungsi Pengecoh
Apabila dilihat strukturnya tes bentuk pilihan ganda berisi permasalahan yang
akan ditanyakan dan sejumlah kemungkinan jawaban atau option.Kemungkinan
jawaban itu dibagi dua yaitu kunci jawaban dan pengecoh atau distractor
(Surapranata, 2004).
Menurut Azwar (1987) efektivitas distraktor dapat dilihat dari dua kriteria,
yaitu (1) distraktor dipilih oleh peserta tes dari kelompok rendah, dan (2) pemilih
distraktor tersebar relatif proporsional pada masing-masing distraktor yang ada.
Lebih lanjut Surapranata (2004) suatu pengecoh dapat dikatakan berfungsi
baik jika paling sedikit dipilih oleh 5% peserta tes. Apabila pengecoh dipilih secara
merata, maka termasuk pengecoh yang sangat baik. Apabila pengecoh lebih banyak
dipilih oleh peserta tes dari kelompok atas dibandingkan dengan kelompok bawah,
maka termasuk pengecoh yang menyesatkan.

11
Masrun (1975) mengemukakan distribusi jawaban dapat diketahui:
1. Banyaknya peserta tes yang menjawab betul,
2. Pengecoh yang bagi peserta tes terlalu mencolok kesalahannya sehingga tidak
ada yang memilih sebagai jawaban betul,
pengecoh yang menyesatkan, dan
3. Pengecoh yang mempunyai daya tarik bagi peserta tes yang kurang pandai.

4. Validitas dan Reliabilitas


Ada langkah yang dilakukandalam menghitung validitas butir (r butir), yaitu :
1.Tabel skor diurutkan dari total skor terbesar ke terendah
2. Setiap butir soal dihitung r nya dangan rumus:

Keterangan:
0,8 r 1 sangat tinggi
0,6 r 0,79 tinggi
0,4 r 0,59 cukup
0,2 r 0,39 rendah
0,0 r 0,19 rendah sekali (Suharsimi, 2003).

Apabila hasil perhitungan validitas butir untuk soal tertentu diperoleh r butir
(r hitung) lebih besar bila dibandingkan dengan r tabel pada taraf signifikansi 5%
dan dk n-1 berarti soal tersebut valid.Perhitungan serupa dilakukan untuk semua soal
yang ada.Dari sejumlah soal yang ada maka kemungkinan terdapat beberapa soal
yang tidak valid.
Validitas

12
Instrumen, baik tes maupunyang non tesharus:
(1) Memiliki bukti kesahihan (validitas) dan keandalan (reliabilitas);
(2) Hasilnya dapat dibandingkan, dan
(3) Ekonomis.

Tes yang baik, harus dibuat sedemikian rupa sehingga mudah digunakan.
Validitas merupakan dukungan bukti dan teori terhadap penafsiran skor tes sesuai
dengan tujuan penggunaan tes. Validitas merupakan fundamen paling dasar dalam
mengembangkan dan mengevaluasi suatu tes. Validitas adalah penafsiran skor tes
seperti yang tercantum pada tujuan penggunaan tes, bukan tes itu sendiri.
Apabila skor tes digunakan ditafsirkan lebih dari satu makna, setiap
penafsiran/pemaknaan harus divalidasi.Kesahihan isi dilihat dari kisi-kisi, yaitu
matrik yang menunjukkan bahan tes serta tingkat berpikir yang terlibat.Kesahihan
ditelaah sebelum tes digunakan. Terdapat 3 bentuk kesahihan yakni :

Kesahihan konstrak dari hasil analisis faktor


Kesahihan konstrak hasil penggunaan tes, yaitu data empirik
Kesahihan prediktif data empirik untuk dapat menghitung.

Contoh:
1. Mengetahui berat cincin emas mengg. timbangan emas agar hasilnya
valid.
2. Menghitung waktu tempuh (kota ke kota) cukup mengg. jam tangan, tetapi
untuk mengukur waktu seorang atlit pelari 100 meter?
3. Jika ingin mengukur kemampuan bahasa seseorang, maka harus ada definisi
tentang bahasa Tes TOEFL
4. Valid untuk mengukur apa, valid bagi siapa
Di dalam bidang ilmu sosial dan psikologi kata validitas atau kesahihan
digunakan sekurang-kurangnya dalam tiga konteks, yaitu:

13
(A) validitas penelitian (research validity),
(B) validitas soal (item validity), dan
(C) validitas alat ukur atau tes (test validity).

Validitas penelitian mengandung dua sisi, yaitu: (1) validitas internal, dan (2)
validitas eksternal. Validitas internal penelitian mempersoalkan kesesuaian antara
data hasil penelitian dengan keadaan yang sebenarnya Validitas Internal digunakan
untuk menjawab pertanyaan apakah penelitian sudah menggunakan konsep yang
seharusnya (actually). Terdapat 3 jenis validitas, yakni :
1. Content Validity
2. Criterion-related validity
3. Construct validity

Validitas internal biasanya membantu mengatasi kelemahan validitas


eksternal.Bila data yang dicapai dapat digeneralisasi kesemua objek, situasi dan
waktu yang berbeda.

Langkah dalam melakukan uji validitas dan reliabilitas internal adalah sebagai
berikut:
1. Cobalah item di lapangan kepada paling sedikit 30 orang responden (batas
sampel besar dalam statistik)
2. Tabulasi data yang telah masuk
3. Ujilah validitas dan reliabilitasnya

Uji validitas dilakukan dengan mengkorelasikan skor item dengan skor total.
Korelasi Rank Spearman jika data yang diperoleh adalah data ordinal, sedangkan jika
data yang diperoleh data interval kita bisa menggunakan korelasi Product Moment.
-Sedangkan uji reliabilitas yang paling sering digunakan adalah uji,
Cronbach Alpha, Hoyt dan Spearman Brown

14
Reliabilitas adalah ukuran yang menunjukkan ketetapan alat evaluasi
mengukur sesuatu yang diukur. Macam-macam cara untuk menentukan reliabilitas
suatu test, seperti test-retest, bentuk-bentuk ekuivalen (equivalent forms), metode-
metode membagi dua (splithalf methods). Jika alat ukur telah dinyatakan valid, maka
selanjutnya reliabilitas alat ukur tsb diuji.Reliabilitas adalah suatu nilai yang
menunjukkan konsistensi suatu alat pengukur di dalam mengukur gejala yang sama.
Untuk mengukur reliabilitas suatu test buatan peneliti perlu menggunakan
cara yang lebih singkat sebagai berikut. Andaikan kita mengadakan test 80 anak
dalam materi pelajaran matematika. Jika rata-rata hitungnya adalah 50, dan standar
deviasinya adalah 7. Kemudian hitunglah reliabilitas itu dengan rumus.

Dimana :
r = reliabilitas test
n = banyak soal dalam test itu
a = standar deviasi dari nilai-nilai (angka-angka) dari test
M = rata-rata hitung dari nilai-nilai (angka-angka) dari test
Maka, r = 0,62

Jadi test itu reliabilitasnya adalah 0,62 yang berarti tidak begitu tinggi. Kita
perlu juga meneliti dan mengganti (bila diperlukan) suatu alat evaluasi yang terlalu
sukar atau terlalu mudah. Biasanya guru yang berpengalaman secara intuitif dapat
melihat mana soal yang terlalu sukar dan mana soal yang terlalu mudah bagi tingkat
tertentu. Soal-soal yang terlalu sukar, rata-rata hitung nilai-nilainya rendah,
sebarannya (rangenya) berkisar di sekitar nilai yang rendah.

15
Sedangkan soal-soal yang terlalu mudah rata-rata hitung nilainya tinggi dan
sebarannya berkisar di sekitar nilai-nilai yang tinggi (besar). Tetapi agar kita lebih
yakin dapat melihat mana soal yang terlalu sukar atau terlalu mudah dapat digunakan
rumus indeks kesukaran:

Dimana :
I.K. = indeks kesukaran
Nb = banyaknya anak pada kelompok baik yang menjawab benar
Nj = banyaknya anak pada kelompok jelek yang menjawab benar
N = banyaknya anak dari kelompok baik atau jelek (25%)

16
III. KESIMPULAN

Tujuan utama analisis butir soal ini adalah untuk meningkatkan validitas dan
reliabilitas tes itu sendiri secara keseluruhan, sebab validitas dan reliabilitas suatu tes
tergantung kepada ciri-ciri butir-butir soalnya.Dengan analisis butir soal dapat
diketahui butir-butir soal mana yang perlu diperbaiki atau direvisi dan dibuang atau
diganti, serta butir-butir soal mana yang dapat digunakan.
Dengan butir-butir soal yang memenuhi syarat, maka validitas dan reliabilitas
tes dapat ditingkatkan.Analisis butir soal ini dapat dilakukan secara kualitatif dan
kuantitatif.Yang termasuk dalam analisis secara kuantitaif ini maliputi pengukuran
tingkat kesukaran dan daya pembeda butir soal.

17

Anda mungkin juga menyukai