Anda di halaman 1dari 14

1

BAB I
PENDAHULUAN

A. Latar Belakang
Analisis kualitas tes merupakan suatu tahap yang harus ditempuh untuk
mengetahui derajat kualitas suatu tes. Baik tes secara keseluruhan maupun butir
soal yang menjadi bagian dari tes tersebut. Dalam penilaian hasil belajar, tes
diharapkan dapat menggambarkan sampel perilaku dan menghasilkan nilai yang
objektif serta akurat. Jika tes yang digunakan guru kurang baik maka hasil tes
yang diperoleh tentunya kurang baik. Dalam artian hasil yang diperoleh peserta
didik menjadi tidak objektif dan tidak adil.
Oleh sebab itu, tes yang digunakan guru harus memiliki kualitas yang lebih
baik dilihat dari berbagai segi. Tes hendaknya disusun sesuai dengan prinsip dan
prosedur penyusunan tes. Setelah digunakan perlu diketahui apakah tes tersebut
berkualitas baik atau kurang baik. Untuk mengetahui apakah suatu tes yang
digunakan termasuk baik atau kurang baik maka perlu dilakukan analisis kualitas
tes.
Dalam menilai dan menganalisis tes ada beberapa hal yang perlu diperhatikan
yang berkaitan dengan analisis hasil tes tersebut. Dalam makalah ini akan
diuraikan tentang Analisis hasil tes, yaitu reliabilitas butir soal, daya pembeda,
tingkat kesulitan/kesukaran soal dan keberfungsian distraktor/pengecoh selain itu
akan di bahas juga tentang kelompok unggul dan asor, korelasi skor butir dengan
skor total dan rekap analisis butir yang ada dalam sofware Anates ini.
B. Rumusan Masalah
Berdasarkan latar belakang di atas dapat diambil suatu rumusan masalah
sebagai berikut:
1. Bagaimana menentukan Reliabilitas butir soal ?
2. Bagaimana menentukan kelompok unggul dan asor ?
3. Bagaimana menghitung daya pembeda ?
4. Bagaimana menghitung tingkat kesukaran/kesulitan ?
5. Bagaimana menentukan korelasi skor butir dengan skor total ?
6. Bagaimana menghitung keberfungsian Distraktor/pengecoh ?
7. Bagaimana Rekap analisis butir soal dalam software Anates ?
1

C. Tujuan
Berdasarkan rumusan masalah di atas, maka tujuannya adalah:
1. Mengetahui bagaimana menentukan Reliabilitas butir soal
2. Mengetahui bagaimana menentukan kelompok unggul dan asor.
3. Mengetahui bagaimana menghitung daya pembeda.
4. Mengetahui bagaimana menghitung tingkat kesukaran/kesulitan.
5. Mengetahui tingkat signifikansi korelasi skor butir dengan skor total.
6. Mengetahui bagaimana menghitung keberfungsian Distraktor/pengecoh.
7. Mengetahui rekap analisis butir soal dalam Anates.

3
BAB II
PEMBAHASAN

A. Reliabilitas Butir Soal.


1. Reliabilitas
Menurut Sugiono (2005), Reliabilitas adalah serangkaian pengukuran atau
serangkaian alat ukur yang memiliki konsistensi bila pengukuran yang dilakukan
dengan alat ukur itu dilakukan secara berulang. Tujuan utama reliabilitas untuk
mengetahui tingkat ketepatan dan keajegan skor tes. Indeks reliabilitas berkisar
antara 0 sampai dengan 1. Semakin tinggi koefisien reliabilitas suatu tes
(mendekati 1) maka semakin tinggi pula keajegan atau ketepatannya, Kusairi
(2012).
Kondisi itu ditengarai dengan konsistensi hasil dari penggunaan alat ukur
yang sama yang dilakukan secara berulang dan memberikan hasil yang relatif
sama dan tidak melanggar kelaziman. Untuk pengukuran subjektif, penilaian yang
dilakukan oleh minimal dua orang bisa memberikan hasil yang relatif sama
(reliabilitas antar penilai). Pengertian Reliabilitas tidak sama dengan pengertian
validitas. Artinya pengukuran yang memiliki reliabilitas dapat mengukur secara
konsisten, tapi belum tentu mengukur apa yang seharusnya diukur.
2. Pengukuran Reliabilitas
Sifat reliabilitas dari sebuah instrumen berhubungan dengan sejauh mana
kemampuan alat ukur itu memberikan hasil yang konsisten dari satu even
percobaan ke even percobaan lainnya. Jika konsistensi pengukuran itu tidak kita
peroleh dalam setiap pengukuran, dapat dibayangkan bila pengukuran yang
dilakukan dengan instrumen itu memberikan hasil yang berbeda dari pengukuran
satu ke pengukuran berikutnya. Saat ini kita memperoleh hasil pengukuran berat
badan seseorang adalah 70 kg. Beberapa saat kemudian, meskipun dengan alat
ukur yang sama kita memperoleh hasil 73 kg. Demikian seterusnya, hasilnya tidak
pernah konsisten. Data yang kita peroleh tidak pernah konsisten dari waktu ke
waktu. Pertanyaan yang akan muncul dari benak kita adalah hasil pengukuran
mana yang kita gunakan?
Dalam kajian teoritis, reliabilitas adalah sejauh mana pengukuran dari suatu
uji coba yang dilakukan tetap memiliki hasil yang sama meskipun dilakukan
3

4
secara berulang-ulang terhadap subjek dan dalam kondisi yang sama. Instrumen
alat ukur dianggap bisa diandalkan apabila memberikan hasil yang konsisten
untuk pengukuran yang sama dan tidak bisa diandalkan bila pengukuran yang
dilakukan secara berulang-ulang itu memberikan hasil yang relatif tidak sama.
Pengujian reliabilitas instrumen untuk memperoleh hasil yang reliabel bisa
dilakukan dengan berbagai metode statistik.
Contoh lain adalah misalnya saja dalam sebuah kesempatan kita ingin
mengukur panjang dan lebar tiga (3) buah lapangan bola volley. Alat yang
digunakan dalam pengukuran itu adalah meteran dan jangkauan langkah. Setelah
dilakukan pengukuran, bisa dipastikan bahwa pengukuran yang dilakukan dengan
menggunakan meteran memperoleh hasil panjang dan lebar yang relatif sama
terhadap ketiga lapangan bola volley itu. Sedangkan pengukuran yang dilakukan
dengan menggunakan jangkauan langkah terhadap ketiga lapangan bola volley itu,
menghasilkan satuan ukur, yakni panjang dan lebar yang berbeda.
B. Menentukan Kelompok Unggul dan Asor
Dari tes yang dilaksanakan terhadap peserta didik maka dari hasil tes tersebut
akan menghasilkan variasi nilai siswa yang berbeda beda, ada sekelompok siswa
yang memperoleh nilai tertinggi di banding peserta didik lain, ada yang
mendapatkan nilai sedang dan ada pula yang mendapatkan nilai rendah dari hasil
tes tersebut.
Kelompok siswa yang mendapatkan nilai tertinggi dalam tes inilah yang
dimaksud dengan kelompok unggul, sedangkan sekelompok siswa yang
mendapatkan nilai terendah dalam tes dinamakan kelompok asor.
Cara menghitung kelompok unggul dan asor
27% x N (jumlah siswa)
Contoh :
Misalnya banyak data N = 38
Maka 27% x 38
= 0,27 x 38
= 10,26 dibulatkan menjadi 10.
Sehingga dari 38 siswa yang menjadi kelompok unggul dan kelompok Asor
masing-masing berjumlah 10 orang.
4

5
C. Daya Pembeda Soal.
1. Daya pembeda
Daya Pembeda Soal adalah kemampuan sesuatu soal untuk membedakan
antara siswa yang pandai (berkemampuan tinggi) dengan siswa yang kurang
pandai (berkemampuan rendah).
Angka yang menunjukkan besarnya daya pembeda disebut indeks
diskriminasi, disingkat D (d besar). Seperti halnya indeks kesukaran, indeks
diskriminasi (daya pembeda) ini berkisar antara 0, 00 sampai 1,00. Hanya
bedanya, indeks kesukaran tidak mengenal tanda negative (-), tetapi pada indeks
diskriminasi ada tanda negatif. Tanda negatif pada indeks diskriminasi digunakan
jika sesuatu soal Terbalik menunjukkan kualitas test. Yaitu anak pandai disebut
bodoh dan anak bodoh disebut pandai.
Dengan demikian ada tiga titik pada daya pembeda, yaitu :
-1,00
Daya (-)

0,00
Daya (rendah)

1,00
Daya (+)

Bagi suatu soal yang dapat dijawab benar oleh siswa pandai maupun siswa
bodoh, maka soal itu tidak baik karena tidak mempunyai daya pembeda.
Demikian pula jika semua siswa baik pandai maupun bodoh tidak dapat
menjawab dengan benar. Soal tersebut tidak baik juga karena tidak mempunyai
daya pembeda. Soal yang baik adalah soal yang dapat dijawab benar oleh siswasiswa yang pandai saja.
Seluruh pengikut tes dikelompokkan menjadi 2 kelompok, yaitu kelompok pandai
atau kelompok atas (upper group) dan kelompok kurang atau kelompok bawah
(lower group).
Jika seluruh kelompok atas dapat menjawab soal tersebut dengan benar, sedang
seluruh kelompok bawah menjawab salah, ,maka soal tersebut mempunyai D
paling besar, yaitu 1, 00. Sebaliknya jika semua kelompok atas menjawab salah,
tetapi semua kelompok bawah menjawab betul, maka nilai D-nya -1,00. Tetapi
jika siswa kelompok atas dan siswa kelompok bawah sama- sama menjawab
benar atau Sama-sama menjawab salah, maka soal tersebut mempunyai nilai D
0,00. karena tidak mempunyai daya pembeda sama sekali.

6
2. Cara Menentukan Daya Pembeda (Nilai D)
Perhitungan daya pembeda adalah pengukuran sejauh mana suatu butir soal
mampu membedakan peserta didik yang sudah menguasai kompetensi dengan
peserta didik yang belum/kurang menguasai kompetensi berdasarkan kriteria
tertentu. Semakin tinggi koefisien daya pembeda suatu butir soal, semakin
mampu butir soal tersebut membedakan antara peserta didik yang menguasai
kompetensi dengan peserta didik yang kurang menguasai kompetensi. Untuk
menghitung daya pembeda setiap butir soal dapat digunakan rumus sebagai
berikut :
DP

B B
N
A

Keterangan :
DP = Indeks Daya Pembeda butir soal tertentu ( satu butir )
BA = jumlah jawaban benar pada Kelompok Atas (Unggul)
BB = jumlah jawaban yang benar pada Kelompok Bawah (Asor)
NA = jumlah siswa pada salah satu kelompok A atau B
Contoh :
Jumlah sampel (NA)

= 27% x 24 =6,48 = 6 (dibulatkan)

BA

=6

BB

=3

Jadi, Daya Pembedanya (DP)

x 100%

= 0,5 x 100%
= 50%
Untuk menginterpretasikan koefisien daya pembeda tersebut dapat
digunakan kriteria yang sebagai berikut (Craker dan Algina dalam Kusaeri:2012).
Daya Beda
Negatif 9%

Keterangan
sangat buruk, harus dibuang

10% - 19%

buruk, sebaiknya dibuang

20% -29%

sedang, kemungkinan perlu direvisi

30% - 49%

Baik

50% keatas

sangat baik

7
D. Menghitung Tingkat Kesukaran
Soal yang baik adalah soal yang tidak terlalu mudah atau tidak terlalu sukar.
Soal yang terlalu mudah tidak merangsang siswa untuk mempertinggi usaha
memecahkannya. Sebaliknya, soal yang terlalu sukar akan menyebabkan siswa
menjadi putus asa dan tidak mempunyai semangat untuk mencoba lagi karena
diluar jangkauannya. Seorang siswa akan menjadi hafal akan kebiasaan kebiasaan
gurunya dalam membuat soal. Misalnya saja guru A dalam memberikan ulangan
soalnya mudah-mudah, sebaliknya guru B kalau memberikan ulangan soalnya
sukar-sukar. Dengan pengetahuan-nya tentang kebiasaan ini, maka siswa akan
belajar giat jika menghadapi ulangan dari guru B dan sebaliknya. Jika siswa akan
menghadapi ulangan dari guru A, tidak mau belajar giat atau bahkan mungkin
tidak mau belajar sama sekali.
Bilangan yang menunjukan sukar dan mudahnya sesuatu soal disebut indek
kesukaran. Indek kesukaran soal diberi simbul P. Besarnya indeks kesukaran antar
0.00 1.0. Soal dengan indeks kesukaran 0.00, menunjukan bahwa soal itu terlalu
sukar, sebaliknya apabila indeks kesukaraanya 1.00 menunjukan bahwa soal itu
terlalu mudah. Untuk menghitung besaran indeks kesukaran soal dapat digunakan
rumus sebagai berikut :
Rumus : P =
Keterangan :
P = Indeks kesukaran
B = Banyaknya siswa yang menjawab soal dengan betul
Js = Jumlah seluruh siswa peserta tes
Di dalam pelaksanaan pengerjaan analisis butir soal, jawaban benar diberi
nilai 1 , dan untuk jawaban salah diberi nilai 0 . Sedangkan kriteria untuk
mengklasifikasikan indeks kesukarannya adalah sebagai berikut :
Soal dengan nilai P = 0.00 0.30 adalah soal sukar, P = 0.30 0.70 adalah
soal sedang dan soal dengan nilai P = 0.70 1;00 adalah soal mudah. Contoh
pengerjaanya dapat dilihat pada table dihalaman berikut :

8
Siswa

Nomor Soal

Skor
Siswa

3 4 5

6 7

9 10 11 12 13 14 15 16 17 18 19 20

0 0 1

0 1

0 1

13

0 0 1

0 1

0 0

11

0 0 1

1 1

0 1

14

0 0 1

1 0

0 0

0 0 1

0 1

0 1

14

0 1 1

1 0

0 0

0 1 0

0 1

0 1

13

0 1 0

0 1

0 0

1 1 1

0 1

0 1

17

1 1 1

0 1

0 0

13

0 0 0

0 1

0 1

10

1 0 0

1 0

0 0

0 0 1

0 1

1 1

13

1 0 1

1 1

0 1

16

0 0 1

0 1

1 1

12

0 1 1

1 1

0 0

10

0 0 0

0 0

0 1

0 1 1

0 1

0 1

11

0 1 1

0 1

1 0

14

0 1 1

0 1

0 0

10

Jumlah 10 14 4 6 15 6 16 17 3 11 10 18 20 10 9

11 14 13 13

Dalam referensi lain menghitung tingkat kesukaran dengan rumus :


TK

nBenar
x100%
N

Ket :
TK

= Tingkat Kesukaran

nBenar = jumlah siswa yang menjawab benar


N

= jumlah semua siswa / subjek

9
E. Korelasi skor butir dan skor total
Butir soal dalam tes yang yang memiliki korelasi tinggi dianggap sebagai soal
yang lebih baik dibandingkan dengan butir soal yang nilai korelasinya rendah.
Butir soal dikatakan signifikan atau bahkan sangat signifikan jika mempunyai
korelasi antara skor butir dengan skor totalnya 0,51 ke atas ( > 50).
Dengan demikian soal yang memiliki korelasi tinggi dianggap sebagai
signifikan untuk digunakan pada tes berikutnya, dan sebaliknya tes yang
memiliki korelasi rendah sebaiknya jangan digunakan pada masa yang akan
datang.
F. Menghitung keefektifan pengecoh
Pada soal bentuk pilihan-ganda, ada alternatif jawaban (opsi) yang
merupakan pengecoh. Butir soal yang baik, pengecohnya akan dipilih secara
merata oleh peserta didik yang menjawab salah. Sebaliknya, butir soal yang
kurang baik, pengecohnya akan dipilih secara tidak merata.
Pengecoh di anggap baik bila jumlah peserta didik yang memilih pengecoh
itu sama atau mendekati jumlah ideal. Indeks pengecoh dihitung dengan rumus :
IP =(

)/ (

Keterangan :

x 100%

IP = Indeks Pengecoh
P = Jumlah peserta didik yang memilih pengecoh
N = Jumlah peserta didik yang ikut tes
B = Jumlah peserta didik yang menjawab benar pada setiap soal
n = Jumlah alternatif jawaban (opsi)
1 = bilangan tetap
Catatan :
Jika semua peserta didik menjawab benar pada butir soal tertentu (sesuai
kunci jawaban), maka IP = 0 yang berarti soal tersebut jelek. Dengan demikian,
pengecoh tidak berfungsi.
Contoh :
50 orang peserta didik di tes dengan 10 soal bentuk pilihan-ganda. Tiap
soal memiliki 5 alternatif jawaban (a, b, c, d dan e). Kunci jawaban (jawaban
yang benar) soal nomor 8 adalah c. Setelah soal nomor 8 diperiksa untuk
semua peserta didik, ternyata. Dari 50 orang peserta didik, 20 peserta didik
9

10
menjawab benar dan 30 peserta didik menjawab salah. Idealnya, .pengecoh
dipilih secara merata, artinya semua pengecoh secara merata ikut menyesatkan
peserta didik. Perhatikan contoh soal nomor 8 berikut ini:
Alternatif jawaban

Distribusi jawaban peserta didik

20

93%

107%

**

++

++

**

IP
Kualitas pengecoh

93% 107%
++

++

Keterangan :
**

= Kunci jawaban

++

= Sangat baik

= Baik

= Kurang baik

--

= Jelek

-- -- = Sangat Jelek
Pada contoh di atas, IP butir a, b, d, dan e adalah 93%, 107%,
93% dan 107%. Semuanya dekat dengan angka 100%, sehingga
digolongkan sangat baik sebab semua pengecoh itu berfungsi. Jika
pilihan jawaban peserta didik menumpuk pada satu alternatif jawaban,
misalnya seperti berikut:
Alternatif jawaban

Distribusi jawaban peserta didik

20

20

267%

27%

**

107%

0%

-- --

**

++

--

IP
Kualitas pengecoh

Dengan demikian, dapat ditafsirkan pengecoh (d) yang terbaik,


pengecoh (e) dan (b) tidak berfungsi, pengecoh (a) menyesatkan, maka
pengecoh (a) dan (e) perlu diganti karena termasuk jelek, dan
pengecoh (b) perlu direvisi karena kurang baik. Adapun kualitas
pengecoh berdasar indeks pengecoh adalah:
Sangat Baik

IP = 76% - 125%

Baik

IP = 51% - 75% atau 126% - 150%

Kurang Baik

IP = 26% - 50% atau 151% - 175%

Jelek

IP = 0% - 25% atau 176% - 200%

Sangat Jelek

IP = Lebih dari 200%


10

11
G. Rekap Analisis Butir Soal Dalam Anates
Pada rekap analisis butir soal dalam software Anates Menampilkan semua
hasil rekap tahap pengolahan data pada analisis butir soal. Salah satu yang harus
diperhatikan dalam rekap analisis butir soal adalah nilai rata-rata soal yang
merupakan jumlah skor dibagi jumlah siswa yang mengikuti tes.
Rata-rata soal dapat dibandingkan dengan rata-rata standar yang merupakan
nilai tengah dari jumlah soal. Misalnya terdapat 25 soal maka rata-rata standar
soal tersebut adalah 12,5 dari 25 soal. Terdapat hubungan antara rata-rata soal
dengan tingkat kesukaran soal secara umum, yaitu semakin tinggi rata-rata (di atas
rata-rata standar) maka tingkat kesukaran semakin mudah.

11

12
BAB III
PENUTUP

A. Kesimpulan
Analisis soal bertujuan untuk mengadakan identifikasi soal-soal yang baik,
kurang baik dan soal yang jelek. Dengan analisis soal dapat diperoleh informasi
tentang kejelekan sebuah soal dan petunjuk untuk mengadakan perbaikan.
Software Anates sangat membantu dalam menganalisis butir soal dan hasil tes
peserta didik sehingga di harapkan dari hasil analisis akan menciptakan soal-soal
tes yang lebih bermutu dan hasil analisis tes yang lebih tepat sehingga bisa
menjadi dasar pengambilan keputusan dalam evaluasi pendidikan.
B. Manfaat Anates
1. Untuk menganalisis data butir soal secara otomatis
2. Memeriksa jawaban benar dan salah secara cepat dan praktis
3. Penyekoran dan pemberian bobot
4. Mengetahui analisis butir soal yang meliputi: reliabilitas, kelompok unggul
dan asor, daya pembeda, tingkat kesukaraan, korelasi skor butir dengan skor
total dan kualitas pengecoh.
C. Keunggulan Anates
1. Dapat digunakan menganalisis butir soal bentuk uraian dan pilihan ganda.
2. Menganalisis butir soal pilihan ganda dan uraian dengan mudah dan cepat.
3. Perintah program mudah dipahami.
4. Program menggunakan bahasa Indonesia.
5. Hasil anates bisa langsung di cetak.
D. Kelemahan Anates
1. Pengisian data hanya dapat dilakukan secara manual.
2. Kesalahan memasukan data akan menurunkan nilainya pada hasil akhir.

12

13
Daftar Rujukan

Abdullah Shodiq. (2012). Evaluasi Pembelajaran Konsep dasar, Teori dan


Aplikasi. Semarang: Pustaka Rizki Putra
Arifin Zaenal. (2013). Evaluasi Pembelajaran. Bandung: Remaja Rosda Karya
Arikunto Suharsimi. (2013). Dasar-Dasar Evaluasi Pendidikan. Jakarta: Bumi
Aksara.
Basuki Ismet dkk. (2014). Asesmen Pembelajaran. Bandung: Remaja Rosda
Karya
Suprananto. & Kusaeri. (2012) Pengukuran dan Penilaian Pendidikan.
Yogyakarta: Graha Ilmu.
(online),(https://www.kuliah-fkip.umm.ac.id/anatest/PPT%20-20Anatest.pptx )
Diakses 21 Maret 2015
(Online),(http://anwarholil.blogspot.com/2009/01/menganalisis-butir-soal.html),
diakses 20 Maret 2015

13

14

ANALISIS HASIL TES DENGAN MENGGUNAKAN


SOFTWARE ANATES

Makalah
Untuk Memenuhi Tugas Mata Kuliah
Evaluasi Pembelajaran
Yang Dibina Oleh Bapak Dr. Eddy Sutadji, M.Pd

Oleh
Helisman
142103806857

Universitas Negeri Malang


Pascasarjana
Jurusan Pendidikan Dasar
Maret 2015

14

Anda mungkin juga menyukai