MAKALAH Analisis Soal Retno - 22176014

MAKALAH
EVALUASI PEMBELAJARAN KIMIA
Makalah ini Disusun Untuk Memenuhi Salah Satu Tugas Mata Kuliah Evaluasi
Pembelajaran Kimia
Oleh :
RETNO HARDILLAH
22176014
PROGRAM STUDI MAGISTER PENDIDIKAN KIMIA

FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM
UNIVERSITAS NEGERI PADANG
2023
KATA PENGANTAR
Puji dan syukur penulis ucapkan kehadirat Allah SWT, karena atas berkat
rahmat, nikmat dan karunia-Nya, sehingga penulis dapat menyelesaikan makalah
evaluasi pembelajaran ini dengan baik. Adapun makalah ini membahas mengenai
Analisis Soal . Shalawat beserta salam senantiasa tercurah untuk Rasulullah SAW.
Adapun tujuan dari pembuatan makalah ini adalah sebagai salah satu syarat
untuk melengkapi tugas mata kuliah evaluasi pembelajaran Semester Genap
Program Studi Pendidikan Kimia Program Pascasarjana Universitas Negeri Padang.
Pada kesempatan ini penulis ingin mengucapkan terima kasih banyak kepada dosen
pembimbing Dr. Andromeda, M.Si., serta rekan-rekan mahasiswa Program Studi
Pendidikan Kimia Program Pascasarjana Universitas Negeri Padang yang telah
memberikan bantuan serta dukungan sehingga penulis dapat menyelesaikan makalah
ini.
Akhirnya, tak ada gading yang tak retak. Penulis menyadari bahwa dalam
penulisan makalah ini masih terdapat kesalahan dan kekurangan. Oleh karena itu,
saran dan kritik yang bersifat konstruktif sangat penulis harapkan. Semoga makalah
ini dapat bermanfaat hendaknya. Atas kritik dan saran yang diberikan, penulis
ucapkan terima kasih.
Padang, Maret 2023
Penulis
DAFTAR ISI
Judul ...........................................................................................................................
Kata pengantar............................................................................................................
BAB I PENDAHULUAN
1.1 Latar Belakang .....................................................................................................1
1.2 Rumusan Masalah ................................................................................................2
1.3 Tujuan ..................................................................................................................3
BAB II PEMBAHASAN
2.1 Validitas ..............................................................................................................4
2.2 Realibilitas............................................................................................................7
2.3 Daya Beda ............................................................................................................10
2.4 Indeks Kesukaran ................................................................................................15
2.5 fungsi Distaktor.....................................................................................................16
BAB III PENUTUP
3.1 Kesimpulan...........................................................................................................19
DAFTAR PUSTAKA
BAB I
PENDAHULUAN
1.1 Latar Belakang

Pendidikan merupakan sebagai usaha sadar dan terencana dalam mewujudkan
proses pembelajaran pengetahuan, keterampilan, serta kebiasaan yang dilakukan suatu
individu untuk mengembangkan potensinya dan mencerdaskan generasi bangsa.
Dengan adanya pendidikan dapat berpengaruh untuk pertumbuhan dan perkembangan
manusia. Tanpa adanya pendidikan manusia akan kebingungan atas perkembangan
ayang ada di masyarakat.
Setiap manusia wajib untuk mendapatkan pendidikan, hal ini jelas
menegaskan bahwa pendidikan memiliki nilai yang sangat penting dalam proses
kehidupan. Sebagai mana yang dijelaskan dalam UU no. 20 thn 2003 pendidikan
adlaah usaha sadar dan terencana untuk mewujudkan suasana belajar dan proses
pembelajaran agar peserta didik secara aktif mengembangkan potensi dirinya untuk
memiliki kekuatan spritual keagamaan, pengendalian diri , kepribadian, kecerdasan,
akhlak mulia, serta keterampilan yang diperlukan dirinya, masyarakat, bangsa, dan
negara. Berdasarkan undang undang di atas sisdiknas menegaskan bahwa peserta
pendidikan harus secara sadar dalam mewujudkan proses pendidikan yang
didalamnya terdapat proses pembelajaran yang bertujuan agar ia dapat
mengembangkan kemampuan dalam dirinya serta kemampuan yang belum pernah ia
dapatnkan sebelumnya.
Dalam kegiatan evaluasi diperlukan alat atau teknik penilaian, sehingga
pelaksanaannya akan lebih terarah. Alat evaluasi dalam pendidikan yang digunakan
untuk mengumpulkan data dapat berupa tes atau non tes. Berkaitan dengan
pemahaman kita terhadap tes, Nurkancana dan surnartana menyatakan tes adalah
suatu cara untuk mengadakan penilaian yang berbentuk sauatu tugas atau serangkaian
tugas yang harus dikerjakan oleh siswa atau sekelompok siswa sehingga
menghasilkan nilai tentang tingkah laku atau prestasi siswa sebagai peserta didik.
Analisis butis soal merupakan suatu kegiatan yang harus dilakukan guru untuk
meningkatkan kualitas soal yang telah ditulis. Menurut Aiken (1994) dalam
Depdiknas (2008), tujuamm analsisi butir soal yaitu meningkatkan kualitas butir tes
dan mengetahui informasi diagnostik siswa. Soal yang berkualitas yaitu soal yang
1
dapat memberikan informasi setepatnya, sehingga dapat dieketahui siswa yang telah
menguasai materi dan yang belum.
Proses evaluasi merupakan salah satu sarana penting dalam meraih tujuan
pembelajaran. Salah satu metode yang dapat digunakan untuk melakukan proses
evaluasi pembelajaran adalah dengan melakukan ujian atau tes. Menurut thoha
(2001:43), tes adalah alat pengukuran berupa pertanyaan, perintah, dan petunjuk yang
ditunjukkan kepada teste untuk mendapatkan respon sesuai dengan petunjuk itu.
Alat penilaian atau tes merupakan salah satu komponen penting dalam
kegiatan pemebelajaran, yang tujuannya untuk mengetahui sejauh mana pembelajran
telah dicapai peserta didik. Oleh karena itu seorang pendidik atau guru dituntut
memiliki kemampuan dala merencanakan, menyusun dan membuat alat penilaian.
Namun, setelah membuat dan memberikan tes kepada peserta didik, jarang ada guru
yang melakukan evaluasi terhadap alat penilaian atau butir - butir tes tersebut.
Kebanyakkan guru hanya terfokus untuk mengevaluasi peserta didiknya tanpa
mengidentifikasi tingkat kesukaran, daya pembeda dan fungsi distraktor soal - soal
itu. Padahal, menurut sudijono (2009:369-370) identifikasi terhadap setiap butir item
tes hasil belajar itu dilakukan dengan harapan akan menghasilkan berbagai informasi
berharga, yang pada dasarnya akan merupakan umpan balik guna melakukan
perbaikan, pembenahan dan penyempurnaan kembali terhadap butir butir item yang
telah dikeluarkan dalam tes hasil belajar, sehingga pada massa- massa yang akan
datang tes hasil belajar yang disusun atau dirancang oleh tester (guru,dosen, dan lain
lain) itu betul - betul dapat menjalankan fungsinya sebagai alat pengukur hasil belajar
yang memiliki fungsi sebagai alat pengukur hasil belajar yang memiliki kualitas yang
tinggi.
1.2 Rumusan Masalah

Adapun rumusan masalah yang dilihat dari latar belakang yaitu :
1. Bagaimana menganalisis soal validitas
2. Bagaimana menganalsis soal realibilitas
3. Bagaimana indek kesukaran
4. Bagaimana daya beda
5. Bagaimana fungsi distraktor
2
1.3 Tujuan
Adapun tujuan pada makalah ini ialah:
1. Mengetahui analisis soal validitas
2. Mengetahui analisis soal reliabilitas
3. Mengetahui daya beda
4. Mengetahui indeks kesukaran
5. Mengetahui Fungsi distraktor
3
BAB II
PEMBAHASAN
2.1 Validitas
Uji validaitas adalah uji ketetapan atau ketelitian suatu alat ukur dalam mengukur
apa yang sedang ingin di ukur. Dalam pengertian yang mudah dipahamai, uji validitas adalah
uji yang bertujuan untuk menilai apakah seperangkat alat ukur sudah tepat.
Validitas merupakan produk dari validasi. Validasi adalah suatu proses yang
dilakukan oleh penyusun atau pengguna instrumen untuk mengumpulkan data secara empiris
guna mendukung kesimpulan yang dihasilkan oleh skor instrumen. Sedangkan validitas
adalah kemampuan suatu alat ukur untuk mengukur sasaran ukurnya. Contoh: mengukur
panas badan menggunakan termometer. Validitas adalah salah satu ciri yang menandai tes
hasil belajar yang baik. Validitas merupakan salah satu alat ukur yang digunakan untuk
mengukur kecermatan, ketepatan suatu produk.
Validitas digunakan untuk mengukur sah atau valid tidaknya suatu butir pertanyaan.
Skala butir pertanyaan disebut valid, jika sesuai dengan tujuan yang dimaksud dan mengukur
yang harus diukur. Jika skala tidak valid maka tidak bermanfaat bagi peneliti, sebab
tidak mencapai tujuan yang seharusnya. Untuk dapat menentukan apakah suatu tes hasil
belajar telah memiliki validitas atau daya ketepatan mengukur, dapat dilakukan dari dua segi,
yaitu dari segi tes itu sendiri sebagai suatu totalitas, dan dari segi itemnya, sebagai bagian
yang tidak terpisahkan dari tes tersebut (Sudijono, 2012).
Validitas sebuah tes dibedakan menjadi dua jenis, yaitu validitas logis dan validitas
empiris (Sudaryono, 2016). Validitas logis sama dengan analisis kualitatif terhadap sebuah
soal, yaitu menentukan berfungsi tidaknya suatu soal berdasarkan kriteria tertentu. Kriteria
yang diperhatikan dalam soal yaitu kriteria materi, kontruksi, dan bahasa. Validitas empiris
diartikan validitas yang ditentukan oleh kriteria internal dan kriteria eksternal. Kriteria
internal adalah tes atau instrumen itu sendiri yang menjadi kriteria, sedangkan kriteria
eksternal adalah hasil ukur instrumen atau tes lain diluar instrumen yang menjadi kriteria.
1) Validitas Logis
3
a. Pengujian Validitas Konstruk
Validitas konstruk adalah suatu alat ukur dikatakan valid apabila telah cocok dengan
konstruksi teoritik dimana tes tersebut dibuat. Instrumen yang mempunyai validitas konstruk
jika instrumen tersebut dapat digunakan untuk mengukur gejala sesuai dengan dengan yang
4
didefinisikan. Misalnya akan mengukur efektivitas kerja, maka perlu didefinisikan
terlebih dahulu apa itu efektivitas kerja. Setelah itu disiapkan instrumen yang
digunakan untuk mengukur efektivitas kerja sesuai dengan definisi.
Validitas konstruk biasa digunakan untuk instrumen 3 instrumen yang dimaksudkan
mengukur variabel konsep sikap, minat, konsep diri, lokus kontrol, gaya
kepemimpinan, motivasi berprestasi, dan lain 3lain. Sebuah tes memilki validitas
konstruk apabila soal pertanyaan mengukur aspek berpikir.
Untuk menguji validitas konstruk, maka dapat digunakan pendapat ahli. Setelah
instrumen dikonstruksikan tentang aspek-aspek yang akan diukur, dengan berlandaskan teori
tertentu, maka selanjutnya dikonsultasikan dengan ahli. Para ahli diminta pendapatnya
tentang instrumen yang telah disusun itu. Jumlah tenaga ahli yang digunakan minimal
tiga orang, dan umumnya mereka telah bergelar doktor sesuai dengan lingkup yang diteliti.
Setelah pengujian konstruk dengan ahli, maka diteruskan dengan uji coba instrumen. Setelah
data ditabulasi, maka pengujian validitas konstruk dilakukan dengan analisis faktor, yaitu
dengan mengkorelasikan antar skor item instrument.
b. Pengujian Validitas Isi (Content)
Validitas isi adalah tes yang mencerminkan keseluruhan konten atau materi yang
diujikan atau yang seharusnya dikuasai secara proporsional (Sudaryono, 2016). Validitas isi
sering digunakan dalam penilaian hasil belajar. Tujuan utamanya yaitu untuk
mengetahui sejauh mana peserta didik menguasai materi apa yang telah disampaikan,
dan perubahan psikologis apa yang dialami peserta didik setelah mendapatkan
pengalaman belajar (Sary, 2018).
Instrumen yang harus memiliki validitas isi adalah instrumen yang digunakan untuk
mengukur prestasi belajar dan mengukur efektivitas pelaksanaan program dan tujuan. Untuk
menyusun instrumen prestasi belajar yang mempunyai validitas isi, maka instrumen
harus disusun berdasarkan materi pelajaran yang telah diajarkan. Sedangkan instrumen
yang digunakan untuk mengetahui pelaksanaan program, maka instrumen disusun
berdasarkan program yang telah direncanakan.
Untuk instrumen yang berbentuk tes, maka pengujian validitas isi dapat dilakukan
dengan membandingkan antara isi instrumen dengan materi pelajaran yang telah
diajarkan. Jika dosen memberikan ujian di luar pelajaran yang telah ditetapkan, berarti
5
instrumen ujian tersebut tidak mempunyai validitas isi. Validitas isi suatu tes tidak
mempunyai besaran tertentu yang dihitung secara statistika, tetapi dipahami bahwa tes itu
sudah valid berdasarkan telaah kisi-kisi tes.
Secara teknis, pengujian validitas konstruksi dan validitas isi dapat dibantu dengan
menggunakan kisi-kisi instrumen. Dalam kisi-kisi itu terdapat variabel yang diteliti, indikator
sebagai tolok ukur, dan nomor butir (item) pertanyaan atau pernyataan yang telah dijabarkan
dari indikator. Dengan kisi-kisi instrumen itu, maka pengujian validitas dapat
dilakukan dengan mudah dan sistematis.
2) Validitas Empiris
Mengandung arti kata pengalaman. Sebuah instrument dikatakan memiliki

validitas empiris apabila sudah di uji dengan pengalaman. Sebagai contoh, seseorang
dapat diakui jujur oleh masyarakat lain apabila dalam pengalaman dia diakui memang
jujur. Pada Validitas empiris terdiri dari dua cara yang dilakukan untuk mengujinya
sehingga dia menjadi valid. Pengujian itu dilakuakn dengan membandingkan kondisi
instrumen yang bersangkutan dengan suatu ukuran.
a. Validitas Konkuren
Disebut juga dengan validitas “yang ada sekarang ‘tetapi lebih dikenal dengan
validitas empiris. Sebuah instrument dikatakan memiliki validitas empiris jika
hasilnya sesuai dengan pengalaman. Jika ada istilah :sesuai” tentu ada dua hal yang
dipasangkan, dimana dalam hal ini hasil tes dipasangkan dengan hasil pengalaman.
Pengalaman selalu mengenai hal yang telah lampau sehingga data pengalaman
tersebut sekarang sudah ada.
Dalam membandingkan hasil sebuah tes maka diperlukan suatu alat pembanding.
Maka hasil tes merupakan sesuatu yang dibandingkan. Contoh : seorang guru ingin
mengetahui apakah tes sumatif yang disusun sudah valid atau belum. Untuk ini perlu
sebuah kreteria masa lalu yang datanya sekarang dimiliki. Misalnya nilai ulangan
harian atau nilai semester yang lalu.
b. Validitas prediksi
Validitas ramalan adalah suatu kondisi yang menunjukkan seberapa jauhkah

sebuah tes telah dapat dengan cara yang tepat menunjukkan kemampuannya
untuk meramalkan apa yang akan terjadi dimasa yang akan datang. Salah satu
6
contoh tes memilki validitas ramalan yaitu tes seleksi penerimaan mahasiswa baru pada sebuah
perguruan tinggi, suatu tes yang diharapkan mampu meramalkan keberhasilan studi calon mahasiswa
dalam mengikuti program pendidikan di perguruan tinggi tersebut dimasa yang akan datang.
Suatu tes hasil belajar dikatakan memilki validitas ramalan atau belum, dapat ditentukan dengan
cara: mencari korelasi antara hasil belajar yang sedang diuji ramalannya dengan kriterium yang ada.
Jika antara kedua variabel tersebut terdapat korelasi positif yang signifikan, maka hasil belajar yang
sedang diuji validitas ramalannya itu memilki daya ramalan tepat sesuai dengan telah terjadi didunia
nyata.
2.2 Reliabilitas
Reliabilitas berasal dari terjemahan dari kata reliability yang mempunyai asal kata
rely dan ability. Bila digabungkan, kedua kata tersebut akan mengerucut kepada pemahaman
tentang kemampuan alat ukur untuk dapat dipercaya dan menjadi sandaran pengambilan
keputusan (Purwanto, 2018). Reliabilitas adalah suatu nilai yang menunjukkan konsistensi
suatu alat pengukur di dalam mengukur gejala yang sama. Suatu instrumen dikatakan reliabel
jika instrumen tersebut dapat menghasilkan data penelitian yang konsisten, karena dengan
konsisten sebuah data dapat dipercaya kebenarannya. Jadi sebuah instrumen dapat dikatakan
reliabel jika menghasilkan data yang sama dalam waktu yang berbeda asalkan karakteristik dari
subjek adalah sama.
Reliabilitas berhubungan dengan kemampuan alat ukur untuk melakukan pengukuran
secara cermat. Reliabilitas merupakan akurasi dan presisi yang dihasilkan oleh alat ukur
dalam melakukan pengukuran (sitoyo dan sodik, 2015).
Dua konsep penting dalam uji reliabilitas data yaitu reliabilitas alat ukur dan
reliabilitas hasil ukur. Reliabilitas alat ukur berkaitan dengan masalah eror pengukuran, eror
pengukuran merujuk pada ketidak konsistenan hasil pengukuran jika instrumen penelitian
digunakan untuk mengukur pada kolompok subjek yang sama. Sementara itu reliabilitas hasil
ukur merujuk pada eror dalam pengambilan sampel subjek, ketidak konsistenan hasil ukur
yang dilakukan secara berulang pada sampel subjek yang berbeda dari populasi yang sama
(Azwar, 2012).
7
Data yang reliabel merupakan kunci dalam sebuah penelitian, karena dari data lah
analisis dan kesimpulan dibuat. Jika data yang digunakan adalah data yang handal maka hasil
dari sebuah penelitian akan memuaskan, begitu sebaliknya. Menurut Azwar (2012)
Reliabilitas berhubungan dengan akurasi instrumen dalam mengukur apa yang diukur,
kecermatan hasil ukur dan seberapa akurat seandainya dilakukan pengukuran ulang.
Realibilitas sebagai konsistensi pengamatan yang diperoleh dari pencatatan berulang baik
pada satu subjek maupun sejumlah subjek.
Kerlinger memberikan batasan tentang reliabilitas yaitu :
1. Reliabilitas dicapai apabila kita mengukur himpunan objek yang sama berulang kali
dengan instrumen yang sama atau serupa akan memberikan hasil yang sama atau
serupa.
2. Reliabilitas dicapai apabila ukuran yang diperoleh dari suatu instrumen pengukur
adalah ukuran yang sebenarnya untuk sifat yang diukur.
3. Reliabilitas dicapai dengan meminimalkan galag pengukuran yang terdapat pada
suatu instrumen pengukuran yang terdapat pada suatu instrumen pengukur.
Reliabilitas instrumen dinyatakan dengan koefisien reliabilitas. Instrumen yang reliable
adalah instrumen yang memiliki koefisien reliabilitas minimal 0,70. Sebaiknya koefisien
reliabilitas instrumen 0,80 atau lebih. Koefisien reliabilitas instrumen dihitung dengan
menggunakan rumus tertentu.
Pada tes belajar bentuk objektif, ada tiga macam metode yang dapat digunakan untuk
menentukan taraf reliabilitas.
a) Metode atau teknik ulangan (test-retest method) atau single test-double trial method.
Instrumen penelitian test-retest dilakukan dengan cara mencobakan instrumen dua

kali pada responden. Jadi dalam hal ini instrumennya sama, respondennya sama, dan
waktunya yang berbeda. Reliabilitas diukur dari koefisien korelasi antara percobaan pertama
dengan yang berikutnya. Bila koefisien korelasi positif dan signifikan maka instrumen
tersebut reliable. Pengujian cara ini sering juga disebut stability, yaitu seberapa stabil skor
yang diperoleh individu apabila dilakuakn pengujian dalam waktu yang berbeda. Rumus
yang dapat digunakan untuk menentukan reliabiltas test dengan metode test-retest antara lain
adalah Product Momen Correlation. Yaitu sebagai berikut:
8
X = skor test pertama
Y = skor test kedua
N = jumlah peserta tes
Cara lain yang dapat digunakan dengan teknik tes retes ini adalah tekinik korelasi rank- order
dari Spearmen menggunakan rumus :
ρ = koefisien korelasi
D = difference (beda antara rank skor hasil tes I dengan rank skor hasil tes II)
N = banyaknya peserta tes.
b) Metode Belah Dua (split-half method) atau Single Test Single Trial Method
Dalam menggunakan metode ini pendidik atau evaluator hanya menggunnakan

sebuah tes dan dicobakan satu kali. Oleh sebab itu disebut juga singel-test-singel-trial
method. Pada metode ini tes yang diberikan dibagi/dibelah menjadi dua bagian. Jumlah
item yang diberikan harus genap sehingga dapat dibagi dua dan tiap kelompok memiliki
jumlah item/butir soal yang sama jumlahnya.
Untuk menentukan reliabilitas seluruh tes dapat digunakan rumus Spearman-Brown
sebagai berikut:
Rumus Spearman Brown:

Dimana:
korelasi antara skor-skor setiap belahan tes

koefisien reliabilitas tes.
9
Cara lain yang juga dapat digunakan pada metode singel-test-singel-trial adalah formula
Rulon, Flanagan, Kuder-Richardson, Hoyt.
c) Metode Bentuk Paralel atau Metode Double Test Double Trial
Pada metode ini dipergunakan dua buah tes yang mempunyai kesamaan tujuan,
tingkat kesukaran, dan susunan, tetapi butir-butir soal berbeda. Pengujian reliabilitas
dengan cara ini cukup dilakukan sekali, tetapi instrumennya dua, pada responden yang
sama, waktu yang sama, instrumen berbeda. Reliabiltas instrumen dihitung dengan cara
mengkorelasikan antara data instrumen yang satu dengan data instrumen yang dijadikan
equivalen. Bila koefisien korelasi positif dan signifikan maka instrumen tersebut reliable.
Kelemahan dari metode ini adalah kesukaran dalam penyusunan item yang parallel
dengan item pada tes pertama, selain itu juga membutuhkan biaya yang lebih mahal dan
memakan waktu yang lebih lama.
Rumus yang dapat digunakan untuk menentukan reliabilitas dengan metode parallel
ini adalah Product Moment Correlation dan Rank Order Correlation.
Pengujian reliabilitas tes bentuk uraian tidak dapat dilakukan seperti contoh di atas. Butir
soal uraian menghendaki gradualisasi penilaian. Barangkali butir soal nomor 1 penilaian
terendah adalah 0 dan penilaian tertinggi adlah 10, tetapi soal nomor 2 mungkin diberi nilai
tertinggi hanya 5 dan butir soal nomor 3 penilaian tertinggi misalnya 5 dan sebagainya.
Keterangan:
∑σ2i = jumlah varians skor tiap-tiap item

σ2t = varians total
2.3 Daya Beda

Daryanto(2010:183) menjelaskan bahwa daya pembeda soal adalah kemampuan sesuatu
soal untuk membedakan antara siswa yang pandai (berkemampuan tinggi) dengan siswa yang
bodoh (berkemampuan rendah). Adapun menurut Sudjiono(2009:386), mengetahui daya pembeda
item itu penting sekali, sebab salah satu dasar yang dipegangi untuk menyusun butir butir item tes
10
hasil belajar adalah adanya anggapan, bahwa kemampuan anatara teste yang satu dengan teste
yang lain itu berbeda beda, dan bahwa butir butir item tes hasil belajar itu haruslah mampu
memberikan hasil tes yang mencerminkan adanya perbedaan perbedaan kemampuan yang terdapat
di kalangan teste tersebut. Pembeda soal adalah kemampuan suatu soal untuk membedakan siswa
yang memiliki kemampuan tinggi dengan siswa yang memiliki kemampuan rendah.
Daya pembeda butir soal adalah kemampuan suatu butir soal untuk membedakan
kelompok dalam aspek yang diukur sesuai dengan perbedaan yang ada dalam kelompok itu.
Salah satu tujuan analisis daya pembeda butir soal adalah untuk menentukan mampu tidaknya
suatu butir soal membedakan antara peserta pelatihan yang berkemampuan tinggi dengan
peserta pengujian yang berkemampuan rendah. Daya pembeda pada dasarnya dihitung atas
dasar pembagian peserta pelatihan ke dalam dua kelompok, yaitu kelompok Atas yaitu
kelompok yang tergolong pandai, dan kelompok Bawah, yaitu kelompok siswa yang
tergolong tidak pandai.
Dalam hubungan ini, jika sebuah butir soal memiliki angka indeks diskriminasi butir soal
dengan tanda positif, hal ini merupakan petunjuk bahwa butir soal tersebut telah memiliki
daya pembeda, dalam arti bahwa peserta yang termasuk kategori pandai lebih banyak
yang dapat menjawab dengan benar terhadap butir soal yang bersangkutan, sedangkan
peserta yang termasuk kategori tidak pandai lebih banyak yang menjawab salah. Klasifikasi daya
pembeda ditentukan berdasarkan angka indeks diskriminasi (D) butir soal.
11
Angka 0,3 merupakan angka kriteria minimal suatu butir soal yang baik (Mardapi
dalam Rasyid dan Mansur 2007). Untuk menghitung indeks diskriminasi, maka langkah
pertama yang harus dilakukan adalah membagi peserta ke dalam 2 kelompok, yaitu kelompok
Atas, yakni kelompok peserta yang memperoleh skor tinggi, dan kelompok Bawah, yaitu
kelompok peserta yang memperoleh skor rendah. Langkah pertama yang dilakukan untuk
menghitung indeks kesukaran adalah mengoreksi lembar jawaban peserta dan untuk jawaban
yang benar diberi skor 1, sedangkan untuk jawaban yang salah diberi skor 0
Contoh daya beda untuk kelompok kecil :
12
Seluruh pengikut tes dideretkan mulai dari skor teratas sampai kepada skor terendah, lalu di bagi
dua. Rumus Mencari Daya Pembeda menurut Daryanto ( 2005, 186) yaitu :
13
Dari angka yang belum teratur tersebut kemudian dibuat urutan penyebaran, dari
skor yang paling tinggi ke skor yang paling rendah.
Uraian ini menunjukkan adanya kelompok atas ( JA) dan kelompok bawah ( JB). Pada
uraian di atas dapat ditunjukkan kelompok A dan B. Dan hal ini mempermudah menentukan BA
dan BB.
Dimana :
BA = Banyaknya siswa yang menjawab benar pada kelompok atas A

dan BB = banyaknya siswa yang menjawab benar pada kelompok bawah
B
Seperti yang diketahui, soal yang baik adalah soal yang dapat membedakan antara anak
berkemampuan tinggi dengan anak berkemampuan rendah, dilihat dari dapat atau tidaknya ia
mengerjakan soal tes.
Bila diperhatikan tabel diatas, dilihat khusus untuk butir soal no satu, dari kelompok atas
yang menjawab benar adalah 8 orang, dari kelompok bawah yang menjawab betul adalah 3
orang. Dan diterapkan rumus daya pembeda maka :
Dengan demikian maka daya pembeda untuk soal no 1 adalah 0,1 dan ini berarti butir soal no
satu ini jelek.

14
2.4 Indeks Kesukaran
Tingkat kesulitan item atau disebut juga indeks kesulitan item menurut (2011:136) adalah
angka yang menunjukkan proporsi siswa yang menjawab betul dalam satu soal yang dilakukan
dengan menggunakan tes objectife. Menurut Daryanto (2010:179), soal yang baik adalah soal yang
tidak terlalu sukar. Soal yang terlalu mudah tidak merangsang siswa untuk mempertinggi usaha
memecahkannya. Sebaliknya soal yang terlalu sukar akan menyebabkan siswa menjadi putus asa
dan tidak mempunyai semangat untuk mencoba lagi karena diluar jangkauannya. Dari beberapa
pendapat di atas dapat disimpulkan bahwa tingkat kesukaran soal adalah angka yang menunjukkan
bahwa apakah soal yang diujikan termasuk mudah, sedang atau sukar.
Soal yang baik adalah soal yang tidak terlalu mudah atau tidak terlalu sukar. Soal
yang terlalu mudah tidak merangsang siswa untuk mempertinggi usaha pemecahannya.
Sebaliknya soal yang terlalu sukar akan menyebabkan siswa menjadi putus asa dan tidak
mempunyai semangat untuk mencoba lagi karena diluar jangkauannya.
Seorang akan menjadi hafal akan kebiasaan gurunya dalam pembuatan soal. Dengan
kebiasaaan ini maka siswa akan belajar giat untuk menghadapi ulangan dengan guru yang
terbiasa memberikan soal sukar, sedangkan siswa akan malas belajar bila akan ujian dengan guru
yang terbiasa dengan soal ulangan yang mudah-mudah.
Bilangan yang menunjukkan sukar dan mudahnya sesuatu soal disebut dengan indeks
kesukaran. Besarnya indeks kesukaran antara 0,00 sampai dengan 1,0. Indeks kesukaran ini
menunjukkan taraf kesukaran soal. Soal dengan indeks kesukaran 0,00 menunjukkan kalau soal
itu terlalu sukar, sebaliknya indeks 1,0 menunjukkan bahwa soalnya terlalu mudah. Indeks
kesukaran butir yang baik berkisar antara 0,3-0,7 paling baik pada 0,5.
Dalam istilah evaluasi, indeks kesukaran ini diberi simbol P singkatan ari proporsi.
Dengan demikian maka soal dengan P = 0,70 lebih mudah jika dibandingkan dengan P = 0,20.
sebaliknya soal dengan P = 0,30 lebih sukar daripada soal dengan P = 0,80.
Rumusan mencari indeks kesukaran menurut Daryanto (2005,180) adalah :
15
Dimana :
P = indeks kesukaran
B = banyaknya siswa yang menjawab soal itu dengan betul
JS = jumlah seluruh siswa peserta tes.
Misalkan :
Jumlah siswa peserta tes dalam suatu kelas ada 40 orang.dari 40 orang siswa tersebut 12
orang dapat mengerjakan soal no 1 dengan betul. Maka indeks kesukarannya adalah:
Kriteria yang digunakan untuk mengklasifikasikan butir soal tersebut adalah makin
kecil indeks yang diperoleh maka makin sulit soal tersebut. Sebaliknya, makin besar indeks
yang diperoleh makin mudah soal tersebut.
2.5 Fungsi Distaktor

Tujuan pemakaian distraktor menurut thoha(2001:149) adalah mengecohkan mereka yang
kurang mampu (tidak tahu) untuk dapat dibedakan dengan yang mampu. Arikunto (2008:220)
menjelaskan bahwa sebuah distraktor (pengecoh) dapat dikatakan berfungsi dengan baik apabila
distraktor tersebut mempuanyai daya tarik yang besar bagi pengikut pengikut tes yang kurang
memahami konsep atau kurang menguasai bahan.
Dari beberapa pendapat tersebut dapat disimpulkan bahwa fungsi distraktor adalah
kemampuan suatu opsi pengecoh dalam mengecohkan teste tertarik untuk memilihnya.
Disebut juga dengan pola jawaban atau fungsi pengecoh, yaitu distribusi siswa dalam hal
menentukan pilihan pada soal bentuk pilihan ganda. Fungsi distraktor ini diperoleh dengan
16
menghitung banyaknya siswa yang memilih pilihan jawaban a, b, c, d dan e yang tidak memiliki
pilihan manapun. Dalam istilah evaluasi disebut omit disingkat O.
Dari pola jawaban soal dapat ditentukan apakah pengecoh berfungsi sebagai pengecoh
dengan baik atau tidak. Pengecoh yang tidak dipilih sama sekali oleh siswa berarti pengecoh itu
jelek, dan terlalu menyolok menyesatkan. Sebaliknya sebuah distraktor dapat dikatakan
berfungsi dengan baik apabila distraktor tersebut mempunyai daya tarik yang besar bagi
pengikut-pengikut tes yang kurang memahami konsep atau kurang menguasai bahan. Dengan
melihat pola jawaban soal, dapat diketahui :
a. taraf kesukaran soal
b. taraf pembeda soal
c. baik tidaknya distraktor.
Sesuatu distraktor dapat diperlakukan dengan 3 cara yaitu :
a. diterima karena sudah baik
b. ditolak karena tidak baik
c. ditulis kembali karena kurang baik.
Kekurangannya mungkin hanya terletak pada rumusan kalimatnya sehingga hanya perlu
ditulis kembali, dengan perubahan seperlunya. Menulis soal adalah suatu kesukaran yang sulit,
sehingga apabila masih dapat distraktor dapat dikatakan berfungsi baik jika paling sedikit dipilih
oleh 5 % pengikut tes.
Dari pola jawaban soal ini dapat dicari :

17
1. P = 21/60 = 0,35
2. D = PA – PB = 15/30 – 6/30 = 0,30
3. distraktor : semua distraktornya sudah berfungsi dengan baik karena sudah dipilih oleh lebih
dari 5% pengikut tes.
4. dilihat dari segi omit 9 kolom pilihan paling kanan) adalah baik. Sebuah item dikatakan
baik jika omitnya tidak lebih dari 10% pengikut tes.
( 5% dari pengikut tes = 5% x 60 orang = 3 orang). Sebenarnya ketentuan ini hanya berlaku
untuk tes pilihan ganda dengan 5 alternatif dan p = 0,80. tetapi demi kepraktisan diberlakukan
untuk semua.
18
BAB III
PENUTUP
3.1 Kesimpulan
Berdasarkan pembahasan maka diperoleh kesimpulan sebagai berikut:
1. Validitas mempunyai arti sejauh mana ketepatan dan kecermatan suatu alat ukur
mampu melakukan sebagai fungsi ukurnya.
2. Reliabilitas berasal dari kata reliable yang diartikan sebagai dapat dipercaya.
3. Daya beda soal diartikan sebagai kemampuan suatu butir soal dalam membedakan
antara peserta didik yang berkemampuan tinggi dengan peserta didik yang
berkemampuan rendah.
4. Taraf kesukaran merupakan proporsi antara peserta didik yang menjawab benar
suatu butir soal dengan jumlah seluruh peserta tes.
5. Analisis pengecoh (distraktor) pada setiap butir soal, untuk mengetahui efektif dan
tidaknya pengecoh pada tes pilihan ganda. Jika terjadi penyimpangan, dalam arti
tidak seorang peserta didik pun yang terkecoh atau kelompok atas justru lebih
banyak yang terkecoh, berarti pengecoh yang disediakan tidak efektif.
19
DAFTAR PUSTAKA
Arikunto. 2016. Dasar-dasar Evaluasi Pendidikan Edisi Kedelapan. Jakarta:

Rineka Cipta
Amalia, Ata Nayla dan Ani Widayati. 2020. “Analisis Butir Soal Tes Kendali
Mutu Kelas XII SMA Mata Pelajaran Ekonomi Akuntansi di Kota Yogyakarta
Tahun 2012”. Jurnal Pendidikan Akuntansi Indonesia X, no 1: 1-26
Anida, R & Aditya, N., T,. 2018. Analisis Butir Soal Pendidikan Agama Islam
Di SMK N 1 Sedayu Tahun Ajaran 2017/2018. Jurnal Mudarrisuna 8, no 1: 1-24
Azwar, S. 2010. Tes Prestasi: Fungsi dan Pengembangan Pengukuran Prestasi.
Belajar. Yogyakarta: Pustaka Pelajar
Daryanto. 2012. Evaluasi Pendidikan. Jakarta: Rineka Cipta
Farida & Anna, M., 2021. Validitas dan Reliabilitas dalam Analisis Butir Soal.
Jurnal Pendidikan Bahasa Arab I, no. 1: 34-44
Sugiono, Noerdjanah dan Afrianti Wahyu. 2020. “Uji Validitas dan
Reliabilitas Alat Ukur SG Posture Evaluation”. Jurnal Keterapian Fisik 5,no 1:1- 61
Sukiman. 2012. Pengembangan Sistem Evaluasi. Yogyakarta: Insan Madani
Laela, U. F,. 2019. Analisis Kesukaran Soal, Daya Pembeda dan Fungsi
Distraktor. Jurnal Komunikasi dan Pendidikan Islam 8, no 2: 37-64
Lestari, K.E. dan Yudhanegara, M. R. 2015. Penelitian Pendidikan
Matematika. Bandung: Refika Aditama.
Muhammad, N. 2015. Analisis Empirik Program Analisis Butir Soal Dalam
Rangka Menghasilkan Soal yang Baik dan Bermutu Sebagai Alat Evaluasi
Pembelajaran Fisika. Prosiding. 336 - 347
Zainal, A. 2013. Evaluasi Pembelajaran. Bandung: Remaja Rosdakarya
20

MAKALAH Analisis Soal Retno - 22176014

Diunggah oleh

Informasi Dokumen

Judul Asli

Hak Cipta

Format Tersedia

Bagikan dokumen Ini

Bagikan atau Tanam Dokumen

Opsi Berbagi

Apakah menurut Anda dokumen ini bermanfaat?

Apakah konten ini tidak pantas?

Hak Cipta:

Format Tersedia

MAKALAH Analisis Soal Retno - 22176014

Diunggah oleh

Hak Cipta:

Format Tersedia

MAKALAH

EVALUASI PEMBELAJARAN KIMIA

PROGRAM STUDI MAGISTER PENDIDIKAN KIMIA

Padang, Maret 2023

1.1 Latar Belakang

1.2 Rumusan Masalah

Mengandung arti kata pengalaman. Sebuah instrument dikatakan memiliki

Validitas ramalan adalah suatu kondisi yang menunjukkan seberapa jauhkah

Instrumen penelitian test-retest dilakukan dengan cara mencobakan instrumen dua

Dalam menggunakan metode ini pendidik atau evaluator hanya menggunnakan

Rumus Spearman Brown:

korelasi antara skor-skor setiap belahan tes

∑σ2i = jumlah varians skor tiap-tiap item

2.3 Daya Beda

Contoh daya beda untuk kelompok kecil :

BA = Banyaknya siswa yang menjawab benar pada kelompok atas A

satu ini jelek.

2.5 Fungsi Distaktor

a. taraf kesukaran soal

b. taraf pembeda soal

c. baik tidaknya distraktor.

Sesuatu distraktor dapat diperlakukan dengan 3 cara yaitu :

a. diterima karena sudah baik

b. ditolak karena tidak baik

c. ditulis kembali karena kurang baik.

Dari pola jawaban soal ini dapat dicari :

2. D = PA – PB = 15/30 – 6/30 = 0,30

Berdasarkan pembahasan maka diperoleh kesimpulan sebagai berikut:

Arikunto. 2016. Dasar-dasar Evaluasi Pendidikan Edisi Kedelapan. Jakarta:

Anda mungkin juga menyukai