BAB I
PENDAHULUAN
A. Latar Belakang
Kemajuan suatu negara dapat dilihat dari kualitas sumber daya manusia.
Kualitas sumber daya manusia ditentukan oleh kualitas pendidikan yang di negara
yang terampil dan siap menghadapi tantangan dunia. Keterampilan dan kecakapan
generasi muda inilah yang dapat membawa negaranya maju dan dapat bersaing
didik sesuai tujuan pembelajaran. Ketercapaian ini dapat diukur melalui penilaian.
Dalam hal ini, peran guru sangat penting dalam melakukan penilaian. Guru tidak
ketercapaian belajar peserta didik. Hal ini sesuai dalam Undang-undang No. 14 tahun
2005 tentang guru dan dosen pasal 1 yang menyatakan bahwa guru adalah pendidik
dan menilai. Oleh karena itu sudah jelas bahwa guru mempunyai peran penting
undang No. 14 tahun 2005 bahwa terdapat delapan standar nasional pendidikan
antara lain standar isi, proses, kompetensi lulusan, pendidik dan tenaga kependidikan,
sarana dan prasarana, pembiayaan, pengelolaan, dan penilaian. Salah satu standar
nasional pendidikan seperti yang telah disebutkan yaitu standar penilaian. Standar
penilaian ini masih dipertegas oleh Peraturan Mendiknas No. 20 tahun 2007 pasal 1
(1) bahwa penilaian hasil belajar peserta didik pada jenjang pendidikan dasar dan
2
secara nasional. Jadi jelaslah bahwa di dalam pendidikan itu tidak hanya terbatas
pada interaksi guru dan peserta didik dalam mencapai tujuan pendidikan melainkan
juga terdapat proses penilaian terhadap ketercapaian belajar peserta didik yang
istilah evaluation. Menurut Depdikbud (1994) yang dikutip oleh Zainal Arifin (2011:
berkesinambungan dan menyeluruh tentang proses dan hasil yang telah dicapai
siswa. Endang Poerwanti, dkk (2008: 1.3) menjelaskan asesmen sebagai berikut.
Asesmen adalah proses untuk mendapatkan informasi dalam bentuk apapun
yang dapat digunakan untuk dasar pengambilan keputusan tentang siswa baik
yang menyangkut kurikulumnya, program pembelajarannya, iklim sekolah,
maupun kebijakan-kebijakan sekolah.
Cece Rakhmat dan Didi Suhedi (1999: 14) juga mengungkapkan pengertian
keseluruhan, serta keberhasilan guru dalam mengajar. Dari beberapa pendapat di atas
maka dapat disimpulkan bahwa penilaian adalah suatu proses atau kegiatan untuk
pengambilan keputusan mengenai keberhasilan belajar siswa dan semua aspek yang
akan digunakan guru untuk mengetahui tingkat keberhasilan peserta didik dalam
peserta didik dalam mencapai kompetensi, hasil dari penilaian dapat digunakan oleh
3
guru dalam menentukan langkah yang akan diambil selanjutnya. Langkah ini
keberhasilan belajar juga dapat menjadi motivasi bagi peserta didik untuk
(2008: 1.4) mengemukakan pengertian pengukuran sebagai kegiatan atau upaya yang
dilakukan untuk memberikan angka-angka pada suatu gejala atau peristiwa, atau
benda, sehingga hasil pengukuran akan selalu berupa angka. Alat yang digunakan
dalam pengukuran yaitu berupa tes dan hasil dari pengukuran diwujudkan dalam
menentukan kompetensi dasar yang akan dinilai. Dari kompetensi dasar itu akan
tersebut. Oleh karena itu, penjabaran indikator dilakukan sedetail mungkin sesuai
kompetensi yang diharapkan. Hal ini dapat bermanfaat untuk mempermudah dan
penilaian apa yang sesuai untuk menilai indikator yang telah dibuat.
Penilaian yang dilakukan oleh guru di sekolah yaitu dengan menggunakan
tes. Ada yang tes objektif dan ada pula yang tes uraian atau kedua-duanya. Dalam
tes yang baik. Tes yang baik yaitu yang dapat memperhatikan syarat-syarat tes.
Apabila tes tersebut dapat memenuhi syarat-syarat tes yang baik maka hal ini dapat
perkembangan belajar peserta didik. Tes sebagai alat ukur dalam penilaian yang
dilakukan oleh guru, dapat membedakan antara peserta didik yang berkemampuan
tinggi dengan yang rendah. Hal ini sebagai dasar guru untuk memberikan tindak
lanjut terhadap ketercapaian belajar setiap peserta didik. Selain itu, tes juga dibuat
dengan kategori yang merata dan bertingkat, mulai dari yang mudah, sedang, sampai
ke yang sukar. Hal tersebut bertujuan agar pola berpikir peserta didik dapat
berkembang.
Namun kenyataan yang ada di lapangan, banyak guru yang dalam pembuatan
tes tidak memenuhi syarat-syarat tes yang baik. Guru juga kurang dapat menjabarkan
sejauh mana peserta didik memahami pelajaran sesuai komperensi menjadi kurang
jelas. Ada pula yang dalam pembuatan tes terlalu mudah ataupun terlalu sukar. Tes
yang seperti itu kurang baik untuk perkembangan belajar peserta didik. Tes yang
terlalu mudah dapat menyebabkan peserta didik kurang serius dalam belajar karena
terlalu menyepelekan. Tes yang terlalu sukar juga kurang baik karena akan
menyebabkan peserta didik menjadi putus asa dan kurang bersemangat dalam belajar.
Hal ini berdampak pada kecenderungan peserta didik yang akan melakukan hal-hal
buruk, salah satunya yaitu mencontek saat ujian. Guru diharapkan dapat
memperhatikan syarat-syarat dalam pembuatan tes yang baik sehingga tes dapat
berkualitas. Oleh karena itu, dalam kesempatan ini, penyusun akan meneliti terhadap
B. Rumusan Masalah
1. Seberapa besar keefektifan pengecoh butir soal?
2. Seberapa besar tingkat kesukaran pada butir soal?
3. Apakah butir soal dapat membedakan antara siswa yang berkemampuan atas dan
bawah?
4. Apakah butir soal memenuhi syarat validitas?
5. Apakah soal yang dibuat memenuhi syarat reliabilitas?
BAB II
KAJIAN TEORI
A. Pengertian Tes
Istilah tes berasal dari kata testum yang berarti piring untuk menyisihkan
(2007: 141) tes merupakan alat yang digunakan untuk mengetahui atau mengukur
sesuatu dalam suasana yang telah ditentukan dan dengan cara serta aturan-aturan
yang sudah ditentukan. James S Cangelosi (1995: 21) yang dikutip oleh Sigit
dipakai guru untuk mencoba menciptakan kesempatan bagi para siswanya untuk
ditentukan. Selain itu juga Endang Poerwanti, dkk (2008: 1.5) menjelaskan
Dari beberapa pengertian tes di atas, dapat disimpulkan bahwa tes adalah alat
yang digunakan oleh guru dalam melakukan penilaian untuk mengetahui dan
mengukur tingkat kemampuan belajar peserta didik dalam penguasaan materi sesuai
dengan tujuan pembelajaran. Tes berisi sejumlah pertanyaan yang harus dijawab
peserta didik dan hasilnya dapat diketahui tingkat ketercapaian peserta didik. Oleh
karena itu, alat ukur jenis tes biasa digunakan guru untuk mengukur sejauh mana
dari tes seleksi nantinya akan menjadi dasar pertimbangan peserta dapat
Peserta didik yang berminat mengikuti olimpiade akan mengikuti tes seleksi
yang dimilikinya.
c. Tes hasil belajar (Achievement test)
Jenis tes yang lebih sering diketahui yaitu tes hasil belajar. Tes hasil belajar
materi yang telah diajarkan sesuai dengan tujuan pembelajaran. Isi dari tes
hasil belajar ini harus disusun secara jelas agar dapat mengukur tingkat
Hasil tes ini akan memberikan informasi tentang konsep yang belum
memenuhi kualifikasi sebagai tes yang baik sehingga perlu adanya uji coba
kesukaran, daya beda dan juga segi lain yang meliputi kecukupan waktu,
Dalam penelitian yang dilakukan oleh penulis, termasuk tes uji coba. Hal
tersebut karena pada penelitian ini, penulis melakukan pengembangan penilaian yang
dijabarkan ke dalam indikator untuk menyusun butir-butir tes. Butir-butir tes ini
mengenai tingkat kesukaran butir tes yang dibuat, keefektifan pengecoh, daya beda,
Tes masuk sama halnya dengan tes seleksi yaitu mengetahui dan menentukan
sesuai isi tes masuk dengan pokok program pembelajaran, makan akan
semakin tinggi tingkat relevansi dan keefektifan dari tes masuk tersebut.
b. Tes formatif (Formative test)
Tes formatif dilakukan pada saat program pembelajaran sedang berlangsung.
pokok bahasan atau sub materi. Jadi, tes formatif digunakan untuk
pembelajaran.
c. Tes sumatif (Summative test)
Tes sumatif dilakukan untuk mengetahui hasil pembelajaran secara
keseluruhan. Hal tersebut berarti bahwa item tes sumatif mencakup seluruh
materi yang telah disampaikan. Hasil tes ini sebagai dasar untuk menentukan
9
kadang-kadang guru akan melakukan tes yang disebut pra-tes. Hasil pra-tes
kemajuan peserta didik di dalam belajar. Kemajuan ini dapat dilihat dengan
post-tes.
Dilihat dari jenis-jenis tes berdasarkan waktu penyelenggaraan, penelitian
yang dilakukan oleh penyusun cenderung termasuk tes formatif. Hal ini karena soal
yang diujicobakan untuk mengetahui sejauh mana kemampuan belajar peserta didik
dalam menguasai kompetensi dasar tertentu. Dalam hal ini dipilih kompetensi dasar
lingkungan sekitar..
3. Berdasarkan cara mengerjakan
a. Tes tertulis
Tes tertulis adalah tes yang dilakukan secara tertulis baik soal maupun
jawabannya. Hasil dari tes lisan biasanya hanya menjadi pelengkap dari
10
instrumen asesmen yang lain karena tes lisan relative tidak memiliki rambu-
psikomotor.
Apabila dilihat berdasarkan cara mengerjakan, tes yang dilakukan dalam
penelitian ini termasuk tes tertulis. Hal ini karena soal tes dan jawaban yang
ukur, salah satunya melalui tes. Tes yang dikembangkan oleh guru disebut tes
buatan guru. Jadi, tes buatan guru adalah tes yang dirancang dan
dikembangkan oleh guru yang mengacu pada karakteristik tes yang baik, dan
dikembangkan sendiri oleh penulis. Oleh karena itu, apabila dilihat berdasarkan cara
penyusunan, tes termasuk tes buatan guru karena dikembangkan sendiri dengan
mengacu karakteristik tes yang baik. Dari segi bahasa, penulis mencoba
mengembangkan butir-butir soal dengan menggunakan bahasa yang jelas dan mudah
dipahami oleh peserta didik. Selain itu juga memperhatikan cara menyusun pengecoh
yang baik.
11
kata lepas, maupun angka-angka. Tes jenis ini termasuk tes yang mengisi
bagian kosong dari sebuah kalimat atau teks sehingga diharapkan peserta tes
menjawab tes sudah tersedia. Tes ini disebut juga tes pilihan jawaban. Tes
objektif sehingga pemberian skor dapat dilakukan dengan bantuan mesin. Tes
objektif hanya memberikan jawaban benar dan salah sehingga penilaian tidak
termasuk tes objektif yaitu pilihan ganda, jawaban pendek, dan esei. Pilihan ganda
biasanya lebih sering digunakan oleh guru. Tes pilihan ganda menurut Sumadi
Suryabrata (2004: 85) yaitu tes yang terdiri batang tubuh soal (stem), yang berupa
pertanyaan pengantar atau pernyataan tidak lengkap, dan dua atau lebih kemungkinan
12
jawaban. Suharsimi Arikunto (2012: 183) juga memberikan penjelasan tentang tes
pilihan ganda. Tes pilihan ganda yaitu tes yang terdiri atas suatu keterangan atau
jawaban yang benar disebut jawaban (kunci), dan yang lainnya disebut pengecoh
Kaidah penulisan soal bentuk pilihan ganda sebagai berikut (H. Sujati, 2010:
22-23):
1. Pokok soal atau stem harus dirumuskan secara jelas sehingga mudah
dipahami maknanya oleh siswa.
2. Hindari pernyataan negatif pada pokok soal atau stem.
3. Usahakan option atau kemungkinan jawaban bersifat homogeny atau
sejenis.
4. Di antara option harus ada satu jawaban yang benar atau tepat.
5. Pengecoh harus berfungsi bukan asal ada.
6. Hindari adanya semacam petunjuk terhadap jawaban yang benar.
7. Apabila option berbentuk angka susunlah mulai dari angka terkecil.
Menurut Zainal Arifin (2011: 143) menyebutkan beberapa petunjuk praktis
Tes pilihan ganda memiliki kelebihan dan kelemahan. Adapaun kelebihan dari
dikehendaki.
4. Semua indikator dapat terwakili.
5. Dapat digunakan berulang-ulang.
6. Cocok untuk jumlah peserta tes yang banyak.
Dari beberapa kelebihan, tes pilihan ganda juga terdapat kelemahannya yaitu:
1. Cenderung menekankan pada aspek kognitif saja.
2. Membutuhkan waktu lama untuk membuat soal yang benar-benar baik.
3. Membiasakan peserta didik berpikir untung-untungan dari tebakan.
4. Kurang memacu peserta didik berpikir analisis.
5. Kurang dapat mengembangkan kemampuan berbahasa peserta didik,
B. Syarat-syarat Tes
1. Keefektifan Pengecoh
Soal pilihan ganda terdapat alternatif jawaban (opsi) yang merupakan
pengecoh. Butir soal yang baik yaitu pengecohnya akan dipilih secara merata oleh
14
peserta didik yang menjawab salah. Sebaliknya, butir soal yang kurang baik,
sama atau mendekati jumlah ideal. Menurut Zainal Arifin (2011, 279) indeks
280) adalah:
Sangat baik IP = 76% - 125%
Baik IP = 51% - 75% atau 126% - 150%
Kurang baik IP = 26% - 50% atau 151 % - 175%
Jelek IP = 0% - 25% atau 176 %- 200%
Sangat jelek IP = lebih dari 200%
Selain itu juga terdapat langkah-langkah untuk mengetahui apakah suatu opsi
(alternative jawaban) dari setiap soal berfungsi secara efektif atau tidak. Langkah-
Opsi
a b c D e
Kelompok
Atas
Bawah
d. Menghitung jumlah alternatif jawaban yang dipilih peserta didik, baik untuk
25% - 75%.
b) Rumusnya:
∑ PKA +∑ PKB ×100
n1 +n2
Keterangan:
PKA = jumlah pemilih kelompok atas
PKB = jumlah pemilih kelompok bawah
n1 = jumlah sampel kelompok atas (27%)
n2 = jumlah sampel kelompok bawah (27%)
dari:
1
25 × × ( Ka + Kb )
2 (∑ d )
Keterangan:
d = jumlah opsi pengecoh
Ka = kelompok atas
Kb = kelompok bawah
distraktor (pengecoh) dapat dikatakan berfungsi baik jika paling sedikit dipilih oleh
5% pengikut tes. Dari dua pendapat yang berbeda, dalam penelitian ini, untuk
ini juga disesuaikan dengan jumlah peserta didik yang diteliti sebanyak 20 orang.
Jumlah ini menurut Suharsimi Arikunto (2012) termasuk kelompok kecil sehingga
16
tidak membutuhkan sampel 27% seperti yang dikemukakan Zainal Arifin (2011)
didalam rumusnya, melainkan cukup membagi jumlah tersebut menjadi dua yaitu 5%
2. Indeks Kesukaran
Tingkat kesukaran soal adalah pengukuran seberapa besar derajat kesukaran
suatu soal (Zainal Arifin, 2011: 266). Soal yang baik yaitu yang memiliki tingkat
kesukarannya seimbang. Soal tes hendaknya tidak terlalu sukar dan tidak terlalu
mudah. Sebagai contoh, sebuah soal sebaiknya memiliki proporsi penyebaran 25%
sukar, 50% sedang, dan 25% mudah (Cece Rakhmat dan Didi Suherdi, 1999: 69).
Saifuddin Azwar (2012: 134) juga menambahkan bahwa indeks kesukaran item
merupakan rasio antara penjawab dengan benar dan banyaknya penjawab item.
Untuk menghitung tingkat kesukaran butir soal dapat diperoleh dengan menggunakan
3. Daya Beda
Menurut Suharsimi Arikunto (2012: 226) daya pembeda soal adalah
tinggi koefisien daya pembeda suatu butir soal, maka semakin mampu butir soal
17
dikelompokkan menjadi dua yaitu kelompok atas (pandai) dan kelompok bawah
(bodoh). Untuk menentukan daya beda pada kelompok kecil (kurang dari 100)
dengan cara seluruh kelompok testee dibagi menjadi dua sama besar, 50% kelompok
atas dan 50% kelompok bawah. Seluruh pengikut tes diurutkan mulai dari skor
teratas sampai skor terbawah, lalu dibagi menjadi dua (Suharsimi Arikunto, 2012:
227). Untuk kelompok besar (100 orang ke atas) dilakukan dengan cara mengambil
kedua kutubnya saja yaitu 27% skor teratas sebagai kelompok atas dan 27% skor
4. Validitas
Instrumen yang valid berarti alat ukur yang digunakan untuk mendapatkan
data (mengukur) itu valid. Valid berarti instrumen tersebut dapat digunakan untuk
mengukur apa yang seharusnya diukur (Sugiyono, 2009: 121). Alat ukur dikatakan
valid/sahih apabila dapat mengungkapkan secara cermat apa yang seharusnya diukur.
Cece Rakhmat dan Didi Suherdi (1999: 187) juga menambahkan bahwa yang
18
atau informasi yang relevan dengan tujuan atau keputusan yang akan dibuat.
Cece Rakhmat dan Didi Suherdi (1999:187-200) membedakan jenis-jenis
mengetahui sejauh mana peserta didik menguasai materi yang telah diajarkan
dan perubahan-perubahan psikologis apa yang timbul pada diri peserta didik
dilakukan secara logis dan rasional dengan cara menimbang kesesuaian setiap
soal dengan indikator sehingga acuan dalam penimbangan soal adalah ruang
lingkup materi dan indikator yang diwujudkan dalam bentuk kisi-kisi tes. Di
dalam kisi-kis tes terdapat indikator, banyak butir, dan nomor butir. Jadi kisi-
kisi tes sebagai pedoman dalam pembuatan butir-butir tes. Adanya kisi-kisi
tes maka pengujian validitas dapat dilakukan dengan mudah dan sistematis.
b. Kesahihan konstruk (construct validity)
Kesahihan konstruk digunakan dalam tes psikologi yang akan menunjukkan
faktor.
c. Kesahihan kriteria (criterion validity)
Kesahihan kriteria diuji secara empirik dengan menggunakan tolak ukur
mengkorelasikan skor tes yang akan divalidasikan dengan skor tes yang
prestasi mendatang. Apabila kriterianya berupa perilaku saat ini juga maka
instrumen itu sendiri. Apabila suatu tes secara sepintas telah dianggap baik
untuk mengukur apa yang harus diukur, maka tes tersebut sudah dapat
mengetahui sejauh mana peserta didik menguasai mata pelajaran yang telah
peserta didik setelah mengalami proses pembelajaran tertentu. Jika dilihat dari
segi kegunaannya dalam penilaian hasil belajar, maka validitas isi disebut
materi tes dengan silabus dan kisi-kisi, melakukan diskusi dengan sesame
pendidik, atau mencermati kembali substansi dari konsep yang akan diukur.
soal-soal itu benar-benar tercakup dalam perumusan tentang apa yang akan
diukur.
c. Validitas empiris
Validitas empiris biasanya menggunakan teknik statistik yaitu analisis
korelasi. Validitas ini mencari hubungan antara skor tes dengan suatu kriteria
tertentu yang merupakan suatu tolok ukur di luar tes yang bersangkutan.
Kriteria tersebut harus relevan dengan apa yang akan diukur. Ada tiga macam
kongruen adalah jika kriteria standarnya berlainan. Misalnya skor tes bahasa
disebut juga validitas logis. Validitas konstruk banyak dikenal dan digunakan
berdasarkan indikator dari variabel yang diukur sesuai dengan apa yang
faktor dengan total skor dan antara skor dari faktor yang satu dengan skor dari
dijelaskan, validitas isi digunakan untuk memperoleh informasi tentang sejauh mana
21
peserta didik dapat menguasai materi yang telah diajarkan. Untuk mengetahui
ketercapaian peserta didik menguasai materi, maka dari kompetensi dasar akan
dijabarkan ke dalam indikator-indikator yang jelas agar dalam proses penilaian juga
menjadi jelas. Sebagai acuan penilaian ini yaitu kisi-kisi tes yang berisi indikator,
alam, hubungannya dengan penggunaan sumber daya alam, dan pengaruh kegiatan
berikut:
Kisi-Kisi Tes
Nomor Butir
No Banyak
Indikator Jawaban Esai
. Butir Objektif
Singkat
Menentukan zat yang
1. dibutuhkan manusia 1 1 0 0
untuk bernafas.
Menyebutkan sifat-
2. sifat zat gas. 1 2 0 0
Menyebutkan sifat-
3. sifat zat cair. 5 3 12, 16, 17 23
Menyebutkan benda-
4. benda yang termasuk 1 4 0 0
zat padat.
5. Menentukan
perubahan wujud 7 5 11, 13, 21, 22
22
benda. 14,15
Menyebutkan
6. peristiwa perubahan 2 6, 7 0 0
benda.
Menyebutkan contoh
7. pelestarian alam. 5 9 18, 19 24, 25
Menyebutkan contoh
8. perusakan alam. 3 8, 10 20 0
Jumlah 10 10 5
Untuk menghitung indeks validitas tes pada pilihan ganda digunakan rumus
γ
Indeks validitas (γ) =
Keterangan:
=
Mp−Mt p
koefisien validitasSd √ q
yang dicari
Mp = rerata skor dari subjek yang menjawab betul pada item yang dicari
validitasnya.
Mt = rerata skor total
Sd = simpangan baku
√
2
∑ X2− ∑ X
N N ( )
p = proporsi siswa yang menjawab butir soal itu benar
Skor butir soal dikatakan memiliki validitas yang memuaskan apabila indeks
validitas 0,3 (Saifuddin Azwar, 2012: 179). Jadi, apabila skor butir hasil
penghitungan berada di bawah atau kurang dari 0,30 maka butir soal tersebut tidak
valid.
5. Reliabilitas
Reliabilitas adalah tingkat atau derajat konsistensi dari suatu instrumen
(Zainal Arifin, 2011: 258). Suatu tes dapat dikatakan reliabel apabila selalu
memberikan hasil yang sama bila diteskan pada kelompok yang sama pada waktu
23
atau kesempatan yang berbeda. Menurut Gronlund (1985) dalam Zainal Arifin (2011:
258) mengemukakan ada empat faktor yang mempengaruhi reliabilitas, antara lain:
a. Panjang tes berarti banyaknya soal tes. Ada kecenderungan semakin panjang
menjadi lebih tinggi karena koefisien reliabilitas yang lebih besar diperoleh
ketika peserta didik tetap pada posisi yang relative sama dalam satu kelompok
acuan normal, soal yang mudah maupun yang sukar cenderung menghasilkan
tingkat reliabilitas yang rendah karena keduanya berada pada sebaran skor
kurva normal.
d. Objektivitas menunjukkan skor tes kemampuan yang sama antara peserta
responden. Instrumen yang dibuat sama, responden sama, dan waktu berbeda.
dinyatakan reliabel.
b. Ekuivalen
Pengujian dilakukan dengan cara sekali, tetapi instrumennya dua, pada
dengan data instrumen yang dijadikan equivalen. Bila korelasi positif dan
c. Gabungan
Reliabilitas instrumen dilakukan dengan mengkorelasikan dua instrumen,
secara silang.
d. Internal consistency
Uji reliabilitas dengan cara mencobakan instrumen sekali saja kemudian data
r i=
k
(k−1){ s2}
s2 −∑ p i qi
Keterangan:
k = jumlah item dalam instrumen
pi = proporsi banyaknya subjek yang menjawab pada item 1
qi = 1 - pi
s2 = varians total
3) Rumus KR.21
r i=
k
√
( k−1)
Keterangan:
1−
M (k−M )
k s2
Menurut Feldt & Brennan (1989: 106) yang dikutip oleh Friyatmi (2012)
menyatakan bahwa suatu instrumen sudah dianggap reliabel jika memiliki koefisien
reliabilitas minimal 0,7. Pernyataan tersebut juga diperkuat oleh Kaplan (1982: 106)
yang dikutip oleh S. Eko Putro Widoyoko (2010: 155) mengemukakan bahwa harga
kritik atau standar reliabilitas untuk indeks reliabilitas instrumen adalah 0,7. Artinya
BAB III
HASIL UJI COBA DAN PEMBAHASAN
yang berjumlah 31 siswa. Hasil uji coba tes IPA yaitu sebagai berikut:
No B1 B2 B B4 B5 B6 B B B B10 X X2 KET.
. 3 7 8 9
1. 1 1 1 1 0 1 0 1 0 1 7 49 B
2. 1 1 0 1 1 1 0 1 1 1 8 64 A
3. 1 1 0 1 0 1 0 1 1 1 7 49 B
4. 1 1 0 1 0 0 0 0 0 0 3 9 C
5. 1 1 1 1 1 1 0 1 1 1 9 81 A
6. 1 1 0 1 1 1 0 1 0 1 7 49 B
7. 1 1 1 1 1 1 0 0 0 1 7 49 B
8. 1 1 1 0 1 1 0 1 1 1 8 64 A
9. 1 1 1 1 0 1 0 0 1 1 7 49 B
10. 1 1 1 1 1 1 0 1 1 1 9 81 A
11. 1 1 1 1 0 1 0 1 0 1 7 49 B
12. 1 1 0 1 0 1 0 0 0 0 4 16 C
13. 1 1 1 1 1 1 0 1 1 1 9 81 A
14. 1 1 1 0 1 1 1 1 1 0 8 64 A
15. 1 1 1 0 1 1 1 1 1 0 8 64 A
16. 1 1 1 1 1 1 1 1 1 1 10 100 A
17. 1 1 1 1 1 1 0 1 1 1 9 81 A
18. 1 1 1 1 1 1 1 1 1 1 10 100 A
19. 1 1 1 1 1 1 1 1 1 1 10 100 A
20. 1 1 1 1 1 1 1 1 1 1 10 100 A
21. 1 1 1 1 1 1 0 1 1 1 9 81 A
22. 1 1 0 1 1 1 1 1 1 1 9 81 A
23. 1 1 1 1 1 1 0 1 1 1 9 81 A
24. 1 1 1 1 1 1 1 1 1 1 10 100 A
25. 1 1 1 1 1 1 0 1 0 1 8 64 A
26. 1 1 1 1 1 1 0 1 1 1 9 81 A
27. 1 1 1 1 0 1 0 0 1 0 6 36 B
28. 1 1 1 1 1 1 0 1 1 1 9 81 A
29. 1 1 1 1 1 1 1 1 1 1 10 100 A
30. 1 1 1 1 1 1 1 1 0 1 9 81 A
31. 1 1 1 1 1 1 0 1 0 1 8 64 A
Jumlah 25 214
3 9
B. Pembahasan
1. Keefektifan pengecoh
Butir 1
27
pengecohnya akan dipilih secara merata oleh peserta didik yang menjawab salah.
Pada butir 1 menunjukkan pengecoh tidak dipilih secara merata sehingga butir
tersebut dapat dikatakan tidak baik. Apabila dilihat pengecoh satu per satu dapat
diketahui bahwa pengecoh a, c, dan d sama sekali tidak ada yang memilih sehingga
pengecoh tersebut tidak efektif karena isinya yang tidak relevan atau kalimat yang
tidak tersusun dengan baik sehingga tampak jelas sebagai pilihan yang salah.
Butir 2
tersebut dapat dikatakan tidak baik. Dilihat pengecoh satu per satu dapat diketahui
bahwa pengecoh a, c, dan d tidak efektif karena sama sekali tidak ada yang memilih.
Hal ini dapat dikarenakan isinya yang tidak relevan atau kalimat yang tidak tersusun
Persentase 20% 5% 5% *
Kategori Efektif Efektif Efektif *
Pada tabel terlihat bahwa distribusi jawaban peserta didik terhadap pengecoh
merata. Hal ini ditunjukkan oleh pengecoh a, b, c dan d dipilih oleh peserta didik.
Dapat dikatakan bahwa butir 3 ini mampu mengecoh siswa. Pengecoh a efektif
karena dapat mengecoh sebesar 20%. Pengecoh b dan c efektif karena dapat
Suharsimi Arikunto (2012) menjelaskan bahwa pengecoh berfungsi dengan baik jika
Butir 5
Sama seperti butir nomor 4, butir nomor 5 memiliki 2 pengecoh yang efektif
yaitu pengecoh c dan d dan memiliki satu pengecoh yang tidak efektif yaitu
29
mengecoh sebesar 10%. Sedangkan pengecoh b tidak ada siswa yang memilihnya
Butir soal nomor 6 ada dua pengecoh yang tidak efektif karena tidak ada satu
pun yang memilih opsi tersebut. Hal ini dapat diartikan bahwa pengecoh tersebut
tampak jelas sebagai pilihan yang salah. Pengecoh c berfungsi efektif. Pengecoh c
dapat mengecoh sebesar 5%. Apabila dilihat secara keseluruhan pengecoh, butir soal
tersebut tidak dapat dikategorikan sebagai soal yang baik karena pengecoh tidak
Butir 7
Pada tabel dapat dilihat bahwa semua pengecoh berfungsi efektif. Hal ini
dapat dilihat dari hasil penghitungan yang menunjukkan bahwa pengecoh a sebesar
65% dan b dapat mengecoh sebesar 35% sedangkan pengecoh d sebesar 5%. Hal
tersebut lebih besar dari standar keefektifan pengecoh yaitu sebesar 5% dari seluruh
peserta didik yang mengikuti tes. Distribusi jawaban juga secara merata dipilih oleh
30
peserta didik yang menjawab salah dan lebih banyak kelompok bawah yang
berfungsi efektif karena pada pengecoh tersebut ada yang memilih baik dari
kelompok atas maupun bawah. Pengecoh a dan c berfungsi efektif yang dapat
mengecoh peserta didik yang menjawab salah sebesar 10%. Pemilih pengecoh b juga
efektif yang mampu mengecoh siswa sebesar 5%. Selain itu, distribusi jawaban
merata keseluruh pengecoh sehingga dapat disimpulkan bahwa butir soal nomor 8
pengecoh c tidak efektif. Distribusi jawaban tidak merata tidak dipilih oleh seluruh
peserta didik yang menjawab salah. Secara keseluruhan, dapat disimpulkan bahwa
a b c d*
Kelompok Atas 1 0 0 1
Kelompok Bawah 1 2 1 3
Persentase 10% 10% 5% *
Kategori Efektif Efektif Efektif *
Sama halnya dengan butir soal nomor 8, butir nomor 10 juga menunjukkan
keefektifan semua pengecoh. Pada tabel dapat dilihat bahwa penegcoh a dapat
mengecoh sebesar 10%, pengecohbc sebesar 10%, dan pengecoh c sebesar 5%.
Angka tersebut lebih besar atau sama dengan 5% keseluruhan peserta didik yang
mengikuti tes. Terdapat adanya distribusi jawaban yang merata terhadap semua
2. Indeks kesukaran
Indeks Kesukaran
Hasil Penghitungan Kategori
Butir
B1 1 Mudah
B2 1 Mudah
B3 0,81 Mudah
B4 0,90 Mudah
B5 0,77 Sedang
B6 0,97 Mudah
B7 0,32 Sukar
B8 0,84 Mudah
B9 0,71 Sedang
B10 0,84 Mudah
meliputi kategori mudah, sedang, dan sukar. Keseluruhan butir soal, indeks
kesukarannya yaitu mudah. Hal ini dapat dilihat dari butir soal yang berkategori
32
mudah berjumlah 7, yaitu nomor 1, 2, 3, 4, 6, 8 dan 10. Butir soal yang kategorinya
sedang yaitu butir soal nomor 5 dan 9. Hal ini disebabkan hampir seluruh siswa
mampu menjawab soal dengan benar. Untuk butir soal yang sukar yaitu nomor 7.
Butir soal nomor 7 hanya dapat dijawab benar oleh 10 siswa. Dari data tersebut, soal
yang digunakan dalam penelitian ini termasuk soal yang kurang baik karena
mayoritas soal mudah dan dapat dijawab benar oleh kebanyakan siswa. Sesuai pada
pendapat Cece Rakhmat dan Didi Suherdi (1999) yang menyatakan bahwa soal tes
hendaknya tidak terlalu sukar dan tidak terlalu mudah dan memiliki proporsi
penyebaran 25% sukar, 50% sedang, dan 25% mudah. Dari tabel di atas telah
ditunjukkan bahwa soal terlalu mudah tidak sesuai proporsi penyebaran yang telah
diungkapkan di atas.
3. Daya beda
antara kelompok atas dengan kelompok bawah. Berdasarkan teori yang telah
dijelaskan di bab sebelumnya yaitu semakin tinggi koefisien daya pembeda suatu
butir soal, maka semakin mampu butir soal tersebut membedakan antara peserta
33
didik yang mampu menguasai kompetensi (pandai) dengan yang kurang menguasai
kompetensi (bodoh). Dari tabel di atas menunjukkan koefisien daya beda yang
termasuk kategori sangat baik sebanyak tiga soal yaitu butir nomor 5, 8 dan 10
sedangkan yang baik pada butir nomor 1, 2, 3, 6, dan 9. Butir soal yang daya
bedanya sedang sebanyak satu soal yaitu pada butir nomor 4 sedangkan selebihnya
yaitu sebanyak satu soal berkategori kurang. Hal ini menunjukkan bahwa soal yang
dibuat sudah baik dalam membedakan antara kelompok atas dan kelompok bawah.
4. Validitas
Validitas suatu butir soal dicapai apabila hasil penghitungan lebih dari atau
sama dengan 0,3 seperti yang dijelaskan oleh Saifuddin Azwar (2012). Berdasarkan
tabel di atas, terlihat bahwa hasil penghitungan yang mencapai lebih dari atau sama
dengan 0,3 sebanyak 6 butir yaitu pada butir soal nomor 3, 5, 6, 7, 9, dan 10. Oleh
karena itu, butir soal yang valid sebanyak 6 butir. Butir soal yang tidak valid pada
butir soal nomor 1, 2, 4, dan 8. Secara keseluruhan soal tersebut termasuk valid
karena lebih banyak soal yang valid dibandingkan dengan yang tidak valid. Semakin
34
rendah indeks validitas suatu butir soal, maka butir soal tersebut tidak baik untuk
digunakan. Dari data pada tabel di atas, indeks validitas terendah yaitu 0 pada butir
5. Reliabilitas
Seperti yang telah dijelaskan di bab sebelumnya bahwa reliabilitas adalah
tingkat atau derajat konsistensi dari suatu instrumen (Zainal Arifin, 2011: 258). Suatu
tes dapat dikatakan reliabel apabila selalu memberikan hasil yang sama bila diteskan
pada kelompok yang sama pada waktu atau kesempatan yang berbeda. Kaplan (1982:
106) yang dikutip oleh S. Eko Putro Widoyoko (2010: 155) mengemukakan bahwa
harga kritik atau standar reliabilitas untuk indeks reliabilitas instrumen adalah 0,7.
Dari hasil penghitungan menggunakan rumus KR21, indeks reliabilitas pada
butir soal yang diuji coba yaitu 0, 4995 . Angka tersebut di bawah indeks minimal
reliabilitas sebesar 0,7. Dapat disimpulkan bahwa soal tes termasuk tidak baik karena
tidak reliabel. Apabila diujicobakan kembali kepada subjek yang sama, dengan soal
yang sama, tetapi waktunya berbeda akan menunjukkan hasil yang berbeda. Oleh
karena itu, butir soal yang telah dibuat dalam penelitian ini tidak reliabel.
Berdasarkan faktor penyebab tidak reliabelnya soal menurut Gronlund (1985)
dalam Zainal Arifin (2011: 258), ada kemungkinan soal yang digunakan penelitian
ini kurang panjang (banyaknya soal hanya 10) karena menurutnya ada
tinggi. Hal tersebut juga dipengaruhi oleh tingkat validitasnya. Semakin panjang tes,
akan semakin menggambarkan apa yang hendak diukur secara jelas. Apabila dilihat
35
tingkat validitas pada soal tes dalam penelitian ini, tingkat validitasnya masih kurang
karena antara yang valid dengan yang tidak valid jumlahnya seimbang sehingga hal
No B1 B1 B1 B1 B1 B1 B1 B1 B1 B2 X KET
. 1 2 3 4 5 6 7 8 9 0 .
1. 2 0 2 0 2 0 2 2 2 0 1 A
2
2. 2 2 2 0 2 2 2 2 2 2 1 A
8
3. 2 2 2 0 2 2 2 2 2 2 1 A
8
4. 0 0 0 0 2 2 2 2 0 2 1 B
0
5. 2 0 2 0 2 0 0 2 2 2 1 A
2
6. 0 0 2 0 2 2 2 2 2 2 1 A
4
7. 0 0 2 0 2 2 2 2 0 2 1 A
2
8. 2 0 2 0 2 0 2 2 2 2 1 A
4
9. 0 0 0 0 2 0 0 2 2 2 8 B
10. 2 2 2 1 2 2 2 2 2 2 1 A
9
11. 2 2 2 0 2 0 2 2 2 2 1 A
6
12. 0 0 2 0 0 2 2 0 0 0 6 B
13. 0 0 2 0 0 2 0 2 0 2 8 B
14. 2 0 2 2 2 0 2 2 2 2 1 A
6
15. 2 0 2 2 2 0 2 2 0 0 1 A
2
16. 2 2 2 2 2 2 2 2 0 2 1 A
8
17. 2 2 2 2 2 2 2 2 2 2 2 A
0
18. 2 2 2 2 2 2 2 2 2 2 2 A
0
19. 2 2 2 1 2 2 2 2 2 2 1 A
9
36
20. 2 2 2 2 2 2 2 2 2 2 2 A
0
21. 2 2 2 2 2 2 2 2 2 2 2 A
0
22. 0 2 2 2 2 2 2 2 2 2 1 A
8
23. 0 0 2 0 2 2 2 2 0 2 1 A
2
24. 2 2 2 2 2 2 2 2 2 2 2 A
0
25. 0 0 2 0 2 2 2 2 2 2 1 A
4
26. 2 2 2 2 2 2 2 2 0 2 1 A
8
27. 0 0 2 0 0 0 2 2 2 2 1 B
0
28. 2 2 2 2 2 2 2 2 2 2 2 A
0
29. 0 0 2 2 2 0 0 2 0 2 1 B
0
30. 0 0 2 0 2 2 2 2 2 2 1 A
4
31. 0 0 2 0 2 2 2 2 2 2 1 A
4
Jumlah
Soal untuk jawaban singkat berjumlah 10 butir. Dalam setiap butir soal jika
siswa menjawab benar akan mendapatkan skor 2 atau jumlah soal yang dijawab
siswa dengan benar akan dikalikan 2. Berdasarkan tabel tersebut terlihat bahwa siswa
terbukti banyak siswa yang mendapatkan skor di atas 10. Sehingga dapat
disimpulkan bahwa soal jawaban singkat tersebut termasuk dalam kategori mudah,
karena sebagian besar siswa mampu menjawabnya. Terlihat bahwa siswa yang
mendapat nilai A ada sebanyak 25 siswa. Sedangkan siswa yang mendapatkan nilai B
ada sebanyak 6 orang. Terjadi perbandingan yang sangat jelas, dimana nilai A lebih
37
dominan dibandingkan nilai A. Siswa mendapatkan nilai A jika skor total ≥ 11. Jika
jawaban singkat berdasarkan tabel di atas, dapat dilihat bahwa siswa yang menjawab
salah ada sebanyak 13 siswa, yang menjawab benar sebanyak 18. Sehingga dapat
disimpulkan bawa butir soal 11 dikategorikan dalam soal yang mudah karena lebih
siswa yang menjawab salah ada sebanyak 17 orang. Soal tersebut dikategorikan
tingkat kesukarannya sedang karena tidak lebih dari setengah siswa yang mampu
siswa saja yang menjawab salah soal, selebihnya atau sebanyak 29 siswa mampu
menjawab soal dengan benar. Sehingga dapat disimpulkan bawa butir soal 13
dikategorikan dalam soal yang mudah karena sebagian besar siswa mampu
sebanyak 14 orang. Sedangkan siswa yang menjawab salah ada sebanyak 17 orang.
Soal tersebut dikategorikan tingkat kesukarannya sedang karena tidak lebih dari
siswa yang menjawab salah ada sebanyak 3 orang. Soal tersebut dikategorikan
mudah karena mayoritas atau sebagian besar siswa mampu menjawab benar soal.
Butir soal 16 siswa mampu menjawab benar sebanyak 22 orang. Sedangkan
siswa yang menjawab salah ada sebanyak 9 orang. Soal tersebut dikategorikan
mudah karena lebih dari setengah siswa yang mampu menjawab benar soal.
38
siswa yang menjawab salah ada sebanyak 4 orang. Hampir sama seperti butir soal 15
karena mayoritas atau lebih dari setengah siswa mampu menjawab soal dengan benar
siswa yang menjawab salah hanya ada 1 orang. Soal tersebut dikategorikan mudah
karena mayoritas atau sebagian besar siswa mampu menjawab benar soal.
Sama seperti butir soal 16, butir soal 19 siswa mampu menjawab benar
sebanyak 22 orang. Sedangkan siswa yang menjawab salah ada sebanyak 9 orang.
Soal tersebut dikategorikan mudah karena lebih dari setengah siswa yang mampu
siswa sebanyak 28 orang. Sedangkan siswa yang menjawab salah ada sebanyak 3
orang. Soal tersebut dikategorikan mudah karena mayoritas atau sebagian besar
14. 15 0 5 15 5 40 1600 A
15. 25 0 5 15 5 50 2500 A
16. 15 0 5 15 5 40 1600 A
17. 30 15 5 15 5 70 4900 A
18. 10 0 5 15 5 35 1225 A
19. 15 0 5 15 5 40 1600 A
20. 25 0 5 15 5 50 2500 A
21. 30 15 5 15 5 70 4900 A
22. 30 0 5 15 5 55 3025 A
23. 15 0 5 15 5 40 1600 A
24. 10 0 5 15 5 35 1225 A
25. 15 0 5 15 5 40 1600 A
26. 30 15 5 15 5 70 4900 A
27. 10 0 5 15 5 35 1225 A
28. 25 7 5 15 5 57 3249 A
29. 20 0 5 15 5 45 2025 A
30. 15 0 5 15 5 40 1600 A
31. 15 0 5 15 5 40 1600 A
Total 1.24 57.70
3 7
Berdasarkan tabel diatas menunjukkan bahwa soal esai berjumlah 5 soal dan
memiliki skor yang berbeda-beda setiap butir soal tergantung dari bobot soal. Namun
sebagian besar siswa mampu menjawab soal dengan skor yang tinggi. Terlihat siswa
yang mendapat nilai A ada sebanyak 23 siswa, yang mendapatkan nilai B ada
sebanyak 6 siswa dan ada 2 orang yang mendapatkan nilai C. Nilai A diperoleh siswa
jika skor total siswa tersebut ≥ 35. Nilai B diperoleh siswa jika skor total siswa
tersebut antara 16-34. Nilai C diperoleh siswa jika skor total siswa tersebut 0-15.
Karena lebih dari setengah atau mayoritas siswa mendapatkan nilai A yaitu sebanyak
23 siswa maka soal esai tersebut dikategorikan sebagai soal yang mudah.
Berbeda dengan soal pilihan ganda dan soal jawaban singkat, soal esai ini
setiap siswa dalam setiap butir soal mendapatkan skor yang berbeda-beda sesuai
dengan bobot jawaban siswa. Untuk butir soal 21 ada siswa yang hanya menjelaskan
40
saja perubahan wujud tanpa memberikan contoh dari perubahan wujud yang telah
ditentukan. Namun ada pula siswa yang hanya menyebutkan contohnya saja dan
tidak memberikan penjelasan padahal dalam soal sudah jelas siswa diminta untuk
menjelaskan dan menyebutkan contohnya. Hal tersebut bisa terjadi mungkin karena
siswa kurang teliti dalam membaca soal atau mungkin juga lupa dan terburu-buru
banyak yang mendapatkan skor 0. Berdasarkan hasil wawancara dan keluhan siswa
selama uji coba tes soal tersebut, hal tersebut terjadi karena sebagian besar siswa lupa
bahwa materi telah disampaikan oleh gurunya, ada juga yang mengaku kalau soal
tersebut belum pernah dijelaskan oleh gurunya, namun ada sebagian kecil siswa yang
mengaku kalau itu sudah dijelaskan oleh gurunya. Berdasarkan masalah tersebut
dapat diketahui bawa soal dalam butir ini terjadi miss comunication antara guru
dengan siswa karena ada siswa yang mengaku belum dijelaskan materi tersebut
banyak yang mendapatkan skor tinggi pada butir soal tersebut. Namun ada juga siswa
yang menjawab soal hanya menyebutkan satu atau dua saja sifat-sifat zat cair
sehingga membuat siswa kurang mendapatkan nilai sempurna. Nilai sempurna akan
didapat siswa jika menyebutkan sifat-sifat zat cair sebanyak 3 atau lebih jawaban.
Namun sebagian besar siswa mendapat skor baik sehingga soal tersebut dalam
hanya sedikit siswa yang merasa kesusuahna dalam menjawab soal tersebut.
Penghitungan Reliabilitas
Diketahui:
Jumlah skor 1243
Mt = = =40,1
Jumlah peserta 31
√
2
∑ X2− ∑ X
( ) √
2
57707 1243
Sd =
N N
=
31
−
31 ( )
¿ √1, 86−49, 84
¿ √−47,98
¿−6,9
Diketahui: k= 5
M= 40, 1
S = Sd2 = (-6, 9)2 = 47, 61
Ditanya: KR21 = ….?
Jawab:
M ( k−M )
KR21 = ( )(
k−1
k
1−
kS )
40, 1 ( 5−40, 1 )
= ( )(
5
5−1
1−
5 × 47,61 )
40,1 (−35,1 )
=
5
4( )(
1−
238,05 )
−1, 42
(
= ( 1,25 ) 1−
238, 05 )
= 1,25× 0, 01
= 0, 0125
butir soal yang diuji coba yaitu 0, 0125 . Angka tersebut di bawah indeks minimal
reliabilitas sebesar 0,7. Dapat disimpulkan bahwa soal tes termasuk tidak baik karena
tidak reliabel. Apabila diujicobakan kembali kepada subjek yang sama, dengan soal
yang sama, tetapi waktunya berbeda akan menunjukkan hasil yang berbeda. Oleh
karena itu, butir soal yang telah dibuat dalam penelitian ini tidak reliabel.
42
C. Kesimpulan
1. Secara keseluruhan keefektifan pengecoh masih kurang karena dari 10 butir soal
yang pengecohnya dijawab secara merata oleh peserta didik hanya empat butir
saja.
2. Tingkat kesukaran pada butir soal yang diujicobakan belum termasuk baik
karena terlalu mudah dijawab oleh siswa. (tidak sesuai proporsi 25% sukar, 50%
dan bawah karena daya beda yang sangat baik sebanyak tiga butir, yang baik
sebanyak lima butir, yang sedang sebanyak satu butir sedangkan yang kurang
valid dengan yang tidak valid jumlahnya lebih banyak yang valid.
5. Soal yang dibuat tidak memenuhi syarat reliabilitas atau dengan kata lain soal
harga reliabel.
43
DAFTAR PUSTAKA
Cece Rakhmat dan Didi Suherdi. 1999. Evaluasi Pengajaran. Jakarta: Depdikbud.
Friyatmi. 2012. Analisis Butir Tes dengan Pendekatan Teori Tes Klasik. Diambil pada
tanggal 25 Desember 2012 dari http://friyatmi.blogspot.com/2012/09/analisis-
item-klasik.html.
------------. 2012. Parameter Kualitas Tes. Diambil pada tanggal 24 Desember 2012
dari power point Parameter Kualitas Tes.
LAMPIRAN
45
D. Kisi-kisi
Kisi-Kisi Tes
No Indikator Banyak Nomor Butir
. Butir Objektif Jawaban Esai
46
Singkat
Menentukan zat yang
1. dibutuhkan manusia 1 1 0 0
untuk bernafas.
Menyebutkan sifat-
2. sifat zat gas. 1 2 0 0
Menyebutkan sifat-
3. sifat zat cair. 5 3 12, 16, 17 23
Menyebutkan benda-
4. benda yang termasuk 1 4 0 0
zat padat.
Menentukan
5. perubahan wujud 11, 13, 21, 22
7 5
benda. 14,15
Menyebutkan
6. peristiwa perubahan 2 6, 7 0 0
benda.
Menyebutkan contoh
7. pelestarian alam. 5 9 18, 19 24, 25
Menyebutkan contoh
8. perusakan alam. 3 8, 10 20 0
Jumlah 10 10 5
E. Butir-butir Soal
Nama Lengkap :
47
Kelas :
Nama Sekolah :
A. Berilah tanda silang (X) pada huruf a, b, c, atau d di depan jawaban yang
paling tepat!
2. Balon jika dilepaskan akan terbang. Hal itu terjadi karena di dalam balon ada . . .
a. gas c. benda cair
b. benda padat d. minyak
7. Peristiwa perubahan wujud benda yang tidak dapat kembali kebentuk semula
adalah. . .
a. telur yang direbus dan didinginkan
b. plastik yang dipanaskan dan didinginkan
c. kayu yang dibakar dan didinginkan
d. karet yang dibakar dan didinginkan
Butir 1
Pengecoh a
54
jumlah pemilih pada pengecoh 0
×100 = ×100 =0
jumlah seluruh siswa 31
Pengecoh c
Pengecoh d
jumlah pemilih pada pengecoh 0
×100 = ×100 =0
jumlah seluruh siswa 31
Butir 2
Pengecoh b
jumlah pemilih pada pengecoh 0
×100 = ×100 =0
jumlah seluruh siswa 31
Pengecoh c
jumlah pemilih pada pengecoh 0
×100 = ×100 =0
jumlah seluruh siswa 31
Pengecoh d
jumlah pemilih pada pengecoh 0
×100 = ×100 =0
jumlah seluruh siswa 31
Butir 3
Pengecoh a
jumlah pemilih pada pengecoh 4
×100 = ×100 =13
jumlah seluruh siswa 31
Pengecoh b
Pengecoh c
Butir 4
Pengecoh a
jumlah pemilih pada pengecoh 1
×100 = ×100 =3
jumlah seluruh siswa 31
Pengecoh b
jumlah pemilih pada pengecoh 0
×100 = ×100 =0
jumlah seluruh siswa 31
Pengecoh d
55
jumlah pemilih pada pengecoh 2
×100 = ×100 =7
jumlah seluruh siswa 31
Butir 5
Pengecoh b
jumlah pemilih pada pengecoh 0
×100 = ×100 =0
jumlah seluruh siswa 31
Pengecoh c
Pengecoh d
Butir 6
Pengecoh b
jumlah pemilih pada pengecoh 0
×100 = ×100 =0
jumlah seluruh siswa 31
Pengecoh c
Pengecoh d
jumlah pemilih pada pengecoh 0
×1 00 = ×100 =0
jumlah seluruh siswa 31
Butir 7
Pengecoh a
jumlah pemilih pada pengecoh 13
×100 = ×100 =42
jumlah seluruh siswa 31
Pengecoh b
Pengecoh d
Butir 8
Pengecoh a
56
jumlah pemilih pada pengecoh 2
×100 = ×100 =7
jumlah seluruh siswa 31
Pengecoh b
Pengecoh c
Butir 9
Pengecoh a
jumlah pemilih pada pengecoh 7
×100 = ×100 =23
jumlah seluruh siswa 31
Pengecoh c
jumlah pemilih pada pengecoh 0
×100 = ×100 =0
jumlah seluruh siswa 31
Pengecoh d
Butir 10
Pengecoh a
jumlah pemilih pada pengecoh 2
×100 = ×100 =7
jumlah seluruh siswa 31
Pengecoh b
Pengecoh c
57
Lampiran Penghitungan Indeks Kesukaran dan Daya Beda
B 31
1. P1 = = =1
S 31
B 31
2. P2 = = =1
S 31
B 25
3. P3 = = =0,8 1
S 31
B 28
4. P4 = = =0,90
S 31
B 24
5. P5 = = =0,77
S 31
B 30
6. P6 = = =0,97
S 31
B 10
7. P7 = = =0,32
S 31
B 26
8. P8 = = =0,84
S 31
B 22
9. P9 = = =0,71
S 31
B 26
10. P10 = = =0,84
S 31
Daya Beda
22 9 13
1. D1 = − = ¿ 0,84
15,5 15,5 15,5
22 9 13
2. D2 = − = ¿ 0,84
15,5 15,5 15,5
19 6 13
3. D3 = − = =0,84
15,5 15,5 15,5
20 8 12
4. D4 = − = =0,77
15,5 15,5 15,5
20 4 16
5. D5 = − = =1,03
15,5 15,5 15,5
22 8 14
6. D6 = − = =0,90
15,5 15,5 15,5
9 1 8
7. D7 = − = =0, 52
15,5 15,5 15,5
58
22 4 1
8. D8 = − = =1,16
15,5 15,5 15,5
18 4 14
9. D9 = − = =0,90
15,5 15,5 15,5
21 5 16
10. D10 = − = =1, 03
15,5 15,5 15,5
√
2
∑ X2− ∑ X
( ) √
2
2149 253
Sd =
N N
=
31
− ( )
31
¿ √ 69,32−66,59
¿ √ 2,73
¿ 1,65
1. Butir nomor 1
253
Mp1 =
31
= 8, 16
γ 1=
M p −M t p
Sd q √
√
31
8,16−8, 16 31
¿
1,65 0
31
¿0
2. Butir nomor 2
253
Mp2= 31
= 8, 16
M −M t p
γ 1= p
Sd q √
√
31
8,16−8, 16 31
¿
1,65 0
31
¿0
59
3. Butir nomor 3
215
Mp3 =
25
= 8, 6
γ 3=
M p−M t
Sd √ p
q
√√
25
8,6−8, 16 31
¿
1,65 6
31
0,44 0,81
¿
1,65 0,19
¿ 0,27 ×2, 06
¿ 0,56
4. Butir nomor 4
229
Mp4 =
28
= 8, 18
γ 4=
M p−M t
Sd √ p
q
√
28
8,18−8,16 31
¿
1,65 3
31
¿
√
0,02 0, 90
1,65 0, 09
¿ 0, 01× 3,16
¿ 0, 03
5. Butir nomor 5
212
Mp5 =
24
= 8, 83
60
γ 5=
M p−M t
Sd √ p
q
√
24
8,83−8, 16 31
¿
1,65 7
31
¿
0,67 0,8
1,65 0,2 √
¿ 0, 41 ×2
¿ 0,82
6. Butir nomor 6
250
Mp6 =
30
= 8, 33
γ 6=
M p−M t
Sd √ p
q
√
30
8,33−8,16 31
¿
1, 65 1
31
¿
0,17 0,97
1,65 0,03√
¿ 0,10 ×5, 69
¿ 0,57
7. Butir nomor 7
94
Mp7 =
10
= 9, 4
γ 7=
M p−M t
Sd √ p
q
61
√√
10
9, 4−8,16 31
¿
1,65 21
31
1,24 0,3
¿
1,65 0,7
¿ 0,75 ×0,66
¿ 0,5
8. Butir nomor 8
226
Mp8 =
26
= 8, 7
γ 8=
M p−M t
Sd √ p
q
√√
26
8,7−8, 16 31
¿
1,65 5
31
0,54 0,84
¿
1,65 0,16
¿ 0,33 ×0,29
¿ 0,1
9. Butir nomor 9
193
Mp9 =
22
= 8, 77
γ 9=
M p−M t
Sd √ p
q
√
22
8,77−8, 16 31
¿
1,65 9
31
62
¿
√
0,61 0,71
1,65 0,29
¿ 0,37 ×1, 57
¿ 0,58
γ 10=
M p −M t p
Sd q√
√
26
8,62−8,16 31
¿
1,65 5
31
¿
√
0,46 0, 8
1,65 0,2
¿ 0,3 ×2
¿ 0,6
Reliabilitas
Diketahui: k=10
M= 8, 16
S = Sd2 = (1,65)2 = 2,7225
Ditanya: KR21 = ….?
Jawab:
M ( k−M )
KR21 = ( )(
k
k−1
1−
kS )
8,16 ( 10−8,16 )
= ( )(
10
10−1
1−
10 ×2,7225 )
8, 16 ( 1, 84 )
= ( )(
10
9
1−
27,225 )
15,0144
(
= ( 1,11 ) 1−
27,225 )
= 1,11 ×0, 45
= 0, 4995
63
Yogyakarta, 10 November 2014
Mengetahui,
64