Anda di halaman 1dari 9

Jurnal THEOREMS (The Original Research of Mathematics) Vol. 2 No. 1, Juli 2017, hal.

28-36

Kriteria Instrumen dalam suatu Penelitian

Zaenal Arifin
Program Studi Pendidikan Matematika, Universitas Majalengka
Email: arifin1169@gmail.com

Abstrak—Artikel ini bertujuan untuk melakukan kajian tentang


kriteria instrumen yang baik yang diperlukan dalam suatu penelitian.
Validitas, reliabilitas, tingkat kesukaran, daya pembeda dan pengecoh
(distraktor) merupakan hal yang penting yang harus diperhatikan
oleh peneliti agar instrumen yang dibuat menjadi baik, sehingga bisa
digunakan dalam dan menghasilkan data yang baik pula. 1) Validitas
terbagi menjadi validitas isi dan konstruk. Validitas isi ditentukan
oleh nilai V, sedangkan validitas konstruk ditentukan oleh nilai KMO.
2) Reliabilitas instrumen ditentukan oleh nilai cronbach’s alfa. 3)
Tingkat kesukaran butir soal ditentukan oleh nilai koefisien p. 4) Daya
pembeda butir soal ditentukan oleh koefisien DB. 5)
Distraktor/pengecoh ditentukan oleh persentase pemlilihan dari
peserta tes. Jika nilai atau persentase dari kelima hal ini berada pada
kategori baik, maka instrumen yang dibuat peneliti memiliki kriteria
yang baik.

Kata kunci: daya pembeda, instrumen yang baik, pengecoh, reliabilitas, tingkat kesukaran,
validitas.

28
Copyright ©2017, Jurnal THEOREMS (The Original Research of Mathematics)
p-ISSN: 2528-102X e-ISSN: 2541-4321
Jurnal THEOREMS (The Original Research of Mathematics) Vol. 2 No. 1, Juli 2017, hal. 28-36

1. PENDAHULUAN
Bagi seorang peneliti, mempelajari kriteria yang baik, maka mutu
metodologi penelitian, dalam penelitiannya juga baik, begitupun
menentukan data tidaklah mudah. sebaliknya.
Tidak hanya mendapatkan data dan Hal ini mudah dipahami karena
mengolahnya sesuai keinginan sendiri, instrumen berfungsi mengungkapkan
namun harus mengikuti prosedur yang suatu fakta menjadi suatu data,
bisa dilakukan untuk menganalisis data sehingga jika instrumen yang
tersebut. Oleh karena itu, agar data digunakan dalam penelitian
yang kita peroleh menjadi data yang mempunyai kualitas yang baik, dalam
valid dan reliabel, diperlukan adanya arti valid dan reliabel serta memiliki
suatu instrumen atau yang biasa tingkat kesukaran, daya pembeda dan
disebut dengan alat ukur yang baik distraktor/pengecoh yang baik, maka
pula. data yang diperoleh akan sesuai
Menurut Azwar (2011: 2), dengan fakta atau keadaan
menyatakan bahwa para ahli sesungguhnya di lapangan. Sedangkan
psikometri telah menetapkan kriteria jika kualitas instrumen yang digunakan
bagi alat ukur, seperti instrumen, untuk tidak baik dalam arti mempunyai
dinyatakan sebagai alat ukur yang baik. validitas dan reliabilitas yang rendah,
Kriteria tersebut antara lain adalah serta memiliki tingkat kesukaran, daya
valid, reliabel, standar, ekonomis dan pembeda dan distraktor/pengecoh
praktis. Menurut Gronlund (2009: 70) yang tidak baik, maka data yang
menyatakan bahwa karakteristik utama diperoleh juga tidak valid atau tidak
yang harus dimiliki oleh sebuah alat sesuai dengan fakta di lapangan,
ukur dapat diklasifikasikan menjadi sehingga dapat menghasilkan
karakter validitas, reliabilitas dan kesimpulan yang keliru.
tingkat kegunaannnya. Secara singkat Sebenarnya, dalam mengumpulkan
dan jelas, dalam membuat instrumen data dalam suatu penelitian, selain
penelitian pengembangan, Setyosari membuat instrumen sendiri, kita dapat
(2013: 207) dan Depdiknas (2008: 4) menggunakan instrumen yang telah
menyatakan bahwa validitas dan tersedia (instrumen baku). Instrumen
reliabilitas menjadi dua hal yang harus yang telah tersedia pada umumnya
benar-benar diperhatikan. sudah dianggap baku untuk
Dengan adanya instrumen mengumpulkan data terhadap variabel-
penelitian, maka kita akan mengetahui variabel tertentu.
sumber data yang akan kita teliti dan Oleh karena itu, jika instrumen
jenis datanya, teknik pengumpulan telah tersedia untuk mengumpulkan
datanya, instrumen pengumpulan data variabel suatu penelitian, maka
datanya, langkah penyusunan kita dapat langsung menggunakan
instrumen penelitian tersebut serta instrumen tersebut. Namun ada
mengetahui validitas, reabilitas, tingkat catatan, bahwa teori yang dijadikan
kesukaran, daya pembeda, dan landasan penyusunan instrumen
pengecoh/distraktor suatu data dalam tersebut harus sesuai dengan teori yang
penelitian. dirujuk pada penelitian kita.
Instrumen mempunyai peranan Selain itu konstruk variabel yang
yang sangat penting. Karena dengan diukur oleh instrumen baku, harus juga
adanya instrumen, mutu suatu sama dengan konstruk variabel yang
penelitian dapat diketahui. Jika akan kita ukur dalam penelitian kita.
instrumen yang dibuat, memiliki Akan tetapi, lebih baik jika kita sendiri
29
Copyright ©2017, Jurnal THEOREMS (The Original Research of Mathematics)
p-ISSN: 2528-102X e-ISSN: 2541-4321
Jurnal THEOREMS (The Original Research of Mathematics) Vol. 2 No. 1, Juli 2017, hal. 28-36

yang membuat instrumen. Selain representatif dari keseluruhan butir


belajar membuat instrumen sendiri, yang mungkin dibuat.
kita juga bisa mengasah kemampuan Validitas kriteria, disebut juga
yang kita punya. validitas prediktif, merupakan
Kajian ini akan membahas kesahihan suatu perangkat tes dalam
mengenai beberapa hal yang harus membuat prediksi, dapat meramalkan
diperhatikan, agar instrumen yang keberhasilan siswa pada masa yang
dibuat bisa dilihat kriterianya, apakah akan datang. Validitas prediktif suatu
instrumennya baik atau tidak baik, perangkat tes dapat diketahui dari
yaitu validitas, reliabilitas, tingkat korelasi antara perangkat tes dengan
kesukaran, daya pembeda, dan kriteria tertentu yang dikehendaki,
distraktor/pengecoh. yang disebut dengan variabel kriteria
2. KAJIAN LITERATUR (Allen & Yen, 1979: 97; Azwar, 2011:
Validitas 51).
Gronlund (2009: 70) menyebutkan Reliabilitas
bahwa validitas adalah ketepatan Reynold (2006: 91) menyatakan
interpretasi yang diperoleh dari hasil bahwa reliabilitas mengacu pada
penilaian. Lebih rinci Azwar (2010: 5) kekonsistenan atau kestabilan hasil
mennyebutkan bahwa validitas berasal penilaian. Namun secara singkat Cohen
dari kata validity yang memiliki arti (2007: 146) menyatakan bahwa
sejauh mana ketepatan dan kecermatan reliabilitas sebagai kestabilan.
suatu alat ukur dalam melakukan Mengenai reliabilitas, Ebel & Frisbie
fungsi ukurnya. Namun secara khusus (1991: 76), menyatakan bahwa jika
Allen & Yen (1979: 97) menyatakan tesnya memiliki konsistensi yang
bahwa validitas dari suatu perangkat tinggi, maka tes tersebut akurat,
tes dapat diartikan merupakan reproducible, dan generalizable terhadap
kemampuan suatu tes untuk mengukur kesempatan testing dan instrumen
apa yang seharusnya diukur. yang sama.
Ada tiga tipe validitas, yaitu Mehrens & Lehmann (1973: 249)
validitas isi, validitas konstruk dan menyatakan bahwa reliabilitas
validitas kriteria (Allen & Yen, 1979: merupakan derajat keajegan (konsisten)
97). Selain itu, menurut (Azwar, 2011: di antara dua buah hasil pengukuran
45-47) terdapat dua macam validitas isi, pada objek yang sama. Definisi ini
yaitu validitas kenampakan dan dapat diilustrasikan dengan seseorang
validitas logika. Validitas isi berarti yang diukur tinggi badannya akan
sejauh mana suatu perangkat tes diperoleh hasil yang tidak berubah
mencerminkan keseluruhan walaupun menggunakan alat pengukur
kemampuan yang hendak diukur yang berbeda dan skala yang berbeda.
(Azwar, 2011: 45), yang berupa analisis Kaitannya dengan dunia pendidikan,
rasional terhadap domain yang hendak prestasi atau kemampuan seorang
diukur. Validitas kenampakan siswa dikatakan reliabel jika sudah
didasarkan pada pertanyaan apakah dilakukan pengukuran. Kereliabelan ini
suatu butir-butir dalam perangkat tes bermakna hasil pengukuran akan sama
mengukur aspek yang relevan dengan informasinya, walaupun penguji
domainnya. Validitas logika berkaitan berbeda, korektornya berbeda atau
dengan keseksamaan batasan pada butir soal yang berbeda tetapi memiliki
domain yang hendak diukur, dan karakteristik yang sama.
merupakan jawaban apakah Allen & Yen (1979: 62) menyatakan
keseluruhan butir merupakan sampel bahwa tes dikatakan reliabel jika skor
30
Copyright ©2017, Jurnal THEOREMS (The Original Research of Mathematics)
p-ISSN: 2528-102X e-ISSN: 2541-4321
Jurnal THEOREMS (The Original Research of Mathematics) Vol. 2 No. 1, Juli 2017, hal. 28-36

amatan mempunyai korelasi yang korelasi 1 atau korelasi sempurna,


tinggi dengan skor yang sebenarnya. dalam bidang pendidikan, hampir
Selanjutnya dinyatakan bahwa tidak pernah tercapai. Umumnya selalu
reliabilitas merupakan koefisien lebih kecil dari 1. Jika angka
korelasi antara dua skor amatan yang korelasinya diatas 0,60 dan kurang dari
diperoleh dari hasil pengukuran 1, maka instrumen tersebut memiliki
menggunakan tes yang paralel. Dengan korelasi tinggi atau reliabel, sedangkan
demikian, pengertian yang dapat jika angka korelasinya di bawah 0,50 ke
diperoleh dari pernyatan tersebut bawah, maka instrumen tersebut
adalah suatu tes itu reliabel jika hasil berkorelasi rendah atau tidak reliabel
pengukuran mendekati keadaan (Basuki dan Haryanto, 2014: 144).
peserta tes yang sebenarnya. Selain validitas dan reliablitas,
Oleh karena itu, dalam bidang dalam penelaahan soal secara
pendidikan, pengukuran tidak dapat kuantitatif terdapat tiga penelaahan
langsung dilakukan pada ciri atau butir soal yang didasarkan pada data
karakter yang akan diukur. Ciri atau empirik dari butir soal yang
karakter ini bersifat abstrak. Hal ini bersangkutan, yaitu Tingkat kesukaran,
menyebabkan sulitnya memperoleh daya pembeda, dan analisis
alat ukur yang stabil untuk mengukur distraktor/pengecoh. Data empirik ini
karakteristik seseorang (Mehrens & diperoleh dari soal yang telah diujikan.
Lehmann, 1973: 103). Tingkat Kesukaran
Berdasarkan uraian di atas, maka Tingkat kesukaran butir soal adalah
dalam pembuatan alat ukur dalam persentase atau proporsi dari peserta
dunia pendidikan harus dilakukan tes untuk menjawab benar suatu butir
secermat mungkin dan disesuaikan soal. Besarnya tingkat kesukaran
dengan kaidah-kaidah yang telah berkisar 0,00 - 1,00. Semakin besar
ditentukan oleh ahli-ahli pengukuran tingkat kesukaran yang diperoleh dari
di bidang pendidikan. Kereliabilitasan hasil hitungan, berarti semakin mudah
suatu alat ukur, yang berupa suatu soal itu dan soal itu harus direvisi.
indeks reliabilitas, dapat dilakukan Suatu soal memiliki p = 0,00 artinya
penelaahan secara statistik. Nilai ini bahwa tidak ada siswa yang menjawab
biasa dinamakan dengan koefisien benar dan bila memiliki p = 1,00 artinya
reliabilitas (reliability coefficient). bahwa semua siswa menjawab benar.
Menentukan nilai reliabilitas suatu tes keberagaman peserta tes terjadi
dapat menggunakan aplikasi SPSS atau ketika level optimum kesukaran adalah
menghitung secara manual 0,50, yang mengindikasikan bahwa
menggunakan formula sebagai berikut: sebanyak 50% peserta tes menjawab
∑ benar, dan sebanyak 50% peserta tes
= 1− menjawab salah. Akan tetapi, tidak
−1
setiap butir soal harus memiliki tingkat
dengan: kesukaran 0,50. Boleh satu soal
R : Banyaknya butir soal memiliki nilai kurang dari 0,50,
: Varians ataupun lebih besar dari 0,50, akan
Penetapan besarnya reliabilitas tetapi rata-rata dari keseluruhan dari
suatu instrumen tes dapat digunakan butir soal tetap 0,50.
teknik korelasi dengan hasil Tingkat kesukaran butir soal
korelasinya -1 sampai dengan +1. memiliki 2 kegunaan, yaitu kegunaan
Tanda minus dan plus menunjukkan bagi guru dan kegunaan bagi pengujian
arah suatu hubungan tertentu. Angka
31
Copyright ©2017, Jurnal THEOREMS (The Original Research of Mathematics)
p-ISSN: 2528-102X e-ISSN: 2541-4321
Jurnal THEOREMS (The Original Research of Mathematics) Vol. 2 No. 1, Juli 2017, hal. 28-36

dan pengajaran (Nitko, 2011: 303-305). (2) Butir soal itu memiliki 2 atau
Kegunaannya bagi guru adalah: lebih kunci jawaban yang
a) Sebagai pengenalan konsep benar
terhadap pembelajaran ulang dan (3) Kompetensi yang diukur tidak
memberi masukan kepada siswa jelas
tentang hasil belajar mereka, (4) Pengecoh tidak berfungsi
b) Memperoleh informasi tentang (5) Materi yang ditanyakan terlalu
penekanan kurikulum atau sulit, sehingga banyak siswa
mengecek terhadap butir soal yang yang menebak
bias. (6) Sebagian besar siswa yang
Adapun kegunaannya bagi memahami materi yang
pengujian dan pengajaran adalah: ditanyakan berpikir ada yang
a) Pengenalan konsep yang salah informasi dalam butir
diperlukan untuk diajarkan ulang, soalnya
b) Mengecek terhadap kelebihan dan Indeks daya pembeda setiap butir
kelemahan pada kurikulum soal biasanya juga dinyatakan dalam
sekolah, bentuk proporsi. Semakin tinggi indeks
c) Memberi masukan kepada siswa, daya pembeda soal berarti semakin
d) Mengecek kemungkinan adanya mampu soal yang bersangkutan
butir soal yang bias. membedakan siswa yang telah
Daya pembeda memahami materi dengan siswa yang
Daya pembeda soal adalah belum memahami materi. Indeks daya
kemampuan suatu butir soal dapat pembeda berkisar antara – 1,00 sampai
membedakan siswa yang telah dengan +1,00. Semakin tinggi daya
menguasai materi yang ditanyakan dan pembeda suatu soal, maka semakin
siswa yang tidak/kurang/belum kuat/baik soal itu. Jika daya pembeda
menguasai materi yang ditanyakan. negatif (<0) berarti lebih banyak
Manfaat daya pembeda butir soal kelompok bawah (peserta didik yang
adalah seperti berikut ini: tidak memahami materi) menjawab
a) Untuk meningkatkan mutu setiap benar soal dibanding dengan kelompok
butir soal melalui data empiriknya. atas (peserta didik yang memahami
Berdasarkan indeks daya pembeda, materi yang diajarkan guru).
setiap butir soal dapat diketahui Proses perhitungan daya pembeda
apakah butir soal itu baik, direvisi, dilakukan jika sudah dibedakan antara
atau ditolak. proses perhitungan daya pembeda
b) Untuk mengetahui seberapa jauh kelompok kecil dengan kelompok
setiap butir soal dapat besar. Terlebih dahulu kita menetapkan
mendeteksi/membedakan sampel yang mewakili kelompok
kemampuan siswa, yaitu siswa pandai dan sampel yang mewakili
yang telah memahami atau belum kelompok kurang pandai, tetapi
memahami materi yang diajarkan sebelumnya data telah diurutkan dari
guru. Apabila suatu butir soal peserta didik yang memperoleh hasil
tidak dapat membedakan kedua yang tinggi ke peserta didik yang
kemampuan siswa itu, maka butir memproleh hasil yang buruk.
soal itu dimungkinkan seperti Kemudian sampel kelompok kecil
berikut ini: dapat diambil 50% dari populasi untuk
(1) Kunci jawaban butir soal itu kelompok pandai dan kelompok
tidak tepat. kurang pandai, sedangkan untuk

32
Copyright ©2017, Jurnal THEOREMS (The Original Research of Mathematics)
p-ISSN: 2528-102X e-ISSN: 2541-4321
Jurnal THEOREMS (The Original Research of Mathematics) Vol. 2 No. 1, Juli 2017, hal. 28-36

kelompok besar masing-masing pengecoh berfungsi sebagai


kelompok pandai dan kelompok pengidentifikasi peserta tes yang
kurang pandai diambil 27% dari berkemampuan tinggi. Pengecoh
populasi sehingga kelompok sedang dikatakan berfungsi efektif jika banyak
sebanyak 54% dari populasi. dipilih oleh peserta tes dari kelompok
Analisis distraktor/pengecoh bawah, sebaliknya jika banyak dipilih
Tes bentuk pilihan ganda oleh kelompok atas, maka
terstruktur atas item permasalahan distraktor/pengecoh tersebut tidak
yang ditanyakan (atau pokok soal) dan berfungsi sebagaimana mestinya.
option (atau sejumlah kemungkinan 3. HASIL DAN PEMBAHASAN
jawaban). Option sendiri dibagi Validitas
menjadi dua, yaitu kunci jawaban dan  Validitas Isi
pengecoh. Ini berarti, dari sekian Validitas isi ditentukan
jawaban yang disediakan hanya menggunakan kesepakatan ahli (expert).
terdapat satu jawaban yang tepat yang Kesepakatan ahli bidang studi atau
disebut kunci jawaban, sedangkan sering disebut dengan domain yang
kemungkinan jawaban yang lain diukur menentukan tingkatan validitas
(jawaban yang tidak benar) disebut isi. Hal ini dikarenakan instrumen
pengecoh/distraktor. pengukuran dibuktikan valid jika ahli
Seseorang yang membuat soal meyakini bahwa bahwa istrumen
pilihan ganda, terkadang ia tidak tersebut mengukur penguasaan
mudah untuk membuat pengecohnya. kemampuan yang didefinisikan dalam
Kecilnya angka daya pembeda domain ataupun juga konstruk
seringkali muncul karena pengecoh psikologi yang diukur (Retnawati, 2014:
yang kurang berfungsi (Surapranata, 7). Peneliti meminta kepada ahli untuk
2009: 47). memeriksa ketepatan antara kesesuaian
Salah satu tujuan analisis distraktor butir soal dengan indikator-
adalah untuk memeriksa berapa indikatornya, redaksi penulisan soal,
banyak siswa pada kelompok atas dan dan kesesuaian pilihan jawaban
kelompok bawah yang memilih tiap- (pengecoh) pada pilihan ganda.
tiap jawaban pada tes pilihan ganda. Apabila masih ada kekeliruan dalam
Oleh karena itu, dalam hal ini memuat pembuatan instrumen, maka instrumen
dua pertanyaan. Pertama, apakah tersebut direvisi kembali.
distraktor mengalihkan perhatian dari Setelah dilakukan pemeriksaan oleh
beberapa peserta tes? Jika tidak ada ahli, dalam hal ini sebagai validator,
peserta tes memilih distraktor, ini selanjutnya ahli memberikan penilaian
berarti distraktor tidak berfungsi. Jika terhadap instrumen. Penilaian tersebut
distraktor begitu jelas menyatakan terdiri dari 5 kriteria sebagai berikut:
sebagai jawaban tidak benar pada suatu Tabel 1. Kriteria Penilaian Butir
tes namun tidak ada peserta tes yang Instrumen oleh Validator
memilih distraktor tersebut, berarti Nilai Keterangan
bahwa distraktor tersebut perlu direvisi 1 Tidak Relevan
atau diganti. 2 Kurang Relevan
Pertanyaan kedua, apakah 3 Cukup
distraktor yang dibuat menarik lebih 4 Relevan
banyak dipilih oleh peserta tes 5 Sangat Relevan
kelompok bawah dari pada pada
kelompok atas? Jika ya, berarti
distraktornya baik. Distraktor atau
33
Copyright ©2017, Jurnal THEOREMS (The Original Research of Mathematics)
p-ISSN: 2528-102X e-ISSN: 2541-4321
Jurnal THEOREMS (The Original Research of Mathematics) Vol. 2 No. 1, Juli 2017, hal. 28-36

Setelah diberikan penilaian oleh 5) Klik OK.


ahli, selanjutnya peneliti menghitung
hasil penilaian menggunakan indeks Estimasi Reliabilitas Instrumen
validitas, diantaranya dengan indeks Teknik analisis data untuk estimasi
yang diusulkan oleh Aiken sebagai reliabilitas instrumen ini menggunakan
berikut. teknik estimasi konsistensi internal
∑ dengan formula Chronbach-alpha yang
= , dimana = −
( ) dibantu aplikasi SPSS IBM 20. Jika nilai
Cronbach's Alpha 0,60 dan kurang dari
Keterangan: 1, maka instrumen tersebut memiliki
: rating penilai korelasi tinggi atau reliabel, sedangkan
: rating penilai kategori terendah jika nilai Cronbach's Alpha di bawah 0,50
c : kategori tertinggi ke bawah, maka instrumen tersebut
N : jumlah penilai/responden berkorelasi rendah atau tidak reliabel
(Aiken, 1980: 956) (Basuki dan Hariyanto, 2014: 105). Hal
ini juga didukung oleh Surapranata
Rentang angka V yang mungkin (2009: 114), bahwa koefisien reliabilitas
diperoleh adalah antara 0 sampai sebesar 0,5 dapat digunakan untuk
dengan 1. Semakin tinggi angka V tujuan penelitian.
(mendekati 1 atau sama dengan 1) Adapun langkah-langkah untuk
maka nilai kevalidan sebuah item/butir mencari nilai Cronbach's Alpha dengan
soal juga semakin tinggi, dan semakin SPSS IBM 20 adalah sebagai berikut:
rendah angka V (mendekati 0 atau 1) Input data,
sama dengan 0) makan nilai kevalidan 2) Klik Analyze,
sebuah item/butir soal juga semakin 3) Pilih Scale, lalu pilih Reliablity
rendah (Aiken, 1980: 957). Analysis,
 Validitas Konstruk 4) Masukkan semua butir soal ke
Analisis untuk membuktikan kolom items, dan
validitas konstruk ialah menggunakan 5) Klik OK.
analisis faktor eksploratori. Analisis Tingkat Kesukaran Butir Soal
faktor eksploratori dapat dilihat dari Teknik analisis data untuk tingkat
persentasi varians yang dilihat dari kesukaran butir soal berupa pilihan
nilai KMO (Kaiser Meyer Olkin). Nilai ganda dapat dihitung dengan rumus:
KMO dapat diperoleh melalui aplikasi ℎ
SPSS IBM 20. Jika nilai KMO lebih dari =

0,5, maka variabel dan sampel yang
digunakan memungkinkan untuk (Nitko, 2011: 301)
dilakukan analisis lebih lanjut (Santoso, Tingkat kesukaran dalam bentuk
2006: 22). Adapun langkah-langkah soal uraian dapat dihitung dengan
untuk mencari nilai KMO dengan SPSS rumus:
2 −
IBM 20 adalah sebagai berikut: =
1) Input data, −
2) Klik Analyze, (Nitko, 2011: 303)
3) Pilih Dimension Reduction, lalu pilih Setelah dilakukan perhitungan,
Factor, maka butir soal dapat dikategorikan
4) Masukkan semua butir soal ke menjadi butir soal yang sukar, sedang,
kolom items, lalu pilih Descriptives dan mudah. Hal itu bergantung
dan beri tanda centang pada KMO koefisien tingkat kesukarannya.
and Bartlett’s test of sphecirity, dan Perhatikan Tabel berikut.
34
Copyright ©2017, Jurnal THEOREMS (The Original Research of Mathematics)
p-ISSN: 2528-102X e-ISSN: 2541-4321
Jurnal THEOREMS (The Original Research of Mathematics) Vol. 2 No. 1, Juli 2017, hal. 28-36

Tabel 2. Kategori Tingkat Kesukaran minimal dipilih oleh 5% peserta tes


Koefisien Kategori (Basuki dan Hariyanto, 2014: 144).
p < 0,3 Sukar Pengecoh dikatakan berfungsi efektif
0,3 ≤ p ≤ Sedang jika banyak dipilih oleh peserta tes dari
0,7 kelompok bawah, sebaliknya jika
p > 0,7 Mudah banyak dipilih oleh kelompok atas,
(Surapranata, 2009: 21) maka distraktor/pengecoh tersebut
Daya Pembeda Butir Soal tidak berfungsi sebagaimana mestinya.
Teknik analisis data untuk daya
pembeda berupa pilihan ganda dapat 4. KESIMPULAN
dihitung dengan rumus: Validitas, reliabilitas, tingkat
JB A  JB B kesukaran, daya pembeda dan
DP  pengecoh (distraktor) merupakan hal
n yang penting yang harus diperhatikan
Dengan:
oleh peneliti agar instrumen yang
DP = Indeks Pembeda soal
dibuat menjadi baik, sehingga bisa
JBA = Jumlah peserta didik
digunakan dalam dan menghasilkan
kelompok atas yang
data yang baik pula. 1) Validitas terbagi
menjawab soal itu benar
menjadi validitas isi dan konstruk.
JBB = Jumlah peserta didik
Validitas isi ditentukan oleh nilai V,
kelompok bawah yang
sedangkan validitas konstruk
menjawab soal itu benar
ditentukan oleh nilai KMO. 2)
n = Persentase perbandingan
Reliabilitas instrumen ditentukan oleh
ukuran kelompok.
nilai cronbach’s alfa. 3) Tingkat
(Nitko, 2011: 304)
kesukaran butir soal ditentukan oleh
Daya pembeda untuk soal uraian
nilai koefisien p. 4) Daya pembeda butir
dapat dihitung dengan rumus;
soal ditentukan oleh koefisien DB. 5)
̅ − ̅ ℎ
= Distraktor/pengecoh ditentukan oleh
(Nitko, 2011: 304) persentase pemlilihan dari peserta tes.
Setelah dilakukan perhitungan, Jika nilai atau persentase dari kelima
maka butir soal dikategorikan menjadi hal ini berada pada kategori baik, maka
butir soal yang diterima, direvisi, dan instrumen yang dibuat peneliti
ditolak. Hal itu bergantung koefisien memiliki kriteria yang baik.
daya pembedanya. Jika ada soal yang 5. REFERENSI
ditolak, maka dapat dibuang atau Aiken, L. R. (1980). Content validity
diganti dengan butir soal yang baru. and reliability of single items or
Perhatikan Tabel berikut: questionnaires. Educational and
Tabel 3. Kriteria Pemilihan Soal psychological measurement, 40(4),
Berdasarkan Daya Pembeda 955-959.
Kriteria Koefisien Keputusan Allen, M.j., & Yen, W.M. (1979).
> 0,30 Diterima Introduction to measurement
Daya theory. Monterey, Mexico:
0,10 s.d 0,29 Direvisi
Pembeda Brooks/Cole Publishing Company.
< 0,10 Ditolak
Azwar, S. (2011). Reliabilitas dan
(Surapranata, 2009: 47)
validitas. Yogyakarta: Pustaka
Kefektifan Distraktor/Pengecoh Belajar.
Suatu distraktor yang efektif harus
dipilih oleh beberapa peserta tes atau

35
Copyright ©2017, Jurnal THEOREMS (The Original Research of Mathematics)
p-ISSN: 2528-102X e-ISSN: 2541-4321
Jurnal THEOREMS (The Original Research of Mathematics) Vol. 2 No. 1, Juli 2017, hal. 28-36

Basuki, I., & Hariyanto. (2014). Setyosari, P. (2013). Metode penelitian


Asesemen pembelajaran. Bandung: pendidikan & pengembangan.
PT. Remaja Rosdakarya. Jakarta: Prenadamedia group.
Cohen, L., Manion, L., & Morrison, K. Surapranata, S. (2009). Analisis,
(2007). Research methods in validitas, reliabilitas, dan
education. New York: Routledge. interpretasihasil tes implementasi
Depdiknas. (2008). Panduan penulisan kurikulum 2004. Bandung: PT.
butir soal. Jakarta: Direktoral Remaja Rosdakarya.
Jenderal Manajemen Pendidikan
Dasar dan Menengah. Direktoral
Pembinaan Sekolah Menengah
Atas.
Ebel, R.L. & Frisbie, D.A. (1991).
Essentials of educational
measurement. Fifth edition. New
Delhi: Prentice Hall of India.
Gronlund, N.E., Linn, R.L., & Miller,
M.D. (2009). Measurement &
evaluation in teaching. Tenth
edition. New York: Macmillan
Publishing Co., Inc.
Mehrens, W.A. & Lehmann, I.J. (1973).
Measurement and evaluation in
education and psychology. New
York : Hold, Rinehart and
Wiston,Inc.
Nitko, A.J. & Brookhart, S.M. (2011).
Educational assessment of students.
Xth edition. Upper Saddle River,
New Jersey: Prentice Hall
Englewood Cliffs.
Retnawati, H. (2014). Membuktikan
validitas instrumen dalam
pengukuran. Diambil pada tanggal 8
Juli 2015 dari
http://www.evaluation-edu.com.
Reynolds, C.R, Livingston, R.B., &
Willson, V. (2010). Measurement
and assessment in education.
Second edition. Upper Saddle
River, New Jersey: Pearson
Education.
Santoso, S. (2006). Seri Solusi Bisnis
Berbasis TI: Menggunakan SPSS
untuk Statistik Multivariat. Jakarta:
Elex Media Komputindo.

36
Copyright ©2017, Jurnal THEOREMS (The Original Research of Mathematics)
p-ISSN: 2528-102X e-ISSN: 2541-4321

Anda mungkin juga menyukai