Anda di halaman 1dari 39

C.

BAB II
KUALITAS INSTRUMEN TES PENDIDIKAN AGAMA ISLAM BUATAN
GURU MGMP PENDIDIKAN AGAMA ISLAM
D.
A. Kualitas Tes
Tes adalah suatu cara untuk mengadakan penilaian yang berbentuk
suatu tugas atau serangkaian tugas yang harus dikerjakan oleh anak atau
sekelompok anak, sehingga menghasilkan suatu nilai tentang tingkah laku atau
prestasi anak tersebut, yang dapat dibandingkan dengan nilai yang dicapai
oleh anak-anak lain atau dengan nilai standar yang ditetapkan (Nurkancana,
1986: 25).
Adapun tujuannya adalah untuk mengetahui sampai di mana prestasi
atau keberhasilan belajar siswa.
1. Pengertian Tes
Secara harfiyah, kata “tes” berasal dari bahasa Perancis Kuno
testum dengan arti “piring untuk menyisihkan logam-logam mulia”,
maksudnya dengan menggunakan alat berupa piring itu akan dapat
diperoleh jenis-jenis logam mulia yang nilainya sangat tinggi (Sudijono,
2003: 66).
Poerbakawatja (1982: 359) dalam Ensiklopedi Pendidikan, yang
dimaksud dengan tes adalah “suatu percobaan untuk secara bertanggung
jawab mendapatkan gambaran mengenai sifat-sifat, kemampuan-
kemampuan, temperamen, dan kepribadian orang, biasanya untuk dapat
mengetahui bagaimana orang harus diperlakukan, pekerjaan apa bagi
seseorang akan lebih sesuai”.
Dalam Ensyclopedia of Educational Evaluation, tes diartikan:
“any series of qustions or other means of measuring the skill, knowledge,
intelligence, capacities or aptitudes of an individual or group”( Anderson,
et.al., 1981: 425). Artinya: Seperangkat pertanyaan atau latihan atau alat-
alat pengukur kemampuan pengetahuan, kepandaian, kapasitas atau
kecerdasan lain dari suatu kelompok atau individu.

1
2

Menurut Suke Silverius (1991: 4-5) mendefinisikan tes adalah


“suatu proses baku untuk memperoleh sampel tingkah laku dari suatu
ranah tertentu”. Pengertian tes menurut Saifuddin Azwar (2000: 2) adalah
“sekumpulan pertanyaan yang harus dijawab dan atau tugas yang harus
dikerjakan yang akan memberikan informasi mengenai aspek psikologis
tertentu berdasarkan jawaban terhadap pertanyaan-pertanyaan atau cara
dan hasil subjek dalam melakukan tugas-tugas tersebut”.
Menurut Doughlas Brown (t.th.: 266) dalam kitab Ususu at-
Ta’allumi al-Lughati wa Ta’limiha terjemahan oleh Abdul ar-Rajhi,
mengartikan tes sebagai berikut:

.‫ طريقة لقياس االفراد ومعار فهم فى مجال معين‬:‫واالختبار‬


Artinya: “Tes dalam pengertian yang singkat adalah cara untuk
mengukur pengetahuan individu (testee) dalam bidang
tertentu”

Kemudian menurut Cronbach (1970: 21) dalam bukunya


Essentials of Psychological Testing mendefinisikan “a test is a systematic
procedure for comparing the behaviour of two or more person”. Artinya:
“Tes merupakan suatu prosedur yang sistematis untuk membandingkan
tingkah laku dua orang atau lebih”.
Dari beberapa pengertian tes di atas, dapat disimpulkan bahwa, tes
adalah merupakan suatu alat pengumpul informasi yang didapat dengan
melalui pertanyaan, petunjuk, latihan, perintah kepada testee untuk
merespon sesuai dengan petunjuk atau prosedur itu, kemudian hasilnya
oleh tester diolah secara sistematis menuju suatu arah kesimpulan yang
menggambarkan tingkah laku subjek tersebut.
Sebelum sampai kepada uraian yang lebih jauh, maka akan
diterangkan dahulu arti dari beberapa istilah-istilah yang berhubungan
dengan tes ini:
3

a. Tes
Tes adalah alat atau prosedur yang dipergunakan dalam rangka
pengukuran dan penilaian (Sudijono, 2003: 66)
b. Testing
Testing merupakan saat pada waktu tes itu dilaksanakan atau sedang
berlangsung. Dapat juga dikatakan testing adalah saat pengambilan tes
(Arikunto, 1990: 53).
c. Testee
Testee adalah responden yang sedang mengerjakan tes. Jadi orang-
orang inilah yang sedang dinilai, diukur baik kemampuan, minat,
pencapaian prestasi (Arikunto, 1990: 53).
d. Tester
Tester artinya orang yang melaksanakan tes, atau pembuat tes, atau
eksperimentor, yaitu orang yang sedang melakukan percobaan
(eksperiment) (Arikunto, 1990: 53). Tester juga diartikan sebagai orang
yang diserahi untuk melaksanakan pengambilan tes terhadap para
responden atau tester (Sudijono, 2003: 66).

2. Macam-macam Tes
Tes merupakan salah satu instrumen dalam evaluasi, yang memiliki
macam-macam dan bentuk. Secara umum macam-macam tes dibedakan:
a. Berdasarkan objek pengukurannya
1) Tes kepribadian (personality test)
Tes kepribadian adalah tes untuk mengukur derajat
kemampuan seseorang yang bersifat herediter atau bawaan
(Mohammad Ali, 1993: 81). Yang termasuk dalam tes ini dan
banyak digunakan dalam pendidikan adalah pengukuran sikap,
pengukuran minat, pengukuran bakat dan tes intelegensi.

2) Tes hasil belajar (achievement test)


4

Tes hasil belajar adalah sekelompok pertanyaan atau tugas-


tugas yang harus dijawab atau diselesaikan oleh siswa dengan
tujuan untuk mengukur kemajuan belajar siswa (Slameto, 2001:
30).
Tes hasil belajar digunakan untuk menilai sampai di mana
hasil belajar yang dicapai oleh siswa, setelah mereka menjalani
perbuatan belajar dalam waktu tertentu. Jadi tes ini dilakukan
setelah siswa mengalami proses belajar, dan bahan yang dijadikan
soal tes tidak keluar dari bahan yang telah dipelajari oleh siswa.
b. Berdasarkan fungsinya
Berdasarkan fungsinya tes dibedakan menjadi empat jenis,
yaitu:
1) Tes penempatan (Placement test)
Tes penempatan adalah tes untuk mengukur kemampuan
dasar yang dimiliki oleh anak didik, kemampuan tersebut dapat
dipakai meramalkan kemampuan peserta didik pada masa
mendatang, sehingga kepadanya dapat dibimbing, diarahkan atau
ditempatkan pada jurusan yang sesuai dengan kemampuan
dasarnya (Chabib Thoha, 2003: 46).
2) Tes formatif
Tes formatif adalah tes untuk mengukur sampai di mana
suatu bagian pelajaran mengenai bagian tertentu sudah dikuasai
oleh anak didik, misalnya suatu unit ataupun bab tertentu dalam
buku pelajaran (Gronlund, 1985: 6-7)
Tes ini diselenggarakan pada saat berlangsunya proses
belajar mengajar, diselenggarakan secara periodik, isinya
mencakup semua unit pengajaran yang telah diajarkan.
3) Tes sumatif
Tes sumatif adalah tes hasil belajar yang dilaksanakan
setelah sekumpulan Satuan Program Pengajaran selesai diberikan.
5

Di sekolah tes ini dikenal dengan istilah ”Ulangan Umum” atau


”EBTA” (Sudijono, 2003: 72).
Tes ini bertujuan mengukur keberhasilan belajar peserta
didik secara menyeluruh, materi yang diujikan seluruh pokok
bahasan dan tujuan pengajaran dalam satu program tahunan atau
semesteran, masing-masing pokok bahasan terwakili dalam butir-
butir soal yang diujikan.
4) Tes diagnostik
Tes diagnostik adalah tes yang digunakan untuk mengetahui
atau mencari sebab-sebab kegagalan atau kesulitan belajar pada
peserta didik (Harjanto, 1997: 284).
c. Berdasarkan tingkatnya
Berdasarkan tingkatnya tes dibedakan menjadi dua jenis, yaitu:
1) Tes standar
Tes standar adalah tes yang disusun oleh satu tim ahli, atau
disusun oleh lembaga yang khusus menyelenggarakan secara
profesional (Chabib Thoha, 2003: 51). Tes tersebut telah
mengalami proses standarisasi yakni proses validasi dan keandalan
sehingga tes tersebut benar-benar valid dan andal untuk suatu
tujuan bagi suatu kelompok tertentu.
2) Tes buatan guru
Tes buatan guru adalah tes yang dibuat oleh guru untuk
keperluan penilaian guru tersebut terhadap siswanya. Tes ini
terutama tes hasil belajar dan biasanya berlaku untuk satu sekolah,
bahkan kadang-kadang hanya untuk satu kelas saja (Slameto, 2001:
32).
d. Berdasarkan bentuknya
Ditinjau dari bentuknya tes dibagi menjadi tiga jenis sebagai
berikut:
6

1) Tes tertulis
Tes tertulis adalah tes yang diberikan kepada sekelompok
murid, yang pertanyaan maupun jawabannya disajikan secara
tertulis dengan menggunakan kertas dan alat tulis (Winkel, 1983:
106).
Tes tertulis dibedakan menjadi dua jenis, yaitu:
a) Tes objektif
Tes objektif adalah tes yang terdiri dari butir-butir soal
yang dapat dijawab dengan memilih satu alternatif yang benar
dari sejumlah alternatif yang tersedia, atau dengan mengisi
jawaban yang benar dengan beberapa perkataan atau simbol
(Dimyati dan Mudjiono, 1998: 211).
Bentuk tes objektif ada beberapa macam, antara lain:
(1) Completion test, terdiri atas:
(a) Completion test (tes melengkapi)
(b) Fill-in (mengisi titik dalam kalimat yang
dikosongkan)
Completion test dan Fill-in adalah merupakan tes
yang menggunakan jawaban pendek dan bebas, butir
soalnya berupa kalimat di mana bagian-bagian tertentu
dihilangkan atau harus diisi dan tidak hanya mengenai satu
hal saja melainkan bisa bermacam-macam hal (Purwanto,
1997: 40).
(2) Selection Type Test (tes yang menjawabnya dengan
mengadakan pilihan) yang terdiri atas:
(a) Multiple Choice (pilihan berganda)
Multiple choice adalah bentuk soal yang terdiri atas
pertanyaan yang tidak lengkap. Kemungkinan jawaban
atas pertanyaan atau pernyataan itu disebut pilihan,
jumlah pillihan berkisar antara tiga sampai lima dan
hanya ada satu jawaban di antaranya yang benar atau
7

jawaban kunci, selebihnya adalah pengecoh (distraktor)


(Yamin, 2004: 152).
(b) True False (benar-salah)
True false adalah bentuk tes yang ditanya tinggal
memilih jawaban di antara benar atau salah, tidak ada
pilihan lain (Sudjana, 1995: 119).
(c) Matching (menjodohkan)
Matching adalah tipe pertanyaan yang terdiri dari dua
kolom, setiap pertanyaan pada kolom pertama harus
dijodohkan dengan urutan pada kolom kedua (Sudjana,
1995: 123).
b) Tes subjektif
Tes subjektif sering disebut dengan tes uraian, tes ini peserta
didik memiliki kebebasan memilih dan menentukan jawaban,
yang mengakibatkan data jawaban bervariasi dan menimbulkan
subjektivitas dalam penilaiannya (Thoha, 2003: 55).
2) Tes lisan
Tes lisan adalah tes di mana tester di dalam mengajukan
pertanyaan-pertanyaan atau soalnya dilakukan secara lisan dan
testee memberikan jawabannya secara lisan pula (Sudijono, 2003:
75).
3) Tes perbuatan
Tes perbuatan pada umumnya digunakan untuk mengukur taraf
kompetensi yang bersifat ketrampilan (psikomotorik), di mana
penilaiannya dilakukan terhadap proses penyelesaian tugas-tugas
dan hasil akhir yang dicapai oleh testee setelah melaksanakan tugas
tersebut (Sudijono, 2003: 156). Alat yang dapat digunakan tes ini
adalah berupa observasi atau pengamatan terhadap tingkah laku
tersebut yang hasilnya kemudian diserahkan pada guru.
8

3. Kriteria Tes yang Baik


Suatu tes dapat dikatakan baik bilamana tes tersebut memiliki ciri
sebagai alat ukur yang baik. Kriterianya antara lain:
a) Memiliki validitas (kesatuan) yang
cukup tinggi
Suatu tes dikatakan valid apabila tes tersebut dengan secara
tepat, secara benar, secara shahih, atau secara absah dapat mengukur
apa yang seharusnya diukur (Sudijono, 2003: 93). Untuk menetapkan
apakah sebuah tes dapat dinyatakan sebagai tes yang telah memiliki
validitas atau daya ketepatan mengukur ataukah belum, dapat
dilakukan penganalisisan secara rasional maupun penganalisisan
empirik.
b) Memiliki reliabilitas
(keajegan/kestabilan) yang baik
Suatu tes dapat dinyatakan reliabel apabila hasil-hasil
pengukuran yang dilakukan dengan menggunakan tes tersebut secara
berulangkali terhadap subjek yang sama, senantiasa menunjukkan hasil
yang tetap sama atau sifatnya ajeg dan stabil (Sudijono, 2003: 95).
c) Memiliki nilai objektivitas
Objektivitas suatu tes ditentukan oleh tingkat/mutu kesamaan
dari skor-skor yang diperoleh siswa melalui tes tersebut, walaupun
hasil pekerjaannya diperiksa oleh beberapa penilai. Untuk itu
diperlukan kunci jawaban soal-soal. Mutu objektivitas suatu tes dapat
dibagi menjadi tiga tingkat, yaitu objektivitas tinggi, sedang dan
fleksibel (Daradjat, 1995: 210).
d) Memiliki nilai kepraktisan
Sebuah tes dikatakan memiliki nilai kepraktisan yang tinggi
apabila tes tersebut bersifat praktis dan mudah pengadministrasiannya
dengan mendasarkan pada biaya, waktu yang diperlukan untuk
menyusun, kemudahan penyusunan, mudahnya penskoran dan
mudahnya penginterpretasian hasil-hasilnya (Purwanto, 1997: 137).
9

4. Kegunaan tes
Penting bagi kita untuk menentukan dahulu alasan mengadakan
tes. Kegunaan tes yang tepat memerlukan satu atau lebih tujuan yang
diperlukan dan penting. Perencanaan yang cerdas merupakan dasar yang
tepat dalam menggunakan hasil tes. Salah satu cara pengelompokkan
kegunaan tes berdasarkan fungsinya ada tiga, yaitu: para pegawai sekolah
atau personilnya yang bisa kita sebut dengan administrator, supervisor dan
guru (Skinner (ed), t.th: 440).
a. Kegunaan bagi administrator
Hasil tes dapat digunakan untuk menyediakan data
perkembangan dan prestasi anak. Hal ini dimasukkan ke dalam kartu
data komulatif anak dan menjadi dasar data permanen evaluasi
pertumbuhan dan perkembangan individu maupun kelompok kelas.
1) Untuk menyediakan laporan
bagi orang tua.
2) Untuk menyediakan data bagi
laporan periodik perkembangan sekolah untuk perlindungan dalam
masyarakat.
3) Untuk membuat interpretasi
status anak lebih baik dan memudahkan penempatan dalam ruang
kelas yang cocok (Skinner (ed), t.th: 440).
b. Kegunaan bagi supervisor
Demikian pula supervisor bisa menggunakan hasil tes bagi
bermacam-macam tujuan. Tugas utamanya yaitu membantu guru
melaksanakan tugas pengajaran yang lebih baik, itu dapat terwujud
dengan baik jika antara supervisor dan guru memiliki bukti status
anak. Jadi kegunaan tes bagi supervisor adalah untuk menentukan
status anak ataupun kelas dalam beberapa tujuan utama kurikulum. Hal
ini memperbolehkannya menandai perubahan yang diperlukan dalam
10

prosedur instruksional ataupun pembelajaran bagi siswa. Tujuan yang


lain adalah untuk mengevaluasi metode-metode pengajaran atau
materi-materi instruksional (Skinner (ed), t.th: 441).

c. Kegunaan bagi guru


Hasil tes digunakan guru untuk mengukur di antaranya:
1) Untuk menentukan status tiap
anak dalam berbagai subjek-subjek dan tujuan kurikulum.
2) Untuk mengevaluasi status
dan tingkat pertumbuhan tiap anak dipandang dari segi umur dan
kemampuan.
3) Untuk mengidentifikasi
kebutuhan pendidikan tiap anak.
4) Untuk mengidentifikasi anak
berbakat, anak normal dan anak yang lamban.
5) Untuk mengelompokkan anak
pada kelompok kelasnya.
6) Untuk menganalisa atau
mendiagnosa kesulitan anak dan tingkat pertumbuhan secara
individual.
7) Untuk menentukan prestasi
status sekolah pada awal dan akhir semester (Skinner (ed), t.th:
441).

B. Validitas Tes
1. Pengertian Validitas
Validitas tes perlu ditentukan untuk mengetahui kualitas tes dalam
kaitannya dengan mengukur hal yang seharusnya diukur. Kata “valid”
diartikan dengan “tepat, benar, shahih, absah”. Jadi, kata validitas dapat
diartikan dengan ketepatan, kebenaran, keshahihan atau keabsahan.
Apabila kata valid itu dikaitkan dengan fungsi tes sebagai alat pengukur,
11

maka sebuah tes dikatakan valid apabila tes tersebut dengan secara tepat,
secara benar, secara shahih, atau secara absah dapat mengukur apa yang
seharusnya diukur (Sudijono, 2003: 93).
Pengertian validitas menurut Sumarna Surapranata adalah “suatu
konsep yang berkaitan dengan sejauhmana tes telah mengukur apa yang
seharusnya diukur” (Surapranata, 2004: 50).
Menurut Muhammad Abdul Khalik Muhammad (1989: 48) dalam
kitabnya Ikhtibarotun al-Lughah, mendefinisikan validitas tes sebagai
berikut:

‫ ان ص دق االختب ار يع نى الى اي م دى يقيس األختب ار الش يئ‬:‫الص دق‬


.‫الذى وضع من اجله‬
Artinya: “Validitas tes adalah sejauhmana tes tersebut dapat mengukur
apa-apa yang hendak diukur”

Dengan demikian alat-alat evaluasi, khususnya tes hasil belajar


dapat dikatakan tes yang valid apabila tes tersebut betul-betul dapat
mengukur hasil belajar, jadi bukan sekedar mengukur daya ingatan atau
kemampuan bahasa saja.

2. Macam-macam Validitas
Validitas sebuah tes dapat diketahui dari hasil pemikiran dan dari
hasil pengalaman. Hal yang pertama akan diperoleh validitas logis (logical
validity) dan hal yang kedua diperoleh validitas empiris (empirical
validity). Dua hal inilah yang dijadikan dasar pengelompokan validitas tes
(Arikunto, 1990: 65).
Secara garis besar ada dua macam validitas, yaitu validitas tes dan
validitas item.
a. Validitas tes
Secara umum validitas tes dapat dikelompokkan menjadi dua
yaitu:
1) Validitas logis
12

Validitas logis mengandung arti logis/penalaran, maka


validitas logis untuk sebuah instrumen evaluasi menunjuk pada
kondisi bagi sebuah instrumen yang memenuhi persyaratan valid
berdasarkan hasil penalaran dan sudah dirancang secara baik,
sesuai dengan teori dan ketentuan yang berlaku.
Tes hasil belajar yang setelah dilakukan penganalisaan
secara rasional ternyata memiliki daya, ketepatan mengukur,
disebut tes hasil belajar yang telah memiliki validitas logika
(logical validity). Istilah lain untuk validitas logika adalah:
validitas rasional, validitas ideal, atau validitas das sollen
(Sudijono, 2003: 164)
Ada dua macam validitas logis yang dapat dicapai oleh
sebuah instrumen, yaitu validitas isi dan validitas konstruksi.
a) Validitas isi
Validitas isi (content validity) sering pula dinamakan
validitas kurikulum yang mengandung arti bahwa suatu alat
ukur dipandang valid apabila sesuai dengan isi kurikulum yang
hendak diukur. Salah satu cara yang digunakan untuk
menentukan validitas adalah dengan mengkaji isi tes tersebut
(Surapranata, 2004: 51). Prosedur yang dapat digunakan antara
lain:
(1) Mendefinisikan domain
yang hendak diukur
(2) Menentukan domain
yang akan diukur oleh masing-masing soal.
(3) Membandingkan masing-
masing soal dengan domain yang sudah ditetapkan
(Surapranata, 2004: 53).
b) Validitas Konstruksi
Tes hasil belajar dapat dinyatakan memiliki validitas
konstruksi, apabila tes hasil belajar tersebut ditinjau dari segi
13

susunan, kerangka atau rekaannya telah dapat secara tepat


mencerminkan suatu konstruksi dalam teori psikologis
(Sudijono, 2003: 166). Artinya, dalam susunan atau
kerangkanya benar-benar tepat mengukur aspek-aspek berfikir
(aspek kognitif, afektif dan psikomotorik). Cara lain untuk
menetapkan validitas konstruksi adalah menghubungkan
(korelasi) alat penilaian yang dibuat dengan alat penilaian yang
sudah baku (standardized) seandainya telah ada yang baku.
Bila menunjukkan koefisien korelasi yang tinggi, maka alat
penilaian tersebut memenuhi validitasnya (Sudjana, 1999: 15).

2. Validitas Empiris
Validitas empiris adalah validitas yang bersumber pada atau
diperoleh atas dasar pengamatan di lapangan (Sudijono, 2003:
167). Sebuah instrumen dikatakan memiliki validitas empiris
apabila sudah diuji dari pengalaman, sehingga terbukti bahwa
instrumen tes hasil belajar itu dengan secara tepat telah dapat
mengukur hasil belajar yang seharusnya diukur.
Ada dua cara untuk mengetahui apakah tes hasil belajar itu
sudah memiliki validitas empiris ataukah belum, yakni:
a) Validitas ramalan (predictive validity)
Predictive validity menunjukkan kepada hubungan
antara tes skor yang diperoleh peserta tes dengan keadaan yang
akan terjadi di waktu yang akan datang. Sebuah tes dikatakan
memiliki validitas prediksi apabila mempunyai kemampuan
untuk memprediksikan apa yang akan terjadi di masa akan
datang (Surapranata, 2004: 54).
b) Validitas bandingan atau “ada sekarang” (concurrent validity)
Validitas bandingan suatu tes artinya membuat tes yang
memiliki perbandingan atau kesamaan dengan tes yang sejenis
yang telah ada atau yang telah dilakukan. Perbandingan atau
14

kesamaan tes terlingkupnya abilitas yang diukurnya, sasaran


atau objek yang diukurnya, serta waktu yang diperlukan.
Perbandingan atau kesamaan suatu tes adalah indeks korelasi
berdasarkan perhitungan korelasi. Apabila menunjukkan indeks
korelasi yang cukup tinggi, yakni mendekati angka satu
(korelasi sempurna), berarti tes yang tersusun sudah memiliki
validtas bandingan atau kesamaan (Sudjana, 1999: 15-16).
b. Validitas Item
Validitas item dari suatu tes adalah ketapatan mengukur yang
dimiliki oleh sebutir item (yang merupakan bagian tak terpisahkan dari
tes sebagai suatu totalitas), dalam mengukur apa yang seharusnya
diukur lewat butir item tersebut (Sudijono, 2003: 182). Sebenarnya
setiap butir item yang ada dalam tes hasil belajar itu adalah merupakan
bagian tak terpisahkan dari tes hasil belajar tersebut sebagai suatu
validitas dalam mengukur atau mengungkap hasil belajar yang telah
dicapai oleh masing-masing individu peserta didik setelah mereka
mengikuti proses pembelajaran dalam jangka waktu tertentu.
Eratnya hubungan antara butir item dengan tes hasil belajar
sebagai suatu totalitas itu dapat dipahami dari kenyataan, bahwa
semakin banyak butir-butir item yang dapat dijawab dengan benar oleh
testee, maka skor-skor item total hasil tes tersebut akan semakin tinggi.
Sebaliknya, semakin sedikit butir-butir item yang dapat dijawab
dengan benar oleh testee, maka skor-skor total hasil tes itu akan
semakin rendah atau semakin menurun.

3. Teknik Pengujian Validitas Item


Sebutir item dapat dikatakan telah memiliki validitas yang tinggi
atau dapat dinyatakan valid, jika skor-skor pada butir soal yang
bersangkutan memiliki kesesuaian atau kesejajaran arah dengan skor
totalnya, atau dengan bahasa statistik: “Ada korelasi positif yang
signifikan antara skor item dengan skor totalnya”. Skor total di sini
15

berkedudukan sebagai variabel terikat (dependent variable), sedangkan


skor item berkedudukan sebagai variabel bebasnya (independent variable).
Dengan demikian, maka untuk sampai pada kesimpulan bahwa
butir-butir yang ingin diketahui validitasnya yaitu valid atau tidak kita
dapat menggunakan teknik korelasi sebagai teknik analisisnya. Sebutir
soal dapat dinyatakan valid, apabila skor butir yang bersangkutan terbukti
mempunyai korelasi yang positif yang signifikan dengan skor totalnya.
Seperti diketahui, pada tes objektif maka hanya ada dua kemungkinan
jawaban, yaitu betul dan salah. Setiap butir soal yang dijawab dengan
betul umumnya diberi skor 1 (satu), sedangkan untuk setiap jawaban yang
salah diberikan skor 0 (nol). Jenis data seperti ini dalam dunia ilmu
statistik dikenal dengan nama data diskret murni atau data dikotomik.
Sedangkan skor total yang dimiliki oleh masing-masing butir soal
merupakan data kontinu (Sudijono, 2003: 185).
Menurut teori yang ada, apabila variabel I berupa data diskret
murni atau data dikotomik (skor butir item), sedangkan variabel II berupa
data kontinu (skor total butir item), maka teknik korelasi yang tepat untuk
digunakan dalam mencari korelasi antara variabel I dengan variabel II
adalah Teknik Korelasi Point Biserial (rpbis) (Sudijono, 1991: 245).
Akhirnya, sebagai penutup dari pembicaraan mengenai validitas tes
dan validitas item, akan disajikan sebuah bagan yang merupakan ikhtisar
dari pembicaraan pada bab ini.

Bagan Tentang Validitas Tes dan Validitas Item

Content Validity = Validitas Isi =


Validity = Validitas Logika = Validitas Validitas Kurikuler
Rasional = Validitas Ideal = Validitas das
Sollen
Construct Validity = Validitas
Konstruksi = Validitas Susunan
Validitas Tes
Predictive Validity = Validitas
Ramalan
Validitas Empirical Validity = Validitas Empiris
=Validitas Lapangan = Validitas das Sein
16

Concurrent Validity = Validitas


Bandingan = Validitas Pengalaman
Validitas Item = Validitas Sama Saat = Validitas
Ada Sekarang

Diadaptasikan dari Sudijono (2003: 245)

E. Reliablilitas Tes
1. Pengertian Reliabilitas
Reliabilitas sering diartikan dengan keterandalan. Artinya, suatu tes
memiliki keterandalan bilamana tes tersebut dipakai untuk mengukur
berulang-ulang hasilnya sama. Dengan demikian reliabilitas dapat pula
diartikan dengan keajegan atau stabilitas.1
Menurut Muhammad Abdul Malik Muhammad dalam kitabnya
Ikhtibaratun al-Lughah mendefinisikan reliabilitas tes adalah sebagai
berikut:

‫ يقص د بالثب ات ع دم التذب دب فى اإلختب ار اذا ماقص د ب ه ان‬:‫الثب ات‬

2
.‫يكون بمثابة المقياس‬
Artinya: Reliabilitas tes adalah tidak adanya perubahan-perubahan dalam
tes yang dilaksanakan dengan menggunakan tes yang serupa”

Menurut Anne Anastati dalam bukunya Psychological Testing


mendefinisikan reliabilitas tes: Reliability refers to the consistency of
scores obtained by the same persons when they are recxamined with the
same test on different accasions, or with different sets of equivalent items.3
Artinya, reliabilitas adalah consistency atau keajegan atau ketetapan dari
nilai yang diperoleh dari tiap individu yang sama manakala diadakan tes
ulang dengan tes yang sama pada waktu yang berbeda atau dengan butir
soal yang sejenis.
1
Chabib Thoha, Teknik Evaluasi Pendidikan, op. cit., hlm. 118.
2
Muhammad Abdul Kholiq Muhammad, op. cit., hlm. 39.
3
Anne Anastasi dan Susana Urbina, Psychological Testing, (New York: Prentice-Hall, 1988), hlm.
84.
17

Tes hasil belajar dikatakan baik apabila telah memiliki reliabilitas


atau bersifat reliabel. Apabila istilah tersebut dikaitkan dengan fungsi tes
sebagai alat ukur mengenai keberhasilan belajar peserta didik, maka
sebuah tes tersebut dapat dinyatakan reliabel apabila hasil-hasil
pengukuran yang dilakukan dengan menggunakan tes tersebut secara
berulangkali terhadap subjek yang sama, senantiasa menunjukkan hasil
yang tetap sama atau sifatnya ajeg dan stabil. Ajeg atau tetap di sini tidak
selalu harus sama, tetapi mengikuti perubahan secara ajeg.

2. Faktor-Faktor yang Mempengaruhi Reliabilitas


Beberapa faktor yang mempengaruhi reliabilitas adalah sebagai
berikut:
a. Luas tidaknya sampling yang handal
Makin luas suatu sampling, berarti tes semakin andal.
b. Perbedaan bakat dan kemampuan murid yang dites
Makin variabel kemampuan peserta tes, berarti semakin tinggi
keandalan koefisien tes. Tes yang diberikan kepada beberapa tingkat
kelas yang berbeda lebih tinggi keandalannya daripada yang hanya
diberikan kepada beberapa kelas yang sama karena tingkat kelas yang
berbeda akan menghasilkan achievemen yang lebih luas.
c. Suasana dan kondisi testing
Suasana ketika berlangsung testing, seperti tenang, gaduh, banyak
gangguan, pengetes yang marah-marah dapat mengganggu pengerjaan
tes, sehingga dengan demikian mempengaruhi pada hasil dan keadaan
tes.

3. Teknik Pengujian Reliabilitas

Ngalim Purwanto, Prinsp-prinsip dan Teknik Evaluasi Pengajaran,op. cit., hlm. 141.
18

Beberapa cara yang dapat digunakan untuk mengadakan uji


reliabilitas tes adalah sebagai berikut:
a. Metode Test-retest (metode bentuk ulang)
Metode ini digunakan untuk menguji reliabilitas tes dengan
jalan mengujikan tes tersebut dua kali atau lebih, kemudian hasilnya
dikorelasikan. Tujuannya adalah untuk mengetahui koefisien stabilitas
tes. Tes tersebut memiliki keterandalan bilamana dipakai untuk
mengukur objek yang sama dalam waktu yang berbeda-beda hasilnya
tetap sama.
Adapun langkah yang dapat ditempuh pada uji reliabilitas ini
adalah sebagai berikut:
1) Menyusun sebuah tes yang akan diukur reliabilitasnya
2) Mengujikan tes yang tersusun tersebut (tahap I).
3) Menghitung skor hasil tes tahap I.
4) Mengujikan ulang tes yang tersusun tersebut (tahap II).
5) Menghitung skor hasil tes ulang (tahap II).
6) Menghitung reliabilitas tes tersebut dengan jalan mengkorelasikan
skor tes I dengan skor tes II dengan rumus korelasi product
moment pearson.
b. Metode Pararel (Equaivalen)
Metode ini berkaitan dengan penggunaan dua buah tes yang
sama atau relatif sama kepada peserta didik yang sama. Kesamaan
yang dimaksudkan pada tes adalah kesamaan tujuan, tingkat kesukaran
dan susunan, pelaksanaan metode ini adalah dengan cara sebagai
berikut:
1) Sajikan satu bentuk tes seri pertama kepada peserta
didik
2) Setelah beberapa waktu, sajikanlah satu bentuk tes
seri kedua kepada peserta didik yang sama

Chabib Thoha, op. cit., hlm. 120.


19

3) Mencari koefisien stabilitas kedua tes (seri I dan II)


dengan jalan mencari korelasinya dengan menggunakan korelasi
product moment.
c. Metode Split Half (metode belah dua)
Metode ini dipakai untuk mengetahui tingkat reliabilitas tes
dengan jalan membelah tes menjadi dua bagian dan skor kedua
belahan tersebut dikorelasikan dengan rumus tertentu. Cara melakukan
pembelahan hasil tes tersebut dapat dilakukan dengan dua jalan, yaitu
membelah antara skor ganjil dengan skor genap, atau membelah antara
belahan nomor atas bawah.
Metode belah dua dapat mengatasi semua kelemahan yang
terdapat pada metode tes ulang dan tes pararel, yang memungkinkan
mengestimasi reliabilitas tanpa harus menyelenggarakaan tes dua kali.
Adapun langkah secara umum yang ditempuh untuk mencari
reliabilitas tes adalah:4
1) Menyusun sebuah tes setidaknya jumlah nomornya genap, sehingga
bila dibelah jumlahnya sama.
2) Mengujikan tes tersebut pada satu sampel.
3) Menghitung skor masing-masing peserta didik dalam dua kelompok
skor, dapat dikelompokkan skor ganjil dan genap, dapat pula
dikelompokkan skor belahan atas dan skor belahan bawah.
4) Mencari reliabilitas setengah tes dengan jalan mengkorelasikan
kedua skor tersebut dengan rumus product moment atau mencari
deviasi pada belahan ganjil genap.
5) Mencari reliabilitas satu tes penuh dengan menggunakan rumus:
a) Rumus Spearman Brown
b) Rumus Flanagan
c) Rumus Rulon
d. Internal Consistency (internal konsistensi)

Sumarna Surapranata, op. cit., hlm. 97.


4
Chabib Thoha, op. cit., hlm. 124.
20

Mengukur koefisien konsistensi untuk mengetahui reliabilitas


tes dapat digunakan pendekatan yang tidak membelah tes menjadi dua.
Hal ini disebabkan oleh dua kemungkinan, yaitu jumlah item ganjil,
sehingga tidak dapat dibelah menjadi dua komposisi antara item-item
ganjil dan genap tidak homogen, sehingga bila dibelah cenderung tidak
memiliki korelasi yang positif.5
Internal consistency berkaitan dengan unsur-unsur yang
membentuk sebuah tes, yaitu soal-soal yang membentuk tes. Internal
consistency didasarkan pada homogenitas atau korelasi antara skor
jawaban pada setiap butir tes. Jika korelasi rerata antar butir soal
tinggi, maka reliabilitas juga tinggi. Jika korelasi rerata mendekati nol,
maka internal consistency nol pula dan reliabilitasnya rendah.6
Adapun langkah-langkah pencarian reliabilitasnya adalah
sebagai berikut:7
1) Membuat tabel analisis butir tanpa harus mengelompokkan nomor
ganjil dan genap.
2) Menghitung proporsi yang menjawab benar dan proporsi yang
menjawab salah pada masing-masing butir dalam tabel analisis
butir.
3) Mengalikan proporsi yang menjawab benar dengan yang menjawab
salah.
4) Mencari varians (standar deviasi kuadrat) dari skor total.
5) Menghitung reliabilitas tes dengan menggunakan rumus:
a) Rumus Kuder-Richardson (KR20 dan
KR21)
b) Rumus C. Hoyt/Alpha
Dari uraian yang dikemukakan di atas, kiranya menjadi cukup
jelas, kemudian langkah pengujian reliabilitas yang akan dilakukan
dalam penelitian ini, penulis menggunakan rumus KR20.
5
Ibid., hlm. 133.
6
Sumarna Surapranata, op. cit., hlm. 113.
7
Chabib Thoha, op. cit., hlm. 133-134.
21

Sebagai penutup dari pembicaraan tentang reliabilitas tes, akan


disajikan sebuah tabel yang menunjukkan bentuk reliabilitas dan
prosedur untuk memperolehnya.

Tabel 2.1
Metode untuk Menentukan Reliabilitas8
Bentuk Reliabilitas Prosedur untuk Memperoleh
Tes-retest methods (Stabilitas)
- Sajikan tes yang sama
-
sebanyak dua kali kepada
Produk Momen dan Korelasi
peserta tes yang sama dalam
intra kelas
waktu yang berbeda dan
tentukan korelasi
Paralel (Equivalen)
- Produk Momen dan Korelasi -
intra kelas
Sajikan dua tes yang sama
kepada peserta tes yang sama
dalam waktu yang relatif
tidak lama (misalnya dua
minggu). Korelasikan kedua
skor tersebut untuk mencari
reliabilitas.
Split-half Methods (belah dua)
-
-
Sajikan satu kali tes lalu dibelah
dua, gunakan persamaan
8
Sumarna Surapranata, op. cit., hlm. 91.
22

Persamaan Split-Half dan untuk mengkorelasikan


Spearman Brown kedua belahan
Internal consistency
-
-
Berikan sekali tes, gunakan
Koefisien alpha persamaan
-
Berikan sekali tes, gunakan
- persamaan
-
Kuder-Richardson (KR20)
Berikan sekali tes, gunakan
persamaan
-
Kuder-Richardson (KR21)

F. Tes Buatan Guru MGMP Pendidikan Agama Islam


1. Pengertian Tes Buatan Guru
Tes buatan guru adalah tes yang disusun sendiri oleh guru yang
akan mempergunakan tes tersebut.9
Menurut Slameto dalam bukunya Evaluasi Pendidikan
mendefinisikan tes buatan guru adalah tes yang dibuat oleh guru untuk
keperluan penilaian guru tersebut terhadap siswanya.10
Kemudian menurut Suharsimi Arikunto dalam bukunya Dasar-
dasar Evaluasi Pendidikan mendefinisikan tes buatan guru adalah tes yang
disusun sendiri oleh guru dengan sedikit atau tanpa bantuan orang lain

9
Wayan Nurkancara, Evaluasi Pendidikan, op. cit., hlm. 26.
10
Slameto, Evaluasi Pendidikan, op. cit., hlm. 32.
23

atau tenaga ahli dan jarang menggunakan butir butir-butir tes yang sudah
diujicobakan, dianalisis dan direvisi.11

2. Mekanisme Kerja MGMP


Musyawarah Guru Mata Pelajaran yang selanjutnya disingkat
MGMP adalah forum/wadah kegiatan professional guru mata pelajaran
sejenis di sanggar. Fokus dalam penelitian ini adalah forum/wadah
kegiatan profesional guru mata pelajaran Pendidikan Agama Islam di
sanggar. MGMP adalah organisasi non struktural di lingkungan
Departemen Pendidikan dan Kebudayaan, struktur organisasinya bejenjang
dari tingkat Propinsi, Kabupaten/Kodia/Kotif, Kecamatan dan sekolah.
Masa bakti pengurus selama 2 tahun baik di tingkat Propinsi,
Kabupaten/Kodia/Kotif, Kecamatan maupun sekolah yang terdiri dari
ketua, sekretaris, bendahara dan anggota.
Musyawarah Guru Mata Pelajaran (MGMP) bertujuan:
a. Menumbuhkan kegairahan guru untuk
meningkatkan kemampuan dan ketrampilan dalam mempersiapkan,
melaksanakan, dan mengevaluasi program kegiatan belajar mengajar
(KBM) dalam rangka meningkatkan keyakinan diri sebagai guru.
b. Menyetarakan kemampuan dan kemahiran guru
dalam melaksanakan kegiatan belajar sehingga dapat menunjang usaha
peningkatan dan pemerataan mutu pendidikan.
c. Mendiskusikan permasalahan yang dihadapi oleh
guru dalam melaksanakan tugas sehari-hari dan mencari cara
penyelesaian yang sesuai dengan karakteristik mata pelajaran, guru,
kondisi sekolah dan lingkungan.
d. Membantu guru memperoleh informasi teknis
edukatif yang berkaitan dengan kegiatan keilmuan dan IPTEK,
kegiatan pelaksanaan kurikulum, metodologi, sistem evaluasi sesuai
dengan mata pelajaran yang bersangkutan.

11
Suharsimi Arikunto, Dasar-dasar Evaluasi Pendidikan, op. cit., hlm. 147.
24

e. Saling berbagi informasi dan pengalaman dalam


rangka menyesuaikan perkembangan ilmu dan teknologi.12
Dan melalui kegiatan MGMP diharapkan:
a. Dapat memberikan motivasi kepada
guru-guru agar mengikuti setiap kegiatan di sanggar.
b. Dapat meningkatkan kemampuan dan
kemahiran guru dalam melaksanakan kegiatan belajar mengajar,
sehingga dapat menunjang usaha peningkatan dan pemerataan mutu
pendidikan.
c. Memberikan pelayanan konsultasi
yang berkaitan dengan kegiatan belajar mengajar.
d. Menunjang pemenuhan kebutuhan
guru yang berkaitan dengan kegiatan belajar mengajar (KBM),
khususnya yang menyangkut materi pelajaran, metodologi, sistem
evaluasi dan sarana penunjang.
e. Menyebarkan informasi tentang
segala kebijakan yang berkaitan dengan usaha-usaha pembaharuan
pendidikan dalam bidang kurikulum, metodologi, sistem evaluasi dan
lain-lain.
f. Merencanakan, melaksanakan,
mengevaluasi, dan melaporkan hasil kegiatan MGMP serta
menetapkan tindak lanjutnya.
Adapun pelaksanaan kegiatan MGMP yaitu mengadakan
konsultasi dengan pengawas, kepala kantor Departemen Dikbud
Kabupaten/Kodia/Kotif, dan Kepala Bidang Pendidikan Menengah Umum
maupun para Pakar yang relevan. Mengadakan konsultasi dan koordinasi
dengan MKKS (KKKS) dan MKP (KKP) dan mengadakan hubungan

12
Buku Pedoman Penyelenggaraan Musyawarah Guru Mata Pelajaran (MGMP) Seluruh
Indonesia, (Jakarta: Departemen Pendidikan dan Kebudayaan Direktorat Jenderal Pendidikan
Dasar dan Menengah Proyek Pengadaan Sarana dan Peningkatan Mutu Pendidikan Menengah
Umum, 1993), hlm. 4-5.
25

kerja dengan organisasi-organisasi masyarakat sekitar. Dan jenis kegiatan


MGMP, antara lain:
a. Kegiatan musyawarah guru mata pelajaran adalah
mengembangkan kemampuan dan ketrampilan guru untuk
meningkatkan keberhasilan kegiatan belajar mengajarnya dengan
melakukan usaha-usaha, antara lain:
1) Penguasaan kurikulum
2) Penyusunan program semesteran
3) Penyusunan program satuan pelajaran termasuk penguasaan
dan pengembangan metode penggunaan media pelajaran, dan
teknik evaluasi.
4) Bahan/materi pelajaran.
b. Kegiatan yang termasuk memperluas wawasan, antara lain:
1) Mengadakan ceramah/diskusi
2) Mengadakan seminar/lokakarya
3) Usaha meningkatkan penguasaan ilmu pengetahuan dan
teknologi.
c. Kegiatan penunjang, antara lain:
1) Mengadakan pelatihan
2) Program peninjauan/pengamatan/widia wisata ke objek-objek
yang relevan.
3) Memanfaatkan media cetak dan media elektronika.13

3. Bagan Mekanisme Kerja MGMP


Gambar 2.2

KA KANWIL

KA BID

13
Ibid., hlm. 6-7.
26

P
E
N MGMP MKS
G PROPINSI PROPINSI
A
W
A KA KANDEP
S
/
M
K MGMP MKS
P KAB/KODYA KAB/KODYA
/

MGMP MKS
KEC. KEC.

KS KS KS KS MGMP
SMA SMA SMP SMP SEKOLAH

Keterangan: MKP = Musyawarah Kerja Pengawas


MGMP = Musyawarah Guru Mata Pelajaran
MKS = Musyawarah Kepala Sekolah
KS = Kepala Sekolah
= Garis Komando

= Garis Konsultasi

4. Kegunaan Tes Buatan Guru


Kegunaan tes buatan guru adalah sebagai berikut:
a. Untuk menentukan
seberapa baik siswa telah menguasai bahan pelajaran yang diberikan
dalam waktu tertentu.
27

b. Untuk menentukan
apakah sesuatu tujuan telah tercapai.
c. Untuk memperoleh
suatu nilai.14
Selanjutnya baik tes standar dan tes buatan guru dianjurkan dipakai
jika hasilnya akan digunakan untuk:
a. Mengadakan diagnosa terhadap kemampuan siswa.
b. Menentukan tempat siswa dalam suatu kelas atau kelompok.
c. Memberikan bimbingan kepada siswa dalam pendidikan dan pemilihan
jurusan.
d. Memilih siswa untuk program-program khusus.
e. Menentukan lulus atau tidak lulusnya siswa pada mata pelajaran
tertentu.

G. Analisis Butir Soal


Analisis butir soal bukanlah merupakan ciri suatu tes yang baik,
melainkan suatu kegiatan yang dapat membantu meningkatkan kebaikan suatu
tes. Tujuan utama analisis butir soal adalah untuk meningkatkan validitas dan
reliabilitas tes itu sendiri secara keseluruhan, sebab validitas dan reliabitas
suatu tes tergantung kepada ciri-ciri butir soalnya. 15 Tujuan lain analisis soal
adalah untuk mengadakan identifikasi soal-soal yang baik, kurang baik dan
soal yang jelek. Dengan analisis soal dapat diperoleh informasi tentang
kejelekan sebuah soal dan petunjuk untuk mengadakan perbaikan.
Sebuah soal dapat dikatakan baik dengan melakukan analisis secara
kuantitatif yang meliputi pengukuran tingkat kesukaran, daya pembeda butir
soal dan pola jawaban soal.

1. Tingkat Kesukaran
Sangatlah penting untuk melihat tingkat kesukaran soal dalam
rangka menyediakan berbagai macam alat diagnostik kesulitan belajar
14
Ibid., hlm. 149.
15
Mudjijo, Tes Hasil Belajar, op. cit., hlm. 61.
28

peserta didik ataupun dalam rangka meningkatkan penilaian berbasis


kelas. Soal yang baik adalah soal yang tidak terlalu mudah atau tidak
terlalu sukar. Soal yang terlalu mudah tidak merangsang siswa untuk
mempertinggi usaha memecahkannya. Sebaliknya soal yang terlalu sukar
menyebabkan siswa yang menjadi putus asa dan tidak mempunyai
semangat untuk mencoba lagi karena di luar jangkauannya.
Secara umum, menurut teori klasik, bahwa tingkat kesukaran dapat
dinyatakan melalui beberapa cara di antaranya: proporsi menjawab benar,
skala kesukaran dapat dinyatakan linier, Indeks Davis dan Skala Bivariat. 16
Tingkat kesukaran yang paling umum digunakan adalah proporsi jawaban
benar (p), yaitu jumlah peserta tes yang menjawab benar pada butir soal
yang dianalisis dibandingkan dengan jumlah peserta tes seluruhnya.
Persamaan yang digunakan untuk menentukan tingkat kesukaran dengan
proporsi menjawab benar adalah:

P=
∑X
Sm N 17

di mana:
P = Proporsi menjawab benar atau tingkat kesukaran
ΣX = Banyaknya peserta tes yang menjawab benar
Sm = Skor Maksimum
N = Jumlah peserta tes

Tingkat kesukaran (p) sebenarnya merupakan nilai rata-rata dari


kelompok tes. Jadi, tingkat kesukaran (p) ini mengandung banyak
kelemahan di antaranya:
a. Tingkat kesukaran (p) sebenarnya ukuran kemudahan
soal, karena makin tinggi tingkat kesukaran (p), maka makin mudah
soalnya dan makin rendah (p), maka makin sulit soalnya.
b. Tingkat kesukaran (p) tidak berhubungan linier dengan
skala kesukaran soal.18

16
Sumarna Surapranata, op. cit., hlm. 12.
17
Ibid.
18
Ibid., hlm. 19.
29

Dengan demikian, tingkat kesukaran sering diklasifikasikan sebagai


berikut:
a. Soal yang
memiliki p < 0,30 adalah soal sukar.
b. Soal yang
memiliki 0,30 < p < 0,70 adalah soal sedang.
c. Soal yang
memiliki p > 0,70 adalah soal mudah.
Setelah mengindentifikasi butir-butir item mana yang derajat
kesukarannya termasuk dalam kategori cukup, sukar dan mudah maka
tindak lanjut yang perlu dilakukan oleh tester adalah sebagai berikut:19
a. Untuk butir-butir item
yang termasuk dalam kategori baik (dalam arti derajat kesukaran
itemnya cukup/sedang), seyogyanya butir item tersebut segera dicatat
dalam buku bank soal. Selanjutnya butir-butir tersebut dapat
dikeluarkan lagi dalam tes-tes hasil belajar pada waktu-waktu yang
akan datang.
b. Untuk butir-butir item
yang termasuk dalam kategori sukar, ada 3 kemungkinan tindak lanjut
yaitu:
1) Dibua
ng atau di drop dan tidak akan dikeluarkan lagi dalam tes-tes hasil
belajar yang akan datang.
2) Ditelit
i ulang, dilacak dan ditelusuri sehingga dapat diketahui faktor yang
menyebabkan butir item yang bersangkutan sulit dijwab oleh
testee; apakah kalimat soalnya yang kurang jelas, apakah petunjuk
cara mengerjakan (menjawab) soalnya sulit dipahami, ataukah
dalam soal tersebut terdapat istilah-istilah yang tidak jelas, dan

19
Anas Sudijono, op. cit., hlm. 376-378.
30

sebagainya. Setelah dilakukan perbaikan kembali, butir-butir item


tersebut dikeluarkan lagi dalam tes hasil belajar yang akan datang.
3) Harusl
ah dipahami bahwa setiap butir item yang termasuk dalam kategori
sukar sama sekali tidak memiliki kegunaan. Butir-butir item yang
terlalu sukar itu sewaktu-waktu masih dapat diambil manfaatnya,
yaitu dapat digunakan dalam tes-tes (terutama tes seleksi) yang
sifatnya sangat ketat, dalam arti sebagian terbesar dari testee tidak
akan diluluskan dalam tes seleksi tersebut.
c. Untuk butir-butir item
yang termasuk dalam kategori mudah, ada 3 kemungkinan tindak
lanjut, yaitu
1) Butir item tersebut dibuang atau di drop dan tidak akan dikeluarkan
lagi dalam tes-tes hasil belajar yang akan datang.
2) Diteliti ulang, dilacak dan ditelusuri secara cermat guna mengetahui
faktor yang menyebabkan butir item tersebut dapat dijawab betul
oleh hampir seluruh testee, ada kemungkinan option/alternatif yang
dipasangkan pada butir-butir item yang bersangkutan “terlalu
kentara” atau “terlalu mudah diketahui” oleh testee, mana option
yang merupakan kunci jawaban item dan mana option yang
berfungsi sebagai pengecoh/distraktor. Tester harus berusaha
memperbaiki/menggantinya dengan option yang lain, sehingga
antara kunci jawaban dan pengecoh sulit untuk dibedakan oleh
testee. Setelah diperbaiki, item yang bersangkutan dicoba untuk
dikeluarkan lagi pada tes hasil belajar berikutnya, guna mengetahui
apakah derajat kesukaran item menjadi lebih baik dari sebelumnya,
ataukah tidak.
3) Butir-butir item yang mudah masih mengandung manfaat, yaitu
dapat dimanfaatkan pada tes-tes (terutama pada tes seleksi) yang
sifatnya longgar, dalam arti bahwa sebagian besar dari testee akan
dinyatakan lulus dalam tes seleksi tersebut. Dalam kondisi ini
31

adalah sangat bijaksana apabila butir-butir item yang dikeluarkan


dalam tes seleksi itu adalah butir-butir item yang termasuk dalam
kategori terlalu mudah, sehingga tes seleksi tersebut boleh
dikatakan hanya sebagai formalitas saja.

2. Daya Pembeda
Daya pembeda soal adalah kemampuan suatu soal untuk
membedakan antara siswa yang pandai (berkemampuan tinggi) dengan
siswa yang bodoh (berkemampuan rendah).20 Indeks daya pembeda soal-
soal yang ditetapkan dari selisih proporsi yang menjawab dari masing-
masing kelompok. Indeks ini menunjukkan kesesuaian antara fungsi soal
dengan fungsi tes secara keseluruhan.
Indeks daya pembeda dihitung atas dasar pembagian kelompok
menjadi dua bagian, yaitu kelompok atas yang merupakan peserta tes yang
berkemampuan tinggi dengan kelompok bawah, yaitu kelompok peserta
tes yang berkemampuan rendah. Indeks daya pembeda didefinisikan
sebagai selisih antara proporsi jawaban benar pada kelompok atas dengan
proporsi jawaban benar pada kelompok bawah. Pembagian kelompk ini
dapat dilakukan dengan berbagai macam metode bergantung pada
keperluannya. Metode yang paling stabil dan sensitif serta paling banyak
digunakan adalah dengan menentukan 27% kelompok atas 27 % kelompok
bawah.21 Prosentase sebesar 27% ini pada umumnya digunakan oleh pakar
di bidang evaluasi pendidikan. Hal ini disebabkan karena bukti-bukti
empirik pengambilan subjek sebesar 27% testee kelompok atas dan 27%
testee kelompok bawah itu telah menunjukkan kesensitifannya, atau
dengan kata lain cukup dapat diandalkan.
Untuk mengetahui daya pembeda butir soal tersebut dapat dilakukan
dengan dua cara, yaitu:22

20
Suharsiomi Arikunto, Dasar-dasar Evaluasi Pendidikan, op. cit., hlm. 211.
21
Anas Sudijono, op. cit., hlm. 387.
22
Mudjijo, Tes Hasil Belajar, op. cit., hlm. 63.
32

d. Dengan menggunakan
kelompok ekstrem (extreme group), kelompok unggul (higher group)
dan kelompok bawah (lower group).
e. Dengan
mengikutsertakan seluruh testee, yakni dengan teknik korelasi.
Dengan demikian, interpretasi indeks DB yang digunakan adalah
sebagai berikut:23
D : 0,00 – 0,20 = jelek (poor)
D : 0,20 – 0,40 = cukup (satisfactory)
D : 0,40 – 0,70 = baik (good)
D : 0,70 – 1,00 = baik sekali (excellent)
D : negatif, semuanya tidak baik, jadi semua butir soal yang
mempunyai nilai D negatif sebaiknya dibuang saja.
Suatu soal yang dapat dijawab benar oleh siswa pandai maupun
siswa bodoh, maka soal itu tidak baik karena tidak mempunyai daya
pembeda. Demikian pula jika semua siswa baik pandai maupun bodoh
tidak dapat menjawab dengan benar, soal tersebut tidak baik karena tidak
mempunyai daya pembeda. Soal yang baik adalah soal yang dapat dijawab
benar oleh siswa-siswa yang pandai saja.
Akhirnya sebagai tindak lanjut atas hasil penganalisisan mengenai
Daya Pembeda item tes hasil belajar tersebut adalah:24
a. Butir-butir item yang sudah memiliki Daya Pembeda
item yang baik (satisfactory, good dan excellent hendaknya
dimasukkan (dicatat) dalam buku bank soal tes hasil belajar. Butir-
butir item tersebut dapat dikeluarkan lagi pada tes hasil belajar yang
akan datang, karena kualitasnya sudah cukup memadai.
b. Butir-butir item yang daya pembedanya masih rendah
(poor) ada 2 kemungkinan tindak lanjut, yaitu:
1) Ditelusuri untuk kemudian diperbaiki, dan
setelah diperbaiki dapat diajukan lagi dalam tes hasil belajar yang
23
Suharsimi Arikunto, op. cit., hlm. 218.
24
Anas Sudijono, Pengantar Evaluasi Pendidikan, op. cit., hlm. 408-409.
33

akan datang, kelak item tersebut dianalisis lagi, apakah daya


pembedanya meningkat ataukah tidak
2) Dibuang (di drop) dan untuk tes hasil belajar
yang akan datang butir item tersebut tidak akan dikeluarkan lagi.
c. Khusus butir-butir item tersebut yang indek
diskriminasi itemnya bertanda negatif, sebaiknya pada tes hasil belajar
yang akan datang tidak usah dikeluarkan lagi, sebab butir item yang
demikian kualitasnya sangat jelek (testee yang termasuk pandai lebih
banyak yang menjawab salah ketimbang testee yang termasuk bodoh
yang justru hanya sedikit saja yang jawabannya salah).

3. Efektivitas Fungsi
Pengecoh (Distraktor)
Tes bentuk pilihan ganda apabila dilihat dari strukturnya terdiri atas
dua bagian yaitu pokok soal atau item yang berisi permasalahan yang akan
ditanyakan dan sejumlah kemungkinan jawaban atau option.
Kemungkinan jawaban itu dibagi dua yaitu kunci jawaban dan pengecoh.
Dari sekian banyak alternatif jawaban hanya terdapat satu yang benar atau
yang paling benar yang dinamakan kunci jawaban, sedangkan
kemungkinan jawaban yang tidak benar dinamakan pengecoh atau
distraktor.
Tujuan utama dari pasangan pengecoh pada setiap butir item itu
adalah agar dari sekian banyak testee yang mengikuti tes hasil belajar
tertarik atau terangsang untuk memilihnya, sebab mereka menyangka
bahwa pengecoh yang mereka pilih itu merupakan jawaban betul.25 Jadi
mereka terkecoh menganggap bahwa pengecoh yang terpasang pada item
itu sebagai kunci jawaban item, padahal bukan.
Pengecoh berfungsi sebagai pengidentifikasi peserta tes yang
berkemampuan tinggi. Pengecoh dikatakan berfungsi efektif apabila
banyak dipilih oleh testee yang berasal dari kelompok bawah, sebaliknya
apabila pengecoh itu banyak dipilih oleh testee yang berasal dari
25
Anas Sudijono, Pengantar Evaluasi Pendidikan, op. cit., hlm. 410.
34

kelompok atas, maka pengecoh itu tidak berfungsi sebagaimana mestinya.


Suatu pengecoh dapat dikatakan baik jika paling sedikit dipilih oleh 5%
dari seluruh peserta tes. Apabila pengecoh lebih banyak dipilih oleh
peserta tes dari kelompok atas dibandingkan dengan kelompok bawah,
maka termasuk pengecoh yang menyesatkan.
Salah satu tujuan analisis soal adalah untuk mengetahui tentang
distribusi jawaban subjek dalam alternatif jawaban yang tersedia. Melalui
distribusi jawaban penyebaran jawaban ini dapat diketahui:26
a. Banyaknya peserta tes yang jawabannya betul.
b. Pengecoh yang bagi peserta tes terlalu menyolok
kesalahannya sehingga tidak ada yang memilih.
c. Pengecoh yang menyesatkan.
d. Pengecoh yang mempunyai daya tarik bagi peserta tes
yang kurang pandai.
Sebagai tindak lanjut atas hasil penganalisisan terhadap fungsi
distraktor tersebut, maka distraktor yang sudah menjalankan fungsinya
dengan baik dapat dipakai lagi pada tes-tes yang akan datang, sedangkan
distraktor yang belum dapat berfungsi dengan baik sebaiknya diperbaiki
atau diganti dengan distraktor yang lain.
Dengan melihat pada jawaban soal, dapat diketahui:
a. Taraf Kesukaran soal
b. Daya Pembeda soal
c. Baik dan tidaknya distraktor

H. Pelajaran Pendidikan Agama Islam


1. Kurikulum Pendidikan Agama Islam
Pada umumnya keberagamaan seseorang dipengaruhi oleh
pendidikan, pengalaman, dan latihan-latihan yang dilaluinya pada masa
kecilnya. Pendidikan Agama Islam adalah upaya sadar dan terencana
dalam menyiapkan peserta didik untuk mengenal, memahami, menghayati,
hingga mengimani ajaran agama Islam, dibarengi dengan tuntunan untuk

26
Sumarna Surapranata, op. cit., hlm. 43.
35

menghormati penganut agama lain dalam hubungannya dengan kerukunan


antar umat beragama hingga terwujud kesatuan dan persatuan bangsa.
Dengan munculnya berbagai perubahan yang sangat cepat pada
hampir semua aspek dan perkembangan paradigma baru dalam kehidupan
berbangsa, bernegara, bermasyarakat, di awal millenium ketiga ini telah
dikembangkan kurikulum Pendidikan Agama Islam secara nasional, yaitu
kurikulum yang ditandai dengan ciri-ciri, antara lain:
a. Lebih menitikberatkan pencapaian target kompetensi
(attainment targets) daripada penguasaan materi.
b. Lebih mengakomodasikan keragaman kebutuhan dan
sumber daya pendidikan yang tersedia.
c. Memberikan kebebasan yang lebih luas kepada pelaksana
pendidikan di lapangan untuk mengembangkan dan melaksanakan
program pembelajaran sesuai dengan kebutuhan.27
Yang dimaksud dengan kompetensi Pendidikan Agama Islam ialah
pengetahuan, ketrampilan dan nilai-nilai dasar ajaran Islam. Direfleksikan
dalam kebiasaan berfikir dan bertindak secara konsisten dan terus menerus
dalam kehidupan sehingga memungkinkan seseorang menjadi kompeten
atau dalam pengertian lain siswa dapat mengamalkan, mengoptimalkan
ajaran Islam.
Kompetensi dasar mata pelajaran berisi sekumpulan kemampuan
minimal yang harus dikuasi siswa selama menempuh pendidikan di SMP
kemampuan ini kognitif dalam rangka memperkuat keimanan dan
ketakwaan kepada Allah SWT. kemampuan dasar yang harus dicapai di
SMP, yaitu:
a. Mampu membaca al-Qur’an surat-surat pilihan sesuai dengan
tajwidnya, mengartikan dan menyalinnya, serta mampu membaca,
mengartikan dan menyalin hadits pilihan.

27
Abdul Majid dan Dian Andayani, Pendidikan Agama Islam Berbasis Kompetensi, (Bandung:
Remaja Rosdakarya, 2004), hlm. 84.
36

b. Beriman kepada Allah SWT. dan lima rukun iman yang lain dengan
mengetahui fungsinya serta terefleksi dalam sikap, perilaku dan akhlak
peserta didik dalam dimensi vertikal maupun horizontal.
c. Mampu beribadah dengan baik dan benar sesuai dengan tuntunan
syari’at Islam baik ibadah wajib dan ibadah sunnah maupun
muamalah.
d. Mampu berakhlak mulia dengan meneladani sifat, sikap dan
kepribadian Rasulullah serta Khulafaur Rasyidin.
e. Mampu mengambil manfaat dari sejarah peradaban Islam.28
a) Tujuan Pembelajaran Pendidikan Agama Islam
Pendidikan Agama Islam di SMP bertujuan untuk
menumbuhkan dan meningkatkan keimanan melalui pemberian dan
pemupukan pengetahuan, penghayatan, pengamalan serta pengalaman
peserta didik tentang agama Islam sehingga menjadi manusia muslim
yang terus berkembang dalam hal keimanan, ketakwaan kepada Allah
SWT, serta berakhlak mulia dalam kehidupan pribadi, bermasyarakat,
berbangsa dan bernegara.
Menurut Zuhairini Pendidikan Agama Islam bertujuan untuk
membimbing anak agar menjadi orang muslim sejati, beriman teguh,
beramal shaleh, dan berakhlak mulia serta berguna bagi masyarakat,
Agama dan Negara.29
Propenas 2000-2004 (UU No. 25 tahun 2000) menyebutkan
bahwa: Pendidikan Agama Islam di sekolah umum (TK, SD, SMP dan
SMU) bertujuan untuk meningkatkan keimanan melalui pemberian dan
pemupukan pengetahuan, penghayatan dan pengamalan serta
pengalaman peserta didik tentang agama Islam sehingga menjadi

28
Departemen Pendidikan Nasional, Standar Kompetensi Mata Pelajaran Pendidikan Agama
Islam; SMP dan MTs, (Jakarta: Pusat Kurikulum, Balitbang Depdiknas, 2003), hlm. 11.
29
Zuhairini, dkk., Metodik Khusus Pendidikan Agama, (Surabaya: Usaha Offset Printing, 1981),
hlm. 45.
37

manusia muslim yang terus berkembang dalam hal keimanan,


ketakwaan serta pembinaan akhlak mulia dan budi pekerti luhur.30

b) Materi Pelajaran Pendidikan Agama Islam


Adapun materi Pendidikan Agama Islam kelas VII semester
dua meliputi:
1) Thaharah
2) Shalat wajib
3) Shalat berjama’ah
4) Macam-macam sujud
5) Shalat Jum’at
6) Shalat jamak dan qashar
7) Shalat sunnah Rawatib dan Idain
8) Masyarakat Makkah sebelum datangnya Islam
9) Masyarakat Makkah setelah datangnya Islam.31

2. Pembelajaran Pendidikan Agama Islam


Di dalam kelas peranan siswa sebagai bagian yang lebih besar
dalam proses pembelajaran sangatlah menentukan, sehingga diperlukan
adanya persiapan-persiapan yang matang diharapkan dalam pentransferan
pengetahuan berjalan seoptimal mungkin. Oleh karena itu dibutuhkan
pendekatan-pendekatan dalam pembelajaran. Adapun pendekatan-
pendekatannya adalah sebagai berikut:
a. Pendekatan keimanan, yaitu memberi peluang kepada peserta
didik untuk mengembangkan pemahaman adanya Tuhan sebagai
sumber kehidupan makhluk sejagad ini.
b. Pendekatan pengamalan, memberikan kesempatan kepada
peserta didik untuk mempraktekkan dan merasakan hasil-hasil
30
A Qodri Azizi, Pendidikan untuk Membangun Etika Sosial (Mendidik Anak Sukses Masa Depan;
Pandai dan Bermanfaat), (Semarang: Anke Ilmu, 2003), hlm. 75.
31
Program Tahunan Pendidikan Agama Islam Kelas VII di SMPN 1 Demak tahun 2004-2005.
38

pengamalan ibadah dan akhlak dalam menghadapi tugas-tugas dan


masalah dalam kehidupan.
c. Pendekatan pembiasaan, memberikan kesempatan kepada
peserta didik untuk membiasakan sikap dan perilaku yang sesuai
dengan ajaran Islam dan budaya bangsa dalam menghadapi masalah
kehidupan.
d. Pendekatan rasional, usaha memberikan peranan pada rasio
(akal) peserta didik dalam memahami dan membedakan berbagai
bahan ajar dalam standar materi serta kaitannya dengan perilaku yang
baik yang buruk dalam kehidupan duniawi.
e. Pendekatan emosional, yaitu upaya menggugah perasaan
(emosi) peserta didik dalam menghayati perilaku yang sesuai dengan
ajaran agama dan budaya bangsa.
f. Pendekatan fungsional, menyajikan bentuk semua standar
materi (al-Qur’an, keimanan, akhlak, fiqh/ibadah dan tarikh), dari segi
manfaatnya bagi peserta didik dalam kehidupan sehari-hari dalam arti
luas.
g. Pendekatan keteladanan, yaitu menjadikan figur guru agama
dan non agama serta petugas sekolah lainnya maupun orang tua peserta
didik, sebagai cermin manusia yang berkepribadian.32

3. Evaluasi Pelajaran Pendidikan Agama Islam


Penilaian terhadap kegiatan dan hasil belajar mengajar siswa
dimaksudkan untuk mengumpulkan data sebagai bahan pertimbangan
dalam membantu perkembangan selanjutnya dan atau menetapkan
keberhasilan siswa. Di samping penilaian itu, penilaian siswa merupakan
bagian integral dari kegiatan pendidikan di SMP, dimaksudkan untuk
memperoleh keterangan tentang kegiatan dan kemajuan belajar siswa.
Penilaian terhadap studi Pendidikan Agama Islam di SMP mencakup tiga
aspek yakni aspek pengetahuan (kognitif), aspek ketrampilan

32
Abdul Majid dan Dian Andayani, op. cit., hlm. 170-171.
39

(psikomotorik), dan aspek sikap (afektif). Ketiga ranah ini sebaiknya


dinilai proporsional sesuai dengan sifat mata pelajaran yang bersangkutan.
Sebagai contoh penilaian pada mata pelajaran Pendidikan Agama
Islam harus menyeluruh pada segenap aspek kognitif, psikomotorik, dan
afektif dengan mempertimbangkan tingkat perkembangan siswa serta
bobot setiap aspek dari setiap materi. Misalnya kognitif meliputi seluruh
materi pembelajaran al-Qur’an/hadits, keimanan, akhlak, ibadah dan
tarikh. Aspek afektif sangat dominan pada materi akhlak. Dan aspek
psikomotorik dan pengalaman sangat dominan pada materi pembelajaran
ibadah dan membaca al-Qur’an.

Anda mungkin juga menyukai