Anda di halaman 1dari 19

Jurnal Penelitian dan Evaluasi Pendidikan

PENGEMBANGAN INSTRUMEN EVALUASI CIPP PADA


PROGRAM PEMBELAJARAN TAHFIZ AL-QUR’AN DI PONDOK PESANTREN
Muyasaroh, Sutrisno
Sekolah Tinggi Ilmu Tarbiyah Al-Qur’an Al-Ittifaqiah, UIN Sunan Kalijaga Yogyakarta
muyasnasir@yahoo.com, trisno_63@yahoo.com
Abstrak
Studi ini bertujuan untuk: (1) menghasilkan model pengembangan evaluasi program pembelajar’an
tahfiẓ al-Quran diberi nama Coni P2, (2) menghasilkan teknik pelaksanaan evaluasi program
pembelajaran tahfiẓ al-Qur’an, dan (3) menghasilkan struktur komponen dan indikator model
evaluasi. Studi ini merupakan penelitian dan pengembangan (R&D) dengan menggunakan
sembilan langkah dari 10 langkah model Borg dan Gall. Jumlah subjek uji coba pertama 33 orang,
uji coba kedua 49 orang, dan uji coba ketiga 224 orang. Komponen model evaluasi yang digunakan
adalah model evaluasi Stufflebeam (CIPP). Langkah-langkah evaluasi yang digunakan adalah
langkah Malcolm Provus. Teknik pengumpul data yang digunakan adalah Delphi, FGD, kuesioner,
observasi, wawancara, dan studi dokumentasi. Validitas konstruk dianalisis menggunakan CFA dan
Reliabilitas menggunakan Cronbach Alpha. Hasil penelitian: (1) model evaluasi program Coni P2
dikembangkan dengan cara kajian teori, temuan di lapangan, Delphi, FGD, uji coba sebanyak tiga
kali; (2) evaluasi di tiga pondok pesantren: Al-Ittifaqiah, Raudhatul Ulum, dan Raudhatul Qur’an
ditemukan kesenjangan sarana belajar, kinerja guru, dan motivasi belajar santri; (3) komponen
konstruk model evaluasi Coni P2 terdiri atas konteks, input, proses, dan produk, yang terbagi
menjadi 13 indikator. Hasil analisis CFA: (1) Chi Square (χ²) = kecil; (2) ρ-value > 0,05; (3) Root
Mean Square Error of Approximation (RMSEA) < 0,08; dan (4) Goodness of Fit Index (GFI) < 0,90.
Kata kunci: pengembangan, evaluasi, tahfiẓ al-Qur’an

DEVELOPING CIPP EVALUATION INSTRUMENT


FOR TAHFIZ AL-QUR’AN IN PONDOK PESANTREN
Muyasaroh, Sutrisno
Sekolah Tinggi Ilmu Tarbiyah Al-Qur’an Al-Ittifaqiah, UIN Sunan Kalijaga Yogyakarta
muyasnasir@yahoo.com, trisno_63@yahoo.com
Abstract
The study aimed to: (1) generate an evaluation development model of tahfiz Al-Qur’an learning
program entitled Coni P2; (2) generate a technique of tahfiz Al-Qur’an learning program
evaluation implementation; and (3) generate component structures and an indicators of evaluation
model. The study was a research and development (R&D) type by implementing 9 of 10 steps in
Borg and Gall’s model. The subject for the first trial the 33 people, for the second trial were 49
people, and for the third trial were 224 people. The implemented component of evaluation model
was Stufflebeam Evaluation Model (CIPP). The evaluation steps that the researchers implemented
were the ones taken from Malcolm Provus. The data gathering techniques that the researchers
implemented were Delphi, FGD, questionnaires, observation, interview and study of
documentation. The construct validity was analyzed by implementing CFA and the construct
reliability was analyzed by implementing Cronbach Alpha. The results of the research were as
follows: (1) the model of Coni P2 evaluation program was developed by implementing theoretical
review, field findings, Delphi, FGD and three-time experiments; (2) from the evaluations
performed in three pondok pesantren, namely Al-Ittifaqiah, Raudhatul Ulum and Raudhatul
Qur’an, the researchers found discrepancy in learning facilities, teacher performance and santri’s
learning motivation; and (3) the construct components of Coni P2 evaluation model consisted of
context, input, process and product that were divided into 13 indicators. The results of CFA
analysis were as follows: (1) (1) Chi Square (χ²) = kecil; (2) ρ-value > 0.05; (3) Root Mean Square
Error of Approximation (RMSEA) < 0.08; dan (4) Goodness of Fit Index (GFI) < 0.90.
Keywords: development, evaluation, tahfiz Al-Qur’an

Pengembangan Instrumen Evaluasi CIPP pada Program − 215


Muyasaroh, Sutrisno
Jurnal Penelitian dan Evaluasi Pendidikan

Pendahuluan Belajar akan mencapai kualitas tinggi


Al-Qur’an merupakan sebuah kitab jika memiliki beberapa faktor belajar. Fak-
suci bagi umat Islam. Keberadaan al-Qur’an tor-faktor yang mempengaruhi belajar siswa
tidak hanya sekedar sebuah kitab suci na- menurut pendapat Cruickshank (1990,
mun juga memiliki kemukjizatan/keistime- pp.10-11) ada empat variabel yaitu (1) guru,
waan bahasa, menjadi sumber kekuatan, dan (2) konteks: siswa, sekolah dan kelas, (3)
menjadi sebuah sumber pengajaran bagi proses: kinerja guru, semangat dalam meng-
pendidikan manusia (Zaid, 2011, p.78). Al- ajar, sikap yang menyenangkan, strategi
Qur’an menjadi sumber ajaran tangguh, mengajar, dan prilaku siswa (motivasi), dan
menjadi inspirasi sumber metode pengajar- (4) produk: jangka pendek (kecakapan/ke-
an yang baik tentang berpikir dan kreativi- pandaian) dan jangka panjang (kecakapan
tas. Demikian mulia kedudukan al-Qur’an profesional atau kecakapan dalam bidang
sehingga tetap terjaga kemurnian dan ke- tertentu).
suciannya. Tujuan Evaluasi program adalah
Menghafal adalah proses mengingat “untuk meninjau kembali atas pencapaian
informasi yang telah lalu dan dijadikan se- tujuan dan untuk membantu memberikan
buah informasi baru. Winkel mengemuka- alternatif berikutnya dalam pengambilan ke-
kan pendapatnya bahwa: “mengingat adalah putusan” (Darussalam, 2010, p.58). Denan
suatu aktifitas kognitif, dimana orang melakukan evaluasi maka teridentifikasi se-
menyadari bahwa pengetahuan berasal dari mua hambatan, hasil evaluasi dijadikan alat
informasi atau kesan-kesan yang diperoleh rekomendasi untuk melakukan perbaikan,
dari masa lampau” (Winkel, 2009, p.73). Hal setelah perbaikan dari berbagai sektor maka
tersebut senada dengan pendapat Joyce, hambatan telah dapat diselesaikan, jika ham-
Weil, & Chaloun, E, (2009, p.223) bahwa batan telah dapat diselesaikan, maka tujuan
kapasitas dalam memperoleh informasi dari program pembelajaran tahfiẓ al-Qur’an
mendukung secara lebih bermakna yang dapat diwujudkan.
artinya mendapatkan kembali dengan baik Penelitian ini lebih menitikberatkan
hasil pembelajaran yang telah lalu. pada evaluasi program melalui aplikasi
Berbagai metode menjaga kemurnian model evaluasi dan model pengembangan
al-Qur’an yang telah dijelaskan, metode R&D (Research and Development). Dasar
yang paling tepat dan baik adalah dengan pemilihan model ini adalah melihat konsep
menghafal al-Qur’an, karena dengan dihafal pembelajaran bahwa kualitas pembelajaran
tidak akan rusak kecuali karena kematian, setidaknya dipengaruhi oleh input, proses,
namun menjaga kemurnian menggunakan dan produk (Issac, Stephen & Michel, &
media akan dapat rusak pada masa tertentu. William 198, pp.2-3). Implementasi peneliti-
Guna mengungkap permasalahan da- an dan pengembangan model ini terletak
lam pembelajaran tahfiẓ al-Qur’an ini sangat pada konsep CIPP dikombinasikan dengan
dibutuhkan model evaluasi. Model evaluasi Provus sehingga menjadi bentuk modifikasi.
program pembelajaran tahfiẓ al-Qur’an sa- Belum ditemukan penelitian yang meng-
ngat diperlukan guna dapat mengungkap evaluasi program pembelajaran tahfiẓ al-
seluruh hambatan dalam pembelajaran tahfiẓ Qur’an melalui hasil MTQ/STQ di tingkat
al-Qur’an dan guna meningkatkan kualitas propinsi, kabupaten, maupun kecamatan
pembelajaran tahfiẓ al-Qur’an. Kualitas pem- untuk mengetahui kelemahan kualitas tahfiẓ
belajaran dipengaruhi oleh tiga hal seperti al-Qur’an di pondok pesantren.
ungkapan Harto & Adbdurrahmansyah, Permasalahan yang dihadapi oleh pon-
(2011, pp.73-74), kualitas pembelajaran ter- dok pesantren sangat komplek. Rasionalnya
diri atas beberapa faktor yakni: (1) ukuran Stufflebeam & Shinkfield mengacu penda-
kelas, (2) suasana belajar secara demokratis, pat Tyler mengungkapkan bahwa: “evaluation
dan (3) ketersediaan fasilitas dan sumber should determine the congruence between performence
belajar. and objectives” (Stufflebeam & Shinkfield,

216 − Jurnal Penelitian dan Evaluasi Pendidikan Tahun 18, Nomor 2, 2014
Jurnal Penelitian dan Evaluasi Pendidikan

1985, p.70). Evaluasi harus menghasilkan luasi program pembelajaran agar dapat di-
pendapat yang sama antara kinerja dan gunakan sebagai acuan penyusunan instru-
kondisi secara nyata tidak boleh direkayasa men evaluasi program pembelajaran tahfiẓ
dan hindari subjektifitas. al-Qur’an di pondok pesantren?.
Program pembelajaran seharusnya di- Tujuan Penelitian adalah mengahasil-
evaluasi untuk mengetahui kelemahan dan kan instrumen model evaluasi program
kekurangan pada proses pembelajaran, ke- pembelajaran tahfiẓ al-Qur’an yang diberi
nyataan di lapangan jarang ditemukan eva- nama Coni P2 agar dapat meningkatkan
luasi program yang mengevaluasi tentang kualitas program tahfiẓ al-Qur’an di pondok
pengawasan, kontrol, dan evaluasi tahfiẓ al- pesantren, menghasilkan model teknik pe-
Qur’an dari pihak pimpinan pondok pesan- laksanaan evaluasi program pembelajaran
tren atau kepala lembaga tahfiẓ al-Qur’an tahfiẓ al-Qur’an secara tepat menggunakan
terhadap proses pembelajaran tahfiẓ al- model evaluasi Coni P2, menghasilkan
Qur’an. struktur komponen-komponen dan indika-
Belum ditemukan pengembangan mo- tor-indikator model evaluasi sebagai acuan
del evaluasi yang tepat dan dapat digunakan penyusunan instrumen evaluasi program
untuk mengevaluasi program pembelajaran pembelajaran tahfiẓ al-Qur’an di pondok
tahfiẓ al-Qur’an di pondok pesantren seperti pesantren.
metode menghafal al-Qur’an, standar baku Penelitian ini memiliki kegunaan
tahfiẓ al-Qur’an, kurikulum yang tersurat, untuk membangun sebuah model instrumen
target minimal tahfiẓ al-Qur’an, minat santri untuk mengevaluasi program pembelajaran
untuk menghafal al-Qur’an dan produk tahfiẓ al-Qur’an melalui model modifikasi
tahfiẓ al-Qur’an. evaluasi program antara model CIPP dan
Belum ditemukan pengembangan mo- Provus disebut model evaluasi “Coni P2”.
del evaluasi menggunakan teknik evaluasi Penelitian ini juga berguna untuk meng-
secara sistematis dengan melihat kesenjang- evaluasi program tahfiẓ al-Qur’an untuk
an yang dapat digunakan untuk meng- membantu memberi bantuan pengambilan
evaluasi pelaksanaan program pembelajaran keputusan kepada pengelola program pem-
tahfiẓ al-Qur’an di pondok pesantren. belajaran tahfiẓ al-Qur’an di pondok pesan-
Belum ditemukan komponen dan in- tren apakah program ini harus dihentikan,
dikator model evaluasi program yang terdiri dilanjutkan atau diperbaiki. Worthen &
atas empat komponen (konteks, input, Sanders menjelaskan bahwa: “evaluation is the
proses, dan produk) dan terbagi menjadi 13 process of delineating, obtaining, and providing
indikator yang dapat digunakan sebagai acu- useful information for judging decision alternatives”
an penyusunan instrumen model evaluasi (Worthen & Sanders, 1981, p.129).
program pembelajaran tahfiẓ al-Qur’an di
pondok pesantren.
Berangkat dari berbagai permasalahan Metode Penelitian
maka dapat diformulasikan rumusan masa- Jenis penelitian ini adalah penelitian
lah sebagai berikut. Bagaimanakah model menggunakan pendekatan prosedur R&D
evaluasi program pembelajaran tahfiẓ al- ini menghasilkan: (1) instrumen untuk
Qur’an Coni P2 dikembangkan agar dapat mengevaluasi program pembelajaran tahfiẓ
meningkatkan kualitas pembelajaran tahfiẓ al-Qur’an; (2) model evaluasi program tahfiẓ
al-Qur’an di pondok pesantren?. Bagaimana al-Qur’an yang diberi nama “Coni P2”; dan
teknik pelaksanaan evaluasi program pem- (3) buku panduan penggunaan model eva-
belajaran tahfiẓ al-Qur’an secara tepat meng- luasi hasil pengembangan model. Tahap
gunakan model evaluasi program pembel- penelitian dan pengembangan dalam pene-
ajaran tahfiẓ al-Qur’an Coni P2 di pondok litian ini menggunakan model pengem-
pesantren?. Bagaimanakah komponen-kom- bangan Borg & Gall (1989, pp.772-781).
ponen dan indikator-indikator model eva- Langkah develop teknik pelaksanaan dalam
Pengembangan Instrumen Evaluasi CIPP pada Program − 217
Muyasaroh, Sutrisno
Jurnal Penelitian dan Evaluasi Pendidikan

penelitian ini menggunakan tahap 1-9 dari Juli 2011 hingga 22 Oktober 2013 peneliti
10 langkah R & D Borg & Gall. Alasan selalu menjaga hubungan baik dengan selalu
menggunakan model pengembangan adalah berkomunikasi dengan keempat pondok pe-
tahap develop Borg & Gall lebih rinci dan santren tersebut untuk memantau perkem-
lebih sistematis. bangan yang ada di masing-masing pondok
Siklus perencanaan, tahap ini terdiri pesantren.
atas tiga langkah yang harus dilakukan, per- Penelitian ini dilakukan di empat pon-
tama penelitian dan pengumpulan infor- dok pesantren di kabupaten Ogan Ilir (OI),
masi. Pada langkah ini peneliti melakukan Sumatera Selatan. Ogan Ilir (OI) merupakan
survei awal di empat pondok pesantren kabupaten/kota pemekaran dari kabupaten
yang mengelola pembelajaran tahfiẓ al- Ogan Komering Ilir (OKI). Usia yang ma-
Qur’an di Kabupaten Ogan Ilir, Sumatera sih muda ini (10 tahun) kabupaten ini me-
Selatan. miliki 16 kecamatan temasuk kecamatan
Siklus pengujian ada empat langkah induk. Kabupaten OI memiliki 21 pondok
yang harus dilalui. Langkah pertama, uji pesantren yang memiliki program tahfiẓ al-
coba pendahuluan menggunakan subjek uji Qur’an hanya ada 4 pondok pesantren anta-
coba 33 orang, langkah kedua, melakukan ra yaitu: (a) Pondok Pesantren Al-Ittifaqiah
revisi berdasarkan masukan-masukan dari kecamatan Idralaya Induk, (2) Pondok Pe-
lapangan, langkah ketiga, uji coba utama santren Raudhatul Ulum Indralaya Induk,
dengan subjek uji coba 49 orang, langkah (3) pondok pesantren Raudhatul-Qur’an,
keempat, dilakukan revisi sesuai masukan Payaraman Barat, (4) Pondok Pesantren
dari lapangan. Darul Funun Kecamatan Rambang Kuang.
Model evaluasi dan perangkat evaluasi Subjek penelitianian menggunakan
diimplementasikan di pondok pesantren beberapa subjek penelitian. Validasi instru-
dalam skala yang lebih besar. Menurut teori men menggunakan empat orang pakar yaitu
Borg & Gall pada tahap ini ada tiga langkah pakar evaluasi, pakar pengukuran, pakar
yang harus dilalui, pertama uji coba lapang- metodologi penelitian, dan pakar tahfiẓ al-
an operasional melibatkan tiga pondok Qur’an. Focus Group Discussion (FGD) meng-
pesantren terdiri 224 subjek uji, kedua me- gunakan subjek uji 19 orang terdiri atas 2
lakukan revisi. orang pimpinan pondok pesantren, 7 orang
Observasi dilakukan untuk melihat guru tahfiẓ al-Qur’an, dan 10 orang santri
kondisi pembelajaran. Kaplan dalam (Keeves tahfiẓ al-Qur’an. Uji keterbacaan instrumen
& Lakomski, 1992, p.84) menjelaskan bah- menggunakan 15 orang validator guna me-
wa, data hasil observasi sendiri harus valid meriksa isi dari instrumen, susunan bahasa
artinya apa yang telah diamati semuanya dan komponen dari instrumen. Uji coba
harus dilaporkan secara benar jangan sam- pertama menggunakan subjek penelitian
pai tidak melaporkan hasil pengamatan. sebanyak 33 orang uji subjek yang terdiri
Penelitian ini dimulai dengan pra- atas 2 orang pakar evaluasi, 4 orang pakar
survei tanggal 2-8 Juli 2011- 23 Oktober al-Qur’an, 2 orang pakar metodologi, 2
2013. Penelitian terbagi menjadi dua bagian: orang pengurus forum pondok pesantren
(1) tahap observasi bertujuan untuk melihat sebagai pengawas pondok pesantren, 10
kondisi objektif lokasi penelitian dan per- orang guru tahfiẓ al-Qur’an, dan 13 orang
masalahan yang dihadapi dilaksanakan pada santri tahfiẓ al-Qur’an. Uji coba kedua
tanggal 2-8 Juli 2011 dan (2) tahap peneliti- menggunakan subjek uji 49 orang terdiri
an selanjutnya pengambilan data lapangan atas 1 orang pimpinan pondok pesantren,
pada uji coba pertama (10-20 Juli 2013), uji 12 orang guru tahfiẓ al-Qur’an, dan 36 orang
coba kedua (28-4 Agustus 2013), dan uji santri tahfiẓ, dan uji coba ketiga dilakukan di
coba ketiga (13-23 Oktober 2013). Rekap 3 pondok pesantren yaitu pondok pesantren
nilai dan pengolahan data 24 Oktober-31 Al-Ittifaqiah, Raudhatul Ulum, dan Raudha-
Desember 2014. Selama kurun waktu bulan tul Qur’an. Subjek uji coba terdiri atas pim-

218 − Jurnal Penelitian dan Evaluasi Pendidikan Tahun 18, Nomor 2, 2014
Jurnal Penelitian dan Evaluasi Pendidikan

pinan pondok pesantren 3 orang, guru tahfiẓ tahfiẓ al-Qur’an 20 orang, dan santri 201
al-Qur’an 20 orang, dan santri 201 orang, orang, jumlah seluruh 224 Orang. (9) Revisi
jumlah seluruh 224 Orang. produk akhir, melakukan perbaikan sebagai-
Langkah-langkah pengembangan mo- mana yang diusulkan dalam uji lapangan
del Evaluasi program pembelajaran tahfiẓ al- operasional, yaitu melakukan perbaikan dan
Qur’an menggunakan 9 langkah dari 10 penyempurnaan akhir pada instrumen mo-
langkah model Borg & Gall (1989, pp.772- del yang dikembangkan sehingga menjadi
7781); (1) penelitian dan pengumpulan in- produk akhir hasil dari pengembangan (final
formasi. Pengumpulan informasi dalam product).
penelitian ini dituntut untuk mulai me- Data yang diperoleh dalam penelitian
ngumpulkan informasi secara rinci dan me- ini adalah data kuantitatif dan kualitatif.
ngumpulkan sejumlah permasalahan yang Data tersebut memberi gambaran tentang
ditemukan dalam penelitian di lapangan program pembelajaran tahfiẓ al-Qur’an me-
(Creswell (2009, p.97). Pengumpulan infor- liputi konteks, input, proses, dan produk
masi dengan melakukan tinjauan literatur, pelaksanaan program yang dicapai. Data
mengkaji beberapa konsep penelitian dan yang diperoleh dijelaskan di bawah ini.
pengembangan (R&D), melakukan peneliti- Data kuantitatif diperoleh dari instru-
an pendahuluan di empat pondok pesan- men angket/kuesioner teknik Delphi me-
tren; (2) perencanaan meliputi merencana- rupakan pendapat dari para pakar dan para
kan produk yang akan dihasilkan, waktu praktisi untuk membuat judgement berupa
penelitian, penulisan draf awal; (3) pengem- hasil kesepakatan tentang konseptualisasi
bangan bentuk produk awal berupa bentuk program pembelajaran tahfiẓ al-Qur’an di
penyusunan instrumen, bentuk model eva- pondok pesantren. Kuesioner juga diguna-
luasi, dan panduan penggunaan model eva- kan untuk menjaring data tentang perenca-
luasi; (4) uji lapangan penduhuluan dengan naan program, pelaksanaan program, dan
skala terbatas yaitu melakukan uji coba hasil dari pelaksaan program pembelajaran
lapangan dengan subjek uji coba sebanyak tahfiẓ al-Qur’an melalui pimpinan pondok
33 orang uji subjek yang terdiri atas 2 orang pesantren, guru, dan santri.
pakar evaluasi, 4 rang pakar al-Qur’an, 2 Data kualitatif diperoleh dari hasil
orang pakar metodologi, 2 orang pengurus data dokumentasi pondok pesantren, studi
forum pondok pesantren sebagai pengawas observasi, wawancara, penilaian pengamat-
pondok pesantren, 10 orang guru tahfiẓ al- an langsung di kelas saat guru mengajar di
Qur’an, dan 13 orang santri tahfiẓ al-Qur’an; kelas. Seluruh data yang berhasil dihimpun
(5) revisi produk, dilakukan perbaikan se- akan diolah guna untuk membuat keputus-
bagaimana yang telah diusulkan oleh hasil an tentang status program apakah akan di-
uji lapangan pendahuluan; (6) uji coba putuskan program tetap berjalan, dihentikan
lapangan utama/diperluas dilakukan di satu atau dimodifikasi dan juga untuk menentu-
pondok pesantren yaitu pondok pesantren kan rekomendasi untuk pondok pesantren.
Darul Funun yang terdiri atas 1 orang Teknik pengumpul data melalui bebe-
pimpinan pondok pesantren, 12 orang guru rapa teknik diantaranya: (1) Teknik Delphi,
tahfiẓ al-Qur’an, dan 36 orang santri tahfiẓ, teknik ini merupakan sebuah peramalan
jumlah seluruh 49 orang; (7) revisi produk, secara interaktif dan sistematik berdasarkan
melakukan perbaikan instrumen berdasar- feedback secara individu dari nilai-nilai yang
kan masukan dan saran sebagaimana di- dipilih sebanyak satu putaran atau lebih.
usulkan oleh hasil uji lapangan utama. (8) Bukti validitas isi tes atau instrumen di-
Uji coba lapangan operasional dilakukan di lakukan oleh panel pakar sesuai bidang yang
3 pondok pesantren yaitu pondok pesantren diukur dan pakar bidang pengukuran
Al-Ittifaqiah, Raudhatul Ulum, dan Raudha- (Mardapi, 2012, pp.17-19). Teknik ini di-
tul Qur’an. Subjek uji coba terdiri atas lakukan dengan mengedarkan draf awal
pimpinan pondok pesantren 3 orang, guru instrumen menggunakan skala likert dengan

Pengembangan Instrumen Evaluasi CIPP pada Program − 219


Muyasaroh, Sutrisno
Jurnal Penelitian dan Evaluasi Pendidikan

pilihan jawaban sangat cocok, cocok, cukup (Davidson, 2005, p.228). Dalam penelitian
cocok, kurang cocok, dan tidak cocok. Se- ini metode angket/kuisioner digunakan un-
lain menggunakan pilihan jawaban tersebut tuk menjaring sikap responden tentang
para pakar juga diminta usulan, saran, dan komponen proses pembelajaran tahfiẓ al-
pendapat pada lembar asulan, saran, dan Qur’an yang meliputi, minat, latar belakang,
pendapat; (2) Teknik FGD, teknik ini me- kesulitan yang dialami, dan prestasi yang
rupakan metode partisipasi dalam pengum- dicapai. Cosby menyatakan, dalam kuesio-
pulan informasi mengenai suatu permasa- ner, pertanyaan-pertanyaan dihadirkan dalam
lahan dan kebutuhan tertentu yang sangat format tertulis dan para responden menulis-
spesifik melalui diskusi secara kelompok kan jawaban-jawaban mereka (Cosby, 2009,
dan untuk mendapatkan kesepakatan ber- pp.214-215). Kuesioner diisi oleh pimpinan,
sama. Mertens (2010, p.240) menjelaskan guru, dan santri untuk dimudahkan dalam
bahwa FGD dapat digunakan sebagai alat menjawab karena sudah disiapkan jawaban
pengumpul data atau merupakan strategi tinggal memilih yang dirasa tepat; (3) obser-
penelitian; (3) uji keterbacaan instrumen vasi, observasi bertujuan untuk melakukan
hasil pembelajaran tahfiẓ al-Qur’an difokus- pengamatan dan proses pembelajaran tahfiẓ
kan pada penilaian: (a) kejelasan indikator al-Qur’an serta melakukan pencatatan seca-
kecakapan tahfiẓ al-Qur’an, (b) kejelasan ra sistematis dan logis, objektif dan rasional
indikator kecakapan individu, (c) kejelasan (Arifin, 2009, p.153); (4) wawancara, wa-
indikator sikap sosial, (d) penggunaan baha- wancara adalah pengajuan pertanyaan secara
sa Indonesia secara baku, (e) perumusan lisan oleh interviewer kapada responden dan
pertanyaan, dan (f) penggunaan kata dan dijawab secara lisan pula oleh responden.
kalimat yang mudah dipahami serta metode Gall, Gall & Borg (2007, p.228) menjelas-
tata tulis yang tepat dan benar; (4) uji coba kan bahwa “interviewer consist of oral question
pertama dengan melibatkan skala kecil yang asked by the interviewer and oral responsses by the
mewakili dari seluruh pondok pesantren research participants”. Wawancara digunakan
untuk menguji perangkat evaluasi, model untuk mewawancarai pimpinan, guru, dan
evaluasi, dan panduan evaluasi; (5) uji coba santri. Wawancara diperlukan untuk dapat
kedua dalam skala lebih besar melibatkan mengungkap hal yang masih tersembunyi,
satu pondok pesantren untuk menguji pe- yang masih tertutup pada saat melakukan
rangkat evaluasi, model evaluasi, dan pan- observasi. Tujuan wawancara adalah mem-
duan evaluasi; (6) uji coba ke-3 dalam skala beri kebebasan kepada pimpinan, guru dan
paling besar melibatkan 3 pondok pesantren santri untuk mengungkap informasi hingga
untuk menguji perangkat evaluasi, model informasi tersulit akan dapat dijelaskan; (5)
evaluasi, dan panduan evaluasi. dokumentasi, metode ini digunakan untuk
Metode instrumen pengumpulan data menggali informasi melalui dokumen lem-
menggunakan beberapa macam; (1) metode baga tahfizh al-Qur’an seperti nilai rapor,
tes, metode ini digunakan untuk meng- jumlah perkembangan santri tiap tahun,
umpulkan data tentang output pembelajaran jumlah wisudawan setiap tahun, dan jum
tahfiẓ al-Qur’an kompentensi psikomotorik santri berprestasi setiap tahun.
(keterampilan) dalam menghafal al-Qur’an. Data hasil penelitian dianalisis dengan
Bentuk insrtumen berupa test tahfiẓ al- cara mengorgasasikan data ke dalam kate-
Qur’an digunakan untuk menjaring kemam- gori, menjabarkan ke dalam unit-unit, me-
puan pemahaman praktik keterampilan lakukan sintesis, menyusun ke dalam pola.
menghafal materi hafalan, penerapan hu- Data dibagi menjadi dua yaitu kualitatif dan
kum tajwid adab dan faṣahah, metode ini kuantitatif. Data kualitatif adalah data yang
menggunakan nilai raport tahfiẓ al-Qur’an. dinyatakan dalam bentuk kata, kalimat, dan
(2) angket/kuesioner, teknik ini dapat mem- gambar. Data kuantitatif adalah data yang
berikan informasi penting dan jelas tentang berbentuk angka atau data kualitatif yang
kualitas, nilai atau keefektifan program diangkakan (Sugiyono, 2010, pp.3-4). Ada-

220 − Jurnal Penelitian dan Evaluasi Pendidikan Tahun 18, Nomor 2, 2014
Jurnal Penelitian dan Evaluasi Pendidikan

pun tahapan-tahapan dapat dilihat sebagai maka dinyatakan bahwa butir tersebut tidak
berikut. valid sehingga harus di-drop.
Analisis data secara kuantitatif, data Uji kecocokan model antara lain di-
yang terkumpul dianalisis dengan Explora- lihat RMSEA harus dibawah 0,08 dan GFI
tory Factor Analysis (EFA) dengan meng- harus lebih besar dari 0,90, (Wijanto, 2008,
gunakan bantuan program SPSS 16.0. Vari- pp.154 & 193). Uji kecocokan antara model
abel laten dibentuk berdasarkan konsep teoretis dan model empiris didasarkan pada
teoretis dengan beberapa indikator/mani- empat kategori; (1) Chi-Square, (2) Signifikan
fest (Ghozali 2008, p.121). Tujuan peng- Probablity,(3) Root Mean Square of Error Ap-
gunaan EFA ini adalah untuk menguji apa- proximation (RMSEA), dan Goodness of Fit
kah konstruk yang telah dibentuk dapat Index (GFI), Standar yang digunakan dapat
dijelaskan oleh indikator-indikatornya atau dilihat pada tabel nomor 1 berikut ini.
tidak. Apabila indikator-indikator tersebut
dapat menjelaskan konstruk atau variabel Tabel 1. Goodness of Fit Index
yang ada, maka kebenaran tersebut ditun- Cut of
jukkan pada nilai loading factor yang tinggi. No Indeks Keterangan
value
Setiap butir harus memiliki muatan lebih Semakin kecil X2
besar dari 0,3 (>0,3), demikian juga se- 1 Chi-Square (X2) Kecil
semakin baik
baliknya jika butir tersebut memiliki muatan Harus lebih besar
lebih kecil dari 0,3 (<0,3) maka butir ter- 2 Probability (p) ≥ 0,05
dari 0,05
sebut dinyatakan tidak valid, maka harus Rata-rata
dibuang atau gugur. Nurosis (1986, p 123). 3 RMSE ≤ 0,08
perbedaan/df
Konstruk diuji dengan melihat nilai Kaiser Goodness of Fit
Mayer Olkin (KMO) diharapkan 0,5 (> 0,5). 4 ≥ 0,90 Nilai berkisar 0-1
Index (GFI)
Analisis menggunakan EFA untuk menguji Sumber Wijanto, 2008, p.61
validitas pada uji coba kedua dan digunakan
untuk uji normalitas konstruk sebelum di- Data hasil observasi terdiri atas data
analisis menggunakan CFA pada uji coba penilaian proses pembelajaran tahfiẓ al-
ketiga. Qur’an yang terdiri atas data hasil observasi
Reliabilitas dilihat dari nilai alphanya santri putra dan putri secara terpisah dari
jika nilai alpha > 0,7 maka instrumen di- tiga pondok pesantren: Pondok Pesantren
anggap reliabel dan jika kurang dari 0,7 Al-Ittifaqiah, Raudhatul Ulum, dan Raudha-
dianggap tidak reliabel. Pengujian meng- tul Qur’an. Data observasi masing-masing
gunakan Cronbach Alpha digunakan untuk diambil dari dua orang penilai. Untuk men-
menguji reliabilitas instrumen pada uji coba jaga reliabilitas antarkedua penilai maka data
kedua dan ketiga. dianalisis menggunakan metode Cohen’s
Hasil uji coba ketiga data dianalisis Kappa menggunakan bantuan komputer de-
menggunakan metode CFA dengan tujuan ngan program SPSS for Window 16.0.
untuk melihat validitas dari masing-masing Relibilitas didasarkan pada hasil hitungan
instrumen yaitu konteks, input, proses, dan Kappa, jika hasil hitungan memilki nilai k <
produk. Analisis menggunakan CFA vali- 0,40 (jelek), 0,40 ≤ k ≤ 0,75 (bagus), dan k
ditas dilihat dari nilai t (t-value), muatan > 0,75 (sempurna) (Eye & Mun, 2005, p.6).
faktor dilihat dari nilai alpha, jika nilai alpha Standar inilah yang digunakan untuk me-
> 0,03 (tarap signifikan 5 %) dibanding de- lihat kesepakatan antardua penilai hasil
ngan nilai t tabel 1,96 maka butir dinyatakan observasi.
valid. Valid dapat dibuktikan pada diagram Analisis secara deskriptif analisis di-
path ditunjukkan dengan tulisan angka hi- lakukan dengan melihat kelengkapan model,
tam, semakin besar nilai t hitung maka se- kejelasan panduan model evaluasi, keleng-
makin valid. Jika nilai alpha tertulis merah kapan instrumen dan analisis keefektifan
model. Analisis model terdiri dari empat

Pengembangan Instrumen Evaluasi CIPP pada Program − 221


Muyasaroh, Sutrisno
Jurnal Penelitian dan Evaluasi Pendidikan

kriteria yang harus dipenuhi, yaitu kom- ma tiga tahun, dan perkembangan hasil
prehensif, praktis, ekonomis dan didukung prestasi MTQ/STQ santri selama tiga
oleh instrumen yang valid dan reliable. tahun.
Keempat kriteria syarat model tersebut ha-
nya validitas dan reliabilitas yang dianalisis Tabel 2. Konfersi Data Kuantitatif ke
secara kuantitatif sedangkan komprehensif, Kualitatif
praktis, dan ekonomis akan dianalisis secara
Rerata Klasifikasi
kualitatif. Rumus
skor
Cara menganalisis data secara deskrip-
Sangat
tif, data kuantitatif yang berasal dari instru- X > x i + 1,8 x sbi > 4,2
baik
men dicari skor reratanya, kemudian dikon-
firmasikan ke dalam data kualitatif dengan Xi + 0,6 x sbi < X ≤ i + 1,8 x sbi > 3,4-4,2 Baik
menggunakan skala 5, kemudian dideskrip- Xi – 0,6 x sbi < X ≤ i + 0,6 x sbi >2,6-3,4 Cukup
sikan. Hasil diskripsi dijadikan dasar untuk Xi – 1,8 x sbi < X ≤ i – 0,6 x sbi >1,8-2,6 Kurang
penilaian apakah instrumen, model evaluasi
Sangat
yang dikembangkan, dan panduan telah me- X ≤ X i – 1,8 X sbi ≤ 1,8
kurang
menuhi syarat pengembangan model yang
digunakan untuk mengevaluasi program
pembelajaran tahfiẓ al-Qur’an di pondok Hasil Penelitian dan Pembahasan
pesantren. Bentuk konfersi data kuantitatif Hasil uji coba pertama instrumen di-
menjadi kualitatif menggunakan skala 5 ini ujikan kepada 33 orang pakar dan praktisi
mengacu terhadap model modifikasi Sudijo- yaitu 2 orang pakar evaluasi, 4 orang pakar
no (2003, pp.329-339). Ketentuan Sudijono al-Qur’an, 2 orang pakar metodologi, 2
dijelaskan Tabel 2. orang pengawas forum pondok pesantren
Analisis data secara kualitatif adalah tingkat kabupaten, 10 orang guru tahfiẓ al-
menaganalisis data hasil validasi (penilaian) Qur’an, dan 13 orang santri tahfiẓ al-Qur’an.
dari para ahli (expert) dan pengguna model
Penilaian yang digunakan adalah skala likert
evaluasi (pimpinan pondok pesantren) serta dengan lima pilihan jawaban. Skor minimal
praktisi yang memberi masukan-masukan
1 dan skor maksimal 5.
dalam rangka perbaikan model evaluasi dan Berdasarkan penilaian para pakar dan
perangkatnya. Penelitian ini menggunakan
praktisi terhadap instrumen menunjukkan
pendekatan deskriftif kualitatif yaitu men-
bahwa instrumen yang telah diujicobakan
diskripsikan atau memberi gambaran ten-
adalah instrumen yang baik. Kriteria baik
tang objek yang diteliti melalui data sampel tersebut ditunjukkan pada nilai rerata dari
atau populasi sebagaimana adanya tanpa
seluruh komponen penilaian instrumen me-
membuat analisis ataupun kesimpulan yang nunjukkan hasil nilai 4,0 posisi ini me-
berlaku untuk umum (Sugiyono, 2006, p.21)
nunjukkan pada rentang skor di antara 3,4-
melalui wawancara, pengolahan angket, dan 4,2 artinya instrumen sudah baik dan layak
dokumentasi.
digunakan untuk melakukan uji coba kedua
Data yang telah dikumpulkan diana-
pada penilaian selanjutnya.
lisis melalui tiga jenis kegiatan yang terjadi
Hasil penilaian model evaluasi uji
secara bersamaan yaitu: reduksi data, pe- coba pertama dibagikan kepada 33 orang
nyajian data, dan penarikan kesimpulan/
terdiri atas 2 orang pakar evaluasi, 4 orang
verifikasi (Miles & Huberman 1985, pp.21- pakar al-Qur’an, 2 orang pakar metodologi,
22). Analisis data secara kualitatif meng-
2 orang pengawas forum pondok pesantren
gunakan tampilan berupa narasi, tabel, dan
tingkat kabupaten, 10 orang guru tahfiẓ al-
grafik meliputi data perkembangan jumlah
Qur’an, dan 13 orang santri. Penilaian yang
santri selama tiga tahun, perkembangan nilai
digunakan adalah skala likert dengan lima
nilai raport selama tiga semester, perkem-
pilihan jawaban. Skor minimal 1 dan skor
bangan jumlah wisudawan-wisudawati sela-
maksimal 5. Hasil penilaian uji coba per-

222 − Jurnal Penelitian dan Evaluasi Pendidikan Tahun 18, Nomor 2, 2014
Jurnal Penelitian dan Evaluasi Pendidikan

tama dianalisis secara deskriptif. Hasil uji tersebut dilihat koefisien rata-ratanya. Rata-
coba pertama model evaluasi program pem- rata nilai koefisien muatan faktor pada in-
belajaran tahfiẓ al-Qur’an adalah baik, kri- strumen konteks, input, proses, dan produk
teria baik tersebut ditunjukkan pada nilai adalah menunjukkan pada posisi lebih dari
rerata total 4,11 posisi ini menunjukkan 0,7. Dengan demikian, instrumen konteks
pada rentang skor di antara 3,4-4,2 artinya dinyatakan reliabel sehingga dapat diguna-
instrumen sudah baik dan layak digunakan kan untuk mengevaluasi program pembel-
untuk melakukan uji coba kedua. ajaran tahfiẓ al-Qur’an. Hasil analisis reliabi-
Uji coba kedua dilakukan di pondok litas selengkapnya dapat dilihat pada Tabel
pesantren Darul Funun dengan melibatkan 4.
subjek uji coba terdiri atas 1 pimpinan pon-
dok pesantren, 12 orang guru tahfiẓ al- Tabel 3. Hasil Analisis Faktor untuk
Qur’an, dan 36 santri tahfiẓ al-Qur’an, Instrumen pada Uji Coba Kedua
jumlah seluruh subjek uji coba berjumlah 49 Komponen Hasil Hitungan
orang. Berdasarkan penilaian terhadap in- Konteks KMO 0,694
strumen mengalami sedikit peningkatan skor Barlet’s X2 781,037
total pada uji coba pertama adala 4,09 dan Df 190
pada uji coba kedua menjadi 4,11 kriteria
Sig 0,00
baik karena terletak rentang skor antara 3,4
Input KMO 0,769
- 4,2 artinya instrumen sudah baik.
Barlet’s X2 1358, 042
Berdasarkan penilaian para pakar ter-
df 378
hadap model menunjukkan bahwa model
evaluasi yang telah diujicobakan adalah Sig 0,00
model yang baik, kriteria baik tersebut di- Proses KMO 0,612
tunjukkan pada nilai rerata dari seluruh Barlet’s X2 2260,450
komponen menunjukkan hasil nilai 4,17, df 780
posisi ini menunjukkan pada rentang skor di Sig 0,00
atas 3,4-4,2 artinya model ini sudah layak Produk KMO 0,655
digunakan tanpa perbaikan untuk melaku- Barlet’s X2 2490,850
kan uji coba ketiga. df 561
Validitas instrumen konteks, input, Sig 0,00
proses, dan produk semua butir menunjuk-
kan bahwa butir-butir tersebut telah meme- Tabel 4. Reliabilitas Cronbach Alpha Uji
nuhi kriteria Kaiser Meiyer Olkin Measure of coba kedua
Sampling Adequacy (KMO) > 0,5 sehingga Komponen Koefisien Keterangan
sudah memenuhi kriteria. Uji Barletts Tes of Alpha
Sphericity nilai Chi-Square, df seperti ditampil- Kontek 0,994 Reliabel
kan pada Tabel 3 dan signifikansi dari se-
Input 0,952 Reliabel
mua konstruk sudah di bawah 0,00 artinya
sudah signifikan. Nilai semua butir berada Proses 0,954 Reliabel
pada di atas 0,3. Dengan demikian, instru- Produk 0,971 Reliabel
men konteks dengan faktor-faktornya me-
miliki butir-butir yang valid semuanya kare- Hasil evaluasi Program tahfiẓ al-
na telah memiliki nilai muatan faktor di atas Qur’an di Pondok Pesantren Darul Funun,
0,3. rerata total skor evaluasi konteks, input,
Estimasi reliabilitas instrumen kon- proses, dan produk menghasilkan nilai 4,08.
teks dilakukan dengan menggunakan rumus Nilai tersebut dikonfirmasikan pada standar
Linier Combination of Reliability yaitu masing- kenfersi peniliaan maka nilai tersebut berada
masing indikator dilihat nilai koefisiennya pada rentang skor nilai antara 3,4-4,2 de-
kemudian koefisien dari seluruh indikator ngan klasifikasi “baik”.

Pengembangan Instrumen Evaluasi CIPP pada Program − 223


Muyasaroh, Sutrisno
Jurnal Penelitian dan Evaluasi Pendidikan

Hasil Evaluasi menyatakan ter-dapat Hasil evaluasi program pembelajaran


sedikit kesenjangan pada kinerja guru tahfiẓ tahfiẓ al-Qur’an di tiga Pondok Pesantren
al-Qur’an dan motivasi belajar santri ke- yaitu PP. Al-Ittifaqiah, PP Radhatul Ulum,
duanya memiliki nilai di bawah angka 4 dan PP. Raudhatul Qur’an dengan analisis
sekalipun kriteria baik. Demikian juga kom- evaluasi kontek memiliki nilai 4,21, input
petensi tahfiẓ al-Qur’an kompetensi akhlak memiliki nilai 4,23, proses memiliki nilai 4,
mulia masih memiliki nilai rendah masih di 19, dan produk memiliki nilai 4,23. Rerata
bawah angka 4. Dengan demikian, direko- total dari evaluasi kontek, input, proses, dan
mendasikan (1) tingkatkan kinerja guru ter- produk pada program tahfiẓ al-Qur’an me-
utama pengusaan materi oleh guru dan me- miliki rerata 4,22 kriteria “ sangat baik”.
tode mengajar; (2) bangun motivasi agar Hasil selengkapnya dapat dilihat pada Tabel
semangat menghafal al-Qur’an; (3) tingkat- 5.
kan kompetensi tahfizh al-Qur’an santri; dan
(4) tingkatkan pembinaan akhlak santri ber- Tabel 5. Rangkuman Hasil Evaluasi
dasarkan al-Qur’an yang dihafal. Program Tahfiẓ Al-Qur’an di 3
Pondok Pesantren
Uji Coba Ketiga di Tiga Pondok Pesantren
Pondok Pesantren Rerata Rerata
Komponen
Penilaian instrumen pada uji coba Evaluasi
Komponen
Total
RQ RU PPI Evaluasi
ketiga mengalami peningkatan. Hasil pen-
ilaian instrumen uji coba pertama memiliki Konteks 4,21 4,22 4,21 4,21 4,22
rerata total 4,09 artinya instrumen evaluasi (Sangat
Input 4,24 4,24 4,21 4,23 baik)
program ini sudah baik. Hasil uji coba
Proses 4,16 4,22 4,21 4,19
kedua mengalami peningkatan rerata skor
total yaitu 4,11, nilai ini memiliki klasifikasi Produk 4,29 4,19 4,21 4,23
tetap “baik”. Instrumen diperbaiki sesuai
dengan saran dan rekomendasi dari para Hasil pelaksanaan evaluasi program
validator dan terbukti hasil uji coba ke tiga pembelajaran tahfiẓ al-Qur’an di tiga pondok
instrumen mengalami peningkatan yang sig- pesantren yaitu Pondok Pesantren Al-
nifikan yaitu dengan nilai 4,21. Nilai ini Ittifaqiah, Raudhatul Ulum, dan Raudhatul
berada pada klasifikasi sangat baik. Dengan Qur’an yang terdiri atas komponen konteks,
demikian, dari uji coba pertama, kedua, dan input, proses, dan produk kemudian diban-
ketiga menunjukkan bahwa nilai hasil pe- dingkan dengan standar evaluasi kesenjang-
nilaian oleh validator mengalami peningkat- an. Hasilnya ditemukan 6 macam kesenjang-
an hingga mencapai “sangat baik” sehingga an tiga kesenjangan di Pondok Pesantren
instrumen dinyatakan layak untuk diguna- Radhatul Qur’an yakni pertama santri tidak
kan mengevaluasi program pembelajaran dilakukan seleksi kemampuan dasar, kedua,
tahfiẓ al-Qur’an di pondok pesantren di- dan ketiga hasil penilaian kinerja guru dinilai
manapun berada. oleh pimpinan dan dinilai oleh guru sendiri
Penilaian model evaluasi memiliki re- sama-sama memiliki nilai agak rendah seka-
rata total skor 4,20 menunjukkan bahwa lipun kriteria baik, namun perlu diperhati-
nilai naik tiga angka dibanding penilaian kan agar meningkatkan kualitas kinerja guru
model kedua, nilai tersebut berada pada melalui metode dan strategi mengajar. Tiga
kriteria evaluasi yang “baik”. Artinya hasil kesenjangan ditemukan di tiga pondok pe-
penilaian ini berada pada puncak kriteria santren yaitu sarana belajar menghafal tidak
baik hampir mencapai kriteria “sangat baik“ memiliki kelas khusus untuk menghafal al-
jika nilai satu angka lagi. Model ini dapat di- Qur’an semua tidak memiliki tempat khusus
gunakan untuk mengevaluasi program pem- setoran hafalan, namun hal tersebut tidak
belajaran tahfiẓ al-Qur’an di pondok pesan- mengurangi kualitas pembelajaran tahfzih al-
tren. Qur’an sehingga kesenjangan tersebut tidak
terlalu dihiraukan, memang idealnya pon-

224 − Jurnal Penelitian dan Evaluasi Pendidikan Tahun 18, Nomor 2, 2014
Jurnal Penelitian dan Evaluasi Pendidikan

dok pesantren meyiapkan lokal secara per- yang dapat digunakan oleh pimpinan pon-
manen khusus untuk kegiatan tahfiẓ al- dok pesantren untuk mengevaluasi program
Qur’an. tahfiẓ al-Qur’an. Pengembangan diawali dari
Pengambilan keputusan tentang prog- kajian teori, preliminari penelitian, dan
ram pembelajaran tahfiẓ al-Qur’an di tiga temuan secara empirik di lapangan maka
pondok pesantren didasarkan atas keterlak- dapat disusun draf awal konsep pengem-
sanaan program sesuai dengan standar eva- bangan model evaluasi. Draf awal yang telah
luasi yang disepakati yaitu standar konteks, disusun kemudian dikritisi oleh para pakar
input, proses, dan produk. Hasil evaluasi melalui teknik Delphi terdiri dari pakar
program pembelajaran tahfiẓ al-Qur’an evaluasi, pengukuran, metodologi, pakar
menggunakan model evaluasi Stufflebeam tahfiẓ al-Qur’an dan pondok pesantren.
(CIPP) dan model evaluasi Malcolm Provus Hasil dari Delphi menjadikan komponen
(Descripancy) memutuskan bahwa: (1) prog- dari draf awal banyak mengalami peruban
ram tahfiẓ al-Qur’an di Pondok Pesantren terutama isi dari komponen konteks evalu-
Al-Ittifaqiah dapat dilanjutkan, dengan per- asi, susunan, jumlah instrumen, susunan
baikan sarana belajar; (2) program tahfiẓ al- komponen model evaluasi program tahfiẓ al-
Qur’an di Pondok Pesantren Raudhatul Qur’an, ketepatan penggunaan istilah dalam
Ulum dapat dilanjutkan dengan perbaikan evaluasi, format penulisan petunjuk pada
sarana belajar; dan (3) program tahfiẓ al- kolom instrumen, dan penggunaan bahasa
Qur’an di Pondok Pesantren Raudhatul Indonesia secara baku dan kata serapan.
Qur’an program tahfiẓ al-Qur’an tetap dilan- Pada saat dilaksanakan proses validasi
jutkan dengan perbaikan pada rekrut santri isi draf awal model evaluasi program pem-
hendaknya dilakukan seleksi kemampuan belajaran tahfiẓ al-Qur’an oleh para pakar
dasar menghafal al-Qur’an, perbaikan kiner- secara beriringan dilaksanakan Focus Group
ja guru, dan perbaikan sarana belajar tahfiẓ Discussion (FGD). Hasil dari FGD adalah 1
al-Qur’an. menentukan standar pokok evaluasi prog-
Penilaian pada panduan penggunaan ram tahfiẓ al-Qur’an terdiri atas konteks
model evaluasi uji coba pertama memiliki program, input program, proses program,
nilai 4,11 menunjukkan bahwa nilai tersebut dan produk program. Selain standar pokok
berada pada kriteria baik. Pada uji kedua ditambah dengan standar pendukung be-
skor total mengalami peningkatan 5 angka rupa kenaikan jumlah santri tiap tahun, dan
namun masih berada pada posisi kriteria jumlah wisudawan tahfiẓ al-Qur’an tiap
baik, dan uji coba ketiga nilai skor total 4,21 tahun, perkembangan nilai raport tahfiẓ al-
penilaian mengalami peningkatan hingga 5 Qur’an, jumlah santri berprestasi bidang
angka kriteria “sangat baik”. Dengan demi- tahfiẓ al-Qur’an.
kian, penilaian yang berdasarkan ketujuh FGD selain menghasilkan standar mi-
kriteria dari 3 kali uji coba menunjukkan nimal evaluasi tersebut juga menghasilkan
bahwa pandaun ini “sangat baik” yang ber- kriteri standar minimal proses menghafal al-
sifat objektif, praktis, dan efisien sehingga Qur’an, metode pemeliharaan hafalan al-
cocok dan tepat digunakan untuk meng- Qur’an. Hasil kesepakatan dari proses FGD
evaluasi program pembelajaran tahfiẓ al- dijadikan standar untuk menentukan kriteria
Qur’an di pondok pesantren. evaluasi kualitas pelaksanaan program pem-
Guna menjawab pertanyaan bagai- belajaran tahfiẓ al-Qur’an di masing-masing
manakah model evaluasi program pembel- pondok pesantren pesantren.
ajaran tahfiẓ al-Qur’an Coni P2 dikembang- Instrumen setelah menjadi draf awal
kan agar dapat digunakan untuk mengeva- kemudian divalidasi oleh pakar pengukuran,
luasi program pembelajaran tahfiẓ al-Qur’an pakar evaluasi, pakar metodologi penelitian,
di pondok pesantren? maka diperlukan des- dan pakar tahfiẓ al-Qur’an, dilanjutkan uji
kripsi tahapan-tahapan pengembangan mo- keterbacaan instrumen untuk menguji ke-
del evaluasi secara sistematis dan praktis layakan isi instrumen oleh calon pengguna
Pengembangan Instrumen Evaluasi CIPP pada Program − 225
Muyasaroh, Sutrisno
Jurnal Penelitian dan Evaluasi Pendidikan

instrumen (praktisi), dilakukan uji coba per- perjanjian kesanggupan menghafal sebanyak
tama menggunakan subjek uji coba 33 30 juz. Sarana belajar disiapkan berupa
orang untuk menerima saran dan masukan muṣalla putra dan putri, asrama santri tahfiẓ
dari kekurangan pada instrumen, uji coba putra dan putri, belum tersedia secara
kedua menggunakan subjek uji coba 49 khusus untuk pelaksanaan tahfiẓ al-Qur’an,
orang untuk melihat kelayakan instrumen disinilah letaknya kekurangan pondok pe-
dan melihat validitas dan reliabilis instru- santren Al-Ittifaqiah sehingga pelaksanaan
men, dan uji coba ketiga menggunakan proses belajar tahfiẓ dilaksanakan di muṣalla,
subjek uji coba 224 orang untuk melihat ke- kantor madrasah Aliyah, waiting room, asrama
layakan instrumen, melihat validitas, me- putra dan putri, dan di rumah guru. Di-
lihat reliabilitas, dan menguji kecocokan sinilah letak kesenjangan di Pondok Pesan-
model dengan data empiris. tren Al-Ittifaqiah.
Menjawab pertanyaan kedua yang Hasil evaluasi proses pembelajaran
berbunyi bagaimana cara pelaksanaan eva- tahfiẓ al-Qur’an adalah “sangat bagus”. Guru
luasi program pembelajaran tahfiẓ al-Qur’an sudah bekerja sangat maksimal, guru me-
secara tepat menggunakan model evaluasi nguasai hafalan al-Qur’an cukup, saat meng-
program pembelajaran tahfiẓ al-Qur’an Coni ajar guru tidak membawa muṣhaf. Guru
P2 di pondok pesantren?. Komponen yang sudah menerapkan hukum tajwid pada
dievaluasi mengikuti standar komponen santri dengan tepat dengan bukti pada saat
yang telah ditentukan oleh standar evaluasi pelaksanaan observasi di kelas dijumpai saat
Coni P2. Komponen model evaluasi ini santri kurang tepat dalam pengucapan huruf
telah mengalami beberapa tahapan uji coba al-Qur’an pada ayat, maka guru akan
instrumen dan dilakukan perbaikan-perbaik- menegor dengan memberi aba-aba atau
an, sehingga menghasilkan model evaluasi ketukan meja kemudian dijelaskan, dan di
yang cocok digunakan di pondok pesantren. praktikkan oleh santri secara langsung.
Teknik yang digunakan untuk analisis data Hasil penilaian dari observasi di kelas
adalah teknik analisis deskriptif dengan santri putra memiliki nilai 0,71 “tingkat
menggunakan rerata skor dan rerata skor reliabilitas “baik” dan hasil observasi pada
total kemudian dikonfirmasikan dengan santri putri menghasilkan nilai 0,70 “tingkat
standar konfersi dengan menggunakan kri- reliabilitas “baik”. Proses observasi diawali
teria penilaian yang telah disepakati. Tahap- dengan melihat saat santri telah dihadapan
an-tahapan uji coba instrumen dijelaskan guru kemudian santri menyerahkan buku
berikut ini. kendali tahfiẓ al-Qur’an. Jika santri akan
Hasil evaluasi di Pondok Pesantren memulai mengaji maka terlebih dahulu
Al-Ittifaqiah (PP.I). Evaluasi konteks prog- membaca ta’awudz, membaca materi hafal-
ram pembelajaran tahfiẓ al-Qur’an terdiri an, dan diakhiri dengan bacaan tashdiq (ṣada-
atas gambaran lingkungan sudah sesuai qallahul ‘adhim), santri mundur dan menjabat
dengan konteks program, kebutuhan yang tangan guru sambil dicium dan santri me-
diperlukan oleh program, dan peluang bagi nerima buku kendali dan kembali duduk di
pondok dan santri dalam pelaksanaan prog- tempat semula.
ram ini sudah “sangat baik”. Evaluasi input Media pembelajaran di Pondok Pesan-
terdiri atas kualitas santri, kualifikasi guru, tren Al-Ittifaqiah sudah dimanfaatkan se-
dan sarana, dinilai oleh pimpinan, guru, dan cara sangat baik dan maksimal, santri di-
santri. Memiliki kriteria “sangat baik” wajibkan menggunakan muṣhaf murni pojok,
memang dalam pelaksanaan input sangat harus menggunakan tulisan rasam Usmani.
selektif baik dari rekrut santri, rekrut guru, Motivasi belajar santri terlihat memiliki
dan persiapan sarana belajar guna menun- antusias yang tinggi, seperti terlihat dari
jang keberhasilan program tahfiẓ al-Qur’an. hasil penilaian evaluasi ini adalah “sangat
Rekrut santri melalui tes kemampuan dasar, baik”. Motivasi belajar tahfiẓ al-Qur’an rata-
wawancara dan bahkan harus mengisi surat rata terbangun dari diri santri sendiri untuk

226 − Jurnal Penelitian dan Evaluasi Pendidikan Tahun 18, Nomor 2, 2014
Jurnal Penelitian dan Evaluasi Pendidikan

masuk di program tahfiẓ ini, karena di Banyu Asin, Sumatera Selatan, Pondok
pondok ini sering diadakan penampilan para Pesantren Gontor, Ponorogo, Jawa Timur,
hafiẓ-hafiẓah, juara kelas, juara umum, juara LIPIA Jakarta, Pondok Pesantren (ma’had
favorit, dihadiri oleh seluruh warga pondok tahfiẓ al-Qur’an) Al-Iman, Yaman, ma’had
pesantren, untuk menerima hadiah berupa tahfiẓ Al-Qur’an di Siria, Ma’had tahfiẓ al-
piagam, pembebasan uang SPP. Qur’an di Madinah, ma’had tahfiẓ Al-Qur’an.
Teknik pemeliharaan hafalan al- Al-Irsyad, Pekalongan, Jawa Tengah, Darul
Qur’an sudah “baik”. Guna menjaga kuali- Hufaẓ, Berenung, Lampung Selatan, Suma-
tas hafalan maka diperlukan frekwensi tera Selatan, dan dari Pondok Pesantren
pengulangan lebih banyak, karena hafalan Raudhatul Ulum sendiri.
jika tidak dilakukan pengulangan akan lupa Sarana belajar sudah baik dengan di-
dan hilang dari ingatan, oleh karena itu sedikannya masjid 2 lantai, muṣalla Putri,
pondok pesantren Al-Ittifaqiah memiliki Kantor Pusat, Gedung Serba Guna dan
program simaan al-Qur’an bagi santri dan Olah Raga, Toko Pelajar, Kantin Putra dan
juga guru. Putri, dan Klinik. Ruang setoran hafalan al-
Evaluasi produk kompetensi tahfiẓ al- Qur’an menggunakan muṣalla, asrama, kelas,
Qur’an dinilai oleh guru dan santri, hasil rumah guru. Semua yang dibutuhkan untuk
evaluasi “sangat baik” dibuktikan dengan menunjang keterlaksanaan program pem-
penguasaan hafalan secara baik disertai ke- belajaran tahfiẓ al-Qur’an sudah sangat baik.
tepatan aplikasi hukum tajwid, dan pe- Media belajar menghafal al-Qur’an
nguasaan ayat mutasyabihat (ayat serupa sudah dimanfaatkan dengan “sangat baik”.
tetapi tak sama). Pemahaman ayat-ayat yang Menggunakan al-Qur’an standar yaitu al-
serupa tetapi tidak sama juga merupakan ciri Qur’an pojok/sudut yang miliki kriteria
kualitas hafalan baik. Indikasi hafalan kuali- tertentu. Evaluasi motivasi belajar tahfiẓ al-
tas baik (lancar) memiliki 3-5 kali kesalahan Qur’an bagi santri memiliki kriteria “sangat
dalam menyetor hafalan, tidak membuka baik”. Kriteria baik tersebut ditunjukkan
atau sesekali membuka muṣhaf saat meng- pada kehadiran santri mencapai 80% setiap
ulangi hafalan sendiri, berani disimak oleh bulan kehadiran santri didokumentasikan,
orang lain, bersedia diuji seperti MHQ. mencapai target satu hari satu halaman
Hasil evaluasi di Pondok Pesantren bahkan ada yang melebihi target karena ada
Raudhatul Ulum. Penilaian konteks sudah yang sekali setor minimal 3 halaman, se-
“sangat baik” program tahfiẓ al-Qur’an su- hingga jangka waktu setahun 6 bulan dapat
dah tergambar secara jelas sehingga dapat menyelesaikan 30 juz.
dipahami bersama untuk menjalankan prog- Penilaian teknik pemeliharaan hafalan
ramnya. Kebutuhan program sudah ter- al-Qur’an memiliki kriteria “baik”. Kriteria
gambar secara jelas, demikian juga peluang tersebut dijelaskan bahwa hafalan yang telah
dari adanya program ini dapat memberi dikuasai dilakukan muraja’ah menyetor ulang
peluang bagi para santri untuk mengkuti (menyetor ulang) kepada guru, muraja’ah in-
program tahfiẓ al-Qur’an sehingga menjadi dividu (nderes), simaan dengan teman sejawat.
hafiẓ-hafiẓah yang berkualitas tinggi untuk Hasil evaluasi proses pembelajaran
mengajarkan kepada masyarakat di masa tahfiẓ al-Qur’an di Pondok Pesantren Raud-
mendatang. hatul Ulum (PP.RU) menghasilkan hasil
Hasil evaluasi input Pondok Pesan- evaluasi dengan kriteria “sangat baik”. Hasil
tren Raudhatul Ulum (PP.RU) sudah “sangat penilaian dari observasi di kelas santri putra
baik” ditandainya setiap santri yang masuk memiliki nilai 0,46 “tingkat reliabilitas baik”
program tahfiẓ al-Qur’an dengan direkrut dan hasil observasi pada santri putri meng-
secara hati-hati dan cermat agar tidak meng- hasilkan nilai 0,48 “tingkat reliabilitas baik”.
alami kesulitan saat menghafal al-Qur’an. Evaluasi kompetensi tahfiẓ al-Qur’an
Guru juga direkrut secara baik seperti dari sudah “sangat baik” dibuktikan dengan pe-
Pondok Pesantren Assalam, Sungai Lilin, nguasaan hafalan secara baik disertai kete-
Pengembangan Instrumen Evaluasi CIPP pada Program − 227
Muyasaroh, Sutrisno
Jurnal Penelitian dan Evaluasi Pendidikan

patan aplikasi hukum tajwid, dan penguasa- Evaluasi input terhadap kualitas santri
an ayat mutasyabihat. “sangat baik”. Santri direkrut untuk masuk
Penilaian akhlak mulia memiliki krite- di pada program tahfiẓ al-Qur’an melalui
ria “baik”. Kriteria tersebut ditunjukkan seleksi administrasi saja dengan mengisi
pada individu santri seperti memiliki jiwa formulir dan menyerahkan foto, belum di-
tenang yang terpancar dalam diri santri lakukan seleksi santri yang memiliki kemam-
seperti santri yang diwawancarai, berpenam- puan untuk menghafal al-Qur’an. Penilaian
pilan menarik menggunakan pakaian seder- kualifikasi guru tahfiẓ al-Qur’an memiliki
hana namun tetap terlihat anggun dan kriteria “sangat baik”. Kriteria baik tersebut
menarik, tidak mudah berkeluh kesah se- memang guru betul-betul direkrut dari be-
perti saat menjumpai ayat yang sulit dihafal berapa pondok pesantren yang betul-betul
dengan berulang kali mengulagi, mampu berkualitas tinggi seperti Al-Amin, Tredian,
menyelesaikan permasalahannya dengan Madura, Jawa Timur, Al-Mukhlish, Ban-
bijak, jujur dalam berkata, disiplin dalam dung, Raudhatul Qur’an, Ogan Ilir, Suma-
bertindak. tera Selatan, Raudhatul Ulum, Ogan Ilir
Penilaian terhadap amal salih memi- Sumatera Selatan, Al-Ittifaqiah. Evaluasi
liki kriteria “baik”. Kriteria amal salih ditun- sarana belajar memiliki klasifikasi “sangat
jukkan pada individu santri berupa mampu baik”. Klasifakasi baik tersebut dapat di-
berinteraksi dengan sesama dan masyarakat jelaskan bahwa pondok pesantren memiliki
seperti memberi ucapan salam sambil ter- gedung 4 unit, lokal belajar formal 12 unit,
senyum saat bertemu dengan orang lain, kantor 4 unit, ruang asrama/inap santri 8
partisipasi pada kegiatan pondok, meng- unit, rumah guru 3 unit, masjid 1 unit, toilet
hadiri panggilan. Santri mampu beradaptasi 11 unit, penerang listrik PLN 1 unit.
terhadap lingkungan seperti menghadiri Evaluasi proses dimulai kinerja guru
acara yang diadakan oleh pondok pesantren, memiliki nilai pada posisi agak rendah se-
kerja bakti lingkungan pondok pesantren, kalipun pada klasifikasi “baik” karena masih
dan menjaga kelestarian alam. Santri mam- di bawah angka 4. Guru menyiasati cara
pu memberikan bantuan kepada orang lain mengajar kepada santri yang masih banyak
seperti mengantar teman sakit di bawa pemula menghafal al-Qur’an seberapapun
berobat ke dokter. kemampuan individu yang terpenting hafal-
Hasil evaluasi di Pondok Pesantren an lancar tidak terbata-bata, Evaluasi pe-
Raudhatul Qur’an (PP.RQ). Hasil evaluasi manfaatan media yang digunakan untuk
konteks pada gambaran lingkungan prog- menghafal al-Qur’an memiliki nilai “sangat
ram tahfiẓ al-Qur’an “sangat baik” karena baik”. Sebagai penunjang penguatan hafalan
dirumuskan oleh pimpinan pondok pesan- santri selalu diperdengarkan dengan lagu-
tren, para pendiri dan pejuang pondok lagu murattal al-Qur’an melalui Radio Santri.
pesantren seperti visi adalah sebagai central Qori’ dari Timur Tengah seperti Syekh
excellent pendidikan Islam, khususnya tahfiẓ Imam besar Makkah Abdurrahman Assu-
al-Qur’an dan penguasaan bahasa Arab, daisy, Syekh Abdurrahman Al-Hudzaifi, dan
sehingga terbentuknya generasi Qur'ani Syekh Al-Minsyari dan Syekh Mushthofa
yang berilmu dan berakhlak mulia. Penilaian Ismail. Evaluasi motivasi belajar tahfiẓ al-
kebutuhan untuk menunjang jalannya prog- Qur’an bagi santri memiliki kriteria “baik”.
ram tahfiẓ al-Qur’an dinilai “baik”. Penilaian Kriteria baik tersebut ditunjukkan pada
peluang adalah pada klasifikasi “baik”. Pe- kehadiran santri setiap bulan, mencapai tar-
luang yang diharapkan adanya program ini get setengah halaman sampai satu halaman
adalah menyediakan tempat pelaksanaan tiap hari, patuh terhadap tata tertib. Pe-
program, peluang bagi para santri memiliki laksaan muroja’ah pengulangan hafalan rata-
prestasi tahfiẓ al-Qur’an 30 juz, memiliki rata 2-5 halaman tiap hari disetor kepada
prestasi baik tingkat kabupaten, propinsi, guru.
nasional, dan hingga internasional.

228 − Jurnal Penelitian dan Evaluasi Pendidikan Tahun 18, Nomor 2, 2014
Jurnal Penelitian dan Evaluasi Pendidikan

Hasil penilaian dari observasi di kelas secara kuantitatif untuk konstruk model
santri putra memiliki nilai 0,80 “tingkat evaluasi program tahfiẓ al-Qur’an.
reliabilitas sangat baik/exellen” karena>0,75 Model yang digunakan untuk meng-
dan hasil observasi pada santri putri evaluasi program pembelajaran tahfiẓ al-
menghasilkan nilai 0,70 “tingkat reliabilitas Qur’an adalah menggunakan model evaluasi
baik”. Observasi diawali dari melihat posisi hasil R & D dari model evaluasi Stufflebean
santri masing-masing duduk berbaris men- (CIPP) dan model evaluasi kesenjangan
jadi dua baris panjang dan berdekatan, Malcolm Provus (descrepancy). Berdasarkan
mereka menyiapkan atau melancarkan ma- temuan-temuan di atas setelah dikaitkan de-
teri hafalan masing-masing sementara santri ngan komponen dan indikator program
yang paling depan dua orang maju terlebih pembelajaran tahfiẓ al-Qur’an yaitu gambar-
dahulu. Penilaian teknik pemeliharaan hafal- an lingkungan, kebutuhan, peluang, kualitas
an al-Qur’an memiliki kriteria “sangat baik”. santri, kualifikasi guru, sarana belajar,
Kriteria tersebut dijelaskan bahwa hafalan kinerja guru, media belajar, motivasi belajar
yang telah dikuasai dalam jiwa maka harus santri, pemeliharaan hafalan al-Qur’an, kom-
dijaga agar tidak hilang dari ingatan dengan petensi tahfiẓ, kompetensi akhlak mulia, dan
muraja’ah menyetor ulang (menyetor ulang) kompetensi amal salih kesemuanya merupa-
kepada guru, muraja’ah individu (nderes), sima- kan indikator yang berhasil disusun hasil
an dengan teman sejawat dan mendengar- dari pengembangan model evaluasi.
kan murattal dari Radio santri. Model evaluasi hasil pengembangan
Kompetensi tahfiẓ al-Qur’an “sangat telah diuji secara empirik dan telah meme-
baik” dibuktikan dengan penguasaan hafal- nuhi kriteria Goodness of Fit Index meng-
an secara baik disertai ketepatan aplikasi gunakan Confirmatory Factor Analysis (CFA).
hukum tajwid, dan penguasaan ayat mutasya- Instrumen hasil pengembangan telah me-
bihat. Penilaian akhlak mulia kriteria “sangat miliki validitas > 0,3 dan memiliki relia-
baik”. Kriteria tersebut ditunjukkan pada bilitas > 0,70. Dengan demikian, instrumen
individu santri seperti sopan saat bicara model evaluasi yang dikembangkan melalui
dengan orang lain, berpenampilan menarik, R&D dapat digunakan untuk mengevaluasi
tidak mudah berkeluh kesah dalam meng- program pembelajaran tahfiẓ al-Qur’an di
hadapi kesulitan, mampu menyelesaikan pondok pesantren. Komponen evaluasi dan
permasalahannya dengan bijak, jujur dalam indikator pembelajaran tahfiẓ al-Qur’an ber-
berkata, disiplin dalam bertindak, dan me- hasil disusun secara sistematis. Model yang
miliki rasa empati terhadap orang lain. digunakan untuk mengevaluasi program
Penilaian terhadap amal salih memiliki tahfiẓ al-Qur’an adalah model CIPP dan
kriteria “sangat baik”. Kriteria amal salih Provus. Model evaluasi ini merupakan hasil
ditunjukkan memberi ucapan salam saat dari pengembangan yang diberi nama Coni
bertemu dengan orang lain, partisipasi pada P2. Model ini mengevaluasi program tahfiẓ
kegiatan yang diselenggarakan oleh pondok al-Qur’an menggunakan komponen dari
pesantren, menghadiri panggilan jika di- CIPP yang terdiri dari konteks, input, pro-
panggil oleh guru atau orang lain.
ses, dan produk.
Untuk menjawab pertanyaan ketiga Hasil analisis komponen dan indi-
yang berbunyi bagaimanakah komponen- kator model evaluasi program pembelajaran
komponen dan indikator-indikator model
tahfiẓ al-Qur’an diuji secara empirik guna
evaluasi program pembelajaran agar dapat
mendapatkan kriteria valid dan reliabel pada
digunakan sebagai acuan penyusunan instru-
konstruk instrumen dan menguji model
men evaluasi program pembelajaran tahfiẓ yang dihipotesiskan dengan menggunakan
al-Qur’an di pondok pesantren. Dijawab
data hasil uji coba di lapangan.
menggunakan analisis deskriptif untuk men- Uji signifikansi sebagai syarat Analisis
deskripsikan komponen model evaluasi dan
Konfirmatori. Instrumen sebelum dilakukan
analisis menggunakan konfirmatori terlebih
Pengembangan Instrumen Evaluasi CIPP pada Program − 229
Muyasaroh, Sutrisno
Jurnal Penelitian dan Evaluasi Pendidikan

dahulu diuji menggunakan teknik Explora- Dengan demikian, instrumen konteks se-
tory untuk mengetahui apakah instrumen luruh butirnya dinyatakan telah valid.
layak atau tidak diuji menggunakan analisis Hasil pengujian konstruk instrumen
konfirmatori. Berikut hasil uji signifikansi input telah memenuhi persyaratan goodness of
instrumen. Instrumen konteks nilai Kaiser fit statistik ditunjukkan pada nilai Lamda (λ)
Meiyer Olkin Measure of Sampling Adequacy terendah 0,52 (λ>0,30), Chi-Square = 390,00,
(KMO) sebesar 0,929. Uji Barletts Tes of df= 347, ρ-value= 0,0554 (> 0,05), RMSEA=
Sphericity nilai Chi-Square 3584,060, df 190, 0,024 (≤ 0,08), GFI= 0.90 (GFI = 0,90).
dan signifikansi 0,00. Instrumen input me- Dengan demikian, semua butir instrumen
miliki KMO sebesar 0,875, uji Barletts Tes of input dinyatakan valid.
Sphericity nilai Chi-Square 2234,886, df 3,78 Instrumen proses memiliki empat di-
dan signifikansi 0,00. Instrumen proses me- mensi yang diukur (1) kinerja guru memiliki
miliki nilai KMO sebesar 0,816, uji Barletts 10 item butir, (2) pemanfaatan media me-
Tes of Sphericity nilai Chi-Square 3403,122, df miliki 10 item butir, (3) motivasi belajar
780, dan signifikansi 0,00. Instrumen pro- santri memiliki 11 item butir, dan (4) teknik
duk memiliki nilai KMO sebesar 0,967, uji pemeliharaan hafalan memiliki sembilan
Barletts Tes of Sphericity nilai Chi-Square item butir.
6428,326, df 561, dan signifikansi 0,00. Hasil analisis konfirmatori instrumen
Seluruh KMO lebih besar dari 0,5 artinya proses memiliki nilai Lamda (λ) terendah
instrumen sudah bagus dan nilai signifikansi 0,69 (λ >0,30), Chi-Square ()= 759,48,122, df=
seluruh instrumen sudah di bawah 0,05. 736, ρ-value= 0,26670 (> 0,05), RMSEA=
Dengan demikian, seluruh instrumen dinya- 0,012 (≤ 0,08), GFI= 0.90 (GFI ≥ 0,90), nilai
takan berdistribusi normal sehingga sudah GFI sudah baik memiliki nilai pada posisi
memenuhi syarat untuk dianalisis meng- standar terendah.
gunakan Confirmatory Factor Analysis. Rang- Instrumen produk dianalisis meng-
kuman nilai hasil uji signifikansi instrumen gunakan Konfirmatori terdiri atas tiga di-
Coni P2 ditampilkan pada tabel berikut ini. mensi pertama, kompetensi tahfiẓ al-Qur’an
memiliki 13 item butir, kedua, kompetensi
Tabel 6. Hasil Uji KMO Instrumen Uji akhlak mulia memiliki 13 item butir, dan ke-
Coba Ketiga tiga, kompetensi amal salih memiliki dela-
pan item butir. Hasil analisis konfirmatori
Barlet’s Test of
instrumen produk nilai Lamda (λ) terendah
Komponen KMO Sphericity
0,74 (λ>0,30), Chi-Square ()= 562,70, df=524
X 2 Df Sig ρ-value= 0,11745 (> 0,05), RMSEA= 0,018
Konteks 0,929 3584,060 190 0,00 (≤ 0,08), GFI= 0.90 (GFI ≥ 0,90), GFI
Input 0,875 2234,886 378 0,00 memenuhi persyaratan sekalipun posisi te-
rendah. Berikut ini rangkuman hasil analisis
Proses 0,816 3403,122 780 0,00
instrumen evaluasi program tahfiẓ al-Qur’an.
Produk 0,967 6428,326 561 0,00
Tabel 7. Rangkuman Hasil Model
Model pengukuran. Instrumen kon- Pengukuran
teks dianalisis menggunakan CFA meng-
Komponen
hasilkan seperti berikut ini. Index
Hasil pengujian konstruk instrumen Konteks Input Proses Produk
konteks menunjukkan hasil sesuai dengan χ² 195, 48 390,00 759,48 562,70
ketentuan goodness of fit ditandai dengan nilai
df 167 347 736 524
Lamda (λ) pada masing-masing butir semua
butir telah menunjukkan valid semua, nilai p-value 0.06506 0,0554 0,2667 0,1174
Lamda terendah 0,71 (λ > 0,30), Chi-Square= RMSEA 0,028 0,024 0,012 0,018
195,48, df=167, ρ-value= 0,06506 (> 0,05),
GFI 0,973 0,90 0,90 0,90
RMSEA= 0,028 (≤ 0,08), dan GFI= 0,97.

230 − Jurnal Penelitian dan Evaluasi Pendidikan Tahun 18, Nomor 2, 2014
Jurnal Penelitian dan Evaluasi Pendidikan

Model evaluasi secara empiris dinya- 0,12805 (> 0,05), RMSEA= 0,031 (≤ 0,08),
takan fit dan telah memenuhi persyaratan GFI= 0.953 (GFI > 0,90). Model empiris
yang ditentukan oleh struktural CFA, yaitu disajikan pada Gambar 1.
nilai Chi-Square = 71,46, df= 59, ρ- value=

Gambar 1. Model Empiris Coni P2

Rata-rata nilai koefisien pada instru- Cara implementasi model Coni P2


men konteks, input, proses, dan produk dari pada pembelajaran tahfiẓ al-Qur’an adalah
tiga pondok pesantren yaitu pondok pe- melakukan evaluasi menggunakan perangkat
santren Al-Ittifaqiah, Raudhatul Qur’an, dan evaluasi Coni P2 dimulai dari kontek prog-
Raudhatul Ulum, reliabilitas konteks 0,955, ram, input program, proses pembelajaran,
input 0,945, proses 0,931 dan produk 0,982. dan produk pembelajaran tahfiẓ al-Qur’an,
Nilai koefisien tersebut menunjukkan pada kemudian dibandingkan dengan standar, dan
posisi lebih dari 0,7. Dengan demikian, dilanjutkan dengan rekomendasi perbaikan.
seluruh instrumen dinyatakan reliabel arti- Hasil pelaksanaan evaluasi program
nya bahwa semua instrumen evaluasi prog- pembelajaran tahfiẓ al-Qur’an menggunakan
ram pembelajaran tahfiẓ al-Qur’an dapat model Coni P2 berhasil mendeteksi kesen-
diterapkan di semua pondok pesantren di jangan dan merekomendasikan pada PP.I
berbagai daerah. perbaikan sarana belajar, PP.RU perbaikan
sarana belajar, dan PP.RQ perbaikan sarana
Simpulan belajar, kinerja guru, dan motivasi belajar
santri.
Berdasarkan uraian dan analisis data Manfaat yang diperoleh oleh pimpin-
dapat disimpulkan sebagai berikut. an pondok pesantren dari pelaksanaan eva-
Instrumen model evaluasi program luasi program tahfiẓ al-Qur’an menggunakan
pembelajaran tahfiẓ al-Qur’an Coni P2 di- model Coni P2 adalah informasi kesenjang-
kembangkan dengan cara melakukan kajian an proses pelaksaan program dan informasi
teori, temuan di lapangan, Delphi, FGD, uji kesenjangan tersebut dijadikan sebagai dasar
keterbacaan, uji coba, uji coba kedua, dan
uji coba ketiga.
Pengembangan Instrumen Evaluasi CIPP pada Program − 231
Muyasaroh, Sutrisno
Jurnal Penelitian dan Evaluasi Pendidikan

untuk melakukan perbaikan perencanaan dan lembaga yang menyelenggarakan prog-


selanjutnya. ram tahfiẓ al-Qur’an, dan bahkan dapat un-
Model Coni P2 terdiri konteks, input, tuk mengevaluasi satuan mata pelajaran.
proses, dan produk, dan terbagi menjadi 13
indikator. Komponen dan indikator instru- Daftar Pustaka
men telah teruji secara empirik mengguna-
kan analisis CFA menghasilkan semua butir Arifin, Z. (2012). Evaluasi pembelajaran.
dinyatakan valid karena semua butir memi- Bandung: PT Remaja Rosdakarya.
liki Chi-Square kecil, p-value > 0,05, RMSEA Borg, W.R. & Gall, M.D. (1983). Educational
< 0,08 dan GFI > 0,90. research: An intruduction. New York &
Berdasarkan hasil observasi dan wa- London: Longman. Book Company.
wancara model evaluasi Coni P2 sangat
efektif digunakan untuk mengevaluasi prog- Cozby, P.C. (2009). Methods behavioral research
ram pembelajaran tahfiẓ al-Qur’an, karena (9th ed). New York: McGrawHill Com-
model Coni P2 memiliki sifat yang seder- panies, Ins, 1221.
hana sehingga mudah dilaksanakan, praktis Creswell, J.W. (2009). Research design (Quali-
karena dapat dilakukan kapan saja, dan tative, quantitative, and mixed methods
ekonomis karena pelaksana evaluasi adalah approaches) (3rd ed). Los Angeles: Sage
warga pondok pesantren sendiri. Publication.
Saran Cruickshank, D.R. (1990). Research that in-
form teacher and teacher educators. Bloo-
Pondok pesantren baik tingkat mene-
mington: Phi Delta Kappa Educa-
ngah dan tingkat tinggi (mahasiswa), rumah
tional Foundation.
tahfiẓ, dan lembaga yang menyelengarakan
program tahfiẓ al-Qur’an apapun namanya Darussalam, G. (2010). Program evaluation
hendaknya selalu melaksanakan evaluasi in higher education program evaluati-
program untuk mengukur ketercapaian on in higher education. The Inter-
program dan mengetahui kelemahan untuk national Journal of Research and Review, 5,
dilakuakan perbaikan dan meningkatkan 56-65.
kualitas program pereode berikutnya. Davidson, E.J. (2005). Evaluation methodology
Model evaluasi Coni P2 hendaknya basics (The nuts and bolts of sound evalu-
digunakan oleh pimpinan pondok pesantren ation). London: ECIY 1 SP United
untuk mengevaluasi program tahfiẓ al- Kingdom.
Qur’an agar pondok pesantren lebih tertib
dan teratur dalam mendokumentasikan da- Eye, A. V. & Mun, E. Y. (2005). Analyzing
ta-data yang digunakan untuk mengevaluasi rater agreement (Manifest variable methods).
program yang dicanangkan. Marwah, New Jersey: Lawrence
Diseminasi hendaknya dilaksanakan Erlbaum Associates, Inc.
dengan mengikutsertakan pihak pemerintah Gall, M.D., Gall, J.P., & Borg,W.R (2007)
terutama Kementrian Agama, pengurus fo- Educational research an intruduction (8th
rum pondok pesantren, dan kalangan per- ed). Library of Congress Cataloging-in
guruan tinggi tahfiẓ al-Qur’an mulai tingkat Publication Data. New York: Pearson
kabupaten hingga nasional agar model ini Education, Inc.
tersosialisasikan melalui pihak-pihak terkait.
Model Evaluasi Coni P2 dapat di- Harto, K. & Abdurrahmansyah. (2011).
kembangkan lebih lanjut tidak terbatas un- Metodologi pembelajaran berbasis active
tuk mengevaluasi program tahfiẓ al-Qur’an learning (Arah baru pembelajaran PAI di
di pondok pesantren belaka, namun dapat sekolah dan madrasah). Yogyakarta:
juga digunakan di tingkat madrasah tahfiẓ al- Pustaka Felicha.
Qur’an, perguruan tinggi tahfiẓ al-Qur’an,

232 − Jurnal Penelitian dan Evaluasi Pendidikan Tahun 18, Nomor 2, 2014
Jurnal Penelitian dan Evaluasi Pendidikan

Issac, Stephen & Michel, William B. (1981). Stufflebeam, D. L, Shinkfield, A. J. (1985).


Handbook in research & evaluation. (2nd Systematic evalaution. U.S.A. Massachu-
ed). San Diego, California: Edits setts: Kluwer-Nijhoff Publishing.
Publisher.
Sudijono, A. (2003). Pengantar evaluasi pendi-
Joyce, B. Weil, M Colhoun, E. (2009). Model dikan. Jakarta: PT Raja Grafindo
of teaching (8th ed). New Jersey: Pearson Persada.
Education, Inc Publishing US Allyn
Sugiyono. (2008). Metode penelitian pendidikan
& Bocam, One Lake Street Upper
(Pendekatan kuantitatif, kualitatif, dan
Saddle River.
R&D). Bandung: Alfabeta.
Keeves, J.P. & Lakomski, G. (1992). Isues in
Wijanto, S.H. (2008). Struktural equation
educational research. Amsterdam: Perga-
modeling dengan lisrel. 8. Yogyakarta:
mon An Imprint of Elveer Science.
Graha Ilmu.
Nurosis, J.M (1986). SPSS/PC + for the
Winkel, W.S. (2009). Psikology pengajaran.
imbbc/xt/at. Chicago, SPSS.Inc
Yogyakarta: Media Abadi.
Mardapi, D. (2012). Pengukuran penilaian &
Worthen, B.R & Sanders, J.R. (1981). Educa-
evaluasi pendidikan.Yogyakarta: Nuha
tional Evaluation: Theory and practice.
Medika.
Ohio: Charles A. Jones Publishing
Merten, D.M. (2010). Research and evaluation Company Worthington.
in education and psychology (Integrating
Zaid, M. A. (2011) (King Khalid Univer-
diversi with quantitative, qualitative, and
sity). Language acquisition, linguistic
mixed methods)(3th ed). California: Sage
creativity and achievement: Insights
Publications, Inc.
from the Qur'an. KEMANUSIAAN
Miles, M.B. & Huberman, A.M. (1985). Vol. 18, No. 2, 75-100.
Qualitative data analysis. California:
Sage Publication, Inc. 275 South
Baverly Drive, Baverly Hills.

Pengembangan Instrumen Evaluasi CIPP pada Program − 233


Muyasaroh, Sutrisno

Anda mungkin juga menyukai