PENDAHULUAN
A. Latar Belakang
Secara etimologi "evaluasi" berasal dan bahasa Inggris yaitu evaluation
dari akar kata value yang berarti nilai atau harga. Nilai dalam bahasa Arab disebut
alqiamah atau altaqdir’ yang bermakna penilaian (evaluasi). Sedangkan secara
harpiah, evaluasi pendidikan dalam bahasa Arab sering disebut dengan al-taqdir
altarbiyah yang diartikan sebagai penilaian dalam bidang pendidikan atau
penilaian mengenai hal yang berkaitan dengan kegiatan pendidikan. Secara
terminologi, beberapa ahli memberikan. mendefinisikan evaluasi merupakan
kegiatan yang terencana untuk rnengetahui keadaan objek dengan menggunakan
instrumen dan hasilnya dibandingkan dengan tolak ukur untuk memperoleh
kesimpulan (M. Chabib dalam Thoha Ina Magdalena DKK. 2020). Sedangkan
Edwind dalam Ramayulis berpendapat tentang evaluasi mengatakan bahwa
evaluasi mengandung pengertian suatu tindakan atau proses dalam menentukan
nilai sesuatu (Ramayulis, 2002).
Evaluasi adalah suatu kegiatan yang disengaja dan bertujuan. Kegiatan
evaluasi dilakukan dengan sadar oleh guru dengan tujuan untuk memperoleh
kepastian mengenai keberhasilan belajar siswa dan memberikan masukan kepada
guru mengenai apa yang dia lakukan dalam kegiatan pengajaran. Dengan kata
lain, evaluasi yang dilakukan oleh guru bertujuan untuk mengetahui bahan bahan
pelajaran yang disampaikan apakah sudah dikuasi oleh siswa ataukah belum.
Seorang guru yang merasa bertanggung jawab atas penyempurnaan
pengajarannya, maka ia harus mengevaluasi pengajarannya itu agar ia mengetahui
perubahan apa yang seharusnya diadakan (Popham & Baker, 2008). Siswa juga
harus dievaluasi.
Evaluasi harus dilakukan secara sistematis dan kontinu agar dapat
menggambarkan kemampuan para siswa yang dievaluasi. Dalam pembelajaran
1
2
A. Evaluasi
1. Konsep Evaluasi Pembelajaran
kata value yang berarti nilai atau harga. Nilai dalam bahasa Arab disebut
alqiamah atau al-taqdir’ yang bermakna penilaian (evaluasi). Sedangkan secara
harpiah, evaluasi pendidikan dalam bahasa Arab sering disebut dengan al-taqdir
altarbiyah yang diartikan sebagai penilaian dalam bidang pendidikan atau
penilaian mengenai hal yang berkaitan dengan kegiatan pendidikan. Secara
terminologi, beberapa ahli memberikan pendapat tentang pengertian evaluasi
diantaranya: Edwind dalam Ramayulis mengatakan bahwa evaluasi mengandung
pengertian suatu tindakan atau proses dalam menentukan nilai sesuatu
(Ramayulis, 2002). M. Chabib Thoha, mendefinisikan evaluasi merupakan
kegiatan yang terencana untuk rnengetahui keadaan objek dengan menggunakan
instrumen dan hasilnya dibandingkan dengan tolak ukur untuk memperoleh
kesimpulan (Thoha, 1990)
Pengertian evaluasi secara umum dapat diartikan sebagai proses sistematis
untuk menentukan nilai sesuatu (ketentuan, kegiatan, keputusan, unjuk-kerja,
proses, orang, objek dan yang lainnya) berdasarkan kriteria tertentu melalui
penilaian. Untuk menentukan nilai sesuatu dengan cara membandingkan dengan
kriteria, evaluator dapat langsung membandingkan dengan kriteria umum, dapat
pula melakukan pengukuran terhadap sesuatu yang dievaluasi kemudian
membandingkan dengan kriteria tertentu. Dalam pengertian lain antara evaluasi,
pengukuran, dan penilaian merupakan kegiatan yang bersifat hirarki.
Evaluasi merupakan suatu proses yang sistematis untuk menentukan atau
membut keputusan sampai sejumlah tujuan-tujuan pengajaran telah dicapai oleh
siswa. ( Purwanto dalam Ramli dan Idrus, 2019). Dalam sistim evaluasi
merupakan salah satu komponen yang penting dan tahap yang harus di tempuh
oleh guru untuk mengetahui keefaktifan pembelajaran. Hasil yang diperoleh dari
5
6
evaluasi dapat dijadikan balikan (feed back) bagi guru dalam memperbaiki dan
menyempurnakan program dari kegiatan pembelajran. (Ramli dan Idrus, 2019)
2. Tujuan Evaluasi Pembelajaran
Evaluasi adalah suatu kegiatan yang disengaja dan bertujuan. Kegiatan
evaluasi dilakukan dengan sadar oleh guru dengan tujuan untuk memperoleh
kepastian mengenai keberhasilan belajar siswa dan memberikan masukan kepada
guru mengenai apa yang dia lakukan dalam kegiatan pengajaran. Dengan kata
lain, evaluasi yang dilakukan oleh guru bertujuan untuk mengetahui bahan bahan
pelajaran yang disampaikan apakah sudah dikuasi oleh siswa ataukah belum.
Selain itu, apakah kegiatan pegajaran yang dilaksanakannya itu sudah sesuai
dengan apa yang diharapkan atau belum.
Menurut Sudirman N, dkk, bahwa tujuan penilaian dalam proses
pembelajaran adalah:
1) Mengambil keputusan tentang hasil belajar.
2) Memahami siswa
3) Memperbaiki dan mengembangkan program pengajaran.
Selanjutnya, mengatakan bahwa pengambilan keputusan tentang hasil
belajar merupakan suatu keharusan bagi seorang guru agar dapat mengetahui
berhasil tidaknya siswa dalam proses pembelajaran. Ketidakberhasilan proses
pembelajaran itu disebabkan antara lain sebagai berikut:
1) Kemampuan siswa yang rendah.
2) Kualitas materi pelajaran tidak sesuai dengan tingkat usia anak.
3) Jumlah bahan pelajaran terlalu banyak sehingga tidak sesuai dengan waktu
yang diberikan.
4) Komponen proses belajar dan mengajar yang kurang sesuai dengan tujuan
yang telah ditetapkan oleh guru itu sendiri.( Mahirah B, 2017)
Di samping itu, pengambilan keputusan juga sangat diperlukan untuk
memahami siswa dan mengetahui sampai sejauh mana dapat memberikan
bantuan terhadap kekurangan siswa. Evaluasi juga bermaksud meperbaiki dan
mengembangkan program pengajaran. Dengan demikian, tujuan evaluasi adalah
untuk memperbaiki cara, pembelajaran, mengadakan perbaikan dan pengayaan
7
bagi siswa, serta menempatkan siswa pada situasi pembelajaran yang lebih tepat
sesuai dengan tingkat kemampuan yang dimilikinya. Tujuan lainnya adalah untuk
memperbaiki dan mendalami dan memperluas pelajaran, dan yang terakhir adalah
untuk memberitahukan atau melaporkan kepada para oran gtua/wali siswa
mengenai penentuan kenaikan kelas atau penentuan kelulusan siswa.
3. Fungsi Evaluasi Pembelajaran
Evaluasi yang sudah menjadi pokok dalam proses keberlangsungan,
pendidikan maka sebaiknya dikerjakan setiap hari dengan jadwal yang sistematis
dan terencana. Guru dapat melakukan evaluasi tersebut dengan menempatkannya
secara satu kesatuan yang saling berkaitan dengan mengimplementasikannya pada
satuan materi pembelajaran. Bagian penting lainnya yaitu bahwa guru perlu
melibatkan siswa dalam evaluasi sehingga secara sadar dapat mengenali
perkembangan pencapaian hasil belajar pembelajaran mereka, Sehingga salah
satu komponen dalam pelaksanaan pendidikan.
Evaluasi mempunyai beberapa fungsi. Berdasarkan Undang-undang RI
tentang Sisdiknas No. 20 Tahun 2003 Pasal 58 ayat 1 bahwa evaluasi hasil belajar
peserta didik dilakukan untuk membantu proses, kemajuan, dan perkembangan
hasil belajar peserta didik secara berkesinambungan. Menurut M. Ngalim
Purwanto bahwa kewajiban bagi setiap guru untuk melaksanakan kegiatan
evaluasi itu (Purwanto, 1991). Hal ini karena pada akhirnya guru harus
memberikan informasi lembaganya ataupun kepada siswanya itu sendiri,
mengenai bagaimana dan sampai dimana penguasaan dan kemampuan telah
dicapai oleh siswa tentang materi dan keterampilan mengenai
mata pelajaran yang telah diberikannya.
Jahja Qohar Al-Haj, mengemukakan bahwa fungsi evaluasi dari sisi siswa
secara individual, dan dari segi program pengajaran
a. Dilihat dari segi siswa secara individu, evaluasi berfungsi sebagai: mengetahui
tingkat pencapaian siswa dalam suatu proses pembelajaran yaitu:
1) Menetapkan keefektifan pengajaran dan rencana kegiatan.
2) Memberi basis Laporan kemajuan siswa
3) Menetapkan kenaikkan dan kelulusan
8
inkonsinstensi hasil ukur apabila hasil pengkuran dilakukan ulang pada kelompok
yang berbeda. (ramli dan idrus, 2019)
Menyatakan bahwa reliabilitas merupakan salah-satu ciri atau karakter
utama instrumen pengukuran yang baik. Arifin dalam zulkfli menyatakan bahwa
suatu tes dikatakan reliabel jika selalu memberikan hasil yang sama bila diteskan
pada kelompok yang sama pada waktu atau kesempatan yang berbeda. (Azwar
dalam zulfikar matondang, 2009)
Konsep reliabilitas dalam arti reliabilitas alat ukur berkaitan
erat dengan masalah kekeliruan pengukuran. Kekeliruan pengukuran
sendiri menunjukkan sejauh mana inkonsistensi hasil pengukuran
terjadi apabila dilakukan pengukuran ulang terhadap kelompok
subyek yang sama. Sedangkan konsep reliabilitas dalam arti
reliabilitas hasil ukur berkaitan erat dengan kekeliruan dalam
pengambilan sampel yang mengacu pada inkonsistensi hasil ukur
apabila pengukuran dilakukan ulang pada kelompok yang berbeda.
(Sudjana 2004) menyatakan bahwa reliabilitas alat penilaian
adalah ketepatan atau keajegan alat tersebut dalam menilai apa yang
dinilainya. Artinya, kapanpun alat penilaian tersebut digunakan akan
memberikan hasil yang relatif sama.
2. Teknik Mengukur Reliabilitas
Pada umumnya pengukuran karakteristik afektif memberikan koefisien
reliabilitas yang lebih rendah daripada pengukuran ranah kognitif, karena
karakteristik kognitif cenderung lebih stabil daripada karakteristik afektif.
Menurut Gable yang di kutip Litwin , koefisien reliabilitas instrumen ranah
kognitif biasanya kira-kira 0,90 atau lebih, sedangkan koefisien reliabilitas
instrumen ranah afektif kurang dari 0,70.Koefisien reliabilitas pada taraf 0,70 atau
lebih biasanya dapat diterima sebagai reliabilitas yang baik.
Sedangkan menurut Naga koefisien reliabilitas yang memadai sebaiknya terletak
di atas 0,75 (Litwin dalam Gaguk Margono, 2013).
Beberapa alasan pentingnya pengukuran reliabilitas yang bersifat
multidimensi seperti dikemukan oleh Widhiarso (2010) dengan uraian sebagai
10
[∑ ]
i
λi
i−1
ω=
[ ∑ ] [∑
i i
1− λi ]
2
λi +
i−1 i−1
Keterangan:
𝜆i = factor loading terstandarisasi indifaktor ke i
membawa teori statistika pada analisis struktural linear yang lebih dikenal dengan
sebutan model persamaan struktural atau SEM. Sumber penting yang digunakan
dalam menganalisis adalah struktur kovarian sehingga terkadang pendekatan ini
dinamakan dengan covariant structure model (CSM). Model yang disusun
memuat variabel tak terukur yang dinamakan dengan konstruk laten yang
dibangun oleh serangkaian variabel terukur yang dinamakan dengan konstruk
terukur. Error pengukuran yang merefleksikan reliabilitas skor pengukuran
dilihat sebagai konstruk unik dan menjadi bagian yang penting dalam analisis
SEM, error pengukuran yang dilibatkan dalam analisis SEM inilah yang
kemudian menjadi kelebihan SEM dibanding dengan teknik analisis lainnya
(Capraro et al., 2001). SEM dapat mengestimasi varians error skor hasil
pengukuran secara aktual mengestimasi reliabilitas. SEM sebagai teknik statistik
multivariat yang mengkombinasikan antara regresi berganda yang
mengidentifikasikan hubungan antara konstruk dan
analisis faktor yang mengidentifikasi konsep tak terukur melalui beberapa
indikator manifest yang keduanya dipakai secara simultan. (Gefen et
al., 2001)
SEM memiliki beberapa kelebihan dibanding dengan teknik analisis
lainnya. Dalam menguji hubungan antara variabel, SEM secara otomatis
mereduksi efek error pengukuran. pengaruh variabel independen terhadap variabel
dependen dipengaruhi oleh efek atenuasi, (Capraro et al., 2001). Nilai efek ini
tidak dapat melebihi batas koefisien reliabilitas skor tes yang digunakan.
Pendekatan pertama adalah koreksi korelasi atenuasi yang disebabkan oleh error
pengukuran dan pendekatan kedua adalah model persamaan struktural dalam
kontek analisis faktor konfirmatori. SEM adalah salah satu pendekatan untuk men
egaskan model pengukuran. Pada model pengukuran SEM menghubungkan antara
konstruk laten dengan dengan konstruk empirik. Konstruk empirik dinyatakan
oleh kombinasi konstruk laten. Disamping dapat mampu menangani generalizabil
ity theory dan item response theory, SEM mampu membandingkan
model pengukuran dan memfasilitasi investigasi ketepatan model.( Lee dan Song
2001)
12
[∑ ]
i
λi
i−1
CR=
[ ] [∑ ]
i i
∑ λi + δ
i−1 i−1
Keterangan:
CR = reliabilitas konstruk
𝜆i = faktor loading terstandarisasi indikator ke i
δ = erros standar pengukuran
p
l 2i
∑
Ω=
i−1 ( 1−l 2i )
p
1+ ∑ ( 1−l 2i )
i−1
13
Keterangan:
li = koefisien dimensi ke i transtandar
Koefisien reliabilitas ini dapat diartikan sebagai korelasi kuadrat antara
dimensi dengan skor komposit linier optimal, sehingga beberapa ahli
menamakannya dengan reliabilitas maksimal (maximal reliability).
Pada penelitian Widhiarso dan Mardapi (2010), model multidimensi untuk
koefisien reliabilitas memiliki ketepatan pengukuran yang tinggi bila
dibandingkan dengan reliabilitas unidimensi. Oleh karena itu dalam penelitian ini,
peneliti hanya difokuskan pada koefiesien konsistensi internal seperi α untuk
reliabilitas unidimensi dan ω , CR dan Ωw .
Instrumen sikap terhadap statistika semula ini terdiri atas 15 butir
pernyataan. Ketiga belas butir instrumen ini merupakan hasil penelitian dari
peneliti sendiri yang semula 15 butir dan gugur 2 butir. Instrumen yang terdiri dari
13 butir ini dapat dirinci sebagai berikut: 5 butir untuk dimensi evaluasi, 3 butir
potensi, dan 5 butir aktivitas. Untuk reliabilitas konsistensi
internal alpha Cronbach diperoleh langsung menggunakan program SPSS sebesar
0,710.(Gaguk Margono, 2013)
Untuk reliabilitas skor komposit McDonald, dengan menggunakan
pemodelan analisis strukturatau structural equation modelling (SEM) diperoleh:
i
( 6,040 )
ω= =0,791
( 6,040 ) + ( 9,632 )
Reliabilitas konstruk diperoleh hasil yang sama sebagai berikut: ∑ ii-1 – 𝜆i =
( 6,040 )
6,040 dan ∑ii-1 δ = 9,620; jadi CR = =0,791
( 6,040 ) + ( 9,620 )
Berikut untuk reliabilitas berbobot, dengan menggunakan pemodelan
l 2i
analisis struktur atau SEM diperoleh: ∑ p
i-1 = 5,148, sehingga dapat di
(1−l 2i )
hitung sebagai berikut:
14
5,148
Ωw = =0,837
1+ 5,148
Responden = 765
empiris setiap set instrumen yang berbeda kategori respon diujicobakan pada
300 responden menggunakan rumus korelasi Product Moment perhitungan
reliabilitasnya menggunakan rumus alpha Cronbach didapatkan koefisien 0,77;
0,75; 0,73; 0,73 yang berarti dinyatakan reliabel.
Hasil penelitian ini menunjukkan bahwa nilai rata-rata koefisien
reliabilitas instrumen disposisi matematika dengan tujuh kategori respon adalah
0,887 dengan standar deviasi 0,037. Nilai rata-rata koefisien reliabilitas
instrumen disposisi matematika dengan enam kategori respon adalah 0,876
dengan standar deviasi 0,036. Nilai rata-rata koefisien reliabilitas instrumen
disposisi matematika dengan lima kategori respon adalah 0,854 dengan standar
deviasi 0,045. Nilai rata-rata koefisien reliabilitas instrumen disposisi matematika
dengan empat kategori respon adalah 0,844 dengan standar deviasi 0,055.
Adapun hasil statistik deskriptif empat kelompok data koefisien reliabilitas dapat
dilihat pada tabel 1, .(Siti Muslihah Hadi, 2013)
Uji reliabilitas dilakukan peneliti untuk melihat konsistensi sebuah alat ukur
untuk mengukur variabel yang akan diukur. Beberapa jenis uji reliabilitas yang
digunakan:
1) Reliabilitas test ulang (re-test)
Pengujian reliabilitas ini dilakukan dengan cara mencobakan 1 jenis intrumen
beberapa kali pada subyek / responden yang sama. Reliabilitas diukur dari koefisien
korelasi antara percobaan pertama dengan percobaan selanjutnya. Intrumen
dinyatakan reliabel jika koefisien korelasi positif dan signifikan
17
2) Reliabilitas ekuivalen
Pengujian ini dilakukan dengan cara mencobakan instrument yang berbeda tetapi
ekuivalen (sebanding/sepadan) . Percobaan dilakukan 1 kali saja pada responden
yang sama. Reliabilitas instrument diukur dari koefisien korelasi antara percobaan
intrumen 1 dengan percobaan instrument lainnya. Instrumen dinyatakan reliabel jika
koefisien korelasi positif dan signifikan
3) Reliabilitas konsistensi internal (internal consistency)
Pengujian ini dilakukan dengan cara mencobakan instrument sekali saja pada subjek
penelitian. Pengujian ini dilakukan dengan beberapa cara seperti tehnik belah 2 (split-
half procedure), tehnik Kuder-Richardson Approach 20 (KR 20), tehnik Kuder-
Richardson Approach 21 (KR 21), dan Alfa Cronbach’s.
Uji reliabilitas kuesioner pada penelitian ini. dilakukan dengan menggunakan
tehnik Alpha Cronbach’s. Tehnik ini digunakan untuk intrumen yang memiliki jawanban
lebih dari 1 misalnya instrumen berbentuk essay, angket atau kuesioner . Rumus
koefisien Alpha Cronbach’s sebagai berikut:
{ }
2
k ∑S
ri = 1− 2 i
( k−1 ) St
keterangan:
k = koefisien reliabilitas alfa cronbach
∑si2 = jumlah item soal
St2 = jumlah varians skor tiap item
905 15
k
KR-20= k−1 1− (
∑ PiQi
2
S1 )
Keterangan:
K= cacah butir
pi qi = varians skor butir
pi = proporsi jawaban yang benar untuk butir nomor i
qi = proporsi jawaban yang salah untuk butir nomor i
S12 = varians skor total responden
( )
2
k ∑ S1
rii = k−1 1− 2
S1
keterangan:
rii = koefisien reliabilitas
k = cacah butir
Si2 = varians skor butir
St2 = varians skor total responden
r11 = ( )(
n
n−1
S 2−∑ pq
S
2 )
keterangan:
r11 = reliabilitas tes secara keseluruhan
p = populasi subjek yang menjawab item dengan benar
q = populasi subjek yang menjawab item dengan salah ( q = 1-p)
∑pq = jumlah hasil perkalian antara p dan q
n = banyaknya item
S = standar deviasi dari tes
23
0 – 0,30 Sukar
0,31 – 0,70 Sedang
0,71 – 1,00 Mudah
(Nana Sudjana, 2014)
sama banyaknya. Koefisien alfa dapat ditentukan dengan menggunakan persamaa
n (Azwar, 2015):
Pxx’ ≥ α = ( k −1
k
) ¿¿
Keterangan:
Pxx’ = koesisien reliabilitas
α = koefisien alfa
k = banyaknya butir dalam tes
αx2 = varians skor tes
αt2 = varians skor belahan tes dengan i = 1,2,3 dst. (belahan tes)
Dalam penelitian ini estimasi reliabilitas instrumen dengan menggunakan
koefisien alfa digunakan untuk mengestimasi reliabilitas instrumen tes.
Reliabilitas alfa memiliki rentang nilai antara 0 sampai dengan 1.
Berdasarkan (Streiner, 2003) sebuah instrumen pada tahap penelitian
pendahuluan dinyatakan reliabel apabila nilai reliabilitas alfa 0,7; pada penelitian
dasar sebesar 0,8 dan pada penelitian dalam bidang kedokteran dengan tujuan
klinis sebesar 0,95.
ICC (Interclass Correlation Coeficient) merupakan reliabilitas yang
digunakan untuk hasil rating dari pengamatan beberapa rater
(Shrout & Fleiss, dalam khoirul & supahar,2018). Hal yang sama juga disampaika
n oleh Mardapi,. ICC dapat diestimasikan dengan menggunakan persama-an
(Mardapi, 2012)
MSrs−MSe
P=
MSr+ ( k −1 ) MSe
Keterangan :
MSrs = rerata kuadrat antara penilain
Mse = varians skor kesalahan
k = jumlah peneilaian
25
Analisis ICC pada penelitian ini menggunakan bantuan SPSS 16. Dalam
penelitian ini, reliabilitas ICC digunakan untuk mengestimasi reliabilitas
instrumen lembar pengamatan.
Sebagai pendukung, pengujian reliabilitas tiap butir soal dapat ditentukan
dengan menggunakan IIC dan reliabilitas perangkat tes dapat diperoleh dari TIC.
Grafik IIC dan TIC didapatkan dengan pengolahan data melalui program BILOG
MG (Mathildadu Toit,dalam khoirul & supahar,2018) Melalui grafik ICC dengan
3 parameter dapat diketahui tingkat kehandalan soal. Grafik IIC dan
TIC memiliki rentang skala logit antara 3 sampai dengan 3. Sumintono & Widhiar
so menjelaskan bahwa kala logit merupakan skala yang menggambarkan abilitas
atau kemampuan peserta didik. Skala minus menunjukkan abilitas yang rendah
dan semakin positif menunjukkan abilitas yang tinggi.( Sumintono & Widhiarso,2
015)
Nurhasan dalam Tegar, reliabilitas tes dihitung dengan mengunakan
metode pengukuran ulang (Test Retest). Sebagaimana dijelaskan oleh Suntoda, PP
T Pembelajaran tes dan pengukuran (Tegar, 2018). Langkah angkahnya adalah se
bagai berikut:
1. Dilakukan dengan dua kali pengukuran yaitu pengukuran pertama dan
pengukuran ulang. Berdasarkan jumlah skore pertama dan skore tes
ulang. Kelompok jumlah skore pertama sebagai variabel X dan jumlah
skore ulang sebagai variabel Y.
2. Selanjutnya mengkorelasikan skore total variabel X(skore pertama)
dengan
skore total variabel Y ( skore tes ulang) dengan rumus teknik korelasi
Product Moment,yaitu sebagai berikut:
N . ∑ xy−(∑ x)( ∑ y)
rxy =
√¿ ¿¿
keterangan:
rxy = koefisien kolerasi antara variabel x,y
∑xy = jumlah dari hasil perkalian antara x,y
26
r √n−2
t=
√ 1−r 2
keterangan:
t =nilai t hit ung
r = koefisien kolerasi hasil rxy hitung
n =jumlah responden
Distribusi tabel t untuk ἀ dan derajat kebebasan (dk = n1+ n2-2), jika t
hitung > t tabel berarti reliabel, jika t hitung < t tabel berarti tidak reliabel. Selain
itu untuk melihat kategori tingkat reliabilitas tes peneliti
mengacu pada:
Tabel 1. Kategori tingkat reliabilitas
1-α(0,05)
1-0,05 = 0,95
dk = 148 maka didapat t tabel sebesar 1,65
Uji Reliabilitas adalah pengujian indeks yang menunjukkan sejauh mana
suatu alat pengukur dapat dipercaya atau diandalkan. Hal ini menunjukkan sejauh
mana hasil pengukuran itu tetap konsisten bila dilakukan dua kali atau lebih
terhadap gejala yang sama, dengan menggunakan alat ukur yang sama. Alat ukur
dikatakan reliabel jika menghasilkan hasil yang sama meskipun dilakukan
pengukuran berkalikali. (livia amanda, dkk, 2019)
Suatu kuesioner dikatakan reliabel jika jawaban dari kuesioner tersebut
konsisten atau stabil dari waktu ke waktu. Kuesioner sebagai alat ukur harus
mempunyai reliabilitas yang tinggi. Perhitungan reliabilitas hanya bisa dilakukan
jika variabel pada kuesioner tersebut sudah valid. Dengan demikian harus
menghitung validitas dahulu sebelum menghitung reliabilitas, jadi apabila
28
2
K St −∑ k 2
1Sj
α= j=1
k−1 St
2
(∑ )
150
150
vi
St = ∑ V −
2 2
i
i=1
= 187,367
i=1 150
150
Nilai varians skor instrumen ke-1,sebagi berikut:
(∑ )
150
150
vi
∑V
i=1
S x1 =
2 2
i − = 0,861
i=1 150
150
Dengan cara yang sama, dicari nilai varians skor indikator ke 2 hingga 30
didapatkan hasil seperti dalam Tabel 3.
Setelah varians skor total dari masing-masing instrumen diketahui.
Selanjutnya dicari nilai Cronbach’s alpha (α) dengan jumlah instrumen (k) = 30.
k
S −∑ S 2j
2
t
α= k j =1 = 0,907
k−1 S 2
t
dikatakan kuesioner ini reliabel yang artinya cocok dan dapat digunakan sebagai
alat ukur tingkat partisipasi masyarakat Kota Padang.
2 r AB
r1=
1+ r AB
keterangan:
r1 = reliabilitas internal seluruh instrumen
r AB = kolerasi product moment pearson antara item ganjil dan genap
( )( )
n
k ∑i=1 ∝2t
r= 1−
k −1 ∝t
2
A. Kesimpulan
evaluasi pembelajaran merupakan hal penting yang perlu di perhatikan dan
dilaksanakan dalam proses evaluasi agar tercapai hasil evaluasi yang maksimal
maka kegiatan evaluasi dilaksanakan melalui beberapa tahap yang meliputi:
evaluasi dalam satuan kegiatan, evaluasi setelah beberapa kali pertemuan, dan
evaluasi setelah menyelesaikan pembelajaran. Sesuai dengan hasil penelitian
tentang prosedur evaluasi pembelajaran pada peserta didik dapat diketahui bahwa
kegiatan evaluasi dilakukan melalui beberapa prosedur kegiatan, meliputi:
perencanaan, pelaksanaan, monitoring pelaksanaan evaluasi, pengolahan data,
hasil, dan penggunaan hasil evaluasi.
Reliabilitas mempermasalahkan sejauh mana hasil suatu
pengukuran dapat dipercaya. Suatu hasil pengukuran hanya dapat
dipercaya apabila dalam beberapa kali pelaksanaan pengukuran
terhadap kelompok subyek yang sama, diperoleh hasil pengukuran
yang relatif sama. Penentukan koefisien reliabilitas instrumen untuk
skor butir dikotomi digunakan rumus KR-20, sedang untuk skor
politomi digunakan rumus Alpha. Interpretasi terhadap koefisien
reliabilitas merupakan intrepretasi relatif, artinya tidak ada batasan
mutlak yang menunjukkan berapa angka koefisien minimal yang
harus dicapai agar suatu pengukuran dapat disebut reliabel. Namun,
memberikan informasi tentang hubungan varians skor teramati dengan
varians skor sejati kelompok individu.
B. Saran
Setelah mengetahui sistem evaluasi berbasis komputer dalam pelaksanaan
evaluasi pembelajaran sudah selayaknya teknologi dalam pendidikan mendapat
perhatian yang lebih dari berbagai pihak
33
Dafrat pustaka
Allima Stefiana Insani, Abdul Hoyyi & Rita Rahmawati, 2014. Analisis Faktor-
Faktor Yang Mempengaruhi Kepuasana Mahasiswa Dalam Pemilihan
Jurusan Menggunakan Structuran Equation Modeling (SEM). Jurnal
Gaussian, vol.3, no.4
Arikunto, Suharsmi, 2010. Prosedur Penelitian. Jakarta: PT Bumi Aksara.
Azwar, S. 2015. Metode penelitian. Yogyakarta: Pustaka Pelajar.
Capraro, M. M., R. M. Capraro, dan R. K. Herson, 2001. Measurement Error of
Score on the Mathematics Anxiety Rating Scale Across Sudies.
Educational and Psychological Measurement.
Christiany Suartono dan Clara Moningka, 2017. Pengujian Validitas Dan
Reliabilitas Skala Identitas sosial. Jurnal Humanitas, Vol.2, No.2
Agustus 2017
Crocker, L, dan Algina, J, 2008. Introduction to classical and modern test theory.
Ohio, USA: Cengage Learning.
Djaali., dkk. Pengukuran Dalam Pendidikan. Jakarta: Program
Pascasarjana, 2000.
Geffen, D., D. W. Straub, dan M. D. Boudreau, 2001. “Structural Equation
Modeling and Regression: Guidelines for Research Practice.”
Communications of AIS, Volume 4, Article 7
Gaguk Margono, 2013. Aplikasi analisis faktor konfirmatori untuk menentukan
reliabilittas multidimensi. Statistika, vol.13 No.1
Hancock, G. R., dan R. O. Mueller, 2000. “Rethinking Construct Reliability
within Latent Variable Systems.” Di dalam Stuctural Equation Modeling:
Present and Future, R. Cudek, S. H. C. duToit, dan D. F. Sorbom (Eds.),
Chicago: Scientific Software International.
Ina Magdalena, Hadana Nur Fauzi Dan Raafiza Putri, 2020. Pentingnya Evluasi
Dalam Pembelajaran Dan Akibat Memanipulasinya. Jurnal Pendidikan
Dan Sain; Vol. 2, No. 2
34
Livia Amanda, Feera Yanura, Dodi Devianto, 2019. Uji Validitas Dan Reliabilitas
Tingkat Partisipasi Politik Masyarakat Kota Padang. Jurnal matematika
UNAND, Vol. 7, No. 1, Mei 2019
Kaplan, R. M, dan Saccuzzo, D. P, 2013. Psychological Testing: Principles,
Applications, And Issues. (8th ed). Belmont, CA: Thomson Wadsworth
Khoirul bashooir dan supahar, 2018. Validitas Reliabiitas Instrumen Asesment
Kinerja Literasi Sains Pembelajaran Fisika Berbasis STEM. Jurnal
penelitian dan evaluasi pendidikan, vol.22, no.2, Desember 2018
Lee, S. Y., dan X.Y. Song, 2001. Hyphotesis testing and model comparsion in two
level structural education model. Multivariate behavioral research, vol. 36
no.4
Mahirah B, 2017. Evaluasi belajar peserta didik (siswa). Jurnal idaarah, vol. 1,
no.2 Desember 2017
Mardapi. D, 2012. Pengukuran, Penilain Dan Evaluasi Pendidikan. Yogyakarta:
Nuha Medika
Murphy, K. R., dan Davidshover, C. O,2001. Psychological Testing: Principles
and Applications. (5th Ed). New Jersey: Prentice Hall.
Nana Sudjana, 2014. Penilaian Hasil Proses Belajar Mengajar. Bandung:
PT Remaja Rosdakarya.
Ramayulis, 2002. Metodologi Pendidikan Agama Islam, Kalam Muliah: jakara
2002
Rahmatika Rahayu dan M. Djazari, 2016. Analisis Soal Pra Ujian Nasional Mata
Pelajaran Ekonomi Akuntasin. Jurnal Pendidikan Akuntansi Indonesia,
vol. XIV no.1
Ramli dan Muhammad Idrus, 2019. Evaluasi Pembelajaran Panduan Para
Pengajar Dan Inovator Pendidikan Sekar. Mujahid press. Bandung.
Riduan. (2010). Skala Pengukuran Variabel-variabel Penelitian. Bandung:
Alfabeta
Siti Muslihah Hadi, 2013. Perbandingan Banyak Kategori Respon Terhadap
Reliabilitas Instrumen Diposisi Matematika. Jurnal evaluasi pendidikan
vol.4, no.2
35
Streiner, D. L. 2003. Startingat the beginning an introduction to coefficient alpha
and internal consistency. Journal of Personality Assessment, 80(1),–
103
Sugiyono. (2019). Metode Penelitian Pendidikan (Kuantitatif, Kualitatif,
Kombinasi, R&D dan Penelitian Pendidikan). Bandung: Alfabeta
Sukardi, 2011. Metodologi penelitian pendidikan kompetensi dan praktiknya.
Jakarta: PT Bumi Aksara
Tegar, 2018. Uji Validitas Dan Reliabilitas Test Of Gross Motor Development-2
(TGMD-2) Dale A. Ulrich Pada Anak 9 Tahun. Jurnal of teaching phisical
education in elementary school, Vol.2, No.1
Peters, G. J. Y. (2014). The alpha and the omega of scale reliability and validity:
Why and how to abandon Cronbach’s alpha and the route towards more
comprehensive assessment of scale quality. The European Health
Psychologist,16, 56–69
Widhiarso, Wahyu dan Djemari Mardapi, 2010. Komparasi Ketepatan Estimasi
Koefisien Reliabilitas Teori skor Murni Klasik. Jurnal Penelitiandan
Evaluasi Pendidikan.
Widhiarso, Wahyu, 2009. “Koefisien Reliabilitas pada Pengukuran Kepribadian
yang Bersifat Multidimensi.” Psikobuana, Vol. 1,No1
Zulkifli Matondang, 2009. Validitas Dan Reliabilitas Suatu Instrumen Penelitian.
Jurnal tabularasa pps unimed, vol. 6, no.1 Juni 2009
36