Disusun Oleh :
KELOMPOK 9
Laily Nur Rahma Damayanti (12204183173)
Latifah Rudiarti (12204183189)
Muhammad Ridwan Adi Nugroho (12204183201)
Nia Ainun Fauziah (12204183203)
Chania Zalfa Anjani Lestari (12204183205)
Virania Ayu Distari (12204183207)
1
URAIAN MATERI
rii=
n
n−1 ( ) ∑ s i2
1− S t 2
st
2
Keterangan
rii : instrument realibilitas
n : banyaknya butir soal
Si 2 : jumlah varians tiap skor
St 2 : varians skor total
2
apabila beberapa kali pengujian menunjukkan hasil yang relatif sama.
Pengujian suatu tes bisa dilakukan terhadap objek yang sama pada
waktu yang berlainan dengan selang waktu yang tidak terlalu lama dan
juga terlalu singkat, bisa juga dilakukan dengan membandingkan hasil
pengujian dari tes yang setara.
a) Single test-single trial
Pendekatan single test-single trial adalah merupakan pendekatan
serba single atau pendekatan serba satu, yaitu satu kelompok
subjek, satu jenis alat ukur, dan satu kali pengukuran, atau satu
kelompok testee, satu jenis tes, dan satu kali testing. Single test-
single trial bisa dilakukan dengan menggunakan formula:
(1) Pendekatan Single Test-Single Trial dengan Menggunakan
Formula Spearman Brown
2 rh
r tt =
1+r h
Dimana:
rii : koefisien reabilitas tes secara total
(tt=total tes)
rh : koefisien korelasi product moment
antara separoh (bagian pertama) tes,
dengan separoh (bagian tes kedua)
dari tes tersebut (hh= half-half)
1&2 : bilangan konstan
3
(2) Pendekatan Single Test-Single Trial dengan Menggunakan
Formula Flanagan
s12+ s22
r ii =2 1− 2
( st )
Dimana:
rii : koefiisien reliabilitas tes secara totalitas
2 dan 1 : bilangan konstan
S12 : jumlah kuadrat deviasi (=varian) dari
skor-skor hasil tes yang termasuk pada
belahan I
S22 : jumlah kuadrat deviasi (=varian) dari
skor-skor hasil tes yang termasuk pada
belahan II
St2 : jumlah kuadrat deviasi (=varian total)
dari skor-skor hasil tes yang termasuk
pada belahan I dan II
(3) Pendekatan Single Test-Single Trial dengan Menggunakan
Formula Rulon
Rumus yang dikemukakan oleh Rulon untuk mencari
Koefisien Reliabilitas Tes (rii) adalah sebagai berikut:
s2d
r ii =1− 2
st
Di mana:
rii : koefisien reliabilitas tes
1 : bilangan konstan
Sd2 : varian perbedaan antarskor yang
dicapai oleh tester pada belahan I
dengan skor yang dicapai oleh testee
pada belahan II
2
S t
: varian total
4
(4) Pendekatan Single Test-Single Trial dengan Menggunakan
Formula Kuder Richadson
Adapun formula yang diajukan oleh Kuder Richadson ada
dua buah yang masing-masing diberi kode: KR20 dan
KR21, yaitu:
Rumus KR20:
n s2−∑ pq
r ii =( )(
n−1 s2 )
Dimana
rii : koefisien reliabilitas tes
5
(5) Pendekatan Single Tes-Single Trial dengan Menggunakan
Formula C. Hoyt
Dengan menggunakan teknik analisis varian, maka
koefisien reliabilitas tes dapat diperoleh dengan
menggunakan rumus:
MK e
r ii =1−
MK s
Dimana
r11 : koefisien reliabilitas tes
1 : bilangan konstan
MKe : mean kuadrat interaksi antara testee dan
item
MKs :
b) Test-retest
Reliabilitas tes-retes tidak lain adalah derajat yang menunjukkan
konsistensi hasil sebuah tes dari waktu ke waktu. Tes retes
menunjukkan variasi skor yang diperoleh dari penyelenggaraan satu tes
evaluasi yang dilakukan dua kali atau lebih, sebagai akibat kesalahan
pengukuran. Dengan melakukan tes retes tersebut seorang guru akan
mengetahui seberapa jauh konsistensi suatu tes apa yang ingin diukur.
Reliabilitas tes retes ini penting, khususnya ketika digunakan
untuk menentukan prediktor misalnya tes kemampuan. Tes kemampuan
tidak akan bermanfaat, jika ternyata menunjukkan hasil yang selalu
berubah ubah secara signifikan saat diberikan kepada responden.
Reliabilitas tes retes dapat dilakukan dengan cara seperti berikut:
(1) Selenggarakan tes pada suatu kelompok yang tepat sesuai dengan
rencana
(2) Setelah selang waktu tertentu, misalnya 1 minggu atau 2 minggu,
lakukan kembali tes yang sama dengan kelompok yang sama
tersebut.
(3) Korelasikan kedua tes tersebut.
(4) Untuk mencari korelasi antara skor-skor hasil tes pertama dengan
skor-skor hasil tes kedua, dapaat dipergunakan teknik korelasi
6
rank-order (teknik korelasi tata-jenjang) dari Spearman, dengan
menggunakan rumus:
6 ∑ D2
¿ 1−
N ( N 2−1)
Di mana:
: koefisien korelasi antara variabel 1
(skor-sjor hasil tes pertama)
dengan variabel II (skor-skpr hasil
tes kedua)
D : Difference (beda antara rank
variabel I dengan variabel II), atau
D= R1-R2
6 dan 1 : bilangan konstan
N banyaknya subjek (testee)
c) Alternate Form
Dalam pelaksanaan pengujian reabilitas tes dengan menggunakan
pendekatan alternate form atau bentuk paralel ini, skor-skor yang
diperoleh dari kedua seri tes tadi dicari korelasinya. Apabila terdapat
korelasi positif yang signifikan maka dapat dikatakan bahwa tes hasil
belajar tersebut dapat dikatakan reliabel. Teknik korelasi yang
dipergunakan bisa dipilih antara teknik korelasi product moment dari
Pearson atau teknik korelasi rank order dari Spearman (khusus untuk N
kurang dari 30).
Rumus product moment Pearson:
r xy =N ∑ XY −¿ ¿ ¿
Keterangan
rxy : koefisien korelasi pearson product moment
N : banyaknya pasangan skor X dan skor Y (banyaknya
subjek)
X : skor variabel X
Y : skor variabel Y
7
Koefisien reliabilitas dapat dipengaruhi diantaranya oleh waktu
penyelenggaraan tes-retes. Interval penyelenggaraan yang terlalu jauh
ataupun yang terlalu dekat akan mempengaruhi koefisien reliabilitas.
Faktor lain yang juga mempengaruhi reliabilitas instrumen evaluasi
diantaranya sebagai berikut :
Gronlund (1985) mengemukakan ada empat factor yang dapat
memengaruhi reliabilitas, yaitu :
a) Panjang tes (length of test). Panjang tes berarti banyaknya soal
tes. Ada kecendrungan, semakin panjang suatu tes akan lebih
tinggi tingkat reliabelitas suatu tes, karena semakin banyak soal,
maka akan semakin banyak sampel yang diukur dan proporsi
jawaban yang benar semakin banyak, sehingga factor tebakan
(guessing) akan semakin rendah.
b) Sebaran skor (spread of score). Besarnya sebaran skor akan
membuat tingkat reliabelitas menjadi tinggi, karena koefisien
reliabelitas yang lebih besar diperoleh ketika peserta didik tetap
pada posisi yang relatif sama dalam satu kelompok pengujian ke
pengujian berikutnya.dengan kata lain, peluang selisih dari
perubahan posisi dalam kelompok dapat memperbesar koefisien
reliabilitas.
c) Tingkat kesukaran ( difficulty indeks). Dalam penilaian yang
menggunakan pendekatan penilaian acuan norma, baik untuk soal
yang mudah maupun sukar, cenderung menghasilkan tingkat
reliabilitas yang rendah. Untuk tes yang mudah, skor akan berada
dibagian atas dan akhir penilaian. Bagi kedua tes (mudah dan
sukar), perbedaan antar peserta didik kecil sekali dan cenderung
tidak dapat dipercaya. Terjadinya tingkat reliabilitas yang rendah
dalam tes disebabkan antara tes dengan sebaran skor yang
terbatas. Tingkat kesukaran soal yang ideal untuk meningkatkan
koefisien reliabelitas adalah soal yang menghasilkan sebaran skor
berbentuk kurva normal.
d) Objektifitas (obyektivity). Obyektivitas di sini menunjukkan skor
tes kemampuan yang sama antara peserta didik yang satu dengan
8
peserta didik lainnya.peserta didik memperoleh hasil yang sama
dalam mengerjakan suatu tes. Jika peserta didik memiliki tingkat
kemampuan yang sama, maka akan memperoleh hasil tes yang
sama pada saat mengerjakan tes yang sama. Objektivitas prosedur
tes yang tinggi akan memperoleh reliabilitas hasil tes yang tinggi
akan memperoleh reliabilitas hasil tes yang tidak dipengaruhi oleh
prosedur penskoran.
Konsep reliabilitas mendasari kesalahan pengukuran yang mungkin
terjadi pada suatu proses pengukuran atau pada nilai tunggal tertentu,
sehingga menimbulkan perubahan pada susunan kelompoknya (error of
measurement). Misalnya, guru mengetes peserta didik dengan intrumen
tertentu dan mendapat nilai 70. Kemudian pada kesempatan yang
berbeda dengan instrument yang sama, guru melakukan tes kembali,
ternyata peserta didik tersebut mendapat nilai 75. Artinya, tes tersebut
tidak reliabel, karena terjadi kesalahan pengukuran. Tes yang reliabel
adalah apabila koefisien reliabelitasnya tinggi dan kesalahan baku
pengukurannya rendah.
12.3. Karakteristik dalam Evaluasi
Tujuan akhir suatu ilmu adalah mengembangkan dan menguji teori.
Suatu teori dapat menjelaskan dan meramalkan fenomena-fenomena
alamiah. Dari perilaku atau kegiatan-kegiatan terlepas yang dilakukan
oleh siswa atau guru umpamanya, peneliti dapat memberikan
penjelasan umum tentang hubungan diantara perilaku atau kegiatan
pembelajaran. Tiap disiplin ilmu mempunyai cara pencarian sendiri
yang sesuai dengan karakteristik disiplin ilmunya. Sains(pengetahuan
alam) umpamanya, banyak menggunakan metode eksperimen, sedang
antropologi menggunakan metode kualitatif. Pendidikan kebanyakan
menggunakan metode deskriptif, tetapi untuk hal-hal tertentu dapat
menggunakan metode eksperimen, penelitian tindakan, penelitian dan
pengembangan, dan juga kualitatif.
Penelitian terhadap ilmu pendidikan mengkaji dasar-dasar, teori-teori dan
konsep-konsep, termasuk sejarah perkembanganya. penelitian dapat
dilakukan dengan menggunakan pendekatan-metode kualitatif maupun
9
kuantitatif. Pendekatan kuantitatif diarahkan pada analisis dasar filosofis,
psikologis, sosiologis-antropologis, serta konsep dan analisis historis. Dari
penelitian demikian dapat dihasilkan penguatan terhadap proposisi dan
asumsi yang ada, dan atau menghasilkan asumsi, proposisi dan hipotesis
yang baru. Penelitian-penelitian yang diarahkan pada perkembangan teori
dan konsep digolongkan sebagai penelitian dasar (basic
reseach). Penelitian dapat dilakukan dengan baik terhadap ilmu maupun
terhadap praktik pendidikan. Ada tujuh karakteristik penelitian pendidikan
menurut McMillan dan Schumacher (2001:11-13), yaitu:
a) Objectivity (objektivitas);
b) Precision (ketepatan);
c) Verification (verifikasi);
d) Parsimonious explanation (Penjelasan ringkas);
e) Empiricism (empiris);
f) Logical reasoning (pendapatlogis); dan
g) Conditional conclutions (kesimpulan kondisional).
Karakteristik evaluasi pendidikan tersebut, secara singkat akan dijelaskan
sebagai berikut:
a) Objektivitas
Penelitian harus memiliki objektivitas(objectivity) baik
dalamkarakteristik maupun prosedurnya. Objektivitas dicapai melalui
keterbukaan, terhindar dari bias dan subjektivitas. Dalam prosedurnya,
penelitian menggunakan teknik pengumpulan dan analisis data yang
memungkinkan dibuat interpretasi yang dapat dipertanggungjawabkan.
Objektivitas juga menunjukkan kualitas data yang dihasilkan dari
prosedur yang digunakan, yang dikontrol dari bias dan subjektivitas.
b) Ketepatan
Penelitian juga harus memiliki tingkat ketepatan(precision), dalam arti
bahwa secara teknis, instrumen pengumpulan datanya harus memiliki
validitas dan realibilitas yang memadai, serta desain penelitian,
pengambilan sampel dan teknik analisisnya tepat.
Dalam evaluasi kualitatif, hasilnya dapat diulang dan diperluas, dalam
10
penelitian kualitatif memiliki sifat reflektif dan tingkat komparasi yang
konstan.
c) Verifikasi
Penelitian dapat diverifikasi, dalam arti dikonfirmasikan, direvisi dan
diulang dengan cara yang sama atau berbeda. Verifikasi
dalam penelitian kualitatif berbeda dengan
kuantitatif. penelitiankualitatif memberikan interpretasi deskriptif,
verifikasi berupa perluasan, pengembangan tetapi bukan pengulangan.
Verifikasi juga bermakna memberikan sumbangan kepada ilmu atau
studi lain.
d) Penjelasan Ringkas
Penelitian mencoba memberikan penjelasan tentang hubungan antar
fenomena dan menyederhanakannya menjadi penjelasan yang ringkas.
Tujuan akhir dari suatu penelitianadalah mereduksi realita yang
kompleks ke dalam penjelasan yang singkat.
Dalam penelitiankuantitatif penjelasan singkat tersebut berbentuk
generalisasi, tetapi dalam penelitiankualitatif berbentuk deskripsi
tentang hal-hal yang essensial atau pokok.
e) Empiris
Penelitian ditandai oleh sikap dan pendekatan empiris yang kuat.Secara
umum empiris berarti berdasarkan pengalaman praktis.
Dalampenelitianempiris kesimpulan didasarkan atas kenyataan-
kenyataan yangdiperoleh dengan menggunakan metode penelitianyang
sistematik, bukanberdasarkan pendapat atau kekuasaan. Sikap empiris
umumnya menuntutpenghilangan pengalaman dan sikap pribadi. Kritis
dalam penelitianberartimembuat interpretasi berdasarkan pada
kenyataan dan nalar yang didasarkanatas kenyataan-kenyataan
(evidensi). Evidensi adalah data yang diperolehdari evaluasi,
berdasarkan hasil analisis data tersebut interpretasi dibuat.Angka, print
out, catatan lapangan, rekaman wawancara artifak dandokumen sejarah
adalah sejumlah contoh data dalam penelitian.
f) Penalaran Logis
11
Semua kegiatan penelitian menuntut penalaran logis. Penalaran
merupakan proses berpikir, menggunakan prinsip-prinsip logika
deduktif dan induktif. Penalaran deduktif adalah penarikan kesimpulan
dari umum ke khusus. Dalam penalaran deduktif, bila premisnya benar,
maka kesimpulan otomatis benar. Logika deduktif dapat
mengidentifikasi hubungan-hubungan baru dalam pengetahuan
(prinsip, kaidah) yang ada. Sementara itu, dalam penalaran induktif,
peneliti menarik kesimpulan berdasarkan hasil sejumlah pengamatan
kasus-kasus (individual, situasi, peristiwa),
kemudian evaluator membuat kesimpulan yang bersifat umum.
Kesimpulan dibatasi oleh jumlah dan karakteristik dari kasus yang
diamati.
g) Conditional conclutions (kesimpulan kondisional)
Penelitian mencoba memberikan kesimpulan kondisional tentang
hubungan antar fenomena dan menyederhanakannya menjadi
penjelasan yang sesuai kondisi. Dalam penjelasan yang lain tentang
karakteristik, secara sederhana Zainal Arifin mengemukakan
karakteristik instrumen evaluasi yang baik adalah valid, reliabel,
relevan, representatif, praktis, deskriminatif, spesifik dan proporsional.
(1) Kevalidan
Valid artinya suatu alat ukur dapat dikatakan valid jika betul-betul
mengukur apa yang hendak diukur secara tepat. Misalnya, alat
ukur matapelajaran Ilmu Fiqih, maka alat ukur tersebut harus
betul-betul dan hanya mengukur kemampuan peserta didik dalam
mempelajari Ilmu Fiqih, tidak boleh dicampuradukkan dengan
materi pelajaran yang lain. Validitas suatu alat ukur dapat ditinjau
dari berbagai segi, antara lain validitas ramalan (predictive
validity), validitas bandingan (concurent validity), dan validitas
isi (content validity), validitas konstruk (construct validity), dan
lain-lain.
12
(2) Realiabel
Reliabel artinya suatu alat ukur dapat dikatakan reliabel atau
handal jika ia mempunyai hasil yang taat asas (consistent).
Misalnya, suatu alat ukur diberikan kepada sekelompok peserta
didik saat ini, kemudian diberikan lagi kepada sekelompok
peserta didik yang sama pada saat yang akan datang, dan ternyata
hasilnya sama atau mendekati sama, maka dapat dikatakan alat
ukur tersebut mempunyai tingkat reliabilitas yang tinggi.
(3) Relevan
Relevan artinya alat ukur yang digunakan harus sesuai dengan
standar kompetensi, kompetensi dasar, dan indikator yang telah
ditetapkan. Alat ukur juga harus sesuai dengan domain hasil
belajar, seperti domain kognitif, afektif, dan psikomotor. Jangan
sampai ingin mengukur domain kognitif menggunakan alat ukur
non-tes. Hal ini tentu tidak relevan.
(4) Representatif
Representatif artinya materi alat ukur harus betul-betul mewakili
dari seluruh materi yang disampaikan. Hal ini dapat dilakukan
bila guru menggunakan silabus sebagai acuan pemilihan materi
tes. Guru juga harus memperhatikan proses seleksi materi, mana
materi yang bersifat aplikatif dan mana yang tidak, mana yang
penting dan mana yang tidak.
(5) Praktis
Praktis artinya mudah digunakan. Jika alat ukur itu sudah
memenuhi syarat tetapi sukar digunakan, berarti tidak praktis.
Kepraktisan ini bukan hanya dilihat dari pembuat alat ukur (guru),
tetapi juga bagi orang lain yang ingin menggunakan alat ukur
tersebut.
(6) Deskriminatif
Deskriminatif artinya adalah alat ukur itu harus disusun
sedemikian rupa, sehingga dapat menunjukkan perbedaan-
perbedaan yang sekecil apapun. Semakin baik suatu alat ukur,
maka semakin mampu alat ukur tersebut menunjukkan perbedaan
13
secara teliti. Untuk mengetahui apakah suatu alat ukur cukup
deskriminatif atau tidak, biasanya didasarkan atas uji daya
pembeda alat ukur tersebut.
(7) Spesifik
Spesifik artinya suatu alat ukur disusun dan digunakan khusus
untuk objek yang diukur. Jika alat ukur tersebut menggunakan
tes, maka jawaban tes jangan menimbulkan ambivalensi atau
spekulasi.
(8) Proporsional
Proporsional artinya suatu alat ukur harus memiliki tingkat
kesulitan yang proporsional antara sulit, sedang dan mudah.
Begitu juga ketika menentukan jenis alat ukur, baik tes maupun
non-tes.
14
f) Uji coba pengadministrasian adalah suatu uji coba
untuk menggunakan instrumen dalam situasi nyata. Uji coba ini
dilakukan pada subjek yang sesuai dengan sasaran penilaian
seperti pada tujuan penilaian.
g) Analisis data merupakan langkah terakhir dari
pengembangan instrumen. Melalui analisis data tersebut dapat
diketahui kehandalan dan validitas instrumen yang sedang diukur.
15
DAFTAR PUSTAKA
Jihad, A., & Haris, A. 2008. Evaluasi Pembelajaran. Jakarta: Multi Pressindo.
http://elearning.unesa.ac.id/myblog/alimsumarno/pengertianpengukuranpenilaian-
pengujian-evaluasi-dan-asesmen
http://file.upi.edu/Direktori/.../pengertian_asesmen.pdf
http://file.upi.edu/...asesmen/asesmen_ (materi_1).ppt_%5BC
16