Anda di halaman 1dari 23

Tugas Terstruktur Dosen Pengampu

Evaluasi Pembelajaran Niki Dian Permana P, M.Pd

VALIDITAS DAN RELIABILITAS

DISUSUN OLEH

KELOMPOK II

Erni Oktavia Ningsih 11711024565

Fachrur Razi 11711013998

Nur Amira Rusadi 11711024240

Nur Fazilah 11711024444

Nur Wahida Herda 11711024349

Randa Nurul Ikhsan 11711014516

Siti Nur Najmi 11711024247

KELAS 5/B

JURUSAN TADRIS IPA

FAKULTAS TARBIYAH DAN KEGURUAN

UNIVERSITAS ISLAM NEGERI SULTAN SYARIF KASIM RIAU

T/A 2019
DAFTAR ISI

DAFTAR ISI

A. Pengertian Validitas ................................................................


B. Jenis Validitas..........................................................................
C. Menghitung Validitas Tes ......................................................
D. Validitas Butir Soal .................................................................
E. Reliabilitas Tes ........................................................................
F. PAP (Penilaian Acuan Patokan) ............................................
G. PAN (Penilaian Acuan Normatif) ..........................................

DAFTAR PUSTAKA

i
A. Pengertian Validitas
Validitas adalah ketepatan, kebermaknaan dan kemanfaatan dari sebuah
kesimpulan yang didapatkan dari interpretasi skor tes. validitasi mengarah kepada
ketepatan interpretasi hasil penggunaan suatu prosedur evaluasi sesuai dengan tujuan
pengukurannya. Makin tinggi validitas suatu instrumen, berarti makin baik
kesimpulan yang diambil dan makin baik pula tingkat kebermaknaan maupun
kegunaannya. Oleh karena itu, suatu instrumen dikatakan valid kalau instrumen atau
alat ukur tersebut benar-benar mengukur sesuatu yang hendak diukur.1
Menurut beberapa ahli tentang pengertian validitas:
 Arikunto (1999:65), Validitas adalah suatu ukuran yang menunjukkan
tingkat kesahihan suatu tes. suatu tes dikatakan valid apabila tes
tersebut mengukur apa yang hendak diukur. tes memiliki validitas yang
tinggi jika hasilnya sesuai dengan kriteria, dalam arti memiliki
kesejajaran antara tes dan kriteria.
 Suryabrata (2000:41), Validitas adalah derajat fungsi pengukuran suatu
tes, atau derajat kecermatan ukurnya suatu tes. validitas suatu tes
mempermasalahkan apakah tes tersebut benar-benar mengukur apa
yang hendak diukur.
 Sudjana (2004:12), Validitas adalah ketepatan alat penilaian terhadap
konsep yang dinilai sehingga betul-betul menilai apa yang seharusnya
dinilai.

B. Jenis Validitas
Validitas suatu instrumen atau alat ukur dapat dilihat dari isi atau konsep yang
terdapat pada alat ukur tersebut. di samping itu, dapat pula dilihat dengan
memperhatikan bantuknya atau hubungan dengan instrumen lain secara empirik atau
statistik. sehubungan dengan itu maka validitas dapat dibedakan atas:

1. Validitas Isi (Content Validity)


Validitas isi dipandang dari segi isi alat ukur itu sendiri; berdasarkan materi yang
disampaikan dalam pembelajaran dan diharapkan dikuasai oleh peserta didik. hal

1
Arikunto, Suharsimi. Dasar-dasar evaluasi pendidikan. Bumi Aksara. Jakarta. 2016
ini untuk memungkinkan tersusunnya isi instrumen yang tepat dan mewakili
materi yang disampaikan serta diharapkan dikuasai oleh peserta didik. untuk
mendapatkan validitas isi yang tinggi perlu dilakukan suatu diskusi yang
mendalam, yang diikuti oleh orang-orang yang ahli dalam bidang studi yang
bersangkutan serta ahli dalam pengukuran dan penilaian. validitas isi ini
digunakan untuk mengukur kemampuan belajar, hasil belajar, atau prestasi
belajar.

2. Validitas Konstruk (Construct Validity)


Validitas konstruk adalah validitas yang mempermasalahkan seberapa jauh butir
butir tes mampu mengukur apa yang benar benar hendak diukur sesuai dengan
konsep khusus atau definisi konseptual yang telah ditetapkan. validitas konstruk
berkaitan dengan fenomena dan objek yang abstrak. tetapi gejalanya dapat diamati
dan dapat diukur. suatu alat ukur dapat dikatakan mempunyai validitas konstruk
yang tinggi dalam kreativitas dengan individu lainnya. validitas konstruk
mempersoalkan apakah yang ditanyakan merupakan bagian yang penting di dalam
suatu konsep atau merupakan bagian dari suatu instrumen yang disusun.
Validitas konstruk dapat digunakan untuk mengukur sikap, minat konsep diri,
gaya kepemimpinan, motivasi berprestasi, dan lain-lain, maupun yang sifatnya
performa maksimum seperti instrumen untuk mengukur bakat (tes bakat),
intelegensi (kecerdasan intelektual), kecerdasan, emosional dan lain-lain.

3. Validitas Patokan (Criterion Validity)


Jenis validitas patokan dapat dibedakan atas dua tipe yaitu: validitas prediktif dan
validitas pengukuran serempak, yaitu:
a. Validitas Prediktif (Predictive Validity)
jenis validitas ini dikaitkan dengan prediksi / perkiraan yang akan terjadi di
masa datang. suatu instrumen masuk perguruan tinggi dikatakan mempunyai
validitas prediktif yang tinggi, apabila mahasiswa yang mendapatkan skor
tinggi pada waktu ujian masuk, mampu menyelesaikan studinya tepat
waktu/bahkan lebih pendek yang seharusnya, dan dengan nilai yang baik.
b. Validitas Pengukuran Serentak
Validitas serentak merujuk kepada kesesuaian tingkah laku atau bukti-bukti
diri yang dimiliki seseorang dengan instrumen yang diberikan, sebagaimana
direfleksikan / ditujukan oleh skornya dalam instrumen paralel atau instrumen
lain yang mempunyai karakteristik yang sama. validitas pengukuran serentak
diperoleh dengan jalan mengorelasikan atau melihat hubungan instrumen lain
yang dipandang sebagai kriterium; yang diberikan/dilaksanakan pada waktu
yang bersamaan dengan pelaksanaan instrumen itu.

4. Validitas kriteria (Criterion Related Validity)


Validitas kriteria atau validitas empiris ditentukan berdasarkan kriteria internal,
baik kriteria internal maupun kriteria eksternal. Validitas kriteria diperoleh
melalui hasil uji coba tes kepada responden yang setara dengan responden yang
akan dievaluasi atau diteliti. Validitas kriteria merupakan sebuah ukuran validitas
yang ditentukan dengan cara membandingkan skor-skor tes dengan kinerja
tertentu pada sebuah ukuran luar atau yang lain. contoh penggunaan validitas
kriteria adalah tes intelejensi yang berkorelasi dengan rata-rata nilai akademis.
Asumsinya, jika intelejensi seseorang tinggi maka yang terjadi adalah dia akan
mendapatkan nilai akademis yang bagus.

5. Validitas Muka (Face Validity)


Validitas muka adalah tipe validitas yang paling rendah signifikasinya karena
hanya didasarkan pada penilaian selintas mengenai isi alat ukur. apabila isi alat
ukur telah tampak sesuai dengan apa yang ingin diukur maka dapat dikatakan
validitas muka telah terpenuhi. Validitas muka bisa dikatakan juga sebagai
validitas rendah dari validitas isi.

C. Menghitung Validitas Tes


Validitas Tes biasa juga disebut sebagai kesahihah suatu tes adalah mengacu
pada kemampuan suatu tes untuk mengukur karakteristik atau dimensi yang
dimaksudkan untuk diukur. Valid berarti cocok atau sesuai. Suatu tes dikatakan valid,
apabila tes tersebut benar-benar tertuju pada yang dituju. Tes tersebut dapat
memberikan keterangan atay gambaran tentang apa yang diinginkan. Untuk menguji
validitas setiap butir soal maka skor-skor yang ada pada butir yang dimaksud
dikorelasikan dengan skor totalnya. Skor tiap butir soal dinyatkan skor X dan skor
total dinyatakan sebagai skor Y. Dengan diperolehnya indeks validitas setiap butir
soal, dapat diketahui butir-butur soal manakah yang memenuhi syarat dilihat dari
indeks validitasnya.2
Tentukan koefisien korelasi antarskor hasil tes yang akan diuji validitasnya dengan
hasil tes yang terstandar yang dimiliki oleh orang yang sama dengan menggunakan
rumus korelasi produk moment di bawah ini:

r xy = n∑𝑛 𝑥𝑖 𝑦𝑖 - ∑𝑛𝑖−1 𝑥1 ∑𝑛𝑖−1 𝑦1


𝑖−1

√(𝑛 ∑𝑛𝑖−1 𝑥2 - (∑𝑛𝑖−1 𝑥2)2)


𝑦2
(𝑛 ∑𝑛𝑖−1 – (∑𝑛𝑖−1 𝑦𝑖)2)
𝑖

Keterangan:
r xy : Koefisien korelasi antara variabel X dan variabel Y
xi : Nilai data ke-i untuk kelompok variabel X
yi : Nilai data ke-I untuk kelompok variabel Y
n : Banyak data

Hitung koefisien validitas instrumen uyang diuji (r-hitung), yang nilainya sama
dengan korelasi-korelasi hasil langkah sebelumnya dikali koefisien validitas
instrumen terstandar. bandingkan nilai koefisien validitas dengan nilai koefisien
korelasi pearson/tabel pearson (r-tabel) pada taraf signifikansi a (biasanya dipilih
0,05) dan n= banyaknya data yang sesuai.3
Kriterianya adalah:
 Instrumen valid, jika r-hitung = r-tabel
 Instrumen tidak valid, jika r-hitung < r-tabel

2
Azwar, Syaifuddin. Reliabilitas dan Validitas. Pustaka Pelajar. Yogyakarta, 1997
3
Kusaeri dan Supranato. Pengukuran dan Penelitian Pendidikan. Graha Ilmu. Yogyakarta, 2012
D. Validitas Butir Soal
Tinggi rendahnya validitas soal secara keseluruhan berhubungan erat dengan
validitas tiap butir soal tersebut. Mengapa validitas soal rendah? Lihat validitas
masing-masing butir soal. Mungkin diantara soal yang diberikan ada yang terlalu
buruk, kurang tepat atau terlalu sulit. Validitas butir soal dicari dalam hubungannya
dengan skor total tiap individu yang ikut serta dalam evaluasi.
Langkah yang ditempuh sebagai berikut:
1. Skor suatu instrumen/alat ukur dengan baik dan telitiuntuk individu yang benar
diberi angka 1, sedangkan yang salah diberi angka nol.
2. Jumlahkan skor total untuk tiap individu.

Perhatikan contoh berikut:


Peserta ujian 10 orang dengan jumlah soal 10 buah. setelah diskor sebagai berikut:

Butir Soal Skor


Sampel Total
1 2 3 4 5 6 7 8 9 10

A 0 1 1 1 0 1 0 0 0 1 5

B 1 1 1 1 0 1 1 0 0 1 7

C 1 0 1 1 1 1 0 1 1 1 8

D 0 0 1 1 1 0 1 1 0 0 5

E 1 0 0 0 1 1 1 1 0 1 6

F 1 1 1 0 0 0 1 1 1 1 7

G 1 0 0 1 0 1 1 1 0 1 6

H 1 0 0 1 1 1 0 1 1 0 6

I 1 0 1 1 0 1 1 0 1 1 7

J 1 1 1 1 0 1 1 1 0 0 7

3. Gunakan rumus Product Moment Correlation atau Korelasi Biserial.


1) Penggunaan Product Moment Correlation
Buat tabel persiapan dengan skor botir soal masing-masing sebagai X dan skor
total sebagai Y, seperti berikut:
Tabel persiapan untuk butir pertama.

Sampel X Y X2 Y2 XY

A 0 5 0 25 0

B 1 7 1 49 7

C 1 8 1 64 8

D 0 5 0 25 0

E 1 6 1 36 6

F 1 7 1 49 7

G 1 6 1 36 6

H 1 6 1 36 6

I 1 7 1 49 7

J 1 7 1 49 7

∑ 𝑌2 ∑ 𝑋𝑌
∑𝑋 = 8 ∑ 𝑌 = 64 ∑ 𝑋2 = 8
= 418 = 54

Selanjutnya masukkan ke dalam rumus.


r xy = N ∑ 𝑋𝑌 − ( ∑ 𝑋 ) ( ∑ 𝑌 )
√[𝑁 ∑ 𝑋2 − (∑ 𝑋2) (N∑ 𝑌2 −
(∑ 𝑌2)]

r xy = 10 x 54 – 8 x 64
√[10𝑥8 − (8)2] [10 x 418 - (64)2

r xy = 540 – 512
√[(80-64) (4180 – 4096)]

r xy = 28
√(16 𝑥 84)
r xy = 28 / 36,66 = 0,76
r xy = 0,76

Dengan memperhatikan koefisien korelasi yang didapat (0,76) maka dapat


dikatakan soal nomor 1 mempunyai hubungan yang tinggi dengan skor total.
ini dapat diartikan bahwa butir pertama mempunyai validitas yang tinggi.
2) Penggunaan Korelasi Biserial
Rumus yang digunakan adalah:
r pbis = Mp - Mt √ p/q
SDt

Keterangan:
r pbis = Koefisien korelasi biserial
Mt = Mean total
Mp = Mean skor dari subjek yang menjawab benar butir soal yang dicari
SDt = Standar deviasi skor total
p = Proporsi peserta didik yang menjawab benar butir soal yang dicari
q = Proporsi peserta didik yang menjawab salah (q = 1 – p).

Langkah yang ditempuh sebagai berikut:

a. Buat Tabel Persiapan


Butir Pertama

Sampel Skor Nomor 1 Skor Total

A 0 5

B 1 7

C 1 8

D 0 5

E 1 6

F 1 7

G 1 6
H 1 6

I 1 7

J 1 7

b. Seleksi dari semua peserta, dan tentukan siapa yang menjawab butir pertama dengan
benar.
Dalam hal ini : B, C, E, F, G, H, I, J
c. Jumlah skor total untuk butir itu dan kemudian cari rata-ratanya.
Mt = 5 +7+8+5+6+7+6+6+7+7
10

= 64
10

Mt = 6,4

d. Jumlahkan skor total dari subjek yang menjawab benar dan kemudian tentukan rata-
ratanya.

Mp = 7+8+6+7+6+6+7+7

= 54 = 8

Mp = 6,75
e. Cari standar deviasi total
SD = ( ∑ 𝑋2) (∑ 𝑋2)
N - N
∑ X2 = 418
∑ X = 64
SDt = √ ( 418 ) - ( 642)
10 10
SD = √ 0,84
SD = 0,916515139
f. Tentukan proporsi peserta didik yang menjawab butir soal tersebut dengan benar dan
yang salah.
p = 8 / 10 = 0,80
q = 1-0,80 = 0,20
g. Masukkan ke dalam rumus
r pbis = M P – M t √ p/q
SD t
r pbis = 6,75 – 6,4 √ 0,80/0,20
0,916515139

r pbis = 0,35 √4
0,916515139
r pbis = 0,38 x 2 = 0,76

Dengan cara yang sama, validitas semua butir soal dalam satu set instrumen
dapat diketahui, sehingga butir soal yang tidak baik harus dibuang.
Selanjutnya Rumus korelasi product moment ada dua macam, yaitu:

1) korelasi product moment dengan simpangan


axy

r xy = 0 (ax 2) (ay2)

Ket:

r xy = Koefisien korelasi antara variabel X dan variabel Y, dua


variabel yang dikorelasikan (x = X – X dan y = Y-Y)

a xy = Jumlah perkalian x dan y

x2 = Kuadrat dari x

y2 = Kuadrat dari y

Contoh perhitungan:
Misalnya akan menghitung validitas tes prestasi belajar matematika, sebagai
kriterium diambil rata-rata ulangan yang akan dicari validitasnya, diberi kode X
dan rata-rata nilai harian diberi kode Y. Kemudian dibuat tabel persiapan sebagai
berikut:

No. Nama X Y x y x2 y2 xy
1. Nadia 6,5 6,3 0 -0,1 0,0 0,01 0,0
2. Susi 7 6,8 + 0,5 +0,4 0,25 0,16 +0,2
3. Cecep 7,5 7,2 + 1,0 +0,8 1,0 0,64 +0,8
4. Erna 7 6,8 + 0,5 + 0,4 0,25 0,16 +0,2
5. Dian 6 7 -0,5 + 0,6 0,25 0,36 -0,3
6. Asmara 6 6,2 -0,5 -0,2 0,25 0,04 +0,1
7. Siswoyo 5,5 5,1 -1,0 - 1,3 1,0 1,69 +1,3
8. Jihad 6,5 6 0 -0,4 0,0 0,16 0,0
9. Yanna 7 6,5 +0,5 +0,1 0,25 0,01 +0,05
10. Lina 6 5,9 -0,5 -0,6 0,25 0,36 +0,3
Jumlah 65,0 63,8 3,5 3,59 2,65

X = ∑ 𝑋/ N = 650 / 10 = 6,5

Y = ZY / N = 63,8 / 10 = 6,38 dibulatkan 6,4

x=X–X

y=Y–Y

Dimasukkan ke rumus

∑ 𝑥𝑦
r xy = = ∑ √(∑2𝑥) (∑2𝑦)

= 2,65 / √3,5𝑥 3,59

= 2,65 / √12,565

= 2,65 / 3,545

Indeks korelasi antara X dan Y inilah indeks validitas soal yang dicari.

Rumus korelasi product moment dengan angka kasar:

` r xy = 𝑁 ∑ 𝑋𝑌 − (∑ 𝑋)(∑ 𝑌)
_______________________

√{𝑁 ∑ 𝑋2 − (∑ 𝑋)2 { 𝑁 ∑ 𝑌2 − (∑ 𝑌)2 }


Ket:
r xy = Koefisien korelasi antara variable X dan variabel Y, dua variabel yang
dikorelasikan
Dengan menggunakan data hasil tes prestasi matematika di atas kini dihitung dengan
rumus korelasi product moment dengan angka kasar yang table persiapannya sebagai
berikut:
No. Nama X Y X2 Y2 XY
1. Nadia 6,2 6,3 42,25 39,69 40,95
2. Susi 7 6,8 49 46,24 47,6
3. Cecep 7,5 7,2 56,25 51,84 54,0
4. Erna 7 6,8 49 46,24 47,6
5. Dian 6 7 36 49 42
6. Asmara 6 6,2 36 38,44 37,2
7. Siswoyo 5,5 5,1 30,25 26,01 28,05
8. Jihad 6,5 6 42,25 45,5 39
9. Yanna 7 6,5 49 36 45,5
10. Lina 6 5,9 36 34,81 35,4
Jumlah 65,0 63,8 426,0 410,52 417,3

Dimasukkan ke dalam rumus diatas:

r xy = 10 x 417,3 – (65 x 63,8)

√(10 𝑥 426 − 4225) (10 𝑥 410,52 − 4070, 44)

= 4173 - 4147

√(4260 − 4225)(410,2 − 4070, 44)

= 26

√35𝑥 34,76

= 26

34,8797
= 0745

Jika perbandingan dengan validitas soal yang dihitung dengan rumus simpangan,
ternyata terdapat perbedaan sebesar 0,003 lebih besar yang dihitung dengan rumus
simpangan. Hal ini wajar karena dalam mengerjakan perkalian atau penjumlahan jika
diperoleh 3 angka di belakang koma dilakukan pembulatan ke atas. Perbedaan ini
sangat kecil sehingga diabaikan.

E. Reliabilitas Tes
Reliabilitas adalah ketetapan suatu tes apabila diteskan kepada subjek yang
sama. untuk mengetahui ketetapan ini pada dasarnya dilihat kesejajaran hasil. seperti
halnya beberapa teknik juga menggunakan rumus korelasi product moment untuk
mengetahui validitas, kesejajaran hasil dalam reliabilitas tes.
Ada beberapa cara yang dapat digunakan dalam menentukan atau mencari
reliabilitas tes. cara yang dapat dipakai sebagai berikut:4
1. Metode Bentuk Paralel (Equivalent)
Tes paralel atau tes equivalent adalah dua buah tes yang mempunyai kesamaan
tujuan, tingkat kesukaran, dan susunan, tetapi butir-butir soalnya berbeda. dengan
metode bentuk paralel ini, dua buah tes yang paralel, misalnya tes Matematika
Seri A yang akan dicari reliabilitasnya dan tes Seri B diteskan kepada
sekelompok siswa yang sama, kemudian hasilnya dikorelasikan. koefisien
korelasi dari kedua hasil tes inilah yang menunjukkan koefisien reliabilitas tes
Seri A. jika koefisiennya tinggi maka tes tersebut sudah reliabel dan dapat
digunakan sebagai alat pengetes yang terandalkan.

2. Metode Tes Ulang (Test-retest Method)


Metode tes ulang dilakukan orang untuk menghindari penyusunan dua seri tes.
dalam menggunakan teknik atau metode ini pengetes hanya memiliki satu seri tes,
tetapi dicobakan dua kali. oleh karena tesnya hanya satu dan dicobakan dua kali,
maka metode ini dapat disebut dengan singel-test-doubel-trial method. kemudian
hasil dari kedua kali tes tersebut dihitung korelasinya.

4
Suryabrata, S. Metodologi Penelitian. Raja Grafindo Persada. Jakarta. 2000
3. Metode Belah Dua atau Split-half Method
Kelemahan penggunaan metode dua-tes dua kali percobaan dan satu-tes dua kali
percobaan diatasi dengan metode ketiga ini, yaitu metode belah dua. Dalam
penggunaan metode ini pengetes hanya menggunakan sebuah tes dan dicobakan
satu kali. oleh karena itu, disebut juga singel-test-single-trial method.
Berbeda dengan metode pertama dan kedua yang setelah ditemukannya koefisien
korelasi langsung ditafsirkan itulah koefisien reliabilitas, maka dengan metode
ketiga ini tidak dapat demikian. pada waktu membelah dua dan mengkorelasikan
dua belahan, baru diketahui reliabilitas separo tes. Untuk mengetahui reliabilitas
seluruh tes harus digunakan rumus Spearman-Brown sebagai berikut:
r 11 = 2r ½ ½
(1+ r ½ ½ )
Dimana:
r ½ ½ = korelasi antara skor-skor setiap belahan tes
r 11 = korelasi reabilitas yang sudah disesuaikan

Contoh:
Korelasi antara belahan tes = 0,60
Maka, reabilitas tes = 2 x 0,60 = 1,20 = 0,75
1 + 0,60 1,60

Mencari Reliabilitas Tes Bentuk Uraian


Untuk keperluan mencari reliabilitas soal keseluruhan perlu juga dilakukan
analisis butir soal seperti halnya soal bentuk objektif. skor untuk masing-masing butir
soal dicantumkan pada kolom item menurut apa adanya. Rumus yang digunakan
adalah rumus Alpha sebagai berikut:
r 11 = n 1- ∑ 𝜎2 i
( n-1) 𝜎2t
Dimana:
r 11 = reliabilitas yang dicari
∑ 𝜎2 i = jumlah varians skor tiap—tiap item
𝜎2t = varians total
Contoh perhitungan mencari reliabilitas
TABEL ANALISIS ITEM
Nomor Item Skor Kuadrat
No Nama 6 skor total
1 2 3 4 5 Total

1 A 10 6 8 8 10 10 52 2704

2 B 6 4 4 6 6 5 31 961

3 C 8 2 6 8 7 8 39 1521

4 D 7 3 7 7 6 6 36 1296

5 E 0 5 3 2 4 4 18 324

6 F 2 4 2 8 6 8 30 900

7 G 4 3 6 6 6 6 31 961

8 H 5 5 5 7 7 7 36 1296

9 I 5 5 4 6 8 5 33 1089

10 J 3 6 3 4 6 6 28 784

Jumlah 50 43 48 62 66 65 334 11836

Jumlah Kuadrat 328 201 264 418 458 2120 2120

2120 = jumlah dari jumlah kuadrat setiap skor


11836 = jumlah kuadrat skor total
Dengan data yang tertera dalam tabel, dicari varians tiap-tiap item dahulu, lalu
dijumlahkan.

Perlu didingat kembali rumus varians yang sudah kita kenal, yaitu:

𝜎 2 = ∑ 𝑋 2 - (∑ 𝑋)2 atau 𝜎 2 = ∑ 𝑋 2 t - (∑ 𝑋 𝑡)2


N N N
N
F. PAP (Penilaian Acuan Patokan)
Penilaian acuan patokan (PAP) biasanya disebut juga criterion evaluation
merupakan pengukuran yang menggunakan acuan yang berbeda. dalam pengukuran
ini siswa dikomperasikan dengan kriteria yang telah ditentukan terlebih dahulu dalam
tujuan intruksional, bukan dengan penampilan siswa yang lain. keberhasilan dalam
prosedur acuan patokan tergantung pada penguasaan materi atas kriteria yang telah
dijabarkan dalam item-item pertanyaan guna mendukung tujuan intruksional.
Dengan PAP setiap individu dapat diketahui apa yang telah dan belum
dikuasainya. bimbingan individual untuk meningkatkan penguasaan siswa terhadap
materi pelajaran dapat dirancang, demikian pula untuk memantapkan apa yang telah
dikuasainya dapat dikembangkan. guru dan setiap peserta didik mendapat manfaat
dari adanya PAP.5
Melalui PAP berkembang upaya untuk meningkatkan kualitas pembelajaran
dengan melaksanakan tes awal (pre test) dan tes akhir (post test). perbedaan hasil tes
akhir dengan tes awal merupakan petunjuk tentang kualitas proses pembelajaran.
pembelajaran yang menuntut pencapaian kompetensi tertentu sebagaimana
diharapkan dan termuat pada kurikulum saat ini, PAP merupakan cara pandang yang
harus diterapkan.
PAP juga dapat digunakan untuk menghindari hal-hal yang tidak diinginkan,
misalnya kurang terkontrolnya penguasaan materi, dan tidak terpenuhinya nilai-nilai
kelompok berdistribusi normal. PAP ini menggunakan prinsip belajar tuntas (mastery
learning).

G. PAN (Penilaian Acuan Normatif)


Penilaian acuan normatif (PAN) merupakan pendekatan klasik, karena
tampilan pencapaian hasil belajar siswa pada suatu tes dibandingkan dengan
penampilan siswa lain yang mengikuti tes yang sama. pengukuran ini digunakan
sebagai metode pengukuran yang menggunakan prinsip belajar kompetitif. menurut

5
Sudjana, Nana. Penelitian Hasil Proses Belajar Mengajar. Remaja Rosdakarya. Bandung. 1999
prinsip pengukuran norma, tes baku pencapaian administrasi dan penampilan baku
normatif dikalkulasi untuk kelompok-kelompok pengambil tes yang bervariasi. skor
yang dihasilkan siswa dalam tes yang sama dibandingkan dengan hasil populasi atau
hasil keseluruhan yang telah dibakukan. guru kelas kemudian mengikuti asas yang
sama, mengukur pencapaian hasil belajar siswa, dengan tepat membandingkan
terhadap siswa lain dalam tes yang sama. seperti evaluasi empiris, guru melakukan
pengukuran, mengadministrasi tes, menghitung skor, merangking skor, dari tes yang
tertinggi sampai yang terendah, menentukan skor rerata menentukan simpang baku
dan variannya.

Berikut ini beberapa ciri dari Penilaian Acuan Normatif:

1. Penilaian Acuan Normatif digunakan untuk menentukan status setiap peserta


didik terhadap kemampuan peserta didik lainnya. Artinya, Penilaian Acuan
Normatif digunakan apabila kita ingin mengetahui kemampuan peserta didik
di dalam komunitasnya seperti di kelas, sekolah dan sebagainya.
2. Penilaian Acuan Normatif menggunakan kriteria yang berifat “relative”.
Artinya, selalu berubah-ubah disesuaikan dengan kondisi atau kebutuhan pada
waktu tersebut.
3. Nilai hasil dari penilaian Acuan Normatif tidak mencerminkan tingkat
kemampuan dan penguasaan siswa tentang materi pengajaran yang diteskan,
tetapi hanya menunjuk kedudukan peserta didik (peringkatnya) dan
komunitasnya (kelompoknya).
4. Penilaian Acuan Normatif memiliki kecendrungan untuk menggunakan
rentangan tingkat penguasaan seseorang terhadap kelompoknya, mulai dari
yang sangat istimewa sampai dengan yang mengalami kesulitan yang serius.
5. Penilaian Acuan Normatif memberikan skor yang menggambarkan
penguasaan kelompok.

Persamaan dan Perbedaan Penilaian Acuan Patokan (PAP) dan Penilaian Acuan
Normatif (PAN)

Penilaian Acuan Patokan dan Penilaian Acuan Normatif mempunyai beberapa


persamaan sebagai berikut:
1) penilaian acuan normatif dan acuan patokan memerlukan adanya tujuan
evaluasi spesifik sebagai penentuan fokus item yang diperlukan. tujuan
tersebut termasuk tujuan intruksional umum dan tujuan intruksional khusus.
2) kedua pengukuran memerlukan sampel yang relevan, digunakan sebagai
subjek yang hendak dijadikan sasaran evaluasi. sampel yang diukur
mempresentasikan populasi siswa yang hendak menjadi target akhir
pengambilan keputusan.
3) untuk mendapatkan informasi yang diinginkan tentang siswa, kedua
pengukuran sama-sama memerlukan item-item yang disusun dalam satu tes
dengan menggunakan aturan dasar penulisan instrument.
4) keduanya mempersyaratkan perumusan secara spesifik perilaku yang akan
diukur.
5) keduanya menggunakan macam tes yang sama seperti tes subjektif, tes
karangan, tes penampilan atau keterampilan.
6) keduanya dinilai kualitasnya dari segi validitas dan reliabilitasnya.
7) keduanya digunakan ke dalam pendidikan walaupun untuk maksud yang
berbeda.

Perbedaan kedua Penilaian adalah sebagai berikut:


1) Penilaian acuan normatif biasanya mengukur sejumlah besar perilaku khusus
dengan sedikit butir tes untuk setiap perilaku. penilaian acuan patokan
biasanya mengukur perilaku khusus dalam jumlah yang terbatas dengan
banyak butir tes untuk setiap perilaku.
2) Penilaian acuan normatif menekankan perbedaan diantara peserta tes dari segi
tingkat pencapaian belajar secara relatif. penilaian acuan patokan menekankan
penjelasan tentang apa perilaku yang dapat dan yang tidak dapat dilakukan
oleh setiap peserta tes.
3) penilaian acuan normatif lebih mementingkan butir-butir tes yang mempunyai
tingkat kesulitan sedang dan biasanya membuang tes yang terlalu mudah dan
terlalu sulit. penilaian acuan patokan mementingkan butir-butir tes yang
relevan dengan perilaku yang akan diukur tanpa peduli dengan tingkat
kesulitannya.
4) Penilaian acuan normatif digunakan terutama untuk survey. penilaian acuan
patokan digunakan terutama untuk penguasaan.
DAFTAR PUSTAKA

Arikunto, Suharsimi. 2016. Dasar-dasar evaluasi pendidikan . Jakarta: Bumi aksara

Azwar, Syaifuddin. 1997. Reliabilitas dan Validitas. Yogyakarta: Pustaka Pelajar

Kusaeri dan Supranato. 2012. Pengukuran dan Penelitian Pendidikan . Yogyakarta:


Graha Ilmu

Sudjana, Nana. 1999. Penelitian Hasil Proses Belajar Mengajar. Bandung: Remaja
Rosdakarya

Suryabrata, S. 2000. Metodologi Penelitian. Jakarta: Raja Grafindo Persada

Anda mungkin juga menyukai