Anda di halaman 1dari 10

MAKALAH PENILAIAN PEMBELAJARAN BIOLOGI

REABILITAS

disusun oleh:

NUR AZMA SEPTI ARYANTI (16304241005)

MERY FITRIA (16304241035)

IMAM KUSUMA DEWI (16304244007)

ISHADIYANTO SALIM (16304244015)

PROGRAM STUDI PENDIDIKAN BIOLOGI


JURUSAN PENDIDIKAN BIOLOGI
FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM
UNIVERSITAS NEGERI YOGYAKARTA
2018
BAB I
PENDAHULUAN
1.1 Latar Belakang
Sebelum melakukan proses evaluasi terlebih dahulu kita harus
melakukan pengukuran dengan alat yang disebut tes. Hasil pengukuran
dapat menggambarkan derajat kualitas, kuantitas dan eksistensi keadaan
yang diukur. Namun demikian hasil pengukuran ini belum memiliki
makna sama sekali apabila belum dibandingkan dengan suatu acuan atau
bahan pembanding. Proses membandingkan inilah yang disebut proses
penilaian. Pengolahan hasil tes merupakan kegiatan lanjutan
pengadministrasian ujian, yaitu memeriksa hasil ujian dan mencocokkan
jawaban peserta dengan kunci jawaban untuk tes kognitif dan tes
keterampilan.
Terdapat dua pendekatan yang berlaku dalam penilaian hasil
belajar, yaitu Penilaian Acuan Norma (PAN) dan Penilaian Acuan Patokan
(PAP).

1.2 Rumusan Masalah

A. Apa itu reliabilitas instrumen secara empiris dengan pendekatan


klasik?
B. Apa itu reliabilitas instrumen secara empiris dengan pendekatan
modern?
C. Apa itu reliabilitas instrumen dengan penilaian acuan kriteria?
D. Apa itu reliabilitas instrumen dengan penilaian acuan norma?

1.3 Tujuan

A. Mendeskripsikan reliabilitas instrumen secara empiris dengan


pendekatan klasik.
B. Mendeskripsikan reliabilitas instrumen secara empiris dengan
pendekatan modern.
C. Mendeskripsikan reliabilitas instrumen dengan penilaian acuan
kriteria.
D. Mendeskripsikan reliabilitas instrumen dengan penilaian acuan norma.
BAB II
ISI
A. Pendekatan Klasik

B. Pendekatan Teori Modern


Teori tes modern sering juga disebut Latent Trait Theory yaitu
performance subjek dalam suatu tes yang dapat diprediksi dari kemampuannya
yang bersifat laten. Atau lebih dikenal dengan Item Response Theory (IRT) yaitu
respon subjek terhadap item yang menunjukkan kognitifnya. Kelebihan kinerja
subjek dapat dilihat dengan Item Characteristic Curve (ICC) (Djemari,2012) .
Artinya semakin baik performance subjek akan semakin banyak respon (jawaban
pada aitem tes) yang benar.
Unsur teori dalam tes modern meliputi:

– Butir (item tes)

– Subjek (responnya)

– Isi respon subjek

Asumsi-asumsi dalam tes modern:

1. Parameter butir soal dan kemampuan adalah (Invariant). Artinya soal yang
dibuat memiliki korelasi positif dengan kemampuan yang diukur.
2. Unidimensionality, artinya 1 item mengukur satu kemampuan. Asumsi ini
kurang terbukti karena pada dasarnya antara item 1 dengan lainnya saling
melengkapi.
3. Local independence, artinya respon terhadap suatu item tidak akan
berpengaruh terhadap item lainnya.
Parameter butir soal pada IRT:

Ukuran atau aturan-aturan yang digunakan untuk mengetahui mana soal yang
valid (bisa dipakai) dan mana soal yang tidak valid (tidak bisa dipakai). Aturannya
ada 3:
1. Daya pembeda soal, Artinya item soal bisa dianggap baik kalau item soal
tersebut dapat digunakan untuk membedakan antara subjek yang
berkemampuan tinggi dari subjek yang berkemampuan rendah.
2. Taraf kesukaran soal, Artinya item soal bisa dianggap baik kalau item soal
tersebut tidak terlalu sulit dan tidak terlalu mudah.
3. Kebetulan menjawab benar. Artinya item soal bisa mendeteksi subjek yang
menjawab asal-asalan dan kebetulan benar.
Penggunaan parameter tersebut tergantung pada penyusun alat tes, boleh
menggunakan ketiganya atau hanya menggunakan dua saja. Ada tiga pilihan yang
bisa digunakan (Hambleton & Swaminathan, 1985: 34) :

 Logistik 1 Parameter. Jika menggunakan logistik 1 parameter, item-item yang


akan digunakan hanya diuji taraf kesukaran soalnya saja. Contoh saya
membuat 50 item soal, setelah saya uji cobakan kepada N=100. Langkah
selanjutnya saya hanya harus menyeleksi mana item-item yang memiliki taraf
kesukaran sedang (item yang sedang ialah item yang bisa dijawab oleh 60%
subjek). Langkah terakhir item-item yang diketahui taraf kesukarannya sedang
langsung bisa digunakan untuk tes.
 Logistik 2 Parameter. Jika menggunakan logistik 2 parameter, item-item yang
akan digunakan harus diuji taraf kesukaran soalnya dan juga daya beda
soalnya. Jelasnya item-item yang tidak terlalu sulit dan tidak terlalu mudah
serta bisa membedakan antara siswa yang berkemampuan tinggi dengan siswa
yang berkemampuan rendah, itu yang bisa dipakai sebagai item soal tes.
 Logistik 3 Parameter. Jika menggunakan logistik 3 parameter, item-item yang
akan digunakan harus diuji taraf kesukaran soalnya, diuji daya beda soalnya,
dan diuji kemungkinan kebetulan menjawab benar.

C. Penilaian Acuan Kriteria / Criterion Referenced Evaluation)


Penilaian Acuan Kriteria adalah model pendekatan penilaian yang
mengacu kepada suatu kriteria pencapaian tujuan (TKP) yang telah ditetapkan
sebelumnya. PAK merupakan suatu cara menentukan kelulusan siswa dengan
menggunakan sejumlah patokan. Pengukuran keberhasilan belajar didasarkan atas
penafsiran tingkah laku (performance) yang didasarkan atas kriteria atau standar
khusus, artinya derajad penguasaan yang ada didasarkan pada tingkat tertentu
yang harus dicapai.
Acuan kriteria berasumsi bahwa hampir semua orang bisa belajar apa saja
namun waktunya yang berbeda. Konsekuensi dari acuan kriteria adalah adanya
program remidi, program pengayaan, dan program percepatan. Penafsiran hasil tes
selalu dibandingkan dengan standar atau kriteria yang telah ditetapkan dulu
(Djemari, 2004). PAK pada dasarnya berarti penilaian yang membandingkan hasil
belajar siswa terhadap suatu patokan yang telah ditetapkan sebelumnya.
Pengertian ini menunjukkan bahwa sebelum usaha penilaian dilakukan terlebih
dahulu harus ditetapkan patokan yang akan dipakai untuk membandingkan angka-
angka hasil pengukuran agar hasil itu mempunyai arti tertentu.
Bilamana siswa telah memenuhi patokan tersebut maka dinyatakan
berhasil. Tetapi bila siswa belum memenuhi patokan maka dikatakan gagal atau
belum menguasai bahan pembelajaran tersebut. Nilai-nilai yang diperoleh siswa
dihubungkan dengan tingkat pencapaian penguasaan siswa tentang materi
pembelajaran sesuai dengan tujuan yang telah ditetapkan.
Siswa yang telah melampaui atau sama dengan kriteria atau patokan keberhasilan
dinyatakan lulus atau memenuhi persyaratan. Guru tidak melakukan penilaian apa
adanya melainkan berdasarkan kriteria keberhasilan yang telah ditetapkan sejak
pembelajaran dimulai. Guru yang menggunakan model pendekatan PAK ini
dituntut untuk selalu mengarahkan, membantu dan membimbing siswa kearah
penguasaan minimal sejak pembelajaran dimulai, sedang berlangsung dan sampai
berakhirnya pembelajaran. Kompetensi yang dirumuskan dalam TKP merupakan
arah, petunjuk, dan pusat kegiatan dalam pembelajaran. Penggunaan tes formatif
dalam penilaian ini sangat mendukung untuk mengetahui keberhasilan belajar
siswa. Pelaksanaan PAK tidak memerlukan perhitungan statistik melainkan hanya
tingkat penguasaan kompetensi minimal.
Sebagai contoh misalnya: untuk dapat diterima sebagai calon tenaga
pengajar di perguruan tinggi adalah IP minimal 3,00 dan setiap calon harus lulus
tes potensi akademik yang diadakan oleh lembaga yang bersangkutan.
Berdasarkan kriteria di atas siapapun calon yang tidak memenuhi persyaratan di
atas maka dinyatakan gagal dalam tes atau tidak diterima sebagai calon tenaga
pengajar.
Seperti uraian di atas tingkat kemampuan atau kelulusan seseorang ditentukan
oleh tercapai tidaknya kriteria. Misalnya seseorang dikatakan telah menguasai
satu pokok bahasan / kompetensi bilamana ia telah menjawab dengan benar 75%
dari butir soal dalam pokok bahasan / kompetensi tersebut. Jawaban yang benar
75% atau lebih dinyatakan lulus, sedang jawaban yang kurang dari 75%
dinyatakan belum berhasil dan harus mengulang kembali.
Muncul pertanyaan bahwa apakah siswa yang dapat menjawab benar 75% ke atas
juga akan memperoleh nilai yang sama? Hal ini tergantung pada sistem penilaian
yang digunakan. Jika hanya menggunakan kriteria lulus dan tidak lulus, berarti
siswa yang menjawab benar 75% ke atas adalah lulus, demikian juga sebaliknya
siswa yang menjawab benar kurang dari 75% tidak lulus. Apabila sistem penilaian
yang digunakan menggunakan model A, B, C, D atau standar yang lain, kriteria
ditetapkan berdasarkan rentangan skor atau skala interval.

Perlu dijelaskan bahwa kriteria atau patokan yang digunakan dalam PAP bersifat
mutlak. Artinya kriteria itu bersifat tetap, setidaknya untuk jangka waktu tertentu
dan berlaku bagi semua siswa yang mengikuti tes di lembaga yang bersangkutan.

Karakteristik penilaian acuan kriteria:

1. Terdapat kemampuan kognitif minimal yang harus dimiliki oleh peserta


didik
2. Adanya kemampuan psikomotorik dan sikap mental minimal sebagai
prasyarat
3. Meletakkan perbedaan latar belakang peserta didik sebagai unsur
individual
4. Sebagai alat diagnosis kesulitan siswa
5. Dapat dufungsikan sebagai embrio tes baku
6. Tidak komparatif terhadap kelompok sehingga dapat melemahkan
semangat kompetisi
Terdapat empat jenis penilaian acuan kriteria yaitu sebagai berikut:
1. Entry-behaviors test, yaitu suatu tes yang diadakan sebelum suatu program
pengajaran dilaksanakan dan bertujuan untuk mengetahui sampai batas
mana penguasaan pengetahuan dan keterampilan yang telah dimiliki
peserta didik yang dapat dijadikan dasar untuk menerima program
pengajaran yang akan diberikan

2. Pre-test, yaitu tes yang diberikan sebelum pengajaran dimulai dan


bertujuan untuk mengetahui sampai dimana penguasaan peserta didik
terhadap bahan pengajaran (pengetahuan dan keterampilan ) yang akan
diajarkan

3. Post-test, yaitu tes yang diberikan pada setiap akhir program satuan
pengajaran dan bertujuan untuk mengetahui sampai dimana pencapaian
siswa terhadap bahan pengajaran setelah mengalami suatu kegiatan belajar

4. Embedded –test, yaitu tes yang dilaksanakan disela-sela atau pada waktu-
waktu tertentu selama proses pengajaran berlangsung dan bertujuan untuk
mengetes peserta didik secara langsung sesudah suatu unit pengajaran
sebelum post-test dan untuk mencek kemajuan siswa untuk remedial
sebelum post-test

D. Penilaian Acuan Norma (PAN / Norm Referenced Evalution)


Penilaian Acuan Norma (PAN) adalah penilaian yang dilakukan dengan
mengacu pada norma kelompok atau nilai-nilai yang diperoleh siswa
dibandingkan dengan nilai-nilai siswa lain dalam kelompok tersebut. Dengan
kata lain PAN merupakan sistem penilaian yang didasarkan pada nilai
sekelompok siswa dalam satu proses pembelajaran sesuai dengan tingkat
penguasaan pada kelompok tersebut. Artinya pemberian nilai mengacu pada
perolehan skor pada kelompok itu.
Dalam hal ini “norma” berarti kapasistas atau prestasi kelompok,
sedangkan “kelompok” adalah semua siswa yang mengikuti tes tersebut dapat
kelompok siswa dalam satu kelas, sekolah, rayon, propinsi, dan lain-lain. Pan
juga dapat dikatakan penilaian “apa adanya” dengan pengertian bahwa acuan
pembandingnya semata-mata diambil dari kenyataan yang diperoleh (rata-rata
dan simpangan baku) pada saat penilaian dilakukan dan tidak dikaitkan dengan
hasil pengukuran lain.
PAN menggunakan prinsip-prinsip yang berlaku pada kurva normal.
Hasil-hasil perhitungannya dipakai sebagai acuan penilaian dan memiliki sifat
relatif sesuai dengan naik turunnya nilai rata-rata dan simpangan baku yang
dihasilkan pada saat itu.
Penggunaan sistem PAN membiarkan siswa berkembang seperti apa adanya.
Namun demikian guru tetap merumuskan Tujuan Khusus Pembelajaran (TKP)
sesuai dengan tuntutan kompetensi. TKP yang berorientasi pada kompetensi
tetap dipakai sebagai tumpuan dalam penyusunan evaluasi akan tetapi pada
saat pemberian skor yang diperoleh siswa maka TKP tidak dipergunakan
sebagai pedoman. Batas kelulusan tidak ditentukan oleh penguasaan minimal
siswa terhadap kompetensi yang ditetapkan dalam TKP, melainkan didasarkan
pada nilai rata-rata dan simpangan baku yang dihasilkan kelompoknya.
Dengan demikian kelemahan sistem PAN dapat terlihat jelas bahwa tes
apapun, dalam kelompok apapun, dengan kadar prestasi yang bagaimanapun
pemberian nilai dengan model pendekan PAN selalu dapat dilakukan. Oleh
karena itu penggunaan model pendekatan ini dapat dilakukan denga baik
apabila memenuhi syarat antara lain: a). skor nilai terpencar atau dapat
dianggap terpencar sesuai dengan pencaran kurva normal; b). jumlah yang
dinilai minimal 50 orang atau lebih dari 100 orang dalam arti sampel yang
digunakan besar.
Dalam penerapan sistem PAN ada dua hal pokok yang harus ditetapkan
yaitu: banyaknya siswa yang akan lulus dan penetapan batas lulus. Terdapat
dua cara di dalam menentukan batas kelulusan antara lain: menetapkan terlebih
dahulu jumlah yang diluluskan, misalnya 75% dari seluruh peserta tes,
kemudian skor tiap siswa disusun dan diranking sehingga akan diketemukan
skor terendah. Cara kedua dengan menggunakan data statistik yang terdapat
dalam kurva normal dengan menggunakan nilai rata-rata dan simpangan baku,
sehingga akan diketemukan luas daerah kurva normal atau jumlah anak yang
diluluskan.
PAN pada dasarnya mempergunakan kurva normal dan hasil–hasil
perhitungannya sebagai dasar penilaiannya. Kurva ini dibentuk dengan
mengikut sertakan semua angka hasil pengukuran yang diperoleh. Dua
kenyataan yang ada didalam “kurva Normal” yang dipakai untuk
membandingkan atau menafsirkan angka yang diperoleh masing – masing
mahasiswa ialah angka rata- rata (mean) dan angka simpanan baku (standard
deviation), patokan ini bersifat relatif dapat bergeser ke atas atau kebawah
sesuai dengan besarnya dua kenyataan yang diperoleh didalam kurva itu.
Dengan kata ain, patokan itu dapat berubah–ubah dari “kurva normal” yang
satu ke “kurva normal” yang lain. Jika hasil ujian mahasiswa dalam satu
kelompok pada umumnya lebih baik dan menghasilkan angka rata-rata yang
lebih tinggi, maka patokan menjadi bergeser ke atas (dinaikkan). Sebaliknya
jika hasil ujian kelompok itu pada umumnya merosot, patokannya bergeser
kebawah (diturunkan). Dengan demikian, angka yang sama pada dua kurva
yang berbeda akan mempunyai arti berbeda. Demikian juga, nilai yang sama
dihasilkan melalui bangunan dua kurva yang berbeda akan mempunyai arti
berbeda. Demikian juga, nilai yang sama dihasilkan melalui bangunan dua
kurva yang berbeda akan mempunyai arti umum yang berbeda pula.
DAFTAR PUSTAKA
Arikunto, Suharsimi (2004). Evaluasi Sistem Pendidikan. Bumi Aksara, Jakarta.

Djemari Mardapi. (2004). Penyusunan Tes Hasil Belajar. Program Pascasarjana


Universitas Negeri Yogyakarta, Yogyakarta.

Djemari Mardapi. (2012). Pengukuran, Penilaian, dan Evaluasi Pendidikan.


Yogyakarta: Nuha Litera.

Hambleton R.K. & Swaminathan H., (1985). Items Response Theory: Principles
and Application. Boston: Kluwer-Nijjhoff Publish.

Anda mungkin juga menyukai