Anda di halaman 1dari 471

MODEL PENILAIAN PENDIDIKAN PROFESI GURU (PPG)

DENGAN PENSKORAN PARSIAL DAN HOLISTIK

Oleh:
LIAN G. OTAYA
NIM : 16701261002

Disertasi ini ditulis untuk memenuhi sebagian persyaratan


untuk mendapatkan gelar Doktor Pendidikan

PROGRAM STUDI PENELITIAN DAN EVALUASI PENDIDIKAN


PROGRAM PASCASARJANA
UNIVERSITAS NEGERI YOGYAKARTA
2020
ABSTRAK

LIAN G. OTAYA: Model Penilaian Pendidikan Profesi Guru (PPG) dengan


Penskoran Parsial dan Holistik. Disertasi. Yogyakarta: Program Pascasarjana,
Universitas Negeri Yogyakarta, 2019.

Penelitian ini bertujuan mengembangkan model penilaian PPG dengan


penskoran parsial dan holistik. Penelitian ini menggunakan model penelitian
Research and Development (R&D). Subjek penelitian pada uji coba tahap I
berjumlah 236 peserta dan uji coba tahap II berjumlah 516 peserta pada PPG
Prajabatan bersubsidi dan PPG Dalam Jabatan tahun akademik 2018/2019 yang
diselenggarakan LPTK Universitas Negeri Yogyakarta, Universitas Negeri
Gorontalo, dan UIN Alauddin Makassar. Teknik pengumpulan data menggunakan
focus group discussion, observasi, dan dokumentasi. Teknik analisis data yang
digunakan yaitu analisis validitas isi melalui Aiken V dan reliabilitas melalui
reliabilitas inter-rater, untuk membuktikan validitas konstruk melalui analisis
faktor konfirmatori, mengestimasi reliabilitas konstruk melalui reliabilitas
komposit, dan untuk menganalisis karakteristik item dan estimasi kemampuan
peserta PPG melalui analisis IRT politomus model Partial Credit Model dan
Graded Response Model, serta analisis fungsi informasi dan kesalahan baku
estimasi. Hasil penelitian dan pengembangan model penilaian ini menghasilkan
tiga konstruk instrumen yaitu: instrumen penilaian RPP, instrumen penilaian
pelaksanaan pembelajaran, serta instrumen penilaian kompetensi sosial dan
kompetensi kepribadian. Model penilaian PPG yang dikembangkan dengan
penskoran parsial dan holistik telah akurat dan terpercaya berdasarkan konstruk
instrumen yang dihasilkan, validitas isi dan reliabilitas instrumen melalui telaah
expert judgement telah memenuhi item-tem instrumen yang dikembangkan
berdasarkan substansial teoretiknya, validitas konstruk dan reliabilitas konstruk
menunjukkan seluruh instrumen pada model penilaian PPG valid dan reliabel
berdasarkan muatan-muatan faktornya. Instrumen model penilaian PPG baik
dengan penskoran parsial maupun penskoran holistik telah memiliki nilai
informasi yang memadai yang bergerak antara 10 hingga 19 dengan estimasi
kesalahan pengukuran yang relatif kecil yaitu sekitar 0,2 hingga 0,3. Hasil
penilaian dengan menggunakan instrumen model penilaian PPG menunjukkan
bahwa penilaian dengan penskoran parsial lebih akurat dibandingkan dengan
penilaian dengan penskoran holistik. Model penilaian telah memenuhi aspek
kepraktisan berdasarkan penilaian oleh pengguna yaitu mampu dipahami oleh
pengguna, dapat diterapkan di lapangan, relevansi dengan Program PPG, memberi
manfaat pada peserta PPG, efektif dan efisien dalam penggunaannya.
Kata kunci: Penilaian PPG, Penskoran Parsial, Penskoran Holistik

ii
ABSTRACT

LIAN G. OTAYA: A Model of the Teaching Profession Education (TPE)


Assessment with Partial and Holistic Scoring. Dissertation. Yogyakarta:
Graduate School, State University of Yogyakarta, 2019.

This study aimed to develop a model of the TPE assessment with partial
and holistic scoring. The study used a research and development (R&D) model
with subjects in the first stage try-out comprising 236 participants and those in the
second stage try-out involving 516 participants of the subsidized pre-service TPE
and the in-service TPE in the 2018/2019 academic year conducted by three
teacher training universities in Yogyakarta, Gorontalo, and Makassar. Data was
collected using focus group discussion, observation and documentation. The data
analyses included content validity analysis through Aiken V, reliability through
inter-rater reliability, proof of construct validity through confirmatory factor
analysis, construct reliability estimate through composite reliability, and analysis
of item characteristics and estimate of TPE participants’ capabilities through IRT
analyses with the polytomous, Partial Credit, and Graded Response models, as
well as analysis of the information function and standard error of the estimate.
The results of the assessment model produced three constructs of instruments,
namely a lesson plan assessment instrument, a learning implementation
assessment instrument, and a social competency and personality competency
assessment instrument. The TPE assessment model developed by partial and
holistic scoring was accurate and reliable based on the constructs of the developed
instruments. The instrument content validity and the reliability through the expert
judgment review fulfilled the developed instrument items based on the theoretical
substance. The construct validity and the construct reliability showed that all
instruments in the TPE assessment model were valid and reliable based on the
factor loadings. The TPE assessment model instruments with both partial and
holistic scoring had adequate information values ranging from 10 to 19 with
relatively small measurement error estimates of around 0.2 to 0.3. The results of
assessments using the TPE assessment model instruments indicated that that of
partial scoring was more accurate than that of holistic scoring. The assessment
model had fulfilled practicality aspects based on the assessments used by users
namely understandable for user, implementable in the field, relevant with the TPE
program, also effective and efficient in the usage.

Keywords: TPE Assessment, Partial Scoring, Holistic Scoring

iii
LEMBAR PENGESAHAN

MODEL PENILAIAN PENDIDIKAN PROFESI GURU (PPG)


DENGAI{ PENSKORAN PARSIAL DAN EOLISTIK

LIAN G. OTAYA
NIIM: l670t}6tffi2

Dipertahankan di depan Dewan penguji Disertasi


Program Pascasarjana Universitas Negeri yogyakarta
Tanggal: 13lanuan2020

DEWAN PENGUJI

Dr. Sugito, M.A.


(Ketua/Penguji)

Dr. Supnhar, M.Si.


(Sekretaris/Penguji)
6/z r zo2o
Prof. Dn Badrun Kartowagiran.

f= o.u
.
(PembimbingUtama/PenguJ| €

Prof. Dr. Heri Retr*weti, M,Pd.


(Pembimbing8enguji)
lt 12 / zozo
Prof. Zamroni, Ph.I).
(Penguji Utama) 7-v/\^- re{,')-,JLu,

Prof. Sulistyo Saputro, M.Si., Ph.I)


(Penguji Utama) li/l: w)a

,y''.usrDtKAnl Pascasa{ana
4
/"*'-"r--"ffi
8" liil:A4

195707191
KATA PENGANTAR

Memanjatkan puji dan syukur ke hadirat Allah swt., atas berkat limpahan

rahmat, taufiq, hidayah, dan inayah-Nya, sehingga disertasi ini dapat diselesaikan.

Disertasi ini bertujuan mengembangkan model penilaian Pendidikan Profesi Guru

(PPG) dengan peskoran parsial dan holistik.

Penyelesaian disertasi ini tidak terlepas dari bantuan dan dukungan dari

berbagai pihak. Dalam kesempatan ini, penulis menyampaikan ucapan terima

kasih yang tak terhingga kepada Bapak Prof. Dr. Badrun Kartowagiran, M.Pd.,

dan Ibu Prof. Dr. Heri Retnawati, M.Pd., selaku tim promotor dalam penyusunan

disertasi ini, yang dengan tulus hati telah memberikan bimbingan, arahan ataupun

masukan mulai dari pengajuan judul, penulisan proposal sampai dengan akhir

penyelesaian disertasi ini. Bimbingan, arahan dan masukan-masukan yang

membangun dan motivasi terus-menerus disertai dengan dukungan yang sangat

berharga telah memotivasi penulis menyelesaikan disertasi ini, sehingga secara

tulus dan penuh hormat penulis sampaikan ucapan terima kasih dan penghargaan

yang setinggi-tingginya teriring doa semoga kebaikan-kebaikannya selama

membimbing penulis mendapatkan balasan dari Allah swt. Selain itu penulis

menyampaikan ucapan terima kasih kepada:

1. Prof. Dr. Marsigit, MA., selaku Direktur Pascasarjana Universitas Negeri

Yogyakarta yang telah memberikan pengarahan, dorongan, masukan sehingga

disertasi ini dapat selesai.

2. Prof. Dr. Margana, M.Hum, M.A., selaku Wakil Rektor I sekaligus sebagai

penanggung jawab Program PPG di LPTK Universitas Negeri Yogyakarta


v
yang telah memberikan izin dan kemudahan dalam melakukan penelitian

disertasi.

3. Prof. Dr. Anik Ghufron, M.Pd., selaku Ketua LPPMP Universitas Negeri

Yogyakarta yang telah mengizinkan melakukan penelitian di P4TKN LPPMP

UNY.

4. Drs. Suyud, M.Pd., selaku Kepala P4TKN Universitas Negeri Yogyakarta,

Dr. Jusna Ahmad, M.Si., selaku Direktur PPG Universitas Negeri Gorontalo,

Dr. H. Muhammad Amri, Lc, M.Ag., selaku Dekan Fakultas Tarbiyah dan

Keguruan Universitas Islam Negeri Makassar sekaligus penanggung jawab

PPG yang telah memberikan izin dan kemudahan dalam melakukan penelitian

disertasi.

5. Kementerian Agama RI pada Direktorat Jenderal Pendidikan Islam yang telah

memberikan penulis kesempatan sebagai penerima Program Beasiswa 5000

Doktor Kementerian Agama RI Tahun 2016 pada Program Studi Penelitian

dan Evaluasi Pendidikan Pascasarjana Universitas Negeri Yogyakarta.

6. Dr. Lahaji, M.Ag., selaku Rektor IAIN Sultan Amai Gorontalo yang telah

memberikan kesempatan sangat berharga kepada penulis dapat melanjutkan

studi Program Doktor. Untuk semua bantuan, dorongan dan motivasi yang

diberikan penulis ucapkan terima kasih yang mendalam.

7. Prof. Dr. H. Kasim Yahiji, M.Ag, selaku Direktur Pascasarjana IAIN Sultan

Amai Gorontalo. Dukungan dan bantuan yang diberikan sangat bernilai dan

sulit terbalaskan.

vi
8. Dr. Lukman Arsyad, M.Pd., selaku Dekan Fakultas Ilmu Tarbiyah dan

Keguruan IAIN Sultan Amai Gorontalo, yang telah memfasilitasi dan

memberi dorongan moril kepada penulis mengikuti program doktor.

9. Dosen dan guru pamong/penguji UKIN yang telah bersedia sebagai subjek

penelitian dalam penelitian disertasi ini.

10. Segenap teman-teman mahasiswa Program Studi Penelitian dan Evaluasi

Pendidikan Pascasarjana Universitas Negeri Yogyakarta angkatan 2016 yang

memberikan dorongan untuk penulisan disertasi ini bisa terwujud.

11. Segenap teman-teman mahasiswa penerima Program beasiswa 5000 Doktor

Kementerian Agama R.I tahun 2016 Program Studi Penelitian dan Evaluasi

Pendidikan Pascasarjana Universitas Negeri Yogyakarta.

12. Segenap keluarga besar yang telah memberikan dukungan, motivasi, doa

restu dan senantiasa mendoakan keberhasilan penulis menyelesaikan program

doktor ini, serta tak lupa kolega-kolega lainnya yang tidak mungkin

disebutkan namanya satu persatu.

Semoga amal kebaikan bapak/ibu, teman-teman semua, dan terutama

keluarga mendapatkan pahala yang berlipat ganda dari Allah swt. Akhirnya

penulis berharap disertasi ini dapat memberi inspirasi, menjadi referensi dan

bermanfaat dalam pengembangan ilmu pengetahuan pada dunia akademik dan

masyarakat di masa kini dan masa datang.

Yogyakarta, Juli 2019


Lian G. Otaya

vii
PERI{YATAAN KEASLIAN

Yang bertanda tangan di bawah ini:

Nama Mahasiswa : Lian G. Otaya

Nomor Mahasiswa : 16701261002

Program Studi : Penelitian dan Evaluasi Pendidikan

Dengan ini menyatakan bahwa disertasi ini merupakan hasil karya saya sendiri

dan belum pernah diajukan untuk memperoleh gelar doktor di suatu perguuan

tinggi, dan sepanjang pengetahuan saya dalam disertasi ini tidak terdapat karya

atau pendapat yang pemah ditulis atau diterbitkan oleh orang lain kecuali yang

secara tertulis diacu dalam naskah ini dan disebutkan dalaln daftar pustaka.

Yogyakarta, Juli 2019


Yang Mernbuat Pemyataan,

Lian G. Otaya.
NIM. 1670t261002

vlll
DAFTAR ISI

HALAMAN JUDUL ............................................................................................ i

ABSTRAK .......................................................................................................... ii

ABSTRACT ....................................................................................................... iii

LEMBAR PENGESAHAN ................................................................................. iv

KATA PENGANTAR ......................................................................................... v

PERNYATAAN KEASLIAN ........................................................................... viii

DAFTAR ISI ...................................................................................................... ix

DAFTAR TABEL ............................................................................................. xii

DAFTAR GAMBAR ........................................................................................ xvi

DAFTAR LAMPIRAN ................................................................................... xxiii

BAB I PENDAHULUAN .................................................................................... 1

A. Latar Belakang Masalah .................................................................... 1

B. Identifikasi Masalah......................................................................... 19

C. Pembatasan Masalah ........................................................................ 20

D. Rumusan Masalah............................................................................ 22

E. Tujuan Pengembangan ..................................................................... 23

F. Manfaat Pengembangan ................................................................... 24

G. Asumsi Pengembangan .................................................................... 25

H. Spesifikasi Produk yang Dikembangkan .......................................... 26

BAB II KAJIAN PUSTAKA ............................................................................. 28

A. Kajian Teori..................................................................................... 28

1. Pendidikan Profesi Guru (PPG) ................................................. 28

ix
2. Sistem dan Prinsip Pembelajaran Pendidikan Profesi Guru ........ 35

3. Standar Pendidikan Profesi Guru (PPG) .................................... 43

4. Sistem Penilaian Pendidikan Profesi Guru (PPG) ...................... 53

5. Performance Assessment ........................................................... 82

6. Penskoran Parsial, Holistik dan Perbandingannya ...................... 86

7. Teori Respons Butir dan Penerapannya ................................... 101

B. Kajian Penelitian yang Relevan ..................................................... 138

C. Kerangka Pikir ............................................................................... 145

D. Pertanyaan Penelitian..................................................................... 148

BAB III METODE PENELITIAN ................................................................... 149

A. Model Pengembangan .................................................................... 149

B. Prosedur Pengembangan ................................................................ 152

C. Desain Uji Coba Produk ................................................................ 155

1. Desain Uji Coba ...................................................................... 155

2. Subjek Uji Coba ...................................................................... 160

3. Teknik dan Instrumen Pengumpulan Data ............................... 166

4. Teknik Analisis Data ............................................................... 167

BAB IV HASIL PENELITIAN DAN PENGEMBANGAN ............................. 173

A. Hasil Pengembangan Produk Awal ................................................ 173

B. Hasil Ujicoba Produk ..................................................................... 188

C. Revisi Produk ................................................................................ 269

x
D. Kajian Produk Akhir ...................................................................... 369

E. Keterbatasan Penelitian .................................................................. 422

BAB V SIMPULAN DAN SARAN ................................................................. 428

A. Simpulan tentang Produk ............................................................... 426

B. Saran Pemanfaatan Produk ............................................................ 428

C. Diseminasi dan Pengembangan Produk Lebih Lanjut ..................... 429

DAFTAR PUSTAKA ...................................................................................... 431

xi
DAFTAR TABEL

Hal
Tabel 1. Kelompok Mata Kegiatan PPG Prajabatan .................................. 50
Tabel 2. Kelompok Mata Kegiatan PPG Daljab ........................................ 51
Tabel 3. Bobot Penilaian Akhir PPL ......................................................... 56
Tabel 4. Rambu-Rambu Ujian Tulis LPTK (UTL) .................................... 57
Tabel 5. Kompetensi Pedagagik, Subkompetensi, dan Indikatornya .......... 66
Tabel 6. Kompetensi Profesional, Subkompetensi, dan Indikatornya......... 70
Tabel 7. Kompetensi Kepribadian, Subkompetensi, dan Indikatornya ....... 76
Tabel 8. Kompetensi Sosial, Subkompetensi, dan Indikatornya ................. 80
Tabel 9. Subjek Uji Coba .......................................................................... 163
Tabel 10. Pengkategorian Validitas Isi Instrumen Penilaian RPP ................ 182
Tabel 11. Pengkategorian Validitas Isi Instrumen Penilaian PP ................... 184
Tabel 12. Pengkategorian Validitas Isi Instrumen Penilaian KSKK ............ 185
Tabel 13. Pengkategorian Validitas Isi Panduan Model Penilaian PPG ....... 187
Tabel 14. Hasil Estimasi Reliabilitas dengan Inter-Rater............................. 188
Tabel 15. Muatan Faktor Variabel Observasi pada Instrumen Penilaian
RPP Penskoran Parsial untuk Penilai Dosen ................................ 205
Tabel 16. Muatan Faktor Variabel Observasi pada Instrumen Penilaian
RPP Penskoran Parsial Penilai Guru pamong/penguji
UKIN .......................................................................................... 207
Tabel 17. Muatan Faktor Variabel Observasi pada Instrumen Penilaian
RPP Penskoran Holistik untuk Penilai Dosen .............................. 208
Tabel 18. Muatan Faktor Variabel Observasi pada Instrumen Penilaian
RPP Penskoran Holistik Penilai Guru pamong/penguji
UKIN .......................................................................................... 209
Tabel 19. Muatan Faktor Variabel Observasi pada Instrumen Penilaian
Pelaksanaan Pembelajaran (PP) Penskoran Parsial Penilai
Dosen ......................................................................................... 211
Tabel 20. Muatan Faktor Variabel Observasi pada Instrumen Penilaian
Pelaksanaan Pembelajaran (PP) Penskoran Parsial Penilai
Guru pamong/penguji UKIN ....................................................... 212
Tabel 21. Muatan Faktor Variabel Observasi pada Instrumen Penilaian
Pelaksanaan Pembelajaran (PP) Penskoran Holistik Penilai
Dosen ......................................................................................... 213

xii
Tabel 22. Muatan Faktor Variabel Observasi pada Instrumen Penilaian
Pelaksanaan Pembelajaran (PP) Penskoran Holistik Penilai
Guru pamong/penguji UKIN ....................................................... 214
Tabel 23. Muatan Faktor Variabel Observasi pada Instrumen Penilaian
Kompetensi Sosial dan Kompetensi Kepribadian Penskoran
Parsial Penilai Dosen .................................................................. 216
Tabel 24. Muatan Faktor Variabel Observasi pada Instrumen Penilaian
Kompetensi Sosial dan Kompetensi Kepribadian Penskoran
Parsial Penilai Guru pamong/penguji UKIN ................................ 217
Tabel 25. Muatan Faktor Variabel Observasi pada Instrumen Penilaian
KSKK Penskoran Holistik untuk Penilai Dosen .......................... 218
Tabel 26. Muatan Faktor Variabel Observasi pada Instrumen Penilaian
Kompetensi Sosial dan Kompetensi Kepribadian Penskoran
Holistik untuk Penilai Guru pamong/penguji UKIN .................... 219
Tabel 27. Hasil Analisis Karakteristik Item Instrumen Penilaian RPP
Penskoran Pasial untuk Penilai Dosen ......................................... 221
Tabel 28. Hasil Analisis Karakteristik Item Instrumen Penilaian RPP
Penskoran Pasial Penilai Guru pamong/penguji UKIN ................ 226
Tabel 29. Hasil Analisis Karakteristik Item Instrumen Penilaian RPP
Penskoran Holistik Penilai Dosen................................................ 230
Tabel 30. Hasil Analisis Karakteristik Item Instrumen Penilaian RPP
Penskoran Holistik Penilai Guru pamong/penguji UKIN ............. 234
Tabel 31. Hasil Analisis Karakteristik Item Instrumen Penilaian
Pelaksanaan Pembelajaran (PP) Penskoran Pasial Penilai
Dosen ......................................................................................... 238
Tabel 32. Hasil Analisis Karakteristik Item Instrumen Penilaian
Pelaksanaan Pembelajaran (PP) Penskoran Pasial Penilai
Guru pamong/penguji UKIN ....................................................... 242
Tabel 33. Hasil Analisis Karakteristik Item Instrumen Penilaian
Pelaksanaan Pembelajaran Penskoran Holistik Penilai
Dosen ......................................................................................... 246
Tabel 34. Hasil Analisis Karakteristik Item Instrumen Penilaian
Pelaksanaan Pembelajaran Penskoran Holistik Penilai
Guru pamong/penguji UKIN ....................................................... 250
Tabel 35. Hasil Analisis Karakteristik Item Instrumen Penilaian
Kompetensi Sosial dan Kompetensi Kepribadian (KSKK)
Penskoran Pasial Penilai Dosen ................................................... 254

xiii
Tabel 36. Hasil Analisis Karakteristik Item Instrumen Penilaian
Kompetensi Sosial dan Kompetensi Kepribadian Penskoran
Pasial Penilai Guru pamong/penguji UKIN ................................. 258
Tabel 37. Hasil Analisis Karakteristik Item Instrumen Penilaian
Kompetensi Sosial dan Kompetensi Kepribadian (KSKK)
Pembelajaran Penskoran Holistik Penilai Dosen .......................... 262
Tabel 38. Hasil Analisis Karakteristik Item Instrumen Penilaian
Kompetensi Sosial dan Kompetensi Kepribadian Penskoran
Holistik Penilai Guru pamong/penguji UKIN .............................. 266
Tabel 39. Muatan Faktor Variabel Observasi pada Instrumen Penilaian
RPP Penskoran Parsial untuk Penilai Dosen pada Uji Coba II ..... 290
Tabel 40. Muatan Faktor Variabel Observasi pada Instrumen Penilaian
RPP Penskoran Parsial untuk Penilai Guru pamong/penguji
UKIN pada Uji Coba II ............................................................... 292
Tabel 41. Muatan Faktor Variabel Observasi pada Instrumen Penilaian
RPP Penskoran Holistik untuk Penilai Dosen pada Uji Coba II ... 293
Tabel 42. Muatan Faktor Variabel Observasi pada Instrumen Penilaian
RPP Penskoran Holistik Penilai Guru pamong/penguji UKIN
pada Uji Coba II.......................................................................... 295
Tabel 43. Muatan Faktor Variabel Observasi pada Instrumen
Penilaian Pelaksanaan Pembelajaran (PP) Penskoran Parsial
untuk Penilai Dosen pada Uji Coba II ......................................... 297
Tabel 44. Muatan Faktor Variabel Observasi pada Instrumen Penilaian
Pelaksanaan Pembelajaran (PP) Penskoran Parsial Penilai
Guru pamong/penguji UKIN pada Uji Coba II ............................ 298
Tabel 45. Muatan Faktor Variabel Observasi pada Instrumen Penilaian
Pelaksanaan Pembelajaran (PP) Penskoran Holistik Penilai
Dosen pada Uji Coba II ............................................................... 300
Tabel 46. Muatan Faktor Variabel Observasi pada Instrumen Penilaian
Pelaksanaan Pembelajaran (PP) Penskoran Holistik untuk Penilai
Guru pamong/penguji UKIN pada Uji Coba II ............................ 301
Tabel 47. Muatan Faktor Variabel Observasi pada Instrumen Penilaian
Kompetensi Sosial dan Kompetensi Kepribadian Penskoran
Parsial untuk Penilai Dosen pada Uji Coba II .............................. 303
Tabel 48. Muatan Faktor Variabel Observasi pada Instrumen Penilaian
Kompetensi Sosial dan Kompetensi Kepribadian Penskoran
Parsial untuk Penilai Guru pamong/penguji UKIN ...................... 305
Tabel 49. Muatan Faktor Variabel Observasi pada Instrumen Penilaian
Kompetensi Sosial dan Kompetensi Kepribadian Penskoran
Holistik Penilai Dosen ................................................................ 306

xiv
Tabel 50. Muatan Faktor Variabel Observasi pada Instrumen Penilaian
Kompetensi Sosial dan Kompetensi Kepribadian Penskoran
Holistik Penilai Guru pamong/penguji UKIN .............................. 308
Tabel 51. Hasil Analisis Karakteristik Item Instrumen Penilaian
RPP Penskoran Parsial untuk Penilai Dosen ............................... 310
Tabel 52. Hasil Analisis Karakteristik Item Instrumen Penilaian
RPP Penskoran Pasial untuk Penilai Guru pamong/penguji UKIN 317
Tabel 53. Hasil Analisis Karakteristik Item Instrumen Penilaian RPP
Penskoran Holistik untuk Penilai Dosen ...................................... 320
Tabel 54. Hasil Analisis Karakteristik Item Instrumen Penilaian RPP
Penskoran Holistik untuk Penilai Guru pamong/penguji UKIN .... 324
Tabel 55. Hasil Analisis Karakteristik Item Instrumen Penilaian
Pelaksanaan Pembelajaran (PP) Penskoran Pasial untuk Penilai
Dosen ......................................................................................... 230
Tabel 56. Hasil Analisis Karakteristik Item Instrumen Penilaian Pelaksanaan
Pembelajaran (PP) Penskoran Pasial untuk Penilai Guru pamong/
penguji UKIN ............................................................................. 335
Tabel 57. Hasil Analisis Karakteristik Item Instrumen Penilaian
Pelaksanaan Pembelajaran Penskoran Holistik untuk Penilai
Dosen ......................................................................................... 344
Tabel 58. Hasil Analisis Karakteristik Item Instrumen Penilaian
Pelaksanaan Pembelajaran Penskoran Holistik Penilai Guru
pamong/penguji UKIN ................................................................ 350
Tabel 59. Hasil Analisis Karakteristik Item Instrumen Penilaian Kompetensi
Sosial dan Kompetensi Kepribadian (KSKK) Penskoran Pasial
Penilai Dosen .............................................................................. 353
Tabel 60. Hasil Analisis Karakteristik Item Instrumen Penilaian
Kompetensi Sosial dan Kompetensi Kepribadian (KSKK)
Pembelajaran Penskoran Holistik untuk Penilai Dosen ................ 360
Tabel 61. Hasil Analisis Karakteristik Item Instrumen Penilaian
Kompetensi Sosial dan Kompetensi Kepribadian Penskoran
Holistik untuk Penilai Guru pamong/penguji UKIN .................... 360
Tabel 62. Perbandingan Akurasi Model Penilaian dengan Penskoran
Parsial dengan Model Penilaian dengan Penskoran Holistik ........ 402

xv
DAFTAR GAMBAR

Hal
Gambar 1. Proses Penyelenggaraan PPG ................................................. 48
Gambar 2. Mata Kegiatan PPG Prajabatan ............................................... 49
Gambar 3. Mata Kegiatan PPG Dalam Jabatan ........................................ 50
Gambar 4. Teknik Penilaian Kualitas Proses dan Hasil Belajar PPG ........ 57
Gambar 5. Domain Model Penilaian Guru .............................................. 85
Gambar 6. Contoh Kurva Karakteristik Butir Model Logistik 1 Parameter 110
Gambar 7. Kurva Karakteristik Butir Untuk Model Logistik 2 Parameter 112
Gambar 8. Kurva Karakteristik Butir Untuk Model Logistik 3 Parameter 113
Gambar 9. Operating Characteristic Curves (OCF) untuk lima kategori .. 123
Gambar 10. Category Response Curves (CRF) untuk lima kategori ........... 123
Gambar 11. Fungsi Informasi .................................................................... 125
Gambar 12. Grafik fungsi informasi tes ..................................................... 130
Gambar 13. Fungsi informasi tes ............................................................... 133
Gambar 14. Grafik CRF untuk 2 kategori .................................................. 135
Gambar 15. Grafik CRF untuk 3 kategori .................................................. 135
Gambar 16. Grafik CRF untuk 4 kategori .................................................. 135
Gambar 17. Grafik CRF untuk 5 kategori .................................................. 135
Gambar 18. Hubungan timbal balik antara NIF dengan SEM ..................... 137
Gambar 19. Kerangka Pikir ....................................................................... 147
Gambar 20. Alur Pengembangan Model R & D ......................................... 150
Gambar 21. Prosedur Pengembangan Model Penilaian PPG ...................... 154
Gambar 22. Konstruk Penilaian Rencana Pelaksanaan Pembelajaran (RPP) 175
Gambar 23. Konstruk Penilaian Pelaksanaan Pembelajaran (PP)................ 178
Gambar 24. Konstruk Penilaian Kompetensi Sosial Kepribadian (KSKK) . 180
Gambar 25. Kurva Karakteristik Item 10 dari Instrumen Penilaian RPP
Penskoran Parsial untuk Penilai Dosen ................................... 223
Gambar 26. Fungsi Informasi Instrumen RPP Penskoran Parsial Penilai
Dosen ..................................................................................... 224
Gambar 27. Hubungan timbal balik antara NIF dengan SEM Instrumen
Penilaian RPP Penskoran Parsial Penilai Dosen ...................... 225

xvi
Gambar 28. Kurva Karakteristik Item 20 dari Instrumen Penilaian RPP
Penskoran Parsial untuk Penilai Guru pamong/penguji UKIN . 227
Gambar 29. Fungsi Informasi Instrumen RPP Penskoran Parsial Penilai
Guru Pamong/Penguji UKIN .................................................. 228
Gambar 30. Hubungan timbal balik antara NIF dengan SEM Instrumen
Penilaian RPP Penskoran Parsial Penilai Guru pamong/
penguji UKIN ......................................................................... 229
Gambar 31. Kurva Karakteristik Item 23 dari Instrumen Penilaian RPP
Penskoran Holistik untuk Penilai Dosen ................................. 231
Gambar 32. Fungsi Informasi Instrumen RPP Penskoran Holistik Penilai
Dosen ..................................................................................... 232
Gambar 33. Hubungan timbal balik antara NIF dengan SEM Instrumen
Penilaian RPP Penskoran Holistik untuk Penilai Dosen .......... 233
Gambar 34. Kurva Karakteristik Item 21 dari Instrumen Penilaian RPP
Penskoran Holistik untuk Penilai Guru pamong/penguji UKIN 235
Gambar 35. Fungsi Informasi Instrumen RPP Penskoran Holistik Penilai
Guru Pamong/Penguji UKIN .................................................. 236
Gambar 36. Hubungan timbal balik antara NIF dengan SEM Instrumen
Penilaian RPP Penskoran Holistik untuk Guru pamong/
penguji UKIN ......................................................................... 237
Gambar 37. Kurva Karakteristik Item 4 dari Instrumen Penilaian
Pelaksanaan Pembelajaran Penskoran Parsial untuk Penilai
Dosen ..................................................................................... 239
Gambar 38. Fungsi Informasi Instrumen PP Penskoran Parsial Penilai
Dosen ..................................................................................... 240
Gambar 39. Hubungan timbal balik antara NIF dengan SEM Instrumen
Penilaian Pelaksanaan Pembelajaran (PP) Penskoran Parsial
untuk Penilai Dosen ................................................................ 241
Gambar 40. Kurva Karakteristik Item 15 dari Instrumen Penilaian
Pelaksanaan Pembelajaran (PP) Penskoran Parsial untuk
Penilai Guru pamong/penguji UKIN ....................................... 243
Gambar 41. Fungsi Informasi Instrumen Pelaksanaan Pembelajaran
Penskoran Parsial Penilai Guru Pamong/Penguji UKIN .......... 244
Gambar 42. Hubungan timbal balik antara NIF dengan SEM Instrumen
Penilaian Pelaksanaan Pembelajaran Penskoran Parsial untuk
Penilai Guru pamong/penguji UKIN ....................................... 245
Gambar 43. Kurva Karakteristik Item 10 dari Instrumen Penilaian
Pelaksanaan Pembelajaran (PP) Penskoran Holistik Penilai
Dosen ..................................................................................... 247
xvii
Gambar 44. Fungsi Informasi Instrumen RPP Penskoran Holistik Penilai
Guru Pamong/Penguji UKIN .................................................. 248
Gambar 45. Hubungan timbal balik antara NIF dengan SEM Instrumen
Instrumen Pelaksanaan Pembelajaran (PP) Penskoran
Holistik Penilai Dosen ............................................................ 249
Gambar 46. Kurva Karakteristik Item 2 dari Instrumen Penilaian
Pelaksanaan Pembelajaran (PP) Penskoran Holistik untuk
Penilai Guru pamong/penguji UKIN ....................................... 251
Gambar 47. Fungsi Informasi Instrumen Pelaksanaan Pembelajaran
Penskoran Holistik Penilai Guru Pamong/Penguji UKIN ........ 252
Gambar 48. Hubungan timbal balik antara NIF dengan SEM Instrumen
Pelaksanaan Pembelajaran (PP) Penskoran Holistik Penilai
Guru pamong/penguji UKIN .................................................. 253
Gambar 49. Kurva Karakteristik Item 17 dari Instrumen Penilaian
Kompetensi Sosial dan Kompetensi Kepribadian (KSKK)
Penskoran Parsial Penilai Dosen ............................................. 255
Gambar 50. Fungsi Informasi Instrumen KSKK Penskoran Parsial Penilai
Dosen ..................................................................................... 256
Gambar 51. Hubungan timbal balik antara NIF dengan SEM Instrumen
Penilaian Kompetensi Sosial dan Kompetensi Kepribadian
(KSKK) Penskoran Parsial Penilai Dosen ............................... 257
Gambar 52. Kurva Karakteristik Item 11 dari Instrumen Penilaian
KSKK Penskoran Parsial untuk Penilai Guru pamong/penguji
UKIN ..................................................................................... 259
Gambar 53. Fungsi Informasi Instrumen KSKK Penskoran Parsial Penilai
Guru pamong/penguji UKIN .................................................. 260
Gambar 54. Hubungan timbal balik antara NIF dengan SEM Instrumen
Penilaian KSKK Penskoran Parsial untuk Penilai
Guru pamong/penguji UKIN .................................................. 261
Gambar 55. Kurva Karakteristik Item 9 dari Instrumen Penilaian KSKK
Penskoran Holistik untuk Penilai Dosen ................................. 263
Gambar 56. Fungsi Informasi Instrumen KSKK Penskoran Holistik Penilai
Dosen ..................................................................................... 264
Gambar 57. Hubungan timbal balik antara NIF dengan SEM Instrumen
Penilaian KSKK Penskoran Holistik untuk Penilai Dosen....... 265
Gambar 58. Kurva Karakteristik Item 5 dari Instrumen Penilaian
KSKK Penskoran Holistik untuk Penilai Guru pamong/
penguji UKIN ......................................................................... 267
xviii
Gambar 59. Fungsi Informasi Instrumen KSKK Penskoran Holistik
Penilai Guru Pamong/Penguji UKIN ...................................... 268
Gambar 60. Hubungan timbal balik antara NIF dengan SEM Instrumen
Penilaian KSKK Penskoran Holistik untuk Penilai Guru
pamong/penguji UKIN .......................................................... 269
Gambar 61. Kurva Karakteristik Item 4 dari Instrumen Penilaian RPP
Penskoran Parsial untuk Penilai Dosen ................................... 312
Gambar 62. Fungsi Informasi Instrumen RPP Penskoran Parsial Penilai
Dosen ..................................................................................... 313
Gambar 63. Hubungan timbal balik antara NIF dengan SEM Instrumen
Penilaian RPP Penskoran Parsial untuk Penilai Dosen ............ 313
Gambar 64. Kurva Karakteristik Item 7 dari Instrumen Penilaian RPP
Penskoran Parsial untuk Penilai Guru pamong/penguji UKIN . 320
Gambar 65. Fungsi Informasi Instrumen RPP Penskoran Holistik Penilai
Guru Pamong/Penguji UKIN .................................................. 318
Gambar 66. Hubungan timbal balik antara NIF dengan SEM Instrumen
Penilaian RPP Penskoran Parsial untuk Penilai Guru pamong/
penguji UKIN ......................................................................... 318
Gambar 67. Kurva Karakteristik Item 14 dari Instrumen Penilaian RPP
Penskoran Holistik untuk Penilai Dosen ................................. 321
Gambar 68. Fungsi Informasi Instrumen RPP Penskoran Holistik Penilai
Dosen ..................................................................................... 322
Gambar 69. Hubungan timbal balik antara NIF dengan SEM Instrumen
Penilaian RPP Penskoran Holistik untuk Penilai Dosen .......... 323
Gambar 70. Kurva Karakteristik Item 2 dari Instrumen Penilaian RPP
Penskoran Holistik untuk Penilai Guru pamong/penguji UKIN 325
Gambar 71. Fungsi Informasi Instrumen RPP Penskoran Holistik Penilai
Guru Pamong/Penguji UKIN .................................................. 326
Gambar 72. Hubungan timbal balik antara NIF dengan SEM Instrumen
Penilaian RPP Penskoran Holistik untuk Penilai
Guru pamong/penguji UKIN .................................................. 327
Gambar 73. Kurva Karakteristik Item 15 dari Instrumen Penilaian
Pelaksanaan Pembelajaran Penskoran Parsial untuk Penilai
Dosen ..................................................................................... 331
Gambar 74. Fungsi Informasi Instrumen Pelaksanaan Pembelajaran
Penskoran Parsial Penilai Dosen ............................................. 332

xix
Gambar 75. Hubungan timbal balik antara NIF dengan SEM Instrumen
Penilaian Pelaksanaan Pembelajaran Penskoran Parsial untuk
Penilai Dosen ......................................................................... 333
Gambar 76. Kurva Karakteristik Item 10 dari Instrumen Penilaian
Pelaksanaan Pembelajaran (PP) Penskoran Parsial untuk
Penilai Guru pamong/penguji UKIN ....................................... 336
Gambar 77. Fungsi Informasi Instrumen RPP Penskoran Holistik Penilai
Guru Pamong/Penguji UKIN .................................................. 237
Gambar 78. Hubungan timbal balik antara NIF dengan SEM Instrumen
Penilaian Pelaksanaan Pembelajaran (PP) Penskoran Parsial
Penilai Guru pamong/penguji UKIN ....................................... 338
Gambar 79. Kurva Karakteristik Item 19 dari Instrumen Penilaian
Pelaksanaan Pembelajaran (PP) Penskoran Holistik Penilai
Dosen ..................................................................................... 341
Gambar 80. Fungsi Informasi Instrumen Pelaksanaan Pembelajaran
Penskoran Holistik Penilai Dosen ........................................... 342
Gambar 81. Hubungan timbal balik antara NIF dengan SEM Instrumen
Penilaian Pelaksanaan Pembelajaran (PP) Penskoran Holistik
Penilai Dosen ......................................................................... 343
Gambar 82. Kurva Karakteristik Item 8 dari Instrumen Penilaian
Pelaksanaan Pembelajaran (PP) Penskoran Holistik Penilai
Guru pamong/penguji UKIN .................................................. 345
Gambar 83. Fungsi Informasi Instrumen RPP Penskoran Holistik Penilai
Guru Pamong/Penguji UKIN .................................................. 346
Gambar 84. Hubungan timbal balik antara NIF dengan SEM Instrumen
Penilaian Pelaksanaan Pembelajaran (PP) Penskoran Holistik
Penilai Guru pamong/penguji UKIN ....................................... 347
Gambar 85. Kurva Karakteristik Item 7 dari Instrumen Penilaian
Kompetensi Sosial dan Kompetensi Kepribadian (KSKK)
Penskoran Parsial Penilai Dosen ............................................. 351
Gambar 86. Fungsi Informasi Instrumen Kompetensi Sosial dan
Kompetensi kepribadian Penskoran Parsial Penilai Dosen ...... 352
Gambar 87. Hubungan timbal balik antara NIF dengan SEM Instrumen
Penilaian Kompetensi Sosial dan Kompetensi Kepribadian
(KSKK) Penskoran Parsial Penilai Dosen ............................... 353
Gambar 88. Kurva Karakteristik Item 18 dari Instrumen Penilaian
Kompetensi Sosial dan Kompetensi Kepribadian (KSKK)
Penskoran Parsial Penilai Guru pamong/penguji UKIN .......... 356
Gambar 89. Fungsi Informasi Instrumen RPP Penskoran Holistik Penilai

xx
Guru Pamong/Penguji UKIN .................................................. 257
Gambar 90. Hubungan timbal balik antara NIF dengan SEM Instrumen
Penilaian Kompetensi Sosial dan Kompetensi Kepribadian
(KSKK) Penskoran Parsial Penilai Guru pamong/penguji
UKIN ..................................................................................... 358
Gambar 91. Kurva Karakteristik Item 16 dari Instrumen Penilaian
Kompetensi Sosial Kepribadian (KSKK) Penskoran Holistik
Penilai Dosen ......................................................................... 361
Gambar 92. Fungsi Informasi Instrumen Kompetensi Sosial dan
Kepribadian Penskoran Holistik Penilai Dosen ....................... 362
Gambar 93. Hubungan timbal balik antara NIF dengan SEM Instrumen
PenilaianKompetensi Sosial Kepribadian (KSKK)
Penskoran Holistik Penilai Dosen ........................................... 363
Gambar 94. Kurva Karakteristik Item 12 dari Instrumen Penilaian
Kompetensi Sosial Kepribadian Penskoran Holistik
Penilai Guru pamong/penguji UKIN ....................................... 365
Gambar 95. Fungsi Informasi Instrumen kompetensi sosial dan kompetensi
kepribadian Penskoran Holistik Penilai Guru Pamong/Penguji
UKIN ..................................................................................... 366
Gambar 96. Hubungan timbal balik antara NIF dengan SEM Instrumen
Penilaian Kompetensi Sosial Kepribadian Penskoran Holistik
Penilai Guru pamong/penguji UKIN ....................................... 367
Gambar 97. Hasil Penilaian Buku Panduan Model Penilaian PPG.............. 383
Gambar 98. Sebaran Daya Beda Item Instrumen Penilaian RPP ................. 395
Gambar 99. Sebaran Daya Beda Instrumen Penilaian Pelaksanaan
Pembelajaran .......................................................................... 396
Gambar 100. Sebaran Daya Beda Instrumen Kompetensi Sosial
Kepribadian ............................................................................ 397
Gambar 101. Fungsi Informasi Instrumen Model Penilaian PPG ................. 400
Gambar 102. Standard Error of Measurement Instrumen Model Penilaian .. 400
Gambar 103. Profil Kemampuan Menyusun RPP untuk Peserta LPTK UNY 405
Gambar 104. Profil Kemampuan Menyusun RPP untuk Peserta LPTK UNG 406
Gambar 105. Profil Kemampuan Menyusun RPP untuk Peserta LPTK
UINAM .................................................................................. 407
Gambar 106. Profil Kemampuan Pelaksanaan Pembelajaran Peserta LPTK
UNY ...................................................................................... 408

xxi
Gambar 107. Profil Kemampuan Pelaksanaan Pembelajaran Peserta LPTK
UNG ...................................................................................... 408
Gambar 108. Profil Kemampuan Pelaksanaan Pembelajaran Peserta LPTK
UINAM .................................................................................. 409
Gambar 109. Profil Kompetensi Sosial Kepribadian untuk Peserta LPTK
UNY ...................................................................................... 410
Gambar 110. Profil Kompetensi Sosial Kepribadian untuk Peserta LPTK
UNG ...................................................................................... 411
Gambar 111. Profil Kompetensi Sosial Kepribadian untuk Peserta LPTK
UINAM .................................................................................. 412
Gambar 112. Hasil Penilaian Kepraktisan Model Penilaian Oleh Pengguna . 419

xxii
DAFTAR LAMPIRAN

Hal
Lampiran 1. Kisi-Kisi Instrumen Penilaian PPG ....................................... 449
Lampiran 2. Hasil Penilaian Expert Judgement dan Pengujian Kecukupan
Sampel ................................................................................. 459
Lampiran 3. Hasil Pembuktian Validitas Konstruk Uji Coba I .................. 466
Lampiran 4. Hasil Estimasi Reliabilitas Uji Coba I................................... 478
Lampiran 5. Karakteristik Instrumen Penilaian PPG Uji Coba I ............... 490
Lampiran 6. Hasil Pembuktian Validitas Konstruk Uji Coba II ................ 542
Lampiran 7. Hasil Estimasi Reliabilitas Uji Coba II ................................. 554
Lampiran 8. Karakteristik Instrumen Penilaian PPG Uji Coba II .............. 566
Lampiran 9. Hasil Penilaian PPG ............................................................ 618
Lampiran 10. Instrumen Penilaian Kepraktisan Model Penilaian PPG
Dengan Penskoran Parsial Dan Holistik ............................... 644
Lampiran 11. Hasil Penilaian Kepraktisan Model Penilaian PPG
Dengan Penskoran Parsial Dan Holistik ............................... 645
Lampiran 12. Rekomendasi Izin Penelitian ............................................... 647

xxiii
BAB I

PENDAHULUAN

A. Latar Belakang Masalah

Pendidikan merupakan aktivitas kompleks melibatkan sejumlah komponen

yang saling berinteraksi ataupun interdepensi satu sama lain secara fungsional

dalam satu kesatuan yang terpadu sebagai komponen sentral. Komponen sentral

yang memengaruhi kualitas pendidikan yaitu guru, peserta didik dan tujuan

pendidikan. Terwujudnya tujuan pendidikan sangat tergantung dari segala bentuk

interaksi yang terjadi antara guru dan peserta didik, dan hal ini hanya menjadi

slogan atau pencitraan jika tidak didukung oleh kualitas guru.

Kualitas guru dipandang sebagai faktor paling berpengaruh terhadap

kualitas pendidikan. Banyak temuan menunjukkan baik buruknya kualitas

pendidikan sangat ditentukan oleh kualitas guru (Bahcivan & Cobern, 2016;

Gerritsen, Plug, & Webbink, 2017; Kartowagiran, 2012a; Le Cornu, 2016;

Retnawati, Apino, & Anazifa, 2018). Beberapa studi juga ditemukan bahwa ada

hubungan yang kuat antara apa yang dilakukan guru dengan pencapaian hasil

belajar peserta didik. Jika guru berkinerja tinggi, maka cenderung peserta

didiknya juga memiliki prestasi belajar yang tinggi, sehingga upaya meningkatkan

prestasi belajar peserta didik salah satunya melalui perbaikan kinerja guru (Fahmi,

Maulana, & Yusuf, 2011; Steinberg & Garrett, 2016; Stronge, 2018; Sulisworo,

Nasir, & Maryani, 2017; Suswantar & Retnawati, 2016). Oleh karena itu, penting

untuk memperbaiki faktor-faktor yang memengaruhi kualitas guru.

1
Kualitas guru hingga saat ini tetap menjadi perhatian global semua negara

di dunia dan menjadi isu-isu penting untuk terus diupayakan peningkatannya. Hal

ini tidak lepas dari kritik dan konsensus berbagai kalangan, baik pemerhati

pendidikan, peneliti dan pembuat kebijakan yang mempertanyakan kualitas guru

sesuai dengan standar yang diharapkan dan tentunya membutuhkan kesadaran diri

dari para guru untuk selalu mengembangkan kemampuannya menjadi seorang

guru yang berkualitas (Creemers, Kyriakides, & Antoniou, 2012; Gareis & Grant,

2014; Good, 2008; Goodwin, 2010; Rabadi-Raol, 2019; Zhu, Goodwin, & Zhang,

2017). Hal ini menunjukkan kualitas guru di berbagai negara termasuk Indonesia,

menjadi sebuah keniscayaan untuk ditingkatkan dalam mencapai kualitas

pembelajaran dan keberhasilan peserta didik dalam belajar.

Kualitas pembelajaran dan prestasi peserta didik di Indonesia berdasarkan

perkembangan terkini berada pada kondisi gawat darurat. Hal ini didukung oleh

data hasil pemetaan oleh Kemendikbud terhadap 40.000 sekolah pada tahun 2012

terdapat 75% sekolah di Indonesia tidak memenuhi standar layanan pendidikan,

hasil uji kompetensi guru tahun 2012 terhadap 460.000 guru hanya mencapai nilai

rata-rata 44,5 dari standar yang diharapkan pada nilai 70. Hasil pemetaan akses

dan mutu pendidikan pada tahun 2013 dan 2014 oleh The Learning Curve-

Pearson posisi Indonesia 10 negara berkinerja rendah. Hasil pemetaan mutu

pendidikan tinggi oleh 21 Universitas tahun 2013 Indonesia berada pada peringkat

49 dari 50 negara. Jika dilihat dari data hasil uji kompetensi guru tahun 2015

terhadap 2.430.427 guru di Indonesia secara nasional belum mencapai target yang

diharapkan dengan nilai rata-rata 55 yaitu hanya 53,05, yang diperoleh dari nilai

2
rata-rata kemampuan profesional 54,77 dan nilai rata-rata kompetensi pedagogik

49.84. Dari 34 Provinsi hanya ada 7 Provinsi yang mencapai nilai rata-rata

nasional, yaitu Provinsi D.I Yogyakarta (62,48), Jawa Tengah (59,10), DKI

Jakarta (58,44), Jawa Timur (56,73), Bali (56,13), Bangka Belitung (55,13), dan

Jawa Barat (55,05), rata-rata terendah hanya mencapai 41,96 untuk Provinsi di

luar Jawa (Baswedan, 2014; Bhakti & Maryani, 2017).

Permasalahan lain yang dihadapi adalah adanya disparitas antara kuantitas

dan kualitas guru di Indonesia. Hal ini dibuktikan dari beberapa hasil studi

menunjukkan: 1) terdapat ketidakmerataan distribusi guru terutama pada sekolah-

sekolah di daerah terpencil masih sangat kekurangan guru, 2) banyak guru yang

mengajar tidak sesuai dengan kualifikasi pendidikannya, 3) masih rendahnya

penguasaan kompetensi guru (Fahdini, Mulyadi, Suhandani, & Julia, 2014; Fahmi

et al., 2011; Krisna, 2017; Mangkunegara & Puspitasari, 2015). Permasalahan ini

juga berbanding lurus dengan hasil survei Program for international student

assessment (PISA) tahun 2015 yang diumumkan pada 6 Desember 2016,

Indonesia berada pada peringkat ke-64 dari 72 negara yang disurvei. Demikian

halnya hasil survey yang dilakukan Progress in International Reading Literacy

Study (PIRLS) dan Trend in International Mathematics and Science Study

(TIMMS) juga tidak menaikkan peringkat Indonesia. Bahkan setiap terjadi

penyimpangan moral di kalangan peserta didik, guru dianggap tidak profesional

dalam mendidik (Antoro, 2017: 9). Data ini menunjukkan permasalahan

pendidikan di Indonesia sangat fundamental dan urgen membutuhkan solusi

penanganan yang serius.

3
Solusi mengatasi permasalahan guru tersebut, tidak terlepas dari

peningkatan kualifikasi dan kompetensi yang dipersyaratkan secara utuh dan

terpadu sebagai guru profesional. Idealnya guru harus memiliki kualifikasi

akademik yang relevan dengan mata pelajaran yang diampunya dan memiliki

berbagai cara untuk memperkaya pengetahuannya tentang materi yang diajarkan.

Selain itu, guru harus memiliki kemampuan yang memadai untuk melakukan

transformasi pembelajaran dalam mencapai efektivitas pengajaran dan

meningkatkan keberhasilan peserta didik dalam belajar (Gerdeman, Garrett, &

Monahan, 2018; Kartowagiran, 2010; McDiarmid & Caprino, 2017; Vangrieken,

Meredith, Packer, & Kyndt, 2017). Artinya untuk menjadi seorang guru, penting

meningkatkan kualifikasi dan kompetensinya dengan melakukan berbagai inovasi

dan terobosan dalam pengembangan profesionalismenya secara terus-menerus.

Berbagai kebijakan telah diambil pemerintah Indonesia dalam

meningkatkan kualifikasi dan kompetensi guru. Salah satunya melalui Program

Pendidikan Profesi Guru (PPG) yang diyakini akan memperbaiki dan

meningkatkan kualitas guru/calon guru di Indonesia. Seiring pemantapan

kebijakan Program PPG tersebut, Pemerintah telah menetapkan berbagai

peraturan pendukung diantaranya melalui Peraturan Menteri Riset, Teknologi dan

Pendidikan Tinggi Republik Indonesia Nomor 55 tahun 2017 tentang Standar

Pendidikan Guru (Standardikgu) yang mengatur sertifikasi atau pemberian

sertifikat pendidik sebagai bukti formal pengakuan kepada guru menjadi tenaga

profesional melalui Program PPG. Sebagaimana disebutkan pada Bab I Pasal 1 (5)

bahwa: “Program Pendidikan Profesi Guru yang selanjutnya disebut program PPG

4
adalah program pendidikan yang diselenggarakan setelah program sarjana atau

sarjana terapan untuk mendapatkan sertifikat pendidik pada pendidikan anak usia

dini jalur pendidikan formal, pendidikan dasar, dan/atau pendidikan menengah”.

Hal ini mempertegas bahwa untuk menjadi seorang guru, lulusan sarjana wajib

mengikuti Program PPG dan jika dinyatakan lulus diberikan sertifikat pendidik.

Program PPG di Indonesia merupakan salah satu upaya pemerintah dalam

merespon berbagai permasalahan pendidikan secara nasional, seperti: 1) shortage,

adanya kekurangan jumlah guru khususnya di daerah terluar, terdepan, dan

tertinggal, 2) unbalanced distribution (distribusi tidak seimbang), 3) under

qualification (kualifikasi di bawah standar), 4) low competence atau guru-guru

yang kurang kompeten, serta 5) missmatched, ketidak sesuaian antara kualifikasi

pendidikan dengan bidang yang diampu (Kemenristekdikti, 2017, 2018b). Hal ini

juga didukung dengan beberapa pendapat yang menyatakan bahwa pendidikan

profesi bagi guru dapat membantu mereka menguasai materi dan mendukung

kesiapannya menjadi guru profesional (Gerdeman et al., 2018; Hotimah &

Suyanto, 2017; Robertson, 2017; Wahyudin, 2016). Dengan demikian untuk

menjadi guru profesional penting mengikuti Program PPG.

Program PPG dalam penyelenggaraannya terbagi menjadi dua bentuk yaitu

PPG prajabatan yang diselenggarakan untuk mempersiapkan lulusan S1

Kependidikan dan S1/DIV nonkependidikan yang memiliki bakat dan minat untuk

menjadi guru. Bentuk kedua adalah PPG dalam jabatan yang diselenggarakan

untuk guru pegawai negeri sipil dan guru bukan pegawai negeri sipil yang sudah

mengajar pada satuan pendidikan. Pada tahun 2018 mengembangkan

5
pembelajaran PPG menggunakan Hybrid Learning yang terdiri dari pembelajaran

tatap muka dan pembelajaran dalam jaringan (daring) melalui aplikasi

Brightspace pada PPG dalam jabatan mulai dari instruktur menyiapkan materi

perkuliahan, mengelola forum diskusi, melakukan video conference dengan

mahasiswa/peserta PPG, memberikan tugas dan tes hingga mengevaluasinya

(Kemenristekdikti, 2018a, 2018b; Pamungkas, Novalitasari, Setiani, & Yuhana,

2019). Hal ini mengindikasikan untuk memperoleh sertifikat pendidik bagi

lulusan S1/DIV kependidikan dan non kependidikan dapat memilih PPG

prajabatan dan bagi guru yang sudah mengajar dapat mengikuti PPG dalam

jabatan yang diselenggarakan oleh Rayon Lembaga Pendidikan Tenaga

Kependidikan (LPTK).

LPTK adalah perguruan tinggi yang diberi tugas oleh pemerintah untuk

menyelenggarakan Program PPG, baik itu di lingkungan Kementerian Riset

Teknologi dan Pendidikan Tinggi (Kemenristekdikti) maupun Kementerian

Agama. LPTK di lingkungan Kemenristekdikti yang menyelenggarakan program

studi PPG Prajabatan ada 45 Universitas dari 27 Provinsi dan untuk tahun 2017

LPTK penyelenggara Program PPG Prajabatan SM3T ada 23 universitas baik

negeri maupun swasta (Kemenristekdikti, 2017b). Khusus Provinsi Daerah

Istimewa (DI) Yogyakarta terdapat 4 LPTK yaitu Universitas Negeri Yogyakarta

(UNY), Universitas PGRI Yogyakarta, Universitas Sanata Dharma dan

Universitas Sarjanawiyata Tamansiswa. Dari keempat rayon LPTK tersebut,

LPTK UNY merupakan LPTK terbanyak pesertanya setiap tahun dengan 24

Program Studi diantaranya: Bimbingan Konseling, Pendidikan Guru Anak Usia

6
Dini (PAUD), Pendidikan Guru SD (PGSD), Pendidikan Luar Biasa, Bahasa

Indonesia, Bahasa Inggris, Pendidikan Kesejahteraan Keluarga, Pendidikan

Pancasila dan Kewarganegaraan, Pendidikan Jasmani, Kesehatan dan Olahraga

(PJKR), Pendidikan Sejarah, Ekonomi, Akuntansi, Sosiologi, Geografi, IPS, IPA,

Biologi, Fisika, Kimia, Teknik Mesin, Teknik Otomotif (P4TKN, 2018).

Penyelenggaraan PPG pada LPTK di lingkungan Kementerian Agama,

kebijakannnya dilaksanakan tahun 2012 dengan kewenangan menyelenggarakan

PPG dalam Jabatan untuk program studi mata pelajaran rumpun keagamaan pada

madrasah (Fikih/Usul Fikih, Akidah Akhlak, Qur’an Hadis, Sejarah Kebudayaan

Islam pada Madrasah Ibtidaiyah (MI), Madrasah Tsanawiyah (MTs) dan

Madrasah Aliyah (MA), guru mata pelajaran Bahasa Arab pada Madrasah dan

guru mata pelajaran Pendidikan Agama Islam di sekolah, namun terdapat

beberapa Perguruan Tinggi Keagamaan Islam Negeri (PTKAIN) diberi peluang

untuk mempersiapkan program studi PPG mata pelajaran umum. Berdasarkan

Surat Keputusan Direktur Jenderal Pendidikan Islam Nomor 1909/2012

ditetapkan 13 LPTK penyelenggara PPG yaitu: Universitas Islam Negeri (UIN)

Syarif Hidayatullah Jakarta, UIN Sunan Kalijaga Yogyakarta, UIN Syarif Kasim

Riau, UIN Sunan Gunung Djati Bandung, UIN Alauddin Makassar, UIN Sunan

Ampel Surabaya, UIN Ar-Raniry Aceh, Institut Agama Islam Negeri (IAIN)

Raden Fatah Palembang, IAIN Sumatera Utara, IAIN Walisongo Semarang yang

saat ini telah menjadi UIN Walisongo Semarang, IAIN Raden Intan Lampung,

IAIN Mataram yang saat ini telah menjadi UIN Mataram, dan Sekolah Tinggi

7
Agama Islam Negeri (STAIN) Jember yang saat ini telah menjadi IAIN Jember

(Fuadi, Sudjanto, & Kamaluddin, 2018; Kemenag, 2012).

Penyelenggaraan Program PPG di LPTK lingkungan Kemenristekdikti

maupun di lingkungan Kementerian Agama tersebut, mengacu pada struktur

kurikulum PPG yang dilaksanakan melalui lokakarya pengembangan perangkat

pembelajaran disertai dengan implementasi pembelajaran dalam bentuk peer

teaching dan dilanjutkan dengan praktik pengalaman lapangan (PPL) dan uji

kompetensi mahasiswa PPG (UKMPPG), substansi kurikulum PPG mengacu

pada tuntutan kompetensi guru, yakni kompetensi pedagogik, profesional,

kepribadian dan sosial (Fauzan & Bahrissalim, 2017; Pamungkas et al., 2019;

Prasojo, Wibowo, & Hastutiningsih, 2017). Dengan demikian penyelenggaraan

PPG di LPTK meliputi kegiatan perkuliahan teori dan praktik tatap muka atau

daring bagi PPG daljab, lokakarya perangkat pembelajaran, PPL dan UKMPPG.

Penyelenggaraan PPG di berbagai LPTK dipengaruhi oleh suatu sistem

penyelenggaraan yang keberhasilannya sangat tergantung pada berbagai

komponen sistem didalamnya, diantaranya sistem penerimaan peserta, kurikulum,

pembelajaran, penilaian, dan penjaminan mutu Program PPG. Berbagai penelitian

telah dilakukan terkait dengan penyelenggaraan PPG diantaranya penelitian di

LPTK UNY pada 255 mahasiswa kependidikan Fakultas Ekonomi UNY terdiri

dari angkatan 2012 dan 2013 ditemukan sebagian besar (50,20%) mahasiswa

ragu-ragu terhadap penerimaan/penyerapan mereka tentang Program PPG, begitu

pula dengan evaluasi atau penilaian mereka terhadap Program PPG sebanyak

48,23% menyatakan ragu-ragu (Indriyani & Ismandari, 2015). Hasil penilaian

8
peserta PPG SM-3T Prodi PPKN Unesa terhadap pelaksanaan Program PPG

tahun 2013 menunjukkan bahwa kemampuan peserta PPG dalam menyusun

perangkat evaluasi berada pada kategori kurang baik (Anita & Rahman, 2013).

Hasil penelitian terkait evaluasi program PPG Pendidikan Agama Islam di

UIN Sunan Kalijaga Yogyakarta tahun 2016 menunjukkan sebagian peserta PPG

mengeluhkan tentang padatnya kegiatan PPG dan juga banyaknya materi yang

harus dikuasai, tugas yang tidak terselesaikan tepat waktu, lamanya waktu jeda

antar kegiatan satu dengan kegiatan lainnya serta banyaknya laporan yang harus

dibuat oleh peserta PPG. Penelitian di LPTK Universitas Negeri Semarang pada

Program PPG SM3T guru geografi, ditemukan perbedaan bentuk perangkat

pembelajaran yang dipelajari saat workshop SSP dengan yang ada di lapangan,

terdapat beberapa peserta PPG yang harus menjalani ujian tulis nasional (UTN)

ulang karena nilainya dibawah standar yaitu 60 (Ningsih, Fatchan, & Susilo,

2016).

Berdasarkan hasil penelitian terkait analisis kesalahan perangkat

pembelajaran mahasiswa Program PPG Prodi Pendidikan Bahasa dan Sastra

Indonesia Universitas Sanata Dharma Yogyakarta tahun 2018 ditemukan ada

sejumlah kesalahan dalam penyusunan RPP mahasiswa PPG Prodi diantaranya: 1)

kurang cermatnya rumusan tujuan pembelajaran, 2) kurang paham dalam

menentukan jenis materi pembelajaran yang mengarah pada metakognitif, 3)

kurang bervariasinya bentuk penilaian yang disusun (Dewi, 2018). Namun

berdasarkan kajian tentang investigasi persepsi, interaksi dan capaian mahasiswa

PPG dalam jabatan pada platform pembelajaran Brightspace terhadap 29

9
mahasiswa Program Studi Matematika di Universitas Ageng Tirtayasa

menunjukkan capaian mahasiswa baik tugas akhir, nilai akhir dan forum diskusi

termasuk dalam kategori sangat baik, persepsi peserta PPG termasuk dalam

kategori baik (Pamungkas et al., 2019).

Hasil penelitian tahun 2018 oleh Research on Improving Systems of

Education (RISE) di Indonesia yang mengevaluasi dampak program PPG

Prajabatan Bersubsidi Pendidikan Guru Sekolah Dasar (PGSD) terhadap calon

guru melalui lokakarya dan PPL di LPTK Universitas Negeri Jakarta, Universitas

Pakuan Bogor, Universitas Negeri Surabaya, Universitas Sebelas Maret Solo,

Universitas Muhammdiyah Purwokerto, Universitas Muhammadiyah Malang,

Universitas Sanata Dharma ditemukakan 59% peserta PPG mampu menyiapkan

pertanyaan untuk peserta didik pada saat pengajaran di kelas, 60% mampu

menerapkan strategi pengajaran yang sesuai keragaman tingkat kemampuan

peserta didik, 60% mampu memberikan pengajaran, dan 89% mampu

menggunakan teknologi pendidikan dalam mengajar. Selain itu, ditemukan

peserta PPG pada pelaksanaan PPL yang mampu melakukan manajemen kelas

hanya 34%, menguasai metode mengajar 27%, menguasai karakteristik peserta

didik 26%, mampu menyesuaikan dengan kondisi sekolah 15%. Selanjutnya

terkait hasil temuan evaluasi terhadap uji kelulusan PPG dititikkan pada uji

pengetahuan yang belum merefleksikan apa yang peserta pelajari selama

pelaksanaan lokakarya, ujian belum diarahkan kepada penilaian kemampuan calon

guru dalam menguasai subjek specific pedagogy (SSP) atau pedagogical content

knowledge (PCK), padahal idealnya syarat kelulusan harus selaras dengan

10
penilaian poses pembelajaran pada program PPG. Sementara hasil evaluasi dari

persepsi peserta setelah mengikuti Program PPG ditemukan 33,7% peserta

mampu menguasai materi pelajaran, 13% mampu membuat instrumen penilaian,

39% mampu membuat media pembelajaran, 44,2% mampu membuat strategi

pengajaran. Oleh karena itu, disimpulkan hanya sebagian kecil peserta PPG yang

mengikuti survei mengakui bahwa program PPG meningkatkan penguasaan

mereka terhadap aspek-aspek yang dinilai tersebut, padahal aspek-aspek tersebut

merupakan indikator penilaian pada saat praktik mengajar di kelas (RISE, 2018).

Berbagai realitas hasil penelitian di atas, menunjukkan bahwa masih

banyak permasalahan-permasalahan yang muncul di lapangan terkait

penyelenggaraan program PPG di berbagai LPTK. Permasalahan-permasalahan

tersebut, semuanya mengerucut pada permasalahan bagaimana meningkatkan

capaian penguasaan kompetensi peserta PPG. Jika kemudian ternyata masih

banyak lulusan Program PPG yang belum memenuhi tuntuan kompetensi yang

dipersyaratkan, maka apakah model penilaian yang digunakan saat ini telah

mencakup komponen-komponen yang dapat menggambarkan pencapaian

kompetensi peserta PPG? Jawabannya, dibutuhkan penelitian dan pengembangan

terhadap model penilaian yang mampu menghasilkan seperangkat prosedur

penilaian capaian penguasaan kompetensi peserta PPG mulai dari pedoman

pengembangan instrumen-instrumennya, prosedur penggunaan instrumen-

instrumen tersebut dan cara pelaporan hasil-hasil penilaiannya.

Berkaitan dengan upaya tersebut, perlu ada model penilaian yang dapat

mengestimasi penguasaan kompetensi peserta PPG untuk pemerolehan hasil

11
penilaian yang objektif, akurat, konsisten dan tidak bias. Meskipun saat ini sudah

ada model penilaian PPG yang dikembangkan oleh Kemenristekdikti Dirjen

Belmawa. Terdapat beberapa alasan model penilaian PPG yang sudah ada perlu

dikembangkan, yaitu: Pertama, penilaian capaian penguasaan kompetensi peserta

PPG diestimasi dengan menggunakan skor mentah yaitu dengan menjumlah skor

setiap aspek menjadi total skor perolehan dibagi dengan skor maksimal, kemudian

hasil skor yang diperoleh peserta tersebut dibandingkan dengan batas kelulusan

(passing grade) capaian pembelajaran program PPG yang ditetapkan yaitu 76

(dengan kriteria Baik). Penilaian seperti ini bersifat relatif tidak mampu

membedakan peserta yang memiliki kemampuan tinggi, sedang maupun

kemampuan rendah berdasarkan komponen dari setiap aspek yang dinilai dan

penilaian seperti ini dalam teori pengukuran masih menggunakan pendekatan teori

klasik. Pendekatan teori ini memiliki keterbatasan diantaranya skor sebenarnya

sangat tergantung pada pengukuran yang dilaksanakan dan pengujiannya tidak

bisa dibandingkan, karena pendekatan penilaian dengan teori klasik memiliki

kesalahan pengukuran yang bersifat acak (tidak sistematis), dimana tidak ada

hubungan antara skor sebenarnya dengan skor kesalahan. Skor amatan dan skor

sebenarnya berubah-ubah bergantung pada tingkat kesulitan dan pembobotan,

sehingga keduanya sangat bergantung pada hasil dari karakteristik peserta yang

dinilai, dimana skor amatan adalah satu-satunya skor yang tampak sedangkan skor

sebenarnya dan skor kesalahan bersifat tersembunyi atau latent (Istiyono,

Mardapi, & Suparno, 2014a; Mardapi, 2017; Retnawati, 2011, 2016b; Sumintono

12
& Widhiarso, 2014). Hal ini menunjukkan penilaian yang ada belum dapat

meningkatkan akurasi pengukuran capaian kemampuan/kompetensi peserta PPG.

Alasan kedua, berdasarkan hasil penelaahan instrumen penilaian PPG yang

dikembangkan oleh Kemenristekdikti Dirjen Belmawa dalam menilai kemampuan

peserta PPG menyusun rencana pelaksanaan pembelajaran dan kemampuan

melaksanakan pembelajaran ditemukan masih terdapat indikator dari komponen

yang perlu dinilai sebagaimana dijabarkan dalam Buku Pedoman

Penyelenggaraan Program PPG Tahun 2018 diantaranya menerapkan prinsip

TPACK (Technological Pedagogical and Content Knowledge), mengingat

komponen tersebut penting untuk dinilai dalam pembelajaran di era revolusi

industri 4.0 saat ini. Selanjutnya untuk penilaian terkait penguasan kompetensi

sosial dan kepribadian dari instrumen penilaian yang sudah ada, menyatu dengan

instrumen penilaian pelaksanaan pembelajaran padahal capaian penguasaan

terhadap kompetensi tersebut harus dinilai secara terpisah berdasarkan komponen

dan indikator yang dinilai. Oleh karena itu, perlu dilakukan pengembangan

instrumen penilaian yang mampu mengambarkan penguasaan capaian kompetensi

peserta PPG secara menyeluruh.

Alasan ketiga, terkait dengan model penskoran yang digunakan.

Berdasarkan hasil Focus Discussion Group (FGD) dengan dosen dan guru

pamong/penguji UKIN, khususnya pada tiga LPTK yaitu LPTK Universitas

Negeri Yogyakarta, LPTK Universitas Negeri Gorontalo dan LPTK Universitas

Islam Negeri Alauddin Makassar diperoleh informasi adanya kecenderungan

penilai memberi skor pada angka 7, 8, dan 9 tanpa memperhatikan perbedaan skor

13
tersebut dari setiap tahapan komponen/aspek yang dinilai, padahal komponen

yang dinilai dalam mengukur capaian kompetensi peserta PPG memiliki

serangkaian tahapan dan skor seharusnya diberikan pada setiap tahapan tersebut.

Selanjutnya setiap kategori dari item yang dinilai pada instrumen menunjukkan

kecenderungan kemampuan peserta PPG benar dilangkah tertentu, namun salah

dilangkah lain. Hal ini terjadi, karena penskoran yang ada dalam instrumen

penilaian menggunakan skala semantik diferensial dari rentang skor 1 sampai 10

dengan 2 kategori sangat baik/tidak baik, sangat sesuai/tidak sesuai, sangat

lengkap/tidak lengkap, tampak/tidak tampak. Alasan keempat, belum ada buku

panduan penilaian yang disertai dengan rubrik yang rinci dan jelas terhadap

komponen dari indikator dan aspek yang dinilai. Padahal buku panduan ini, sangat

membantu penilai memiliki persepsi yang sama dalam melakukan penilaian agar

penguasaan kompetensi peserta PPG mampu diukur capaiannya secara maksimal.

Hasil analisis need assessment menunjukkan adanya kebutuhan yang

dirasakan penilai tentang pentingnya model penilaian PPG yang memuat

seperangkat prosedur dalam menilai penguasaan capaian kompetensi peserta PPG,

terutama pada penilaian kemampuan peserta PPG menyusun rencana pelaksanaan

pembelajaran dan melaksanakan pembelajaran yang termanifestasikan dalam

penguasaan kompetensi pedagogik dan penilaian terhadap capaian penguasaan

kompetensi sosial dan kepribadian berdasarkan komponen dan indikator yang

harus ternilai. Karena selama ini penilai kurang mampu mendeskripsikan

indikator capaian penguasaan kompetensi peserta PPG, diakibatkan kurangnya

informasi yang diperoleh terkait kekurangan capaian kemampuan peserta PPG

14
yang harus diperbaiki dan dikuasai dan tentunya hal ini berdampak pada

ketidakmampuan penilai melakukan pembinaan dan perbaikan terhadap

kekurangan-kekurangan yang dimiliki peserta PPG. Padahal menurut hasil

penelitian Ratnaningrum (2016); Yahya, Abdal, Setialaksana, & Putri (2019)

bahwa penilaian kompetensi peserta PPG memberikan informasi untuk

mengetahui tingkat kemampuan peserta yang difokuskan pada kelemahan-

kelemahan yang dimilikinya dalam menguasai standar kompetensi guru,

berdasarkan hasil penilaian juga dapat diketahui kemampuan rata-rata para peserta

PPG pada aspek mana yang perlu ditingkatkan dan siapa yang perlu mendapatkan

pembinaan secara kontinu, serta siapa yang telah mencapai standar kemampuan

minimal, karena tingkat ketercapaian dari keberhasilan program PPG, dapat

dilihat dari tinggi rendahnya prestasi yang diperoleh peserta PPG dan prestasi

tersebut dapat diketahui setelah diadakan evaluasi yang dinyatakan dalam bentuk

nilai pada setiap sub kompetensi, selain itu untuk mengidentifikasi kesulitan

belajar yang dialami peserta dengan mencari penyebab dan solusi pemecahannya.

Hal ini juga diperkuat oleh Selvi (2010); Kartowagiran (2010); Munadi,

Arlinwibowo, Wulandari, & Sulistyaningsih (2017); Mardapi (2017: 14-15)

bahwa penilaian harus mampu menggambarkan hasil belajar yang komprehensif,

memberikan informasi terhadap kekurangan-kekurangan dari peserta yang dinilai

dan menemukan penyebabnya, penyimpulan tingkat pencapaian hasil belajar

dibandingkan dengan kriteria yang harus dicapai sesuai dengan kompetensi,

sehingga dalam pelaksanaan penilaian perlu ditingkatkan sistem penilaiannya

secara terus-menerus dan berkelanjutan.

15
Kelebihan-kelebihan yang dapat diperoleh dengan adanya pengembangan

model penilaian PPG ini diantaranya: pertama, pengukuran dirancang dengan

pendekatan teori respon butir (Item Response Theory, IRT) model politomus

untuk menentukan level atau kategori yang dicapai peserta berdasarkan respons

yang diberikan, agar dapat menggali informasi karakteristik item lebih jauh dan

mampu mengestimasi kemampuan atau capaian kompetensi peserta PPG, karena

pemberian skor yang dilakukan memperhatikan seluruh tahapan-tahapan yang

harus dikerjakan peserta PPG pada komponen yang dinilai dan skor yang

diberikan memperhatikan tingkat kesukaran setiap tahapan. Alasan kedua,

instrumen penilaian yang dikembangkan memiliki acuan kerangka teoretik yang

cocok dan sesuai dengan kebutuhan dalam mengestimasi penguasaan kompetensi

peserta PPG, mulai dari mencari teori yang relevan dari buku reverensi, jurnal-

jurnal atau penelitian yang terdahulu, kemudian dikonstruk menjadi indikator-

indikator dan dikembangkan menjadi sub indikator untuk menyusun item

instrumen yang dibuktikan validitas isi, validitas konstruk dan estimasi

reliabilitasnya.

Kelebihan ketiga, model penskoran dalam penilaian ini menggunakan

penskoran parsial dan holistik yang bertujuan untuk menggali informasi lebih jauh

hasil estimasi kemampuan peserta PPG. Pada penilaian dengan penskoran parsial,

skor dikumpulkan berdasarkan respons tahap demi tahap, sehingga mampu

menggambarkan tahap-tahap yang dikuasai oleh peserta PPG, karena biasanya

tahapan yang dinilai dari peserta PPG benar ditahap tertentu, tetapi salah ditahap

berikutnya atau yang lain. Oleh karena itu, penskoran parsial merupakan pilihan

16
yang berpeluang untuk memberikan informasi posisi kemampuan peserta PPG.

Semakin tinggi parameter kemampuan peserta PPG, maka semakin besar pula

peluang peserta tersebut mengerjakan tahapan demi tahapan dengan benar untuk

suatu item yang dinilai. Sementara penskoran holistik digunakan untuk menilai

kemampuan atau proses secara keseluruhan tanpa ada pembagian komponen

secara terpisah, namun mampu menilai semua kinerja yang ditunjukkan dalam

kategori karena skor yang diberikan berdasarkan urutan kategori, misalnya

menilai kelengkapan rumusan tujuan pembelajaran memenuhi kriteria ABCD

(Audience, Behavior, Condition, Degree), agar rumusan tujuan pembelajaran

tersebut memenuhi kategori lengkap, maka peserta PPG dalam rumusan tujuan

pembelajarannya ada audience sebagai tahap ke-1, tahap ke-2 ada audience dan

behavior, tahap ke-3 audience, behavior, condition, tahap ke-4 ada audience,

behavior, condition, degree. Oleh karena itu, penskoran holistik merupakan

pilihan penskoran yang berpeluang untuk memberikan informasi posisi

kemampuan peserta PPG secara urut berdasarkan kategori respons.

Kelebihan keempat, untuk mengetahui keakuratan kedua model penskoran

ini dalam mengestimasi kemampuan peserta PPG, digunakan fungsi informasi dan

kesalahan baku estimasi, karena dalam mengembangkan model penilaian tersebut

memerlukan ketepatan dan akurasi yang tinggi untuk menghindari adanya resiko

atau kesalahan pengukuran dalam penilaian capaian penguasaan kompetensi

peserta PPG. Kelebihan kelima, model penilaian ini dikembangkan berdasarkan

kaidah prosedur pengembangan dan memperhatikan kepraktisan penggunaannya,

serta dilengkapi dengan panduan penilaian. Kelebihan keenam, applicability dari

17
model penilaian ini bukan hanya dapat digunakan untuk menilai penguasaan

capaian kompetensi peserta PPG, namun juga dapat digunakan untuk penilaian

kinerja guru, supervisi guru, praktik lapangan persekolahan (PLP)/praktik

pengalaman lapangan mahasiswa, dan penilaian bidang keguruan lainnya.

Berdasarkan berbagai alasan pentingnya mengembangkan model penilaian

PPG dan kelebihan yang dimilikinya, maka hasil penilaian yang diperoleh akan

lebih objektif, akurat dan akuntabel dalam mengestimasi penguasaan capaian

kompetensi peserta PPG. Melalui perbaikan proses penilaian diharapkan mampu

menghasilkan lulusan yang menguasai kompetensi secara memadai dan mampu

mengimplementasikannya. Upaya inilah yang dapat mewujudkan peningkatan

kompetensi guru sebagai guru yang profesional. Hal diperkuat dengan beberapa

hasil penelitian dan beberapa teori pendukung diantaranya Biktagirova and

Valeeva (2014); Pollard (2014); K. Liu (2015); Galih & Iriani (2018)

profesionalisme seorang guru harus selalu ditingkatkan bukan hanya saat

mengajar di kelas tetapi juga sebelum dan setelahnya setelah berkelanjutan,

menjadi guru profesional tidak cukup hanya dinilai dari kepemilikan sertifikat

pendidik secara legalitas, tetapi pada upaya meningkatkan profesionalismenya

secara terus-menerus dan berkelanjutan dalam menjalankan tugas dan tanggung

jawabnya, melakukan refleksi diri dalam membuat keputusan lebih lanjut untuk

perbaikan pengajaran di masa kini dan masa depan. Karena ketidakmampuan guru

menerapkan pengetahuan secara sistematis dan konstruktif dalam kegiatan

pembelajaran, akan berdampak pada hasil pembelajaran yang dicapai. Dengan

demikian, melalui hasil penelitian ini diharapkan akan mengantarkan pada usaha

18
peningkatan kompetensi peserta PPG tidak hanya berhenti selama pelaksanaan

PPG, namun penguasaan peserta terhadap standar kompetensi guru yang

dipersyaratkan benar-benar terimplementasi dengan baik.

B. Identifikasi Masalah

Berdasarkan uraian pada latar belakang masalah, berikut disampaikan

beberapa permasalahan sebagai berikut.

1. Penilaian PPG saat ini bersifat relatif belum mampu membedakan peserta

yang memiliki kemampuan tinggi, sedang maupun kemampuan rendah

berdasarkan komponen dari setiap aspek yang dinilai karena masih

menggunakan pendekatan teori klasik dimana skor sebenarnya sangat

tergantung pada pengukuran yang dilaksanakan dan tidak bisa dibandingkan.

2. Model penskoran yang digunakan belum memperhatikan perbedaan skor dari

setiap tahapan komponen/aspek yang dinilai, padahal komponen yang dinilai

dalam mengukur capaian kompetensi peserta PPG memiliki serangkaian

tahapan dan skor seharusnya diberikan pada setiap tahapan tersebut, sehingga

penskoran dalam model penilaian PPG dikembangkan menggunakan

pendekatan teori respon butir model politomus yaitu parcial credit model dan

graded respons model.

3. Model penilaian PPG dengan penskoran parsial dan holistik hingga kini

belum ada yang mengembangkan, padahal penskoran parsial merupakan

pilihan yang berpeluang untuk memberikan informasi posisi kemampuan

peserta PPG meskipun tidak secara urut, sedangkan penskoran holistik

19
berpeluang untuk memberikan informasi posisi kemampuan peserta PPG

secara urut berdasarkan kategori respons.

4. Belum adanya panduan model penilaian PPG dengan penskoran parsial dan

holistik yang berisi komponen-komponen penilaian apa saja yang harus

dinilai, mekanisme penilaian yang dilakukan beserta instrumennya, penskoran

yang digunakan dan interpretasi hasil penilaian, untuk membantu dan

memudahkan pengguna/penilai dalam menilai capaian penguasaan

kompetensi peserta PPG.

C. Pembatasan Masalah

Menghindari kekeliruan dan ketidakselarasan antara pembatasan dengan

pokok masalah di atas, maka penelitian ini membatasi pada pengembangan model

penilaian PPG dengan penskoran parsial dan holistik dengan beberapa batasan:

1. Penelitian ini fokus pada pengembangan model penskoran yaitu dengan

penskoran parsial dan holistik yang mengacu pada penguasaan kompetensi

berdasarkan komponen dan indikator yang dinilai dalam Buku Pedoman

Penyelenggaraan PPG yaitu kompetensi pedagogik, kompetensi kepribadian,

kompetensi sosial, dan kompetensi profesional. Namun dalam pengembangan

ini, difokuskan pada penilaian kompetensi pedagogik yang menilai

kemampuan peserta PPG dalam menyusun Rencana Pelaksanaan

Pembelajaran (RPP) dan melaksanakan pembelajaran, penilaian kompetensi

sosial dan kepribadian. Untuk penilaian penguasaaan kompetensi profesional

tidak dinilai dan dikembangkan, karena pelaksanaan penilaiannya secara

20
tertulis menggunakan soal dari Panitia Nasional Uji Kompetensi Mahasiswa

Program PPG (Panas UKMPPG) yang terjadwal secara nasional dan tentunya

item-item pada soal tersebut telah melalui tahapan-tahapan pengembangan

soal yang baku dan memenuhi kriteria item yang baik dan telah digunakan

secara nasional dalam skala besar.

2. Untuk penilaian kompetensi pedagogik yang menilai kemampuan peserta

PPG dalam menyusun RPP dan melaksanakan pembelajaran menggunakan

instrumen penilaian rencana pembelajaran dengan penskoran parsial dan

holistik dan instrumen penilaian pelaksanaan pembelajaran dengan penskoran

parsial dan holistik. Item-item yang ada dalam instrumen yang dikembangkan

menyesuaikan dengan item-item yang sudah dikembangkan oleh

Kemenristekdikti dan melengkapi item-item yang tidak ternilai. Untuk

penilaian kompetensi sosial dan kepribadian, belum ada item-item yang

dikembangkan, sehingga instrumen penilaian kompetensi sosial dan

kepribadian dikembangkan berdasarkan konstruk indikator ukur.

3. Lingkup Program PPG yang diteliti yaitu PPG Prajabatan bersubsidi dan PPG

Dalam Jabatan tahun akademik 2018/2019 yang diselenggarakan Rayon

LPTK Universitas Negeri Yogyakarta (UNY), LPTK Universitas Negeri

Gorontalo (UNG), dan LPTK UIN Alauddin Makassar (UINAM).

4. Model penilaian PPG yang dikembangkan difokuskan pada penilaian kinerja

(performance assessment) dari peserta PPG saat lokakarya perangkat

pembelajaran, PPL dan pelaksanaan UKMPPG dengan cakupan penilaian

pada penguasaan kemampuan peserta PPG dalam menyusun rencana

21
pelaksanaan pembelajaran, kemampuan melaksanakan pembelajaran,

penguasaan kompetensi sosial dan kepribadian peserta PPG.

5. Model penilaian PPG yang dikembangkan berisi instrumen-instrumen

penilaian kompetensi pedagogik dengan teknik analisis dokumen dan

observasi, penilaian kompetensi sosial dan kompetensi kepribadian

menggunakan penskoran secara parsial dan holistik dengan teknik observasi.

6. Lingkup Program Studi PPG yang diteliti disesuaikan dengan Program Studi

yang ada pada saat penyelenggaraan PPG Prajabatan bersubsidi dan PPG

Dalam Jabatan tahun akademik 2018/ 2019 di Rayon LPTK UNY, LPTK

UNG, dan LPTK UINAM.

D. Rumusan Masalah

Berdasarkan latar belakang dan identifikasi masalah yang telah

dikemukakan, permasalahan utama pada penelitian ini dirumuskan sebagai

berikut: “Bagaimana model penilaian PPG dengan penskoran parsial dan holistik

yang dapat digunakan dalam mengestimasi penguasaan kompetensi peserta PPG

secara akurat dan terpercaya?”. Secara operasional permasalahan penelitian ini

dapat dirumuskan sebagai berikut.

1. Bagaimana konstruk model penilaian PPG dengan penskoran parsial dan

holistik yang dapat digunakan dalam mengestimasi penguasaan kompetensi

peserta PPG?

22
2. Bagaimanakah validitas dan reliabilitas model penilaian PPG dengan

penskoran parsial dan holistik yang dapat digunakan dalam mengestimasi

penguasaan kompetensi peserta PPG?

3. Bagaimana karakteristik model penilaian PPG dengan penskoran parsial dan

holistik yang dapat digunakan dalam mengestimasi penguasaan kompetensi

peserta PPG?

4. Bagaimana deskripsi hasil penskoran parsial dan holistik dalam model

penilaian PPG terhadap akurasi estimasi kemampuan peserta PPG?

5. Bagaimana kepraktisan model penilaian PPG dengan penskoran parsial dan

holistik berdasarkan penilaian oleh pengguna?

E. Tujuan Pengembangan

Tujuan pengembangan dalam penelitian ini secara umum bertujuan untuk

mengetahui pengembangan model penilaian PPG dengan penskoran parsial dan

holistik untuk mencapai penguasaan kompetensi peserta PPG secara akurat dan

terpercaya dan secara khusus bertujuan:

1. Merumuskan konstruk model penilaian PPG dengan penskoran parsial dan

holistik yang dapat digunakan dalam mengestimasi penguasaan kompetensi

peserta PPG.

2. Menyusun model penilaian kompetensi peserta PPG dengan penskoran

parsial dan holistik yang memenuhi syarat validitas dan reliabilitas, agar

mampu menghasilkan estimasi penguasaan kompetensi peserta PPG lebih

akurat dan terpercaya.

23
3. Mendeskripsikan karakteristik model penilaian PPG dengan penskoran parsial

dan holistik yang dapat digunakan berdasarkan fungsi informasi dan

kesalahan baku estimasi dalam mengestimasi penguasaan kompetensi peserta

PPG.

4. Mendeskripsikan hasil penskoran parsial dan holistik yang dapat digunakan

dalam model penilaian PPG terhadap akurasi estimasi kemampuan peserta.

5. Mendeskripsikan kepraktisan model penilaian PPG dengan penskoran parsial

dan holistik berdasarkan penilaian oleh pengguna.

F. Manfaat Pengembangan

Hasil penelitian ini diharapkan dapat memberikan manfaat secara teoritis

maupun praktis sebagai berikut:

1. Secara teoretis hasil penelitian ini diharapkan dapat digunakan sebagai acuan

teoritik dalam mengembangkan model penilaian PPG dengan penskoran

parsial dan holistik. Selain itu memperkuat pentingnya pengembangan model

penilaian PPG dalam mengestimasi penguasaan kompetensi peserta PPG.

2. Secara praktis, hasil penelitian dapat dijadikan sebagai panduan bagi penilai

dalam menilai penguasaan kompetensi peserta PPG dengan penskoran parsial

maupun holistik secara akurat dan terpercaya serta mampu melakukan

pelaporan hasil penilaian lebih rinci dan detail.

3. Hasil penelitian ini dapat digunakan sebagai bahan evaluasi dalam melakukan

perbaikan model penilaian PPG yang ada selama ini dalam menilai

penguasaan kompetensi peserta PPG, sehingga mampu menghasilkan

24
estimasi kemampuan peserta yang lebih akurat dibandingkan dengan

penskoran yang sudah ada.

G. Asumsi Pengembangan

Beberapa asumsi yang mendasari pengembangan model penilaian PPG

dengan penskoran parsial dan holistik yaitu:

1. Jika teori yang relevan digunakan untuk membuat konstruk, indikator yang

dinilai dapat diukur dan diamati, maka model penilaian PPG dengan

penskoran parsial dan holistik yang dikembangkan diasumsikan memiliki

acuan kerangka teoretik yang cocok dan sesuai dengan kebutuhan dalam

mengestimasi penguasaan kompetensi peserta PPG. Untuk keperluan ini,

peneliti mencari teori yang relevan dari buku reverensi, jurnal-jurnal atau

penelitian yang terdahulu, kemudian dikonstruk menjadi indikator-indikator

dan dikembangkan menjadi sub indikator untuk menyusun item instrumen.

2. Jika model penilaian PPG dengan penskoran parsial dan holistik yang

dikembangkan dapat dibuktikan validitas dan diestimasi reliabilitasnya, maka

diasumsikan mampu mengestimasi penguasaan kompetensi peserta PPG lebih

akurat dibandingkan dengan penskoran yang sudah ada.

3. Jika model penilaian PPG dengan penskoran parsial dan holistik yang telah

dikembangkan sudah memenuhi kaidah atau prosedur pengembangan , maka

diasumsikan dapat melengkapi penilaian PPG saat ini.

4. Jika prinsip-prinsip dan prosedur pengembangan model penilaian PPG

dengan penskoran parsial dan holistik diterapkan dengan baik, maka

diasumsikan dapat menghasilkan model penilaian PPG yang akurat dan

25
praktis dalam meningkatkan kualitas hasil pelaksanaan PPG di LPTK dan

penguasaan kemampuan akademik dan penguasaan kompetensi lulusan PPG.

H. Spesifikasi Produk yang Dikembangkan

Spesifikasi produk yang dikembangkan dari model penilaian PPG dalam

penelitian dan pengembangan ini fokus pada dua penskoran yaitu penskoran

parsial dan holistik yang menghasilkan produk sebagai berikut.

1. Instrumen penilaian rencana pembelajaran dengan penskoran parsial dan

holistik yang mengacu pada komponen dan indikator kompetensi pedagogik

yang ada dalam Buku Pedoman Penyelenggaraan PPG Tahun 2018 dan

menyesuaikan dengan item-item pada instrumen penilaian rencana

pembelajaran yang sudah dikembangkan Kemenristekdikti Dirjen Belmawa.

2. Instrumen penilaian pelaksanaan pembelajaran dengan penskoran parsial dan

holistik yang mengacu pada komponen dan indikator kompetensi pedagogik

yang ada dalam Buku Pedoman Penyelenggaraan PPG Tahun 2018 dan

menyesuaikan dengan item-item pada instrumen penilaian pelaksanaan

pembelajaran yang telah dikembangkan Kemenristekdikti Dirjen Belmawa.

3. Instrumen penilaian kompetensi sosial dan kepribadian dengan penskoran

parsial dan holistik yang mengacu pada komponen dan indikator kompetensi

sosial dan kepribadian yang ada dalam Buku Pedoman Penyelenggaraan PPG

Tahun 2018 oleh Kemenristekdikti Dirjen Belmawa.

4. Buku Panduan Penilaian PPG dengan penskoran parsial dan holistik. Panduan

penilaian ini bertujuan untuk memandu penilai dalam menilai setiap tahapan

26
komponen dari masing-masing instrumen yang dikembangkan, sehingga

memiliki persepsi yang sama dalam melakukan penilaian agar penguasaan

kompetensi peserta PPG mampu diukur capaiannya secara maksimal.

5. Model yang dimaksud dalam penelitian ini adalah seperangkat prosedur yang

terdiri dari sejumlah alat dan cara yang disusun secara berurutan untuk

menilai suatu proses dan hasil. Oleh karena itu, model penilaian PPG dengan

penskoran parsial dan holistik merupakan seperangkat prosedur yang disusun

untuk mengestimasi capaian penguasaan kompetensi peserta PPG.

Seperangkat prosedur yang dimaksud berisi konsep dasar sistem penilaian

Program PPG, mekanisme penilaian Program PPG, penskoran dan

interpretasi hasil penilaian Program PPG. Sistem penilaian Program PPG

menjelaskan tentang pengertian, prinsip, acuan penilaian serta teknik

penilaian. Mekanisme penilaian Program PPG yang meliputi lingkup

penilaian berisi cakupan komponen-komponen yang dinilai dan perumusan

indikator, teknik penilaian dan bentuk instrumen. Selanjutnya penskoran dan

interpretasi hasil penilaian Program PPG yang mencakup pengertian

penskoran, model penskoran, interpretasi hasil penilaian, contoh penilaian

dan tindak lanjut, skoring dan pemanfaatan hasil penilaian.

27
BAB II

KAJIAN PUSTAKA

A. Kajian Teori

1. Pendidikan Profesi Guru (PPG)

Profesi guru di Indonesia memiliki kedudukan sentral sebagai tenaga

profesional pada jenjang pendidikan anak usia dini, pendidikan dasar, dan

pendidikan menengah sehingga menuntut adanya kualifikasi akademik dan latar

belakang pendidikan yang relevan. Indonesia juga telah merumuskan syarat

kompetensi yang harus dimiliki oleh seorang guru dalam Undang-Undang Nomor

14 Tahun 2005 tentang Guru dan Dosen Pasal 10 disebutkan bahwa kompetensi

guru meliputi kompetensi pedagogik, kompetensi kepribadian, kompetensi sosial,

dan kompetensi profesional yang diperoleh melalui pendidikan profesi. Adanya

pengakuan profesi guru sebagai tenaga profesional di Indonesia dibuktikan secara

nyata sejak tahun 2007 dilakukan uji sertifikasi guru untuk selanjutnya bagi yang

lulus berhak mendapatkan sertifikat pendidik dan tunjangan sertifikasi atas

profesinya.

Pendidikan profesi mengacu pada pendidikan untuk pekerjaan profesional

termasuk pengacara/penasihat hukum, dokter, guru, dan sebagainya. Istilah

pendidikan profesi secara umum mencakup program pembelajaran formal,

nonformal dan informal bagi setiap orang di semua profesi sehingga sering

disebut sebagai “white collar” adalah tipe pekerja yang memiliki keterampilan

khusus namun istilah ini biasanya digunakan untuk menggambarkan

pengembangan profesi guru. Guru termasuk profesi khusus seperti dokter dan

28
penasihat hukum karena menjadi seorang guru dituntut memiliki keahlian tertentu

sebagaimana dipersyaratkan dari segi kualifikasi dan kompetensi yang terukur dan

teruji sesuai dengan fungsi dan perannya. Oleh karena itu, pengembangan profesi

guru sangat penting, karena ketika guru berada di sekolah akan berhadapan

dengan peserta didik dari berbagai latar belakang, sehingga membutuhkan sosok

guru yang memiliki kompetensi yang tinggi sesuai dengan kebutuhan dan

tantangan yang dihadapi (Athar & Jamal, 2017; Copriady, 2013; Cranton, 2016).

Seseorang yang ingin berprofesi menjadi guru, maka ia dipersyaratkan

harus mengikuti berbagai jenjang pendidikan formal, praktik lapangan, magang

atau pendidikan lainnya yang mendukung profesinya dalam kurun waktu tertentu.

Bahkan, di negara-negara maju seperti negara-negara di wilayah Eropa yaitu

Luksemburg, Polandia, Portugal, Slovakia, Slovenia dan Spanyol lebih

menekankan pada pengembangan profesi guru secara berkelanjutan melalui

peningkatan gaji dan kemajuan karir guru, serta guru juga harus memiliki

kesadaran dan komitmen yang kuat secara internal untuk terus belajar

meningkatkan kompetensinya, sehingga layak disebut sebagai guru profesional

(Hendriks, Luyten, Scheerens, Sleegers, & Steen, 2010; Sulisworo et al., 2017).

Pendidikan profesi bagi guru sangat terkait dengan guru profesional karena

memberikan kesempatan dalam menguasai pengetahuan terkait profesi guru dan

memiliki pengalaman belajar agar dapat meningkatkan kompetensinya sesuai

dengan tuntutan perubahan. Pendidikan profesi bagi guru memberikan

pembelajaran yang memperkaya pengetahuan, konsep teori dan pengalaman yang

lebih mendalam untuk menjadi guru profesional (Caena, 2011; Galih & Iriani,

29
2018; Oviyanti, 2016; Petrie & McGee, 2012). Pendapat ini menunjukkan

pentingnya pendidikan profesi bagi guru dan akan terus menjadi isu penting dalam

meningkatkan kualitas guru di Indonesia.

Salah satu pendidikan profesi yang diselenggarakan dalam pengembangan

profesi dan profesional guru di Indonesia adalah melalui Program Pendidikan

Profesi Guru (PPG). PPG merupakan salah satu program pemerintah yang

bertujuan untuk menghasilkan guru yang memiliki kompetensi dan mampu

mengembangkan profesionalitas secara berkelanjutan, melalui Program PPG

diharapkan menghasilkan lulusan guru/calon guru yang memiliki kompetensi utuh

yaitu unggul dan berkarakter disamping kompetensi-kompetensi keprofesionalan

guru lainnya untuk menjadi guru yang profesional. Disamping itu, program PPG

merupakan syarat mutlak bagi guru untuk mendapatkan pengalaman nyata yang

mendukung profesionalismenya sesuai dengan standar nasional pendidikan dan

memperoleh sertifikat pendidik (Amadi, 2013; Anita & Rahman, 2013; Hotimah

& Suyanto, 2017; Ningrum, 2012; Nurmaliah, 2018).

Rumusan di atas menunjukkan PPG merujuk kepada pengembangan

keterampilan dan pengetahuan yang dicapai dalam pengembangan pribadi dan

pengembangan karir guru. pendapat ini mengindikasikan bahwa Program PPG

dinilai efektif bagi calon guru dan guru di Indonesia dalam meningkatkan

kompetensinya menjadi lebih profesional melakukan inovasi baru pada praktik

pembelajaran. Pendapat ini didukung oleh Mizell (2010), Smylie (2014), Gareis

and Grant (2014) menyatakan untuk menjadi guru profesional penting mengikuti

pendidikan profesi guru dalam meningkatkan kompetensinya menjadi lebih baik,

30
karena untuk mempersiapkan seseorang menjadi guru profesional tergantung pada

praktik mengajarnya secara nyata dan pengembangan dari serangkaian

pengetahuan, keterampilan dan kecenderungan hal lain yang mendukung

pengembangan kompetensinya. Oleh karena itu, pengembangan profesi guru

harus fokus pada tugas-tugas pengajaran, proses pengembangannya harus

dirancang sesuai dengan kebutuhan dan bagaimana guru belajar, berlatih, dan

melakukan refleksi diri memperbaiki praktik mengajar yang lebih efektif secara

intensif dan berkelanjutan.

Program PPG membantu peserta/mahasiswa mendalami bidang studi

sehingga mampu meningkatkan kompetensinya sebagai seorang guru. Terdapat

tiga aspek yang berbeda dalam mengartikulasikan profesi guru yaitu terletak pada

pengetahuan, pemahaman dan intuisi, teknik “tahu dan bagaimana” dalam

menerapkan pengetahuan prosedural menjadi refleksi kritis terhadap apa yang

dilakukan guru di masa lalu dengan tujuan untuk mempertahankan atau

meningkatkan praktik mengajar mereka di masa depan (Winch, Oancea, &

Orchard, 2015, Indriyani & Ismandari, 2015). Dengan demikian secara teoritis

Program PPG dimaksudkan untuk membimbing, menambah pengalaman dan

penghayatan guru/calon guru tentang proses pendidikan dan profesionalisme

melaksanakan pembelajaran yang berkualitas.

Pengembangan profesi yang diterapkan dalam Program PPG yaitu

profesionalisasi guru berbasis individu, karena dalam program ini hal yang

ditekankan adalah peningkatan kompetensi yang wajib dimiliki oleh seorang guru

untuk mendapatkan tunjangan sertifikasi. Pembinaan dan pengembangan profesi

31
guru meliputi pembinaan kompetensi pedagogik, kepribadian, profesional, dan

sosial. Program PPG membelajarkan peserta/mahasiswa bagaimana mereka

mengajar dengan berbagai strategi pembelajaran yang baru (Prasojo et al., 2017;

Surya, 2014). Untuk mewujudkan hal ini mahasiswa/peserta PPG perlu difasilitasi

agar siap mengikuti program tersebut dengan baik dan perlu ditumbuhkan

semangat serta motivasinya untuk berperan aktif mengikuti berbagai kegiatan

yang dirancang dalam program tersebut.

Berbagai kajian di atas menunjukkan bahwa Program PPG sangat penting

dalam penyiapan guru masa depan yang berkualitas sehingga pelaksanaannya

perlu memperhatikan prinsip-prinsip yang mendasarinya. Menurut American

Federation of Teachers (2014) pendidikan profesi bagi guru memiliki prinsip

yaitu (a) memastikan kedalaman pengetahuan materi, (b) memberikan fondasi

yang kuat dalam disiplin pengetahuan tertentu, (c) memberikan pengetahuan yang

lebih umum tentang proses belajar dan mengajar di sekolah dan lembaga

pendidikan, (d) mencerminkan penelitian terbaik yang tersedia, (e) berkontribusi

terhadap prestasi belajar peserta didik yang terukur, (f) setiap guru untuk terikat

intelektual dengan ide-ide dan sumber daya, (g) memberikan cukup waktu,

dukungan dan sumber daya untuk memungkinkan para guru menguasai konten

dan pengetahuan baru. Hal ini menunjukkan bahwa Program PPG mampu

membekali dan mengembangkan kompetensi calon guru/guru melalui praktik

mengajar pada pengalaman lapangan dengan mengaplikasikan kompetensi yang

telah dikuasainya. Jika prinsip-prinsip ini terlaksana dengan baik maka tujuan

dari Program PPG akan tercapai.

32
Konsep pembelajaran program PPG di atas, sejalan dengan teori

pembelajaran orang dewasa (andragogi). Pembelajaran orang dewasa merupakan

inti dari praktik pembelajaran yang berbeda dengan anak-anak. Orang dewasa

berada di posisi yang berbeda dalam siklus hidup, pengalaman hidup orang

dewasa lebih besar dan lebih bervariasi dibandingkan dengan anak-anak sehingga

kebutuhan dan minat belajar orang dewasa dan anak-anak berbeda. Pembelajaran

orang dewasa dilakukan sepanjang hayat atau seumur hidup tanpa memandang

usia untuk menjamin pertumbuhan dan kecakapan hidup yang pada akhirnya

terletak pada sifat dan kebutuhannya (Jarvis, 2004; Merriam & Bierema, 2013).

Sebagaimana dinyatakan Merriam (2001) terdapat lima asumsi yang mendasari

pembelajaran orang dewasa yaitu: 1) memiliki konsep diri dan kemandirian dalam

pembelajaran, 2) memiliki pengalaman hidup yang memperkaya dalam belajar, 3)

memiliki kebutuhan belajar yang erat kaitannya dengan perubahan peran sosial, 4)

tertarik dan terpusat pada penerapan pengetahuan langsung, 5) memiliki dorongan

belajar yang bersumber dari diri internal.

Pembelajaran pada orang dewasa memiliki karakteristik untuk

membangun karakter kemandirian dalam diri pembelajar (outonomus learning)

dan menekankan pada self directed learning yang memberikan acuan bagaimana

mereka memiliki inisiatif untuk belajar, menganalisis kebutuhan belajar sendiri,

mencari sumber belajar sendiri, memformulasi tujuan belajar sendiri atau

menetapkan tujuan belajar sendiri, memilih/merancang dan mengimplementasikan

strategi belajar serta mengevaluasi kemajuan terhadap pencapaian tujuan belajar

secara mandiri (Brookfield, 1984; Knowles, Holton, & Swanson, 2015).

33
Kaitannya dengan pembelajaran pada Program PPG, menjadikan peserta PPG

sebagai subjek belajar aktif, yang mampu merubah etos belajar mandiri pada diri

mereka sebagai guru/calon guru, karena sikap belajar orang dewasa memengaruhi

usahanya dalam pencapaian hasil yang lebih baik. Dalam pembelajaran orang

dewasa memberikan kesempatan untuk secara aktif terlibat dalam pembelajaran

dan memberikan pengalaman belajar yang terpusat pada pembelajar, karena

pembelajar perlu terlibat secara aktif dalam proses pembelajaran untuk

membangun pengetahuan mereka sendiri, untuk memahami pembelajaran, dan

menerapkan apa yang dipelajari menuju pada peningkatan arah diri secara

otonomi guna membantu pembelajar tidak hanya memiliki pengalaman belajar

tetapi juga untuk memberdayakan interaksi mereka (Chan, 2010; Giannoukos,

Besas, Galiropoulos, & Hioctour, 2015; Henschke, 2011; Ozuah, 2016). Dengan

demikian, peserta PPG sebagai orang dewasa cenderung memilih kegiatan belajar

yang dapat segera diaplikasikan baik pengetahuan maupun keterampilan yang

dipelajarinya.

Hatton (1997) menyatakan dalam pembelajaran orang dewasa mengenal

konsep DAMN yaitu: 1) desire to learn, orang dewasa belajar karena dorongan

instrinsik, kebutuhan intelektual dan keingingan meraih cita-cita, 2) ability to

learn, sasaran belajar berada pada kemampuan dan peningkatan penguasaan

terhadap langkah-langkah kegiatan belajar secara bermakna, 3) means to learn,

belajar dikonsepkan sebagai suatu proses pemenuhan kebutuhan hidup dalam

menghadapi kehidupan yang lebih kompleks, 4) need to learn, belajar dalam

konsepsi belajar sepanjang hayat sebagai suatu kebutuhan, sehingga mendorong

34
dirinya untuk terus belajar dan sebagai kebutuhan yang mendesak untuk terus

beradaptasi dengan kondisi perkembangan masyarakat dan kehidupan. Dari

konsep tersebut, perlunya penerapan konsep pembelajaran andragogi pada

program PPG, karena lebih pada kegiatan membimbing dan membantu peserta

PPG mengembangkan pengetahuan, keterampilan, dan sikap yang dimilikinya

menguasai kompetensi yang dipersyaratkan sebagai guru profesional. Hal ini

didukung pendapat Wardoyo (2015) profesi guru berbeda dengan profesi lain,

karena ada karakteristik tertentu yang dapat mengarahkan pembelajar ke empat

pilar pendidikan yang dikeluarkan oleh UNESCO (learning to know, learning to

do, and learning to be, learning to live together).

Dengan demikian pembelajaran orang dewasa (andragogi) dapat menjadi

landasan dalam proses pembelajaran Program PPG, agar mampu menghasilkan

lulusan Program PPG yang dapat mengarahkan dirinya sendiri untuk terus belajar

mengembangkan kompetensinya sebagai seorang guru dan mampu menjadi

menjadi guru bagi dirinya sendiri. Hal ini berpijak pada landasan pembelajaran

andragogi itu sendiri yang memiliki formula pembelajaran yang selalu diarahkan

pada kondisi dan sasaran yang menekankan pada pemberian keterampilan dan

peningkatan kemampuan untuk memecahkan permasalahan yang dialami terutama

dalam pembelajaran.

2. Sistem dan Prinsip Pembelajaran Pendidikan Profesi Guru (PPG)

Sistem merupakan berbagai komponen yang memiliki satu kesatuan antara

satu dengan yang lain saling berinteraksi dan berkaitan untuk mencapai hasil yang

diharapkan sesuai dengan tujuan yang telah ditentukan. Demikian halnya dengan

35
PPG memiliki sistem yang terdiri dari berbagai komponen dalam mendukung

pembelajaran seperti sistem penerimaan peserta, kurikulum, pembelajaran,

penilaian, sarana dan prasarana, penjaminan mutu PPG dan komponen pendukung

lainnya yang saling berinteraksi dan berkaitan satu sama. Dengan adanya berbagai

komponen tersebut diharapkan mampu menghasilkan lulusan yang memiliki

kompetensi utuh (kompetensi pedagogik, kompetensi profesional, kompetensi

kepribadian, dan kompetensi sosial), unggul, dan berkarakter yang kesemuanya

sangat tergantung dari sistem pembelajaran.

Sistem pembelajaran pada program PPG mencakup praktek pengalaman

lapangan (PPL) dan uji kompetensi mahasiswa PPG (UKMPPG) yang ditekankan

pada p pendidikan profesi dalam rangka perubahan pola pikir mahasiswa/peserta

bahwa PPG adalah pendidikan profesi. Pengajaran dan pembelajaran pada

Program PPG dilakukan berdasarkan prinsip yaitu (a) Belajar dengan melakukan,

(b) keaktifan peserta didik, (c) Berpikir tingkat tinggi, (d) dampak pengiring, (e)

mekanisme balikan secara teratur, (f) pemanfaatan teknologi informasi, (g)

pembelajaran kontekstual, (h) penggunaan multistrategi dan aneka sumber belajar,

(i) berorientasi pada TPACK (Caena, 2011; Widiati & Hayati, 2015; Winch et al.,

2015). Prinsip-prinsip ini yang perlu mendapat perhatian khusus pada pengajaran

dan pembelajaran Program PPG.

Prinsip pertama belajar dengan melakukan (learning by doing)

mengembangkan pengetahuan, sikap dan keterampilan seorang guru dalam

melakukan tugas-tugas pembelajaran dan pemecahan masalah. Prinsip ini

digunakan untuk membentuk keterampilan, pengetahuan, dan sikap sebagai guru,

36
karena proses pengembangan profesionalnya dimulai sebelum guru memasuki

program pendidikan guru yang dilengkapi dengan pengalaman bertahun-tahun

sebagai peserta didik di sekolah (Prasojo et al., 2017). Dengan prinsip ini,

pengetahuan dan sikap peserta terbentuk melalui pengalaman. Dewey (1997)

menyatakan pengalaman adalah segala proses kehidupan manusia dalam

berinteraksi dengan berbagai macam hal dari luar diri maupun dari dalam diri

manusia itu sendiri, yang kemudian interaksi itu akan memengaruhi interaksi

selanjutnya. Oleh karena itu, pengalaman yang diperoleh peserta selama

mengikuti PPG merupakan seluruh proses pembelajaran yang dialaminya tidak

sekedar menjadi tumpukan pengalaman yang lepas, tetapi dapat terjadi suatu

perpaduan yang memperkaya dan menumbuhkan penguasaan kompetensinya

sebagai seorang guru profesional.

Pandangan Dewey menyiratkan makna bahwa proses pendidikan adalah

hasil pengalaman dari peserta yang terus-menerus baik dari masa lalu maupun

masa kini. Pengalaman masa lalu dapat digunakan untuk merekonstruksi masa

kini, sebaliknya masa kini digunakan untuk membangun masa depan. Oleh karena

itu, pandangan Dewey ini dapat menjadi dasar dalam merefleksi pengalaman yang

berkesinambungan pada diri peserta PPG dalam meningkatkan kompetensinya

secara timbal balik baik yang bersifat pribadi maupun sosial, dan dapat menjadi

kontribusi sejarah pendidikan dalam membangun perolehan pengalaman masa lalu

untuk merekonstruksi teori masa kini, sehingga penting peserta PPG perlu diajak

untuk merefleksikan masa lalunya dengan perolehannya masa kini agar mampu

membuat keputusan yang tepat dalam berbuat di masa kini untuk masa depannya

37
dalam meningkatkan kompetensinya sebagai guru profesional. Hal ini sejalan

dengan pandangan Paterson (2010) bahwa pendidikan tidak hanya dapat terjadi

pada diri seseorang, melainkan sebagai proses yang akan membentuk diri

seseorang menjadi lebih baik.

Prinsip kedua yaitu keaktifan peserta didik yang diarahkan pada upaya

mengaktifkan peserta didik bukan dalam arti fisik melainkan dalam keseluruhan

perilaku belajar. Prinsip ini menggunakan konsep pembelajaran terpusat pada

pembelajar keaktifan peserta tidak hanya diukur dari pengertian fisik semata,

tetapi juga dilihat dari tingginya minat dalam menyelesaikan permasalahan yang

sedang dihadapi serta mencari berbagai macam sumber belajar termasuk media

online dan offline (Prasojo et al., 2017; Widiati & Hayati, 2015). Prinsip ini dapat

diwujudkan antara lain melalui pemberian kesempatan menyatakan gagasan,

mencari informasi dari berbagai sumber dan melaksanakan tugas-tugas yang

merupakan aplikasi dari konsep-konsep yang telah dipelajari. Hal ini sejalan

dengan teori konstruktivisme sebagai salah satu filosofi pembelajaran yang paling

berpengaruh dalam pendidikan. Para pendukung teori konstruktivisme ini

berpandangan bahwa pembelajaran berlangsung melalui suatu proses dimana

pengetahuan dibangun atas dasar pengetahuan sebelumnya dan pembelajaran

adalah hasil dari gagasan dan pengalaman (Calvert, 2016; Krahenbuhl, 2016).

Prinsip ketiga berpikir tingkat tinggi (higher order thinking), semua

kegiatan pembelajaran berorientasi untuk mendukung pengembangan

keterampilan berpikir tingkat tinggi, keterampilan berpikir kritis, kreatif, logis,

dan reflektif, keterampilan dalam pemecahan masalah dan pengambilan

38
keputusan. Menurut Tekkumru Kisa and Stein (2015) berpikir tingkat tinggi

memerlukan lebih dari sekedar menghafal informasi yang diberikan, lebih dari

sekedar mengetahui definisi dari sebuah konsep ilmiah namun memahaminya

secara lebih mendalam. Penerapan sistem pembelajaran yang berorientasi pada

kemampuan berfikir tingkat tinggi meliputi: eksplorasi, elaborasi, konfirmasi dan

koreksi pada saat memaparkan hasil workshop, peerteaching maupun real

teaching saat PPL (Prasojo et al., 2017; Widiati & Hayati, 2015). Prinsip ini

menunjukkan pembelajaran pada Program PPG mampu mendukung

pengembangan keterampilan berpikir tinggi peserta agar memiliki keterampilan

berpikir kritis, kreatif, logis, dan reflektif dalam memecahkan setiap permasalahan

pembelajaran yang dihadapinya dan menjadi sebuah pengalaman yang akan

menuntun ke arah perubahan pembelajaran yang lebih baik. Hal ini sejalan dengan

pandangan Dewey (1997:11) terdapat dua jenis pengalaman yaitu pengalaman

yang bersifat mendidik dan pengalaman yang justru bersifat menghambat

perkembangan individu menuju kedewasaan. Setiap pengalaman yang bersifat

mendidik akan diorganisasikan secara sistematis dan dijadikan pijakan untuk

merumuskan pengalaman yang akan dilalui dan dipelajari oleh individu, sehingga

pengalaman dijadikan sebagai basis dari pendidikan.

Prinsip keempat dampak pengiring (nurturant effects) yang diarahkan

pada pencapaian dampak instruksional (instructional effects), proses pembelajaran

yang diharapkan mengakomodasi upaya pencapaian dampak pengiring. Prinsip ini

mendukung pengembangan soft skill yang diperlukan untuk menjadi seorang guru

profesional, seperti kerjasama tim, kepemimpinan, kebebasan dan sikap yang baik

39
serta menghormati satu sama lain (Calvert, 2016; Widiati & Hayati, 2015). Prinsip

ini akan membantu pengembangan sikap dan kepribadian peserta PPG sebagai

guru disamping penguasaan materi.

Prinsip kelima yang harus diperhatikan dalam pembelajaran pada Program

PPG adalah mekanisme balikan dengan menerapkan tahapan eksplorasi, elaborasi,

konfirmasi, dan koreksi terutama pada saat presentasi hasil workshop, peer

teaching, dan realteaching. Prinsip ini dilakukan secara teratur melalui tugas-

tugas, menulis tes, tes kinerja, dan memberikan umpan balik pada kinerja peserta

didik pada tugas dan tes. Dengan demikian prinsip mekanisme balikan pada

pembelajaran PPG harus dilakukan secara teratur agar dapat diketahui kinerja

pada tugas dan tes dari peserta PPG.

Prinsip keenam dalam pembelajaran Program PPG harus memanfaatkan

teknologi dan informasi. Menurut Cober, Tan, Slotta, So, and Könings (2015)

guru sebagai perancang desain lingkungan belajar penting menggunakan

teknologi dalam pembelajaran, karena peran teknologi dalam pendidikan sangat

penting dalam mendesain proses pembelajaran yang partisipatif yang melibatkan

peserta didik. Guru yang selalu menggunakan teknologi dalam pembelajaran

dapat meningkatkan keterlibatan peserta didik, meningkatkan interaksi dan

partisipasi peserta didik, meningkatkan komunikasi, dan meningkatkan

pembelajaran yang terpusat pada peserta didik serta dengan penggunaan teknologi

yang mampu menggabungkan materi pengajaran dengan berbagai bentuk

teknologi yang bervariasi secara bersamaan akan mampu menstimulasi indrawi

peserta didik tertarik dalam belajar (Aburezeq & Ishtaiwa, 2013; Chen, Chang, &

40
Yen, 2012). Demikian halnya menurut Yueh, Lin, Jo-Yi, and Sheen (2012) bahwa

pembelajaran yang menerapkan teknologi telah terbukti memiliki potensi untuk

menciptakan lingkungan belajar yang berkualitas tinggi. Oleh karena itu, tujuan

penggunaan multimedia dan ICT peserta PPG untuk mengembangkan

pengetahuan dan keterampilan mereka dan menggunakan ICT sebagai media

instruksional (Prasojo et al., 2017; Widiati & Hayati, 2015). Pemanfaatan

teknologi informasi perlu dikembangkan selama kegiatan Program PPG baik

untuk mengembangkan pengetahuan, sikap, dan keterampilan maupun sebagai

media pembelajaran, sehingga prinsip ini menekankan pada penggunaan dan

pemaksimalan teknologi informasi sebagai sumber belajar dan pembelajaran.

Prinsip ketujuh dalam pembelajaran Program PPG menggunakan

pembelajaran kontekstual yaitu dalam pendampingan pemilihan materi atau objek

dalam workshop pengembangan perangkat pembelajaran menggunakan

pendekatan Contextual Teaching and Learning. Peserta Program PPG belajar

melalui bahan dan kegiatan yang sedang dalam konteks pengembangan,

menemukan dan mencerminkan kondisi mereka sebagai guru dan menumbuhkan

kreativitas dan inovasi yang ada dalam diri peserta PPG (Prasojo et al., 2017;

Widiati & Hayati, 2015). Hal ini didukung pendapat Suryawati & Osman (2018)

bahwa efektivitas pengajaran guru dapat ditingkatkan dengan mengikuti prosedur

yang sistematis, dua aspek penting dalam pengajaran sistematis adalah metode

pembelajaran yang digunakan dan pengumpulan informasi yang sedang

berlangsung untuk menghasilkan hasil pembelajaran yang diinginkan dan

menentukan tingkat perencanaan pembelajaran berikutnya. Oleh karena itu, tugas

41
utama guru adalah menggunakan strategi pengajaran yang memungkinkan

pembelajaran efektif. Dengan demikian prinsip ini menekankan pada penggunaan

strategi yang bervariasi dengan berbagai macam sumber belajar yang tersedia.

Prinsip kedelapan dalam pembelajaran Program PPG menggunakan multi

strategi dan aneka sumber belajar. Keberhasilan pembelajaran sangat tergantung

dari strategi yang digunakan seorang pendidik menempatkan peserta didik dalam

situasi dan kondisi dimana ia belajar, sehingga seorang pendidik hendaknya

memberikan kebebasan kepada peserta didik untuk memilih kondisi yang

menyenangkan baginya untuk belajar (Moore, 2010; Peters, 2010; Pring, 2005).

Dengan demikian kegiatan pembelajaran Program PPG dapat menerapkan

berbagai strategi pembelajaran yang inovatif dan menggunakan beraneka sumber

belajar..

Prinsip kesembilan dalam pembelajaran PPG berorientasi pada TPACK

(Technological Pedagogical and Content Knowledge) yaitu integrasi teknologi

informasi, pedagogi, dan content knowledge dalam proses pembelajaran. Oleh

karena itu, selama lokakarya pengembangan perangkat pembelajaran dosen perlu

memastikan mahasiswa menerapkan TPACK, ketika memilih dan menetapkan

strategi, pendekatan ataupun model dan media pembelajaran, harus

memperhatikan karakteristik peserta didik, materi, dan tujuan pembelajaran.

Berdasarkan sistem dan prinsip yang perlu diperhatikan dalam

pembelajaran Program PPG secara teoritis dapat disimpulkan sistem pembelajaran

pada Program PPG mencakup lokakarya/workshop pengembangan perangkat

pembelajaran dan PPL. Untuk melaksanakan sistem pembelajaran tersebut perlu

42
memperhatikan prinsip-prinsip pembelajaran yang mendasarinya yaitu belajar

dengan melakukan, keaktifan, berpikir tingkat tinggi, dampak pengiring,

mekanisme balikan secara teratur, pemanfaatan teknologi informasi, pembelajaran

kontekstual, penggunaan multistrategi dan aneka sumber belajar, serta berorientasi

pada TPACK.

3. Standar Pendidikan Profesi Guru (PPG)

Standar pendidikan guru diperlukan dalam menyediakan kerangka kerja

yang jelas tentang keseluruhan pengetahuan, praktik dan keterlibatan profesional

yang diperlukan pada Program PPG. Standar Program PPG membedakan antara

belajar profesional merupakan pengembangan pengetahuan profesional, praktik

profesional merupakan belajar dari pengalaman dan keterlibatan profesional

merupakan belajar berkelanjutan melalui keterlibatan aktif berbagai kegiatan

pendukung profesi. Pengembangan profesi guru yang efektif merupakan

pembelajaran profesi yang terstruktur menghasilkan perubahan pada pengetahuan

dan praktik mengajar guru, serta peningkatan hasil pembelajaran peserta didik.

Standar pengembangan profesi guru harus dilakukan oleh semua orang

yang berprofesi sebagai guru, untuk meningkatkan harapan pengembangan

profesionalnya, untuk fokus pada pencapaian peningkatan terbesar dalam

keberhasilan peserta didik. Hal ini mengindikasikan bahwa standar ini akan

membantu siapa saja yang ingin memahami secara lebih rinci persyaratan untuk

melaksanakan pendidikan profesi guru yang efektif. Terdapat standar profesi yang

berlaku untuk semua guru yaitu: a) nilai dan hubungan profesional, b) integritas

profesional, c) perilaku profesional, d) praktik profesional, e) pengembangan

43
profesional, f) kerjasama dan kolaborasi profesional (Darling-Hammond, Hyler, &

Gardner, 2017; Departement of Education, 2016; The Teaching Council, 2012).

Standar pendidikan profesi bagi guru berkaitan dengan sejumlah harapan

mengenai pengembangan profesionalnya, karena pembelajaran yang dilakukan

oleh guru profesional akan menunjukkan dampak pada pencapaian hasil belajar

peserta didik terkait dengan materi yang diajarkannya. Dalam mengembangkan

guru yang profesional harus: (a) meningkatkan pengetahuan dan keterampilan

sebagai guru, (b) bertanggung jawab untuk meningkatkan pengajaran, (c)

menunjukkan pengetahuan dan pemahaman tentang bagaimana peserta didik

belajar dan berdampak pada pengajaran, (d) memiliki pengetahuan yang relevan

dengan kurikulum, (e) merefleksikan pendekatan pengajaran dan pembelajaran

secara sistematis dan efektif; dan, (f) mengetahui dan memahami bagaimana cara

menilai ranah hasil belajar peserta didik. Hal ini mensyaratkan untuk menjadi

guru yang profesional senantiasa meningkatkan pengetahuan dan keterampilan,

bertanggungjawab, merefleksikan pendekatan pengajaran dan tahu menilai hasil

pembelajaran (Darling-Hammond et al., 2017; Departement of Education, 2016).

Standar pengembangan profesi guru seperti di Australia mencakup tujuh

standar yang menguraikan apa yang harus diketahui dan dilakukan guru yaitu: a)

tahu peserta didik dan bagaimana mereka belajar, b) tahu konten dan bagaimana

mengajarkannya, c) merencanakan dan melaksanakan pengajaran dan

pembelajaran efektif, d) menciptakan dan memelihara lingkungan belajar yang

aman dan mendukung, e) menilai, memberikan umpan balik dan melaporkan

pembelajaran peserta didik, f) terlibat dalam pembelajaran profesional, g) terlibat

44
secara profesional dengan kolega, orang tua/wali dan masyarakat (O’Meara,

2011). Ketujuh standar tersebut dikelompokkan ke dalam tiga domain yaitu

pengetahuan profesional, praktik profesional dan keterlibatan profesional. Dengan

demikian guru harus memiliki pengetahuan yang berkaitan dengan profesinya

yang dijewantahkan dalam praktik pembelajaran di kelas dan selalu terlibat dalam

berbagai kegiatan pendukung profesinya, misalnya pengembangan pedagogical

content knowledge (PCK) penting dikuasai oleh setiap guru karena berkaitan

dengan bagaimana peserta didik belajar dan materi yang diajarkan (Van Driel &

Berry, 2012).

Indonesia juga melakukan standarisasi terhadap guru agar kompetensinya

teruji dan terukur yang dikembangkan secara utuh dari empat kompetensi utama,

yaitu kompetensi pedagogik, kompetensi profesional, kompetensi sosial dan

kepribadian. Keempat kompetensi tersebut terintegrasi dalam kinerja guru.

Kaitannnya dengan standar pendidikan pada Program PPG dalam

Permenristekdikti Nomor 55 Tahun 2017 disebutkan pada pasal 17 bahwa standar

pendidikan Program PPG terdiri atas: a) standar kompetensi lulusan; b) standar

isi; c) standar proses; d) standar penilaian; e) standar pendidik dan tenaga

kependidikan; f) standar sarana dan prasarana; g) standar pengelolaan; dan h)

standar pembiayaan. Standar ini dijadikan acuan kriteria LPTK dalam

penyelenggaraan program PPG untuk menyelenggarakan pembelajaran yang

mendukung peserta menjadi guru profesional dengan memiliki, menguasai, dan

mampu menerapkan kompetensi akademik dan kompetensi profesional. Dari

delapan standar pendidikan pada program PPG hanya empat standar yang dibahas

45
yaitu standar kompetensi lulusan, standar isi, standar proses dan standar: penilaian

dengan deskripsi berikut.

Standar kompetensi lulusan program PPG merupakan kriteria minimal

mengenai kualifikasi kemampuan lulusan yang mencakup sikap, pengetahuan, dan

keterampilan yang dinyatakan dalam rumusan capaian pembelajaran lulusan

(CPL) dan capaian pembelajaran Bidang Studi (CPBS) Program PPG. Rumusan

capaian pembelajaran lulusan mengacu pada deskripsi capaian pembelajaran

lulusan dalam Standar Nasional Pendidikan Tinggi yang memuat kompetensi

pedagogik, kompetensi kepribadian, kompetensi profesional dan kompetensi

sosial (Permenristekdikti Nomor 55 Tahun 2017 Pasal 18). Sehubungan dengan

standar kompetensi lulusan tersebut, maka standar ini dalam penyelenggaraan

PPG ini dimaksudkan untuk menghasilkan lulusan yang memiliki sertifikat

pendidik sesuai dengan kebutuhan.

Terkait implementasi standar ini dalam Buku Panduan PPG tahun 2018

sebagaimana Pasal 5 Permenristekdikti Nomor 44 tahun 2015 tentang Standar

Nasional Pendidikan Tinggi SNDikti) dan Pasal 18 Permenristekdikti Nomor 55

tahun 2017 tentang Standar Pendidikan Guru (StandarDikgu) yang mencakup

sikap, pengetahuan, dan keterampilan dinyatakan dalam rumusan capaian

pembelajaran lulusan Program PPG yang memuat kompetensi pedagogik,

kompetensi profesional, kompetensi sosial dan kepribadian yang harus dimiliki

oleh peserta PPG beserta sub kompetensi dan indikatornya yang tertera dalam

Lampiran Permenristekdikti Nomor 55 tahun 2017 tentang StandarDikgu

(Kemenristekdikti, 2018: 16).

46
Standar isi pada program PPG merupakan kriteria minimal tingkat

keluasan, kedalaman, urutan, dan saling keterkaitan materi pembelajaran dan

keilmuan dan/atau keahlian Program PPG. Standar isi untuk Program PPG

meliputi isi pembelajaran terkait pengembangan kompetensi pedagogik,

kompetensi kepribadian, kompetensi profesional, dan kompetensi sosial

(Permenristekdikti Nomor 55 Tahun 2017 Pasal 19). Tahap pengembangan

kurikulum Program PPG dilakukan berdasarkan: a) perumusan capaian

pembelajaran lulusan (CPL)/capaian pembelajaran bidang studi (CPBS), b)

penentuan mata kegiatan belajar dan bobot/beban kegiatan belajar, c) perumusan

capaian mata kegiatan (CPMK) dan penyusunan rencana pembelajaran semester

(Kemenristekdikti, 2018b).

Dengan demikian struktur kurikulum PPG tersebut dijabarkan ke dalam

rencana program semester (RPS) Program PPG yang digunakan sebagai

penjabaran lebih lanjut dari tujuan Program PPG. RPS sekurang-kurangnya berisi

capaian pembelajaran workshop/PPL, sub capaian pembelajaran workshop/PPL,

bahan kajian, bentuk/model pembelajaran, pengalaman belajar mahasiswa, alokasi

waktu, indikator penilaian, bobot nilai, dan referensi. Proporsi antara workshop

SSP dan PPL yaitu 60 : 40 dari beban belajar PPG (Kemenristekdikti, 2018b;

Prasojo et al., 2017). Dengan demikian struktur kurikulum PPG berisi workshop

pengembangan perangkat pembelajaran bidang studi yang diimplementasikan

peer teaching dan PPL.

47
Standar proses merupakan kriteria minimal pelaksanaan pembelajaran

pada Program PPG untuk memperoleh capaian pembelajaran lulusan sebagai guru

profesional. Standar proses yang dimaksud mencakup karakteristik proses

pembelajaran, perencanaan proses pembelajaran, pelaksanaan proses

pembelajaran, dan beban belajar PPG Prajabatan adalah 36-40 SKS dengan

karakteristik pembelajaran yaitu interaktif, holistik, integratif, saintifik,

kontekstual, tematik, efektif, kolaboratif, inovatif dan berpusat pada peserta didik

serta mandiri. Implementasi dari standar proses PPG disajikan pada Gambar 1:

Gambar 1. Proses Penyelenggaraan PPG

Berdasarkan mata kegiatan dan bobot kegiatan, Program PPG terbagi

menjadi PPG Prajabatan dan PPG dalam Jabatan dengan mengacu pada

Permenristekdikti Nomor 55 Tahun 2017 tentang StandarDikgu dijelaskan

kegiatan Program Studi PPG Prajabatan sebagaimana disajikan Gambar 2:

48
Gambar 2. Mata Kegiatan PPG Prajabatan

Berdasarkan mata kegiatan PPG Prajabatan pada Gambar 2, kegiatan

pembelajaran pada program PPG dikelompokkan ke dalam tiga kegiatan yaitu

lokakarya pengembangan mata kegiatan umum (MKU), lokakarya pengembangan

perangkat pembelajaran, dan PPL. MKU terdiri dari orientasi awal, penyusunan

rancangan Penelitian Tindakan Kelas (PTK), serta praktik dan seminar hasil PTK.

Hasil Mata kegiatan lokakarya merupakan kegiatan untuk menyusun perangkat

pembelajaran bidang studi dengan bobot SKS keseluruhan sebesar 19 SKS.

Sementara kegiatan PPL berisi kegiatan praktik mengajar dan non mengajar

dengan bobot SKS 19 SKS dan untuk PPG kejuruan, PPL dapat disertai dengan

kegiatan industri. Adapun mata kegiatan, kode dan besaran jumlah SKS mata

kegiatan PPG Prajabatan disajikan pada tabel 1 berikut.

49
Tabel 1. Kelompok Mata Kegiatan PPG Prajabatan

Jumlah
No Kelompok Mata Kegiatan Kode
SKS
1 Mata kegiatan Umum MKU 4
2 Lokakarya Pengembangan
LOK 19
Perangkat Pembelajaran
3 PPL MPL 15
Jumlah 38

Selanjutnya mata kegiatan dan bobot kegiatan Program PPG dalam jabatan

(Daljab) mengacu pada Permenristekdikti Nomor 55 tahun 2017 Pasal 20 Ayat

(11) Beban belajar Program PPG Daljab paling sedikit 24 sks yang dibagi dalam

tiga bentuk pembelajaran sebagaimana disajikan pada Gambar 3.

Gambar 3. Mata Kegiatan PPG Dalam Jabatan

50
Selanjutnya untuk mahasiswa/peserta PPG Daljab mengingat telah

memiliki pengalaman mengajar menjadi guru di sekolahnya, untuk pendalaman

materi dilakukan secara online (daring) dengan bobot 10 SKS. Sedangkan

lokakarya dilakukan secara tatap muka di LPTK dengan bobot 8 SKS dan PPL

dilakukan di sekolah-sekolah sekitar lokasi LPTK dengan bobot 6 SKS

(Kemenristekdikti, 2018b). Adapun mata kegiatan, kode dan besaran jumlah SKS

mata kegiatan PPG Daljab disajikan pada Tabel 2 berikut.

Tabel 2. Kelompok Mata Kegiatan PPG Daljab


No Kelompok Mata Kegiatan Kode Jumlah SKS
1 Pendalaman Materi DAR 10
2 Lokakarya LOK 8
3 PPL PPL 6
Jumlah 24

Standar penilaian pada Program PPG merupakan kriteria minimal

mengenai penilaian proses dan hasil belajar mahasiswa/peserta PPG dalam rangka

pemenuhan capaian pembelajaran lulusan Program PPG. Penilaian terhadap

proses dan hasil belajar mahasiswa meliputi penilaian proses dan produk

pengembangan perangkat pembelajaran, proses dan produk PPL, uji kompetensi

mahasiswa Program. Program PPG diakhiri dengan uji kompetensi yang

diselenggarakan oleh Panitia Nasional yang dilakukan melalui uji tulis dan uji

kinerja sesuai dengan standar nasional kompetensi guru dan mahasiswa/peserta

PPG yang lulus penilaian proses dan produk, uji kompetensi, dan penilaian

kehidupan berasrama memperoleh sertifikat pendidik yang berlaku secara

nasional (Permenristekdikti Nomor 55 Tahun 2017 Pasal 21). Dengan adanya

standar penilaian proses dan hasil belajar mahasiswa/peserta PPG, tentunya

51
capaian pembelajaran lulusan Program PPG dapat terukur dan teruji. Oleh karena

itu, capaian pembelajaran mata kegiatan dirumuskan berdasarkan capaian

pembelajaran bidang studi untuk masing-masing mata kegiatan belajar pada

Program PPG untuk suatu bidang studi.

Pelaksanaan PPG daljab melalui daring pelaksanaan pembelajarannya

memanfaatkan teknologi dengan ditunjuk instruktur PPG yang bertugas sebagai

kurator tugas, dimana instruktur setelah membaca tugas mahasiswa/peserta PPG

harus menentukan apakah tugas dapat diberikan ke peserta atau tugas harus

diganti. Selain itu, tugas instruktur PPG daljab adalah kurator tes, yang harus

menentukan apakah tes dapat diberikan ke peserta atau tes harus diganti.

Selanjutnya tugas instruktur juga membuat topik diskusi dengan cara menuliskan

pemantik diskusi, semua hasil diskusi peserta merupakan komponen penilaian

sehingga forum diskusi hanya dapat digunakan untuk mendiksuiakn materi yang

sedang dibahas dalam kegiatan belajar tersebut (Anggraeni, 2019; Khaerudin,

2019). Intisari dari Program PPG bukan merupakan jalur pintas menjadi guru

profesional, namun harus melalui tahapan proses yang panjang mulai dari lulus

Daring bagi peserta PPG Dalam Jabatan, lapor diri, orientasi, mengikuti

lokakarya, PPL, uji kompetensi mahasiswa PPG (UKMPPG).

Berbagai kajian secara teoritis tentang standar pendidikan profesi guru

baik secara de jure maupun de facto berkonstribusi pada peningkatan

profesionalisasi pengajaran dari profesi guru dan sebagai dasar model

akuntabilitas profesional guru. Hal ini bertujuan untuk memastikan bahwa guru

dapat menunjukkan tingkat pengetahuan profesional, praktik profesional dan

52
keterlibatan profesional yang sesuai dengan yang distandarkan. Jika standar

pendidikan pada PPG terlaksana dengan baik, maka berimplikasi kepada

perancangan, pelaksanaan, dan penilaian pembelajaran dengan mengacu pada

perangkat kompetensi yang dicapai.

4. Sistem Penilaian Pendidikan Profesi Guru (PPG)

Penilaian merupakan komponen penting dalam penyelenggaraan

pendidikan yang berkualitas, keduanya saling terkait dan tidak dapat dipisahkan

karena kualitas pendidikan dapat dilihat dari hasil penilaiannya. Penilaian

mengidentifikasi keberhasilan pendidikan dan hasil dari penilaian tersebut

memiliki fungsi utama dalam proses pendidikan lebih lanjut, memberikan

informasi berharga untuk membantu dalam membuat keputusan tentang kinerja

suatu kelompok misalnya kelas, sekolah atau pembuat kebijakan (Kartowagiran &

Jaedun, 2016; Retnawati, Kartowagiran, Arlinwibowo, & Sulistyaningsih, 2017).

Selain itu, penilaian memberikan informasi penting untuk meningkatkan proses

pendidikan yang mampu menggambarkan hasil belajar komprehensif, dan

kegiatan penilaian itu sendiri dapat dilakukan melalui kegiatan pengukuran

(Anisa, 2017; Ofianto & Suhartono, 2015; Suyata, Mardapi, Kartowagiran, &

Retnawati, 2011). Jika ingin meningkatkan kualitas penyelenggaraan pendidikan,

maka perlu meningkatkan kualitas penilaiannya.

Penilaian yang berkualitas dapat diwujudkan jika tujuan penilaian

dirumuskan dengan jelas, dapat diukur dan mampu menjelaskan keberhasilan dari

tujuan penilaian yang dirumuskan. Kegiatan penilaian perlu diarahkan pada

empat hal, yaitu: a) penelusuran, yaitu menelusuri apakah telah berlangsung

53
sesuai yang direncanakan, b) pengecekan, yaitu untuk mencari informasi apakah

terdapat kekurangan-kekurangan pada peserta didik selama proses pembelajaran,

c) pencarian, yaitu mencari dan menemukan penyebab kekurangan yang muncul,

d) penyimpulan, yaitu menyimpulkan tingkat pencapaian belajar dibandingkan

dengan yang harus dicapai sesuai dengan kompetensi (Mardapi, 2017: 14-15).

Pendapat ini menunjukkan bahwa penilaian menjadi isu yang sangat penting

dalam mengukur capaian kompetensi yang diukur termasuk capaian kompetensi

peserta PPG menjadi guru profesional.

Kaitan antara penilaian dan ketercapaian kompetensi lulusan PPG

dipertegas dalam Permenristekdikti Nomor 55 Tahun 2017 bagian kelima pasal 21

dalam standar penilaian dijelaskan bahwa penilaian proses dan hasil belajar

mahasiswa dilakukan dalam rangka pemenuhan capaian pembelajaran peserta

PPG. Hal ini juga sejalan dengan paradigma penilaian yang merupakan bagian

dari cara membelajarkan peserta didik, jika ingin mengevaluasi pelaksanaan hasil

belajar harus didahului penilaian yang mampu mendorong peserta didik belajar

lebih baik (Mardapi, 2017: 14). Penilaian sebenarnya terbatas pada penafsiran

skor hasil tes atau hasil pengukuran lainnya yang bukan tes (Popham, 1997: 6;

Mardapi, 2017: 162). Pendapat ini memperjelas titik fokus penilaian merupakan

bagian dari evaluasi keberhasilan pembelajaran pada Program PPG.

PPG merupakan suatu program dari kebijakan pemerintah guna

pemantapan kompetensi dasar yang harus dimiliki peserta sebagai seorang guru

profesional, sehingga perlu dinilai dan dievaluasi keberhasilannya. Program perlu

dievaluasi, jika ingin memperbaiki desain, implementasi dan hasil dari

54
pelaksanaan sebuah program menjadi lebih baik, maka harus dilakukan penilaian

(American Educational Research Association & National Council on

Measurement in Education, 2014).

Lingkup penilaian kompetensi mahasiswa/peserta PPG di Indonesia

dikembangkan mengacu pada tuntutan empat kompetensi guru yaitu kompetensi

pedagogik, komptensi profesional, kompetensi sosial dan kompetensi kepribadian

baik dalam konteks pembelajaran maupun dalam konteks kehidupan guru sebagai

anggota masyarakat sebagaimana dipersyaratkan dalam Undang-Undang Nomor

20 Tahun 2003 tentang sistem pendidikan nasional, Undang-Undang Nomor 14

Tahun 2005 tentang guru dan dosen. Selain itu mengacu pada Permendiknas

Nomor 16 Tahun 2007 tentang standar kualifikasi akademik dan kompetensi guru,

serta tertuang dalam Permendikbud Nomor 57 tahun 2012 tentang uji kompetensi

guru, Peraturan Pemerintah Nomor 19 tahun 2017 tentang perubahan Atas

Peraturan Pemerintah Nomor 74 Tahun 2008 tentang Guru dan Permenristekdikti

Nomor 55 Tahun 2017 tentang Standar Pendidikan Guru. Hal ini menunjukkan

bahwa penilaian kompetensi lulusan Program PPG memiliki landasan hukum

yang kuat sebagai pijakannya.

Penilaian penguasaan kompetensi peserta PPG kaitannya dengan

kompetensi pedagogik, kompetensi sosial dan kompetensi kepribadian melalui

penilaian kinerja penguasaan kemampuan menyusun rencana pelaksanaan

pembelajaran untuk pendalaman lebih lanjut dilakukan wawancara sebelum

maupun setelah proses pembelajaran dilaksanakan. Selanjutnya penilaian kinerja

dalam konteks otentik ditekankan pada kualitas kinerja secara keseluruhan selama

55
peserta melakukan PPL melalui pengamatan dan juga dapat dilengkapi dengan

wawancara (Kemenristekdikti, 2017; Prasojo et al., 2017).

Ketentuan mengenai penilaian kinerja PPL dilakukan oleh guru pamong

dan dosen pembimbing lapangan meliputi penilaian praktik mengajar, praktik

persekolahan, kemampuan interpersonal, dan laporan hasil PPL dengan

deskripsi kompetensi yang masih perlu ditingkatkan dalam bentuk rubrik.

Penilaian setiap peserta melalui penilaian portofolio dengan kriteria nilai minimal

kelulusan kegiatan PPL adalah B (3,0) bagi yang gagal diberi latihan tambahan

sampai berhasil mencapai nilai minimal (Kemenristekdikti, 2017; Prasojo et al.,

2017). Untuk bobot penilaian akhir PPL seperti disajikan pada Tabel 3.

Tabel 3. Bobot Penilaian Akhir PPL

No Aspek yang dinilai Bobot


1 Praktik mengajar 4
2 Kegiatan non mengajar 2
3 Kompetensi sosial dan kepribadian 2
4 Laporan PPL dan PTK 2
Jumlah 10

Selanjutnya penilaian dalam konteks ujian akhir melalui uji kompetensi

terdiri atas ujian tulis dan ujian kinerja. Ujian tulis terdiri dari Uji Tulis LPTK

(UTL) dan Uji Tulis Nasional (UTN) yang ditempuh mahasiswa/peserta PPG

setelah lulus dalam kegiatan workshop dan PPL dengan penyelenggaranya

program studi menggunakan seperangkat tes essai yang berupa pemecahan

masalah dan untuk UTN diselenggarakan oleh Ditjen Belmawa mengukur

kompetensi pedagogis dan profesional yang diselenggarakan secara online dan

serentak (Kemenristekdikti, 2017b: 26) sebagaimana dapat dilihat pada Tabel 4:

56
Tabel 4. Rambu-Rambu Ujian Tulis LPTK (UTL)

No Aspek Ujian Deskripsi


1 Materi ujian Materi uji bersumber dari portofolio hasil
workshop, PPL, dan Subject-Specific Pedagogy
(SSP). Bahan ajar SSP dapat berupa modul,
buku teks, media dan lain-lain
2 Bentuk soal Soal berbentuk uraian berbasis kasus dan
berorientasi pada pencapaian SKL PPG
3 Kualitas soal Mengungkap kemampuan kognitif minimal
pada level analisis (C4)

Ada beberapa macam teknik penilaian yang dapat digunakan untuk

menetapkan kualitas proses dan hasil belajar mahasiswa Program PPG seperti

disajikan pada Gambar 4 sebagai berikut.

Gambar 4. Teknik Penilaian Kualitas Proses dan Hasil Belajar PPG


(Kemenristekdikti, 2018b)

57
Mencermati Gambar 4 menunjukkan bahwa teknik-teknik penilaian

tersebut baik tes maupun non tes dapat digunakan untuk menilai kualitas proses

dan hasil belajar peserta/mahasiswa Program PPG. Sebagaimana dinyatakan pada

Buku Pedoman Penyelenggaraan PPG tahun 2018 (Kemenristekdikti, 2018: 17)

dijelaskan rincian atau pembagian teknik penilaian menurut standar pendidikan

guru ini adalah: a) penilaian proses dan produk pengembangan perangkat

pembelajaran dapat menggunakan teknik analisis isi dokumen; b) proses dan

produk Praktik Pengalaman Lapangan (PPL) dapat menggunakan teknik observasi

dan analisis isi dokumen; c) uji kompetensi berupa tes tulis dan tes kinerja

(performance test), mencakup penilaian proses dan produk kegiatan (lokakarya

dan PPL); dan d) penilaian kehidupan bermasyarakat di asrama/sarana lain dapat

menggunakan teknik kuesioner dan observasi.

Memperhatikan sistem dan teknik penilaian tersebut dalam menentukan

kelulusan peserta menunjukkan bahwa penilaian kompetensi lulusan PPG menjadi

sangat penting untuk mendapatkan keakuratan dan konsistensi penilaian dari

mahasiswa/peserta PPG. Akurasi dan konsistensi penilaian pada PPG merupakan

prasyarat mutlak untuk menghasilkan penilaian kompetensi lulusan PPG yang

objektif dan akuntabel. Menurut Kane, Kerr, & Pianta, (2014: 1) mengajar adalah

interaksi yang kompleks antara guru, siswa, dan materi yang tidak hanya satu

instrumen yang digunakan sebagai alat pengukuran untuk dapat menilainya,

sehingga untuk memastikan ketepatan dalam pengukurannya, menimbulkan

tantangan besar dalam mendesain instrumen penilaian dan melaksanakannya agar

mampu mengukurnya dengan efektif.

58
Guna menghasilkan penilaian yang objektif dan akuntabel dilakukan

berbagai kajian teoritik yang mampu menggambarkan karakteristik dari

kompetensi yang diukur, sehingga bisa digunakan sebagai point pencermatan

dalam penetapan dimensi yang diukur yang selanjutnya diuraikan menjadi

indikator. Indikator ini yang menjadi acuan dari dimensi yang dinilai dari capaian

penguasaan kompetensi mahasiswa/peserta PPG dengan merujuk kepada empat

kompetensi yang dipersyaratkan yaitu kompetensi pedagogik, sosial, kepribadian

dan kompetensi profesional dengan deskripsi sebagai berikut.

a. Kompetensi Pedagogik

Kompetensi adalah kemampuan seseorang untuk melakukan pekerjaan

atau tugas yang didasarkan pada pengetahuan, sikap, dan keterampilan yang

sesuai dengan tuntutan pekerjaan. Kompetensi juga merupakan kebulatan

penguasaan pegetahuan, keterampilan, dan sikap yang ditampilkan melalui unjuk

kerja yang diharapkan bisa dicapai seseorang setelah menyelesaikan suatu

program pendidikan (Hakim, 2015; Kartowagiran, 2012b). Kompetensi yang

berkenaan langsung dengan profesi guru dan banyak disoroti dalam proses

pembelajaran adalah kompetensi pedagogik.

Kompetensi pedagogik adalah serangkaian prinsip-prinsip yang efektif

dalam mengajar. Kompetensi ini secara khas mencirikan dan membedakan

profesi guru dengan profesi lainnya yaitu fokus pada penguasaan terhadap teori

perkembangan dan teori-teori belajar mutlak ada pada guru, serta mampu

mengoptimalkan potensi peserta didik dan mampu melakukan penilaian terhadap

kegiatan pembelajaran yang telah dilakukan, sehingga dapat dikatakan kompetensi

59
pedagogik berkaitan dengan kemampuan guru mengelola peserta didik dan

mengelola pembelajaran dengan baik yang mendidik dan dialogis (Kartowagiran,

2012b; Nur, 2014; Pamungkas et al., 2019; Robinson & Campbell, 2010;

Wardoyo, 2015; Yasin, 2012). Artinya untuk menjadi seorang guru harus

memahami tujuan pembelajaran dan mampu mengelola proses pembelajaran.

Kaitan dengan kemampuan mengelola proses pembelajaran, Shulman

(2005) menggambarkan kompetensi pedagogik sebagai bentuk karakteristik

pembelajaran. Terdapat tiga aspek dari praktik profesional guru yang terintegrasi

dengan kompetensi pedagogik, yaitu: 1) berpikir, mempekerjakan pengetahuan

secara profesional, 2) melaksanakan, memanfaatkan keterampilan profesi, dan 3)

bertindak dengan integritas, mengamalkan nilai-nilai etika dan profesi. Pendapat

ini mempertegas bahwa kompetensi pedagogik adalah menyangkut pengetahuan

dan keterampilan pengajaran yang mengacu pada kinerja pembelajaran.

Kompetensi pedagogik sangat penting dan menjadi tantangan dalam

perspektif guru profesional. Kompetensi ini cenderung digunakan dalam standar

profesional minimum guru, yang akan meningkatkan peran dari profesinya serta

pada program pendidikan guru menjadi suatu kebutuhan untuk terus ditingkatkan

(Jurčić, 2014; Martínez, 2010; Suciu & Mata, 2011). Ini mengindikasikan bahwa

rendahnya kompetensi pedagogik guru dapat menyebabkan kualitas proses

pembelajaran akan rendah, sehingga kompetensi ini perlu selalu dikembangkan.

Pengembangan kompetensi ini memiliki banyak dimensi yaitu dimensi

pertama, pengembangan individu dan spesifik pada jalur karir yang dipilih.

Dimensi kedua, adalah perguruan tinggi mengembangkan kompetensi pedagogik

60
melalui program praktik pengalaman lapangan untuk mempromosikan mahasiswa

yang siap dengan segala kemampuannya mengabdikan diri dalam dunia

pendidikan. Dimensi ketiga, meletakkan kerangka dasar dan prosedural mengenai

kemampuan guru dalam peraturan yang relevan. Dimensi keempat adalah

pengembangan standar nasional pendidikan guru berbasis kompetensi.

Kompetensi pedagogik guru telah menjadi standar kompetensi yang harus

dikuasai calon guru dan guru di negara-negara bagian Eropa, terutama di bagian

Utara dan Barat (Merkt, 2017). Indonesia sendiri juga telah mensyaratkan

kompetensi pedagogik sebagai salah satu kompetensi yang harus dimiliki calon

guru dan guru dengan selalu memfokuskan perhatian pada peningkatan

kompetensi ini. Keberhasilan guru dalam melaksanakan pembelajaran sangat

terkait dengan kompetensi pedagogik dan kompetensi ini memiliki hubungan

yang signifikan dengan kualitas pembelajaran yang dilaksanakannya.

Kualitas pembelajaran dari seorang guru sangat dipengaruhi oleh

kompetensi pedagogik. Orazbayeva (2016) mengemukakan bahwa idealnya guru

yang memiliki kompetensi pedagogik ditunjukkan dengan 4 dimensi yaitu: 1)

effective classroom management, 2) effective teaching practices, 3) effective

assessment, 4) technology skill. Keempat dimensi kompetensi tersebut

dideskripsikan sebagai berikut.

Dimensi pertama, effective teaching practices yaitu pengelolaan kelas

dengan cara: 1) mengidentifikasi karakteristik peserta didik, 2) memberikan

kesempatan yang sama kepada semua peserta didik, 3) merencanakan dan

menggorganisasikan pembelajaran, 4) melakukan berbagai strategi untuk

61
menciptakan hubungan yang positif, kerjasama dan mencapai tujuan belajar.

Dimensi kedua, effective teaching practices yaitu melaksanakan praktik mengajar

yang efektif dengan cara: 1) mengidentifikasi, memilih dan menerapkan berbagai

strategi mengajar yang dapat membantu peserta didik terlibat aktif dalam

pembelajaran, 2) melakukan aktivitas pembelajaran secara bervariasi atau tidak

monoton, 3) mengidentifikasi masalah yang dihadapi peserta didik dan

membantunya dalam memecahkannya, 4) membantu peserta didik menggunakan

sumber belajar, 5) memberikan banyak kesempatan kepada peserta didik untuk

bertanya, mempraktekkan dan berinterkasi dengan peserta didik lainnya. Kedua

dimensi ini memiliki keterkaitan satu sama lain dalam menunjang keberhasilan

pembelajaran yang dilaksanakan guru.

Dimensi ketiga, effective assessment yaitu melaksanakan penilaian yang

efektif dengan cara: 1) menyusun alat penilaian yang sesuai dengan tujuan

pembelajaran, 2) melaksanakan penilaian dengan berbagai jenis dan teknik

penilaian, 3) melibatkan peserta didik dalam kegiatan penilaian untuk membantu

mereka menjadi sadar akan kekuatan dan kelemahan mereka, 4) mendorong

peserta didik memiliki keinginan prestasi belajar yang tinggi, 5) memanfaatkan

hasil penilaian dari peserta didik dan merefleksikannya untuk meningkatkan

pembelajaran selanjutnya. Dimensi keempat, technology skill yaitu memiliki

keterampilan dalam menggunakan teknologi. Guru harus mengetahui kapan dan

bagaimana menggunakan teknologi pendidikan saat ini, serta mampu

mengidentifikasi dan memilih yang paling sesuai dengan materi yang diajarkan

dan mampu memaksimalkan dengan waktu pembelajaran yang ada. Dari kedua

62
dimensi ini menunjukkan bahwa menjadi seorang guru yang berkualitas harus

mampu melaksanakan penilaian yang efektif dan dan terampil dalam

menggunakan teknologi dalam pembelajaran.

Guru berkualitas tercermin dari pengetahuan dan kemampuannya dalam

merencanakan pembelajaran, mengelola kelas, memilih metode dan strategi

pembelajaran, menggunakan media pendukung hingga melakukan evaluasi

pembelajaran. Selain itu, untuk mewujudkan guru yang berkualitas, guru

senantiasa aktif belajar memperkaya pengetahuan dan kemampuan yang

dimilikinya melalui seminar, lokakarya, dan kegiatan pendukung lainnya (Calvert,

2016; Griffin & Care, 2014; König & Pflanzl, 2016).

Menurut Lewin & Shoemaker, (2011: 4) sistem penilaian guru

memasukkan empat unsur penting: 1) valid dalam menilai didasarkan pada

sejumlah sumber data, termasuk pengamatan langsung, penilaian kinerja,

penilaian diri, tes, dan tugas kelas yang mencerminkan kemampuan siswa dari

waktu ke waktu, 2) keamanan penilaian yang diberikan di bawah kondisi yang

terkendali (selama waktu tertentu), yang mana tidak ada bantuan yang diberikan,

3) penilaian kelas, 4) catatan yang menyediakan bukti pengetahuan, keterampilan

dan pengembangan peserta didik dari waktu ke waktu. Sementara menurut

Kartowagiran, Jaedun, and Hamdi (2017) bahwa guru dapat melakukan penilaian

ini kapan saja baik melalui pengamatan langsung maupun tes harian. Melalui

pengamatan langsung, guru mungkin dapat mengidentifikasi kemajuan dan

pencapaian sikap peserta didik sehingga penilaian tersebut harus menjadi sarana

untuk meningkatkan kinerja mengajar guru, yang dikenal sebagai assessment for

63
learning (AfL), dan menjadi sarana untuk meningkatkan pembelajaran peserta

didik, yang dikenal sebagai assessment as learning (AaL).

Keempat dimensi kompetensi pedagogik tersebut secara eksplisit

menunjukkan bahwa guru perlu memiliki kemampuan dalam hal: 1) memilih

materi belajar yang harus diajarkan, 2) menetapkan kriteria keberhasilan

pembelajaran dan memberitahukan kriteria tersebut kepada peserta didik, 3) guru

menunjukkan kepada peserta didik belajar menggunakan pengetahuan dan

keterampilannya melalui pemodelan, 4) melakukan evaluasi terhadap peserta

didik, 5) memberikan kesempatan perbaikan untuk memperoleh pengetahuan/

keterampilan jika diperlukan, 6) menutup kegiatan pembelajaran di akhir

pelajaran. Selain itu, guru juga penting memiliki kesadaran dan kesiapan untuk

melakukan perubahan atau perbaikan selama proses belajar seperti membiasakan

peserta didik melakukan aktivitas pembelajaran yang mendukung peserta didik

memiliki kemampuan Higher Order Thinking Skills (HOTS), hal ini penting

untuk membantu peserta didik dalam memecahkan masalah baru, aklimatisasi diri,

dan membuat keputusan tentang masalah tertentu (Retnawati, Djidu, Apino, &

Anazifa, 2018). Pendapat ini menunjukkan bahwa kompetensi pedagogik yang

perlu dimiliki guru terkait kemampuan dalam hal pemilihan materi, penetapan

kriteria keberhasilan pembelajaran, penggunaan berbagai strategi pembelajaran,

melakukan penilaian dan perbaikan pembelajaran serta menutup pembelajaran.

Jika mampu melakukan berbagai hal tersebut, maka hal ini akan menjadikan

pembelajaran yang dilaksanakan guru berkualitas.

64
Kaitannya dengan standar kompetensi pedagogik guru dalam penilaian

pendidikan, Sanders et al. (1999) mengemukakan bahwa menurut American

Federation of Teachers (AFT), National Council on Measurement in Education

(NCME), dan National Education Association (NEA) terdapat 7 (tujuh) standar

lingkup peran dan tanggung jawab guru dalam penilaian peserta didik yaitu: “1)

terampil dalam memilih metode penilaian, 2) terampil dalam mengembangkan

metode penilaian, 3) terampil dalam merancang dan menafsirkan hasil penilaian,

4) terampil menggunakan hasil penilaian, 5) terampil dalam mengembangkan

prosedur penilaian, 6) terampil dalam mengkomunikasikan atau menyampaikan

hasil penilaian, 7) terampil dalam mengenali metode penilaian yang tidak pantas,

tidak etis, illegal, dan menggunakan informasi penilaian”. Sebagai pendukung

pengembangan sistem pembelajaran menyelaraskan penilaian guru dan peserta

didik dengan tujuan utama untuk meningkatkan keduanya (National Education

Association, 2010). Hal ini menunjukkan bagaimana standar pembelajaran dapat

memiliki hubungan yang sistemik antara pengajaran guru dengan penilaian yang

dilakukan.

Idealnya dalam melakukan penilaian harus dipersiapkan dengan baik

terutama dalam mengembangkan instrumen penilaian yang baik dan tepat, namun

kemampuan tersebut jarang dikuasai oleh seorang guru seperti memutuskan

indikator yang sesuai dengan tujuan pembelajaran menjadi masalah besar bagi

guru, belum lagi menjabarkannya ke dalam beberapa item. Banyak guru sering

mengeluh dalam proses penilaian seperti masalah dalam penilaian kognitif yaitu

dalam mengkonstruksi item tes, dalam penilaian sikap para guru tidak dapat

65
mendesain instrumen yang baik dari perumusan definisi konseptual dari

perumusan definisi operasional hingga perumusan indikator dan menguji item

(Retnawati, Hadi, & Nugraha, 2016; Retnawati, Munadi, et al., 2017).

Berbagai pendapat di atas, mempertegas bahwa kompetensi pedagogik

menjadi sangat penting dimiliki dan dikuasai calon guru dan guru di Indonesia.

Kompetensi pedagogik mendukung dan membantu mereka dalam meningkatkan

kemampuannya pada proses pembelajaran. Jika merujuk pada buku Pedoman

Penyelenggaraan Program PPG tahun 2018 terdapat capaian kompetensi

pedagogik yang harus dikuasai oleh mahasiswa/peserta PPG ini beserta

subkompetensi dan indikatornya seperti disajikan dalam Tabel 5.

Tabel 5. Kompetensi Pedagagik, Subkompetensi, dan Indikatornya

Kompetensi Sub Kompetensi Indikator


Kompetensi 1. Merencanakan a. Merumuskan indikator kompetensi dan capaian
Pedagogik pembelajaran pembelajaran berdasarkan standar kompetensi
lulusan
b. Mengorganisasikan materi, proses, sumber, media,
penilaian, dan evaluasi pembelajaran
c. Menyusun Rencana Pelaksanaan
Pembelajaran (RPP) sesuai silabus dengan
menerapkan prinsip Techno-Pedagogical Content
Knowledge (TPACK)
2. Melaksanakan Mewujudkan suasana dan proses pembelajaran yang
Pembelajaran mendidik dan mencerdaskan sesuai dengan kaidah
pedagogik untuk memfasilitasi pengembangan potensi
diri dan karakter peserta didik
3. Menilai dan a. Melaksanakan penilaian yang otentik-holistik yang
Mengevaluasi mencakup ranah sikap, pengetahuan, dan
Pembelajaran keterampilan (assessment of learning)
b. Melaksanakan penilaian sebagai proses belajar
(assessment as learning)
c. Menggunakan hasil penilaian untuk meningkatkan
kualitas pembelajaran (assessment for learning)

66
Berdasarkan Tabel 5 menunjukkan secara teoritis bahwa penilaian capaian

kompetensi pedagogik yang harus dikuasai oleh mahasiswa/peserta PPG perlu

dikembangkan meliputi seperangkat kemampuan yang dikuasai dalam

merencanakan pembelajaran, melaksanakan pembelajaran, menilai dan

mengevaluasi pembelajaran dengan sub kompetensi yaitu: kemampuan dalam

merencanakan pembelajaran dapat dikembangkan dari indikator merumuskan

indikator kompetensi dan capaian pembelajaran berdasarkan standar kompetensi

lulusan, mengorganisasikan materi, proses, sumber, media, penilaian, dan evaluasi

pembelajaran serta kemampuan menyusun Rencana Pelaksanaan Pembelajaran

(RPP) sesuai silabus dengan menerapkan prinsip Techno-Pedagogical Content

Knowledge (TPACK). Kemampuan dalam melaksanakan pembelajaran

dikembangkan dari indikator: kemampuan dalam mewujudkan suasana dan proses

pembelajaran yang mendidik, kemampuan dalam mewujudkan suasana dan proses

pembelajaran yang mencerdaskan sesuai dengan kaidah pedagogik serta

kemampuannya dalam memfasilitasi pengembangan potensi diri dan karakter

peserta didik.

Selanjutnya kemampuan dalam menilai dan mengevaluasi pembelajaran

dikembangkan dari indikator yang meliputi: kemampuan melaksanakan penilaian

yang otentik-holistik yang mencakup ranah sikap, pengetahuan, dan keterampilan

(assessment of learning), kemampuan melaksanakan penilaian sebagai proses

belajar (assessment as learning), dan kemampuan menggunakan hasil penilaian

untuk meningkatkan kualitas pembelajaran (assessment for learning). Pentingnya

penguasaan capaian kompetensi pedagogik oleh mahasiswa/peserta PPG yang

67
harus dikuasainya adalah untuk mengembangkan kemampuan peserta didiknya

secara maksimal. Oleh karena itu, diperlukan instrumen penilaian yang mampu

mengukur kompetensi ini pada program PPG agar penilaian dari kompetensi ini

teruji dan terukur dalam mengestimasi kemampuan mahasiswa/peserta PPG

merencanakan pembelajaran dan melaksanakan pembelajaran dengan baik.

b. Kompetensi Profesional

Kompetensi profesional termasuk kemampuan, keterampilan, pengetahuan

dan sikap yang dibutuhkan mencapai tujuan profesional secara efisien.

Kompetensi profesional guru umumnya dipahami sebagai kebutuhan individu

guru yang memiliki kecenderungan bergerak secara kontinum berdasarkan

keterampilan yang dimiliki, karena kompetensi ini berkaitan dengan kemampuan

guru dalam menguasai materi bidang studi secara luas dan mendalam yang

mencakup penguasaan subtstansi isi materi kurikulum mata pelajaran di sekolah

dan substansi keilmuwan yang menaungi materi kurikulum tersebut

(Kartowagiran, 2012b; Zinn, 2017). Kompetensi ini secara implisit membedakan

keterampilan yang dimiliki setiap guru, yang dapat dipelajari dan berubah, karena

kompetensi ini berkaitan dengan kemampuan dan kewenangan guru dalam

menjalankan profesi keguruan secara profesional.

Guru yang profesional memiliki komitmen tidak hanya sekedar memenuhi

seperangkat kriteria teknis dalam mencapai tingkat kompetensi yang terkait

dengan pekerjaannya. Kompetensi profesional guru sangat penting dalam

membantu mengatur strategi pengembangan pendidikan nasional dan pemodelan

kurikulum pendidikan dengan fokus pada tantangan dan perkembangan era

68
globalisasi (Orazbayeva, 2016). Oleh karena itu, Kamerilova et al. (2018)

mengemukakan pembentukan kompetensi profesional guru-guru di masa depan,

diperlukan perbaikan proses sistem pendidikan guru di perguruan tinggi secara

terpadu dalam menyiapkan calon guru yang profesional. Hakim (2015)

menyatakan indikator yang dapat digunakan untuk mengukur kompetensi

profesional seorang guru mencakup pemahaman tentang kurikulum yang sesuai

dengan bidang studi yang diajar, memahami konsep yang berkaitan dengan ilmu

pengetahuan lain, serta menguasai langkah dalam penelitian untuk

mengembangkan bahan ajar. Ketiga pendapat ini mempertegas bahwa kompetensi

profesional guru sangat penting dalam meningkatkan sistem pendidikan nasional

dikarenakan untuk menjadi guru yang profesional ia harus memiliki pengetahuan

yang luas dan mendalam mengenai bidang studi yang diajarkan kepada peserta

didik dan metodologinya serta memiliki pengetahuan yang fundamental tentang

pendidikan.

Mencermati permasalahan di atas, maka penilaian kompetensi profesional

mahasiswa/peserta Program PPG sangat penting untuk dilakukan. Dengan

dilakukan penilaian kompetensi profesional akan mampu membekali mereka

memiliki kemampuan penguasaaan materi pembelajaran secara luas dan

mendalam yang sekiranya dapat mungkin membimbing peserta didik untuk

memenuhi standar kompetensi yang ditetapkan. Penilaian kompetensi profesional

pada Program PPG dapat dinilai secara lengkap, jika memperhatikan item-item

yang ada pada instrumen yang digunakan dalam menilai kompetensi profesional

guru di Indonesia seperti instrumen pada uji kompetensi guru dan instrumen

69
penilaian kinerja guru kelas/mata pelajaran. Jika merujuk pada Pedoman PPG

terdapat capaian kompetensi profesional yang harus dimiliki oleh lulusan program

PPG ini beserta subkompetensi dan indikatornya seperti disajikan dalam Tabel 6.

Tabel 6. Kompetensi Profesional, Subkompetensi, dan Indikatornya

Kompetensi Sub Kompetensi Indikator


Kompetens 1. Menguasai materi a. Menganalisis kompetensi (capaian
i pelajaran pembelajaran) sebagai dasar pemilihan
profesional secara luas dan materi
mendalam b. Menerapkan dan mengevaluasi materi,
struktur, konsep, dan pola pikir keilmuan
yang mendukung pengembangan ilmu
pengetahuan, teknologi, dan seni (Ipteks)
2. Menguasai dan a. Menguasai konsep, pendekatan, teknik,
menemukan konsep, atau metode keilmuan, teknologi, atau
pendekatan, teknik, seni yang relevan
dan metode ilmu b. Menemukan konsep, pendekatan, teknik,
pengetahuan, atau metode baru dalam ilmu
teknologi, atau seni pengetahuan, teknologi, atau seni yang
yang relevan relevan

Berdasarkan Tabel 6 menunjukkan secara teoritis bahwa penilaian

kompetensi profesional yang perlu dikembangkan meliputi seperangkat

kemampuan yang dimiliki dalam menguasai materi pelajaran secara luas dan

mendalam, menguasai dan menemukan konsep, pendekatan, teknik, dan metode

ilmu pengetahuan, teknologi, atau seni yang relevan. Sub kompetensi yang dinilai

yaitu kemampuan menguasai materi pelajaran secara luas dan mendalam yang

dapat dikembangkan dari indikator: kemampuan dalam menganalisis kompetensi

(capaian pembelajaran) sebagai dasar pemilihan materi, dan kemampuan dalam

menerapkan dan mengevaluasi materi, struktur, konsep, dan pola pikir keilmuan

70
yang mendukung pengembangan ilmu pengetahuan, teknologi, dan seni (Ipteks).

Kemampuan dalam menguasai dan menemukan konsep, pendekatan, teknik, dan

metode ilmu pengetahuan, teknologi, atau seni yang relevan dikembangkan dari

indikator: kemampuan dalam menguasai konsep, pendekatan, teknik, atau metode

keilmuan, teknologi, atau seni yang relevan dan kemampuan dalam menemukan

konsep, pendekatan, teknik, atau metode baru dalam ilmu pengetahuan, teknologi,

atau seni yang relevan. Jika kompetensi profesional peserta program PPG yang

dinilai dilaksanakan sesuai dengan komponen dan sistem penilaiannya, maka

tentunya akan mampu memberikan informasi terkait penguasaan kompetensi yang

dimiliki peserta dengan akurasi yang tinggi.

c. Kompetensi Kepribadian

Kepribadian adalah karakteristik seseorang yang mencerminkan tingkah

lakunya sehari-hari yang membedakan dengan individu lainnya. Teori kepribadian

telah memainkan peran penting dalam psikologi positif, dan salah satu temuan

yang paling konsisten di antara prediktor yang memengaruhi sifat kepribadian

terkuat adalah kebahagiaan dan kepuasan hidup. Setiap individu memiliki

kepribadian yang berbeda, karena kepribadian sebagai pola perilaku yang

kompleks yang tertanam secara mendalam dan sebagai karakter psikologis yang

muncul secara otomatis pada setiap individu (Jordan, 2011; Matthews, Deary, &

Whiteman, 2009; Villanueva, 2010).

Kepribadian mengacu pada pola perilaku yang stabil atau sifat yang

memengaruhi individu untuk bertindak secara konsisten, kepribadian juga

menggambarkan dan menjelaskan perilaku seseorang dalam hal sifat kepribadian

71
yang dimilikinya seperti: bertanggungjawab, kreatif, dan komunikatif serta

kepribadian adalah organisasi-organisasi dinnamis dari sistem-sistem psikifisik

dalam indvidu yang turut menentukan cara-caranya yang unik dalam

menyesuaikan diri dengan lingkungan (Chamorro-Premuzic & Furnham, 2006,

2014; Nicholson, 2003). Hal ini menunjukkan bahwa kepribadian mencerminkan

setiap tindakan dan tingkah laku seseorang, termasuk setiap perkataan, tindakan,

dan tingkah laku dari seorang guru menceminkan kepribadiannya sebagai guru.

Kepribadian seorang guru adalah proyeksi diri kepada orang lain yang

membantu guru menjadi peka terhadap kebutuhan peserta didik dan memberikan

pengetahuan dan keterampilan yang diperlukan untuk membuat peduli pada

lingkungan belajar yang sehat, menjadi pribadi yang terbuka dan tidak emosional,

memiliki kredibilitas dan ketulusan dalam mengekspresikan perasaan dan

menjalin hubungan dengan sesama, memiliki semangat yang tinggi dalam bekerja

secara optimal, memiliki keterampilan berkomunikasi, kreatif, produktif, memiliki

etika kerja yang tinggi, dan komitmen terhadap profesi serta bersedia dan

memiliki kesadaran untuk terus mengembangkan kemampuannya (Mirzagitova &

Akhmetov, 2015; Mkpanang, 2015; Wardoyo, 2015).

Guru dalam melaksanakan tugasnya sebagai pengajar dan pendidik harus

mampu menjadi pribadi yang dapat dicontoh dan dijadikan sebagai figur teladan

dan panutan bagi peserta didik, memiliki kesadaran sosial/berempati kepada

sesama, mampu menjalin hubungan saling percaya, mampu menyelaraskan diri

dengan berbagai tipe individu, mampu memotivasi diri dan peserta didik serta

sebagai seorang guru mampu mencerminkan kepribadian yang mantap, stabil,

72
dewasa, arif, dan berwibawa, menjadi teladan bagi peserta didik dan berakhlak

mulia (Kartowagiran, 2011, 2012b; Mangkunegara & Puspitasari, 2015). Oleh

karena itu, kompetensi kepribadian penting untuk dinilai dikarenakan kompetensi

ini mencakup kemantapan pribadi dan akhlak mulia dari guru sebagai orang yang

ditiru dan digugu oleh peserta didiknya, sehingga guru perlu memiliki sikap

kedewasaan, arif, teladan dan berwibawa.

Kompetensi kepribadian merupakan salah satu kompetensi guru

profesional dan tidak terpisahkan dengan kompetensi lainnya dikarenakan

kompetensi ini merupakan perpaduan antara pengetahuan, kemampuan, dan

penerapan dalam melaksanakan tugas sebagai guru. Guru harus senantiasa

mengembangkan kompetensi kepribadiannya dalam menjalin komunikasi dengan

kelompok-kelompok sosial meskipun memiliki bahasa dan budaya yang berbeda

seperti toleransi, tanggung jawab, inisiatif, dan menjalin komunikasi dengan siapa

saja, selain itu seseorang yang memiliki kompetensi kepribadian ditandai dengan

adanya inisiatif yang tinggi, penetapan tujuan yang realistis, memiliki

perencanaan yang substansial, memiliki kesabaran dalam upaya memberikan

pelayanan untuk mencapai tujuan. Sebaliknya, orang yang tidak memiliki

kompetensi kepribadian menjadi pribadi yang pasif, memiliki tujuan yang tidak

menentu dan dan akhirnya merasa diri selalu gagal (Orazbayeva, 2016; Tyler,

1978). Pendapat ini mengindikasikan kepribadian seorang guru yang terpenting

adalah toleransi, tanggung jawab, inisiatif, dan menjalin komunikasi dengan siapa

saja yang sangat dibutuhkan oleh seorang guru sebagai teladan bagi peserta

didiknya sebagai pribadi yang ditiru dan digugu.

73
Guru sebagai panutan seharusnya tidak menunjukkan citra negatif di depan

peserta didik, karena akan memberikan pengaruh buruk pada perkembangan

karakter peserta didik, ketika perilaku buruk terjadi di antara para guru, para

peserta didik mungkin meniru dan membuat kebiasaan itu. Guru diharapkan

memiliki kepribadian yang mantap dan stabil, dewasa yang ditunjukkan dengan

bertindak sesuai dengan norma agama, norma hukum, norma sosial, senang

bekerja, konsisten dalam bertindak, kemandirian dalam bertindak dan memiliki

etika kerja sebagai seorang guru, serta memiliki kepribadian yang bijaksana,

berwibawa dan berkarakter mulia, menampilkan tindakan yang bermanfaat bagi

peserta didik, sekolah dan masyarakat, menunjukkan keterbukaan dalam

bertindak, memiliki sikap positif yang dapat diikuti peserta didik dan perilaku

yang dihormati. Selain itu, dalam proses pembelajaran, para guru penting

memberikan contoh model bagaimana berperilaku di sekolah sesuai dengan ajaran

agama dan peraturan sekolah serta guru senantiasa mengingatkan peserta didik

akan perbuatan yang baik dan mengevaluasi perilaku peserta didik (Hakim, 2015;

Kartowagiran & Maddini, 2015). Oleh karena itu, dalam keadaan apa pun, guru

hendaknya selalu memberikan teladan yang baik bagi peserta didik.

Kompetensi kepribadian juga mencakup nilai-nilai yang ada pada

kepribadian seorang guru dan dapat disalurkan kepada para peserta didik dalam

proses belajar sehingga tercipta pembelajaran yang kondusif, sehingga guru yang

efektif senantiasa melengkapi dirinya dengan kepribadian yang baik, humoris,

antusias dan memiliki kreativitas (Archer & Hughes, 2011; Pahrudin, Martono, &

Murtini, 2016). Kedua pendapat ini menunjukkan bahwa jika guru memiliki

74
kompetensi kepribadian yang baik, maka guru yang bersangkutan akan selalu

memahami kekurangan diri untuk terus merefleksi diri.

Guru yang mampu memahami kekurangan diri sendiri akan selalu belajar

untuk menutup kekurangan itu, sehingga kompetensi ini menjadi tuntutan

pendidikan di berbagai negara. Menurut Russian Federation Education Act dalam

konsep Federal Education Development Target Program for 2011-2015

disebutkan perkembangan tuntutan pada guru meningkat, terutama kepribadian

dari seorang guru, tanggung jawab dan memiliki kemampuan yang komunikatif

ditetapkan sebagai prioritas dari pendidikan guru yang profesional (Olesova &

Borisova, 2016). Dengan demikian karakter kepribadian guru yang diinginkan

peserta didik perlu untuk dikembangkan pada penilaian kompetensi kepribadian

yang harus dikuasai mahasiswa/peserta Program PPG.

Temuan Piri, Keshtiaray, and Saadatmand (2016) menyatakan bahwa

terdapat hubungan yang signifikan antara kompetensi kepribadian guru dengan

kinerja peserta didik. Jika guru ramah, perhatian, baik, teliti, terbuka, dan tidak

mudah emosi dapat meningkatkan kinerja belajar peserta didik. Dengan demikian

kompetensi kepribadian menjadi sangat penting untuk dinilai pada capaian

penguasaan kompetensi mahasiswa/peserta PPG. Adanya penilaian pada

kompetensi ini akan mampu membekali mereka memiliki kemampuan yang

berhubungan dengan sikap dan kepribadian sebagai calon guru atau guru.

Idealnya penilaian kompetensi kepribadian pada Program PPG mencakup

komponen kompetensi kepribadian yang dipersyaratkan. Target minimal

kompetensi kepribadian yang harus dimiliki mahasiswa setelah mereka

75
melaksanakan PPG adalah: 1) menunjukkan sikap dewasa dalam berpikir dan

bertindak, 2) memiliki perilaku dan bertutur kata sopan, 3) memiliki perilaku

ilmiah sebagai seorang akademisi, 4) menunjukkan rasa tanggung jawab yang

tinggi dalam melaksanakan tugas, 5) memiliki kedisiplinan yang tinggi dalam

melaksanakan tugas dan kewajiban, 6) mampu menampilkan diri sebagai calon

guru yang baik. Oleh karena itu, diperlukan pengembangan instrumen penilaian

kompetensi kepribadian pada Program PPG yang dapat mengungkap penguasaan

kompetensi tersebut pada mahasiswa/peserta PPG secara lengkap. Jika merujuk

pada buku Pedoman PPG terdapat capaian kompetensi kepribadian yang harus

dimiliki oleh lulusan program PPG ini beserta subkompetensi dan indikatornya

seperti disajikan dalam Tabel 7.

Tabel 7. Kompetensi Kepribadian, Subkompetensi, dan Indikatornya

Kompetensi Sub Kompetensi Indikator


Kompetensi Berperilaku sesuai a. Mengamalkan ajaran agama yang dianutnya
Kepribadian dengan norma agama, sebagai insan yang
norma hukum, norma beriman, bertaqwa, dan berakhlak mulia.
sosial, etika, dan nilai b. Memiliki jiwa dan rasa kebangsaan dan cinta
budaya tanah air berdasarkan Pancasila, Undang-
Undang Dasar Negara RepubIik Indonesia
Tahun 1945, komitmen NKRI, dan semangat
Bhinneka Tunggal Ika.
c. Menunjukkan kesadaran hukum
dengan melaksanakan norma sesuai peraturan
peundang-undangan di bidang pendidikan dan
keguruan.
d. Tampil sebagai pribadi teladan yang jujur,
berakhlak mulia, beretos kerja, bertanggung
jawab, dan bangga menjadi guru.
e. Memiliki sikap mau mengembangkan diri
secara mandiri dan berkelanjutan.

76
Berdasarkan uraian di atas secara teoritis disimpulkan bahwa penilaian

kompetensi kepribadian yang perlu dikembangkan meliputi seperangkat

kemampuan yang dimiliki dan dihayati dalam berperilaku sesuai dengan norma

agama, norma hukum, norma sosial, etika, dan nilai budaya. Sub kompetensi

yang dinilai yaitu berperilaku sesuai dengan norma agama, norma hukum, norma

sosial, etika, dan nilai budaya dalam penelitian ini dikembangkan dari indikator

yang meliputi: mengamalkan ajaran agama yang dianutnya sebagai insan yang

beriman, bertaqwa, dan berakhlak mulia, memiliki jiwa dan rasa kebangsaan dan

cinta tanah air, komitmen NKRI, dan semangat Bhinneka Tunggal Ika,

menunjukkan kesadaran hukum dengan melaksanakan norma sesuai peraturan

peundang-undangan di bidang pendidikan dan keguruan, tampil sebagai pribadi

teladan yang jujur, berakhlak mulia, beretos kerja, bertanggung jawab, dan bangga

menjadi guru, memiliki sikap mau mengembangkan diri secara mandiri dan

berkelanjutan. Jika kompetensi kepribadian lulusan program PPG yang dinilai

dilaksanakan sesuai dengan komponen dan sistem penilaiannya, maka

diasumsikan penilaian yang dilakukan pada kompetensi ini memiliki akurasi dan

konsistensi yang tinggi.

d. Kompetensi Sosial

Kompetensi yang tidak kalah penting dikuasai oleh mahasiswa/peserta

PPG menjadi seorang guru adalah kompetensi sosial. Keberhasilan dari

kompetensi sosial yang dimiliki seseorang dapat dinilai dalam konteks bagaimana

perilaku individu yang bersangkutan memahami atau respek terhadap orang lain

(Rose‐Krasnor, 1997). Demikian halnya kompetensi sosial guru berkaitan dengan

77
keterampilan yang dimiliki guru beradaptasi menyesuaikan diri dengan situasi

mengajar atau situasi dimana dirinya bertindak sebagai pendidik. Indikator yang

dapat digunakan dalam pengukuran kompetensi sosial guru yaitu termasuk

kemampuan untuk berkomunikasi dan berinteraksi secara efektif dengan peserta

didik, sesama guru, orangtua/wali peserta didik dan masyarakat (Hakim, 2015;

Lacey, 2012)

Pengembangan kompetensi sosial guru harus didasarkan pada pendekatan

proses pendidikan dan pengajaran, karena kompetensi ini berkenaan dengan

kemampuan guru sebagai bagian dari masyarakat untuk berkomunikasi dan

bergaul secara efektif dengan peserta didik, sesama pendidik, tenaga

kependidikan, orangtua/wali peserta didik dan masyarakat sekitar

(Dzheksembekova et al., 2016; Kartowagiran, 2011, 2012b). Kompetensi sosial

adalah kompetensi yang berkaitan dengan hubungan antara guru dan lingkungan,

orang-orang yang ada di sekolah atau di luar sekolah, berkomunikasi,

berinteraksi dengan warga sekolah dan memiliki nilai, perilaku dan etika, sebagai

orang yang tinggal di tengah masyarakat, guru perlu memiliki kemampuan

bersosialisasi atau berinteraksi dengan masyarakat (Pahrudin et al., 2016;

Wardoyo, 2015). Hal ini mempertegas bahwa bagaimana, guru/calon guru dituntut

memiliki kemampuan bersosialisasi dan beradaptasi dengan lingkungan baik di

dalam maupun di luar sekolah, karena lingkungan belajar yang baik dipengaruhi

oleh kompetensi sosial guru.

Kompetensi sosial menuntut guru mampu menyesuaikan diri dengan

lingkungan kerja, mampu menilai kerja sendiri, dan mampu bekerja mandiri serta

78
mampu bekerjasama yang dikuatkan dengan kemampuan untuk berkomunikasi.

Seperti pendapat O'Malley (1977), Cooper (2013: 227), Kamerilova et al. (2018)

bahwa kemampuan guru ditentukan oleh cara berinteraksi dengan lingkungan

melalui komunikasi. Ini sangat penting untuk bersosialisasi dan beradaptasi

dengan lingkungan sekitar dan situasi sosial, sehingga kompetensi sosial menjadi

prioritas utama dalam pendidikan dan menjadi faktor penting yang

dipertimbangkan dalam tatanan sosial seperti komunikasi, pengakuan, pernyataan

diri, tekad diri dan lain-lain. Hal ini menunjukkan bahwa kompetensi sosial

penting untuk dinilai.

Penilaian kompetensi sosial pada Program PPG menjadi penting untuk

dinilai dikarenakan dengan adanya penguasaan terhadap kompetensi ini,

mahasiswa/peserta PPG akan memiliki kemampuan yang berhubungan dengan

cara menempatkan diri dalam lingkungan maupun cara menjalin hubungan dengan

orang lain. Kompetensi ini merupakan kemampuan berkomunikasi dan

berinteraksi secara efektif dan menarik serta kemampuan dalam menjalin relasi

yang positif, empatik, dan santun. Oleh karena itu, penilaian kompetensi sosial

tidak bisa diabaikan. Penilaian pada kompetensi ini akan mampu mengungkap

kecakapan dan keluwesan seorang mahasiswa/peserta PPG dalam bersosialisasi

dengan lingkungan sekitarnya, membina hubungan dengan sesama.

Pengembangan instrumen penilaian pada kompetensi ini perlu

memperhatikan item-item yang ada pada instrumen yang digunakan dalam

menilai kompetensi sosial guru di Indonesia. Jika merujuk pada buku Pedoman

79
PPG terdapat capaian kompetensi sosial yang harus dimiliki oleh lulusan program

PPG ini beserta subkompetensi dan indikatornya seperti disajikan dalam Tabel 8.

Tabel 8. Kompetensi Sosial, Subkompetensi, dan Indikatornya

Kompetensi Sub Kompetensi Indikator

Kompetensi Memiliki kemampuan a. Berkomunikasi dan berinteraksi dengan peserta


Sosial berkomunikasi, didik, guru, tenaga kependidikan, orang tua,
berinteraksi, dan dan masyarakat secara lisan dan tulisan dengan
beradaptasi secara santun, efektif, dan produktif
efektif dan efisien b. Berpartisipasi sebagai warga negara yang baik
dengan peserta didik, dalam pembangunan
sesama guru,
bangsa
orangtua/wali dan
masyarakat sekitar c. Memiliki komitmen mengadaptasi dan
menggunakan teknologi informasi dan
komunikasi dalam melaksanaan tugas
profesionalnya

Berdasarkan Tabel 8 menunjukkan secara teoritis bahwa penilaian

kompetensi sosial yang perlu dikembangkan meliputi seperangkat kemampuan

yang dimiliki dalam berkomunikasi, berinteraksi, dan beradaptasi secara efektif

dan efisien dengan peserta didik, sesama guru, orangtua/wali dan masyarakat

sekitar. Sub kompetensi yang dinilai yaitu memiliki kemampuan berkomunikasi,

berinteraksi, dan beradaptasi secara efektif dan efisien dengan peserta didik,

sesama guru, orangtua/wali dan masyarakat sekitar yang dapat dikembangkan dari

indikator: kemampuan berkomunikasi dan berinteraksi dengan peserta didik, guru,

tenaga kependidikan, orang tua, dan masyarakat secara lisan dan tulisan dengan

santun, efektif, dan produktif, kemampuan dalam berpartisipasi sebagai warga

negara yang baik dalam pembangunan bangsa serta komitmen mengadaptasi dan

menggunakan teknologi informasi dan komunikasi dalam melaksanaan tugas

80
profesionalnya. Jika kompetensi sosial mahasiswa/peserta PPG yang dinilai sesuai

dengan komponen dan sistem penilaiannya, maka maka diasumsikan penilaian

yang dilakukan pada kompetensi ini memiliki akurasi dan konsistensi yang tinggi.

Berdasarkan komponen penilaian capaian kompetensi yang dipersyaratkan

menjadi guru pada peserta PPG, maka perlu dikembangkan model penilaian yang

mengukur capaian kompetensi pedagogik, kompetensi profesional, kompetensi

sosial dan kompetensi kepribadian dari peserta PPG. Keempat kompetensi

tersebut pada PPG terintegrasi dalam penilaian kinerja melalui kegiatan

workshop, PPL dan uji kompetensi. Namun dalam pengembangan model

penilaian ini dibatasi pada kompetensi pedagogik, kompetensi sosial dan

kompetensi kepribadian. Sebagaimana pendapat Marzano & Toth (2013: 76)

bahwa model penilaian guru terbagi dalam empat kategori atau yang disebut

sebagai domain yaitu: 1) Domain-1 strategi pengelolaan kelas dan perilaku yang

memiliki pengaruh langsung pada prestasi siswa, 2) Domain 2- perencanaan dan

persiapan, sejauhmana rencana dan cara guru mempersiapkan diri untuk

melaksanaan pekerjaan dalam mengajar sehari-hari sesuai pelajaran, 3) Domain 3-

pelaksanaan pembelajaran. Domain ini memiliki kaitan langsung dengan

perencanaan dan persiapan yang dibuat guru seperti mengevaluasi kinerja pribadi

kekuatan dan kelemahan yang dimiliki dalam pembelajaran, mengevaluasi

efektivitas pembelajaran, mengevaluasi efektivitas strategi pembelajaran yang

spesifik dengan kemampuan siswa pada berbagai, 4) Domain 4-profesionalisme

dan hubungan dengan teman sejawat. Hubungan keempat domain tersebut

disajikan pada Gambar 5.

81
Gambar 5. Domain model penilaian guru (Marzano & Toth, 2013: 76)

Jika teori yang relevan digunakan untuk membuat konstruk, indikator yang

dinilai dapat diukur dan diamati dalam menilai penguasan empat kompetensi

mahasiswa/peserta PPG yaitu kompetensi pedagogik, kompetensi profesional, dan

kompetensi sosial dan kepribadian, maka diasumsikan penilaian yang dilakukan

pada keempat kompetensi tersebut memiliki akurasi dan konsistensi yang tinggi

dalam mengestimasi penguasaan capaian kompetensi mahasiswa/peserta PPG.

5. Performance Assessment

Salah satu teknik penilaian yang banyak digunakan dalam menentukan

kemampuan seseorang adalah penilaian kinerja atau unjuk kerja yang lebih

dikenal dengan istilah performance assessment. Penilaian ini terkait pengujian

82
jabatan, sertifikasi dan lisensi jabatan profesional (American Educational

Research Association & National Council on Measurement in Education, 2014).

Hasil penilaian kinerja digunakan untuk sertifikasi atau lisensi penting dilakukan

agar kualitas pekerjaan yang dilakukan seseorang mencapai standar atau kriteria

yang ditetapkan, dalam arti benar-benar bekerja secara profesional (Mardapi,

2017: 18). Hal ini menunjukkan dalam menentukan kemampuan seseorang agar

diperoleh informasi yang sahih dan memiliki kesalahan kecil hendaknya

menggunakan penilaian dengan teknik performance assessment. Performance

assessment merupakan teknik yang digunakan dalam penilaian berbasis

kompetensi karena teknik dan sistem penilaiannya fokus pada kinerja atau hasil.

Performance assessment menilai penguasaan kemampuan dan

keterampilan yang dimiliki seseorang terkait dengan objek yang dan dinilai.

Penilaian dilakukan terhadap unjuk kerja, tingkah laku, atau interaksi serta dapat

digunakan untuk menilai kemampuan seseorang selama proses pembelajaran

tanpa harus menunggu sampai proses tersebut berakhir (Stiggins and Chappuis

(2005); Brookhart & Nitko (2008: 167). Pendapat ini menunjukkan bahwa

performance assessment adalah suatu bentuk penilaian untuk mendemostrasikan

atau mengaplikasikan pengetahuan yang telah diperoleh dan menggambarkan

suatu kemampuan seseorang melalui suatu proses, kegiatan, atau unjuk kerja.

Unjuk kerja seseorang dalam performance assessment dapat dinilai dari

beberapa kriteria yang dapat digunakan sebagai bahan pertimbangan antara

lain: generalizability atau keumuman, authenticity atau keaslian/nyata, muliple

focus (lebih dari satu fokus), fairness (keadilan), teachability (bisa tidaknya

83
diajarkan), feasibility (kepraktisan), scorability atau bisa tidaknya tugas tersebut

diberi skor (Popham, 1999). Bila hasil pengukuran tidak baik, dengan teknik

apapun yang digunakan untuk menganalisa data, hasilnya tetap tidak baik

(Retnawati, 2016: 2, Mardapi, 2017: 1). Hal ini dipertegas Lutasari and

Kartowagiran (2019) performance assessment tidak hanya mengukur hasil

pembelajaran tetapi juga memberikan informasi yang lebih jelas tentang kegiatan

belajar. Pendapat ini mempertegas bahwa performance assessment memiliki

esensi penting dalam mengukur kemampuan seseorang.

Esensi penting dari performance assessment dapat secara langsung

mengukur keterampilan-keterampilan dari seseorang. Penilaian ini menempatkan

penekanan lebih besar pada kemampuan seseorang dalam menerapkan konsep

pengetahuan yang dimiliki ke dalam situasi dunia nyata, dan untuk berkomunikasi

secara efektif. Hal ini sesuai dengan hakikat dan tujuan pengukuran dilaksanakan

untuk mengetahui kemampuan atau performa dari sesuatu atau seseorang, baik

berupa kemampuan, sikap, keterampilan, persepsi dan lain-lain.

Menurut The Center for Collaborative Education (CCE 2017)

performance assessment sebagai penilaian kualitas kinerja tingkat tinggi kinerja

karena memuat multi-langkah tugas dengan kriteria jelas, harapan, dan proses

yang mengukur seberapa baik mahasiswa mentransfer pengetahuannya dan

mampu menilai keterampilan kompleks dalam membuat atau memperbaiki hasil

(French, 2017). Dengan menggunakan penilaian ini dapat mengukur proses

kinerja seseorang langkah demi langkah yang sesuai dengan prosedur yang telah

ditetapkan termasuk dalam penilaian capaian penguasaan mahasiswa/peserta PPG.

84
Dengan demikian penilaian pada Program PPG berdasarkan capaian

kompetensi yang dipersyaratkan sebagai seorang guru tidak terlepas dari

performance assessment misalnya performance dalam lokakarya/workshop,

praktik mengajar pada PPL, sehingga metode pengukurannya harus dilakukan

secara langsung terhadap tindakan/performance kerja yang ditampilkan oleh

seorang mahasiswa/peserta PPG pada saat praktik mengajar dengan menggunakan

instrumen penilaian untuk mengukur capaian kompetensi yang harus dinilai.

Melalui penilaian kinerja mampu menggambarkan capaian penguasaan

kompetensi mahasiswa/peserta PPG.

Penilaian kompetensi mahasiswa/peserta PPG juga harus dilakukan secara

langsung pada saat mengajar yaitu dengan cara mengobservasi kompetensi

mahasiswa yang meliputi kompetensi pedagogik, sosial dan kompetensi

kepribadian. Sebagaimana dikemukakan Sax (1980: 472) mengukur kemampuan

calon guru termasuk didalamnya adalah mengukur kemampuan pedagogik,

kemampuan profesional, kemampuan personal dan kemampuan sosial calon guru

baik kemampuan di kelas maupun kemampuan di luar kelas. Dengan

menggunakan performance assessment, kompetensi mahasiswa/peserta PPG akan

terukur dan teruji dengan baik.

Berdasarkan kajian tentang performance assessment tersebut dikaitkan

dengan penilaian penguasaan capaian kompetensi yang dinilai pada saat

mahasiswa/peserta PPG melakukan praktik mengajar di dalam kelas dengan

mengunakan instrumen penilaian yang dikembangkan berdasarkan konstruk yang

diukur. Menurut Wilson (2005: 12) pengembangan instrumen penilaian biasanya

85
tidak lepas dari beberapa permasalahan: a) kesewenang-wenangan dalam pilihan

item dan format item, b) tidak ada teknik yang jelas untuk menghubungkan hasil

empiris untuk perbaikan instrumen, dan c) ketidakmampuan untuk menggunakan

temuan empiris untuk meningkatkannya dalam membangun ide. Untuk

menghindari masalah ini, pada penilaian capaian penguasaan kompetensi

mahasiswa/peserta PPG perlu mengembangkan model penilaian yang mampu

mengungkap performance mahasiswa/peserta PPG berdasarkan hasil pengamatan

pada komponen yang dapat teramati dan terukur. Oleh karena itu, penilaian yang

dilakukan difokuskan pada penguasaan kompetensi pedagogik, kompetensi sosial

dan kompetensi kepribadian.

6. Penskoran Parsial, Holistik dan Perbandingannya

Pengukuran pada hakikatnya adalah kuantifikasi atribut dengan skala

psikologi sebagai instrumennya yang tidak terlepas dari masalah penskoran.

Istilah penskoran sangat penting dalam pemerolehan hasil penilaian yang

tidak bias dikarenakan penilaian yang dilakukan tidak konsisten. Dengan adanya

penskoran dapat diperoleh deskripsi performansi dari suatu subjek dinilai dan

dapat memberikan evaluasi terhadap perfomansi subjek dalam bentuk nilai.

Penskoran merupakan salah satu langkah penting untuk menetapkan atau

menentukan besaran angka pada suatu gejala atau objek yang harus diberikan

sebagai harga suatu jawaban yang lebih dikenal dengan score (Sumintono &

Widhiarso, 2014: 20, Mardapi, 2017: 194, Azwar, 2017: 55). Pendapat ini

menunjukkan bahwa penskoran sebagai proses pemberian skor atau angka

terhadap respons, sehingga skor atau angka tersebut dapat ditafsirkan sebagai

86
ukuran ciri terpendam yang tak tampak (latent trait) yang ada pada peserta tes,

sehingga dalam pemberian skor atau angka tersebut dilakukan perdasarkan aturan

dan kriteria tertentu.

Penskoran sendiri tidak terlepas dari proses penskalaan, karena skala

adalah aturan pemberian angka kepada atribut dan pemberian angka pada atribut

berarti mempertemukan karakteristik sistem angka riil yang merupakan besaran

berupa kontinum yang membentang dari minus (-) tak hingga sampai plus (+) tak

hingga dengan karakteristik sistem atribut dimana ada atribut yang menggunakan

sedikit karakteristik sistem angka dan ada juga yang menggunakan lebih banyak,

sehingga perbedaan kandungan informasi pada karakteristik sistem atribut ini

dikenal dengan level skala (Naga, 2013: 21-23). Penskoran juga tidak lepas dari

pembobotan dan umumnya besar skor suatu item/butir ditetapkan berdasarkan

tingkat kesulitan, tingkat kepentingan dan lama kerja (Wakhinuddin, 2012). Hal

ini menunjukkan bahwa penetapan atau penentuan skor sangat penting dilakukan

dalam proses penskalaan.

Proses penskalaan merupakan upaya untuk menempatkan atribut atau

karakteristik pada suatu rentang kontinum, yang didalamnya melibatkan

perubahan nilai atau transformasi skor baik berupa transformasi linear maupun

nonlinear (Brennan, 2006, de Ayala, 2009: 2). Penskalaan dikaitkan dengan upaya

untuk menempatkan atribut psikologi dengan mengubah atau mentransformasi

data yang semula berbentuk data ordinal yang tidak memiliki unit pembanding

yang sama menjadi data interval atau rasio yang memiliki satuan pembanding

87
yang sama. Berbagai macam cara atau metode dilakukan dalam upaya untuk

mentransformasi data menjadi data interval.

Pengukuran dengan skala interval menunjukkan perbedaan antar titik

dalam skala haruslah sistematis artinya ada perbedaan angka 1 dan 2 sama dengan

perbedaan angka 2 dan 3, begitu seterusnya walaupun angka nol masih bersifat

semu, namun beda ukuran antara angka 1 dan 3 sama dengan beda angka 3 dan 5.

Kategori skala dinilai sebagai alat praktis untuk penilaian cepat dengan tujuan

menentukan prestasi atau kemampuan dari subjek yang dinilai dengan angka

daripada memberikan umpan balik secara detail (Dogan & Uluman, 2017). Jika

dilihat dari penggunaannya di lapangan penilai lebih senang menggunakan skala

sesuai dengan kategori dinilai dalam situasi dimana mereka perlu melakukan

penilaian dengan cepat.

Berdasarkan berbagai pendapat di atas menunjukkan bahwa penskoran erat

kaitannya dengan masalah penskalaan, sehingga dibutuhkan kecermatan dan

kemantapan dalam penskoran. Penskoran merupakan proses pengubahan jawaban

instrumen menjadi angka-angka yang merupakan nilai kuantitatif dari suatu

jawaban terhadap item dalam instrumen. Dengan demikian penskoran adalah

suatu proses pengubahan jawaban-jawaban item menjadi angka-angka, yang

hasilnya tidak selalu tetap karena ditentukan berdasarkan atas banyak item serta

bobot item yang dibuat. Penskoran dalam penilaian Program PPG adalah proses

pemberian skor atau angka yang dilakukan berdasarkan aturan dan kriteria

tertentu terhadap respons yang diberikan oleh mahasiswa/peserta PPG, sehingga

88
skor tersebut dapat ditafsirkan sebagai ukuran ciri dari laten trait yang ada pada

mahasiswa/peserta PPG.

Penskoran dalam penilaian Program PPG diperlukan sebagai pedoman

menentukan skor hasil kerja mahasiswa/peserta PPG, sehingga diperoleh skor

seobjektif mungkin. Oleh karena itu, penting mengembangkan model penilaian

Program PPG dengan penskoran yang sesuai dan tepat, sehingga hasil penilaian

yang diperoleh lebih akurat dan konsisten. Dalam mengembangkan model

penilaian PPG harus mampu menentukan dengan tepat jenis penskoran yang akan

dibuat sehingga pedoman penskoran tersebut benar-benar dapat memberikan hasil

yang akurat dan konsisten terhadap hasil capaian penguasaan kompetensi

mahasiswa/peserta PPG. Model penskoran yang dapat dipilih yaitu dengan

menggunakan penskoran parsial dan holistik dengan karakteristik dan

perbandingan sebagai berikut.

a. Penskoran Parsial

Istilah parsial bukanlah istilah yang umum digunakan sehari-hari. Istilah

ini lebih banyak digunakan dalam bidang-bidang tertentu seperti Matematika dan

penelitian ilmiah. Secara bahasa pengertian parsial adalah sebagian dari suatu

keseluruhan. Jika istilah parsial tersebut, digunakan dalam penskoran lebih

dikenal dengan model dikotomi dalam praktiknya.

Penskoran parsial dalam praktiknya, sebagai panduan penyekoran yang

berisi kategori skor memiliki jenjang atau peringkat (ordered category). Pada

pengukuran pendidikan, kesehatan, psikologi, dan lainnya, penskoran sering

dilakukan secara dikotomus yaitu skor 1 dan 0. Data yang bersifat pilah disebut

89
data dikotomi yang hanya memiliki dua kategori saja. Misalnya, untuk pilihan

benar dan salah, maka kategorinya hanya dua, yaitu ‘benar’ yang dapat

dilambangkan dengan angka 1, dan ‘salah’ yang dilambangkan dengan angka nol

(Sumintono & Widhiarso, 2014: 32, Retnawati, 2016a: 114). Kedua pendapat ini

menunjukkan bahwa penyekoran secara dikotomus misalnya: benar-salah, ya-

tidak, melakukan-tidak melakukan suatu kegiatan, ada-tidak ada dan lainnya.

Biasanya pada penyekoran dikotomus, yang benar atau yang melakukan

diskor 1 dan yang salah atau tidak melakukan diskor 0 (de Ayala, 2009: 162).

Naga (2013: 86) menyatakan bahwa pada penskoran parsial, penjumlahan skor

satuan dilakukan sebagian-sebagian. Skor bagian ini dikenal dengan sub skor yang

pembagiannya berdasarkan keperluan. Jika sub skor berdasarkan dimensi ukur,

maka setiap dimensi ukur memiliki sub skor sendiri, demikian halnya jika ada

beberapa dimensi ukur pada atribut yang diukur, maka ada beberapa sub skor.

Kaitannya dengan sub skor ada banyak ragam instrumen yang

mengggunakan model dikotomi, diantaranya: benar salah, setuju-tidak setuju,

sesuai-tidak sesuai, ataupun ya-tidak. Respons butir dikotomus mempunyai dua

kategori skor jawaban, yaitu jawaban betul skor 1 dan jawaban salah skor 0 (Bond

& Fox, 2007: 49, DeMars, 2010: 9). Model penskoran dikotomus tidak dapat

digunakan untuk menemukan kesalahan yang dilakukan oleh peserta, karena

semua option yang salah diberi skor 0.

Berdasarkan karakteristik tersebut, menunjukkan bahwa penilaian capaian

kompetensi mahasiswa/peserta PPG dengan penskoran parsial menilai respons

dari mahasiswa/peserta PPG tersebut dalam bagian demi bagian yaitu skor 1

90
diberikan pada respons yang mampu melakukan bagian demi bagian yang dinilai

dan skor 0 untuk peserta yang tidak mampu melakukannya. Artinya penskoran ini

jika diterapkan dalam menilai capaian penguasaan kompetensi mahasiswa/peserta

PPG dapat bermakna bahwa seorang mahasiswa/peserta PPG mendapatkan skor 1

apabila memiliki kesesuaian dengan suatu item yang dinilai dan skor 0 bila tidak

terdapat kesesuaian dengan item yang dinilai.

Contoh penskoran model ini, misalnya pada instrumen untuk menilai

kemampuan mahasiswa/peserta PPG dalam melakukan kegiatan apersepsi pada

pelaksanaan pembelajaran diperlukan 4 bagian atau 4 tahap yang harus dilakukan

pada tahapan tersebut yaitu: 1) mengungkap kembali materi yang telah dipelajari

sebagai tahap 1, 2) mengajukan pertanyaan yang mengaitkan pengetahuan

sebelumnya dengan materi yang dipelajari sebagai tahap 2, 3) mengaitkan dengan

kehidupan sehari-hari sebagai tahap 3, 4) mengaitkan dengan isu mutakhir sebagai

tahap 3. Jika keempat tahap tersebut dapat dilakukan oleh mahasiswa/peserta

PPG, maka mahasiswa/peserta PPG yang bersangkutan mendapatkan total skor 4

dalam melakukan kegiatan apersepsi, namun jika ada salah satu tahapan yang

tidak dapat dilakukan peserta PPG, maka mahasiswa/peserta PPG yang

bersangkutan akan dikurangi 1 skornya, sehingga total skor yang diperoleh adalah

skor 3. Sebaliknya jika ada mahasiswa/peserta PPG yang bersangkutan tidak

melakukan salah satu tahap atau beberapa tahap dari aspek yang diamati, maka

masing-masing tahapan yang tidak dilakukan mahasiswa/peserta PPG mendapat

skor 0 atau berkurang sesuai dengan jumlah tahapan yang tidak dapat dilakukan

dari skor total. Artinya total skor yang diperoleh mahasiswa/peserta PPG tersebut

91
berdasarkan jumlah tahapan yang dilakukan, misalnya jika peserta hanya mampu

melakukan 3 tahapan, maka total skor yang diperolehnya adalah 3 meskipun

tahapan yang dilakukan peserta tidak berurutan.

Berdasarkan uraian dan contoh yang dikemukakan menunjukkan bahwa

model penskoran parsial dalam aplikasi penilaian capaian penguasaan kompetensi

pada mahasiswa/peserta PPG yang dinilai diberikan skor untuk tiap langkah yang

dilakukannya. Langkah yang dilakukan diskor 1, yang tidak dilakukan diskor 0,

meskipun kadang subjek yang diamati tidak melakukan semua tahap atau bagian

yang harus dipenuhi pada aspek yang dinilai, dan kemungkinan tahap-tahap

tersebut tidak berurutan namun dilakukan. Total skor yang diperoleh merupakan

penjumlahan dari setiap tahapan yang dilakukan dan hal ini merupakan

karakteristik dari penskoran dengan model parsial.

b. Penskoran Holistik

Sebelum membahas penskoran holistik, perlu untuk memahami istilah

“holistik”. Sebagaimana dinyatakan Horby and Cowie (2000) mendefinisikan

“holism” as: “Considering a whole thing or being to be more than a collection of

parts” (Holistik adalah mempertimbangkan keseluruhan hal atau lebih). Dengan

demikian, istilah “holistik” merujuk kepada keseluruhan aspek yang dinilai.

Holistik dalam penilaian bertujuan untuk melihat pengujian keseluruhan

kinerja. Dalam jenis penilaian dengan penskoran ini, keterampilan yang diuji

dianggap sebagai sebuah kesatuan utuh, dimana tidak ada kemungkinan untuk

menilai setiap bagian secara independen atau terpisah dengan yang lain (Harsch &

Martin, 2013, Ounis, 2017). Selama proses penilaian, penilai berusaha untuk

92
menimbang dampak berbeda dari efektivitas keseluruhan dimensi dari kriteria

yang dinilai dengan skor holistik.

Penilaian degan penskoran holistik dalam hal penyusunan penskoran dapat

diawali dengan menyusun atribut dan indikator kunci dari aspek yang diukur.

Atribut dan indikator kunci tersebut kemudian dirumuskan menjadi kategori-

kategori untuk menentukan skor jawaban. Dengan penskoran holistik penilai tetap

dapat memberikan penghargaan yang lebih akurat dan berkeadilan untuk seluruh

subjek yang dinilai dengan masing-masing cara penyelesaiannya yang mungkin

satu dengan yang lain berbeda.

Penskoran holistik oleh Borich & Kubiszyn, (2003: 154) digunakan ketika

penilai lebih tertarik dalam memperkirakan kualitas keseluruhan dari kinerja dan

menetapkan angka nilai pada kualitas tersebut daripada menerapkan penambahan

atau pengurangan poin atas aspek kinerja tertentu. Menurut Brookhart (2013 : 6)

bahwa penskoran holistik merupakan rubrik yang menerapkan semua kriteria pada

waktu yang sama dan memungkinkan penilaian keseluruhan tentang kualitas

pekerjaan. Kedua pendapat ini menunjukkan bahwa penskoran holistik merupakan

penetapan atau pemberian angka untuk menilai berdasarkan kesan keseluruhan

atau kombinasi semua kriteria dari aspek atau objek yang dinilai.

Kriteria dari aspek atau objek yang dinilai dalam penskoran holistik, harus

menggunakan makna yang jelas, dimana harus ada perbedaan jelas antara skor,

dan setiap level skor harus memiliki keterangan sendiri (Jones & Vickers, 2011).

Artinya penskoran dengan model ini harus jelas dalam mengartikulasikan kriteria

untuk pemberian skor setiap level. Deskriptor level skor harus memiliki hubungan

93
dari level satu skor ke level lain, dengan kata lain kriteria yang digunakan untuk

mengevaluasi respons harus diwakili di setiap level skor.

Penskoran holistik dapat disebut penskoran dengan skala global, caranya

adalah dengan membaca jawaban secara keseluruhan tiap item kemudian

meletakkan dalam kategori-kategori mulai dari yang baik sampai yang kurang

baik, bisa tiga sampai lima kategori. Karakteristik dari penskoran holistik perlu

untuk mengidentifikasi kriteria untuk kinerja yang akan didasarkan untuk dinilai,

tiap jawaban dimasukkan dalam salah satu kategori, dan selanjutnya tiap jawaban

diberi skor sesuai dengan kualitas jawabannya (Brookhart & Nitko, 2008: 197,

Mardapi, 2017: 163). Dengan demikian dalam menyusun rubrik penilaian dengan

penskoran holistik deskripsi yang paling sesuai dengan kinerja subjek yang dinilai

mampu mengidentifikasi skor yang diberikan.

Penskoran holistik biasanya dapat menggunakan antara tiga kategori

misalnya dibedakan, mahir, menengah dan pemula dan lima kategori, seperti A,

B, C, D, dan F; atau 4, 3, 2 dan 1. Misalnya jika menggunakan nilai A sampai F,

kemudian menggunakan lima kategori, menunjukkan adanya jumlah yang berbeda

yang akan memengaruhi tingkat kualitas dalam rubrik penilaian dan akan

menyulitkan dalam memberi angka (Brookhart & Nitko, 2008: 197). Hal ini

menunjukkan bahwa kategori yang sesuai dengan sistem penilaian yang paling

mudah untuk digunakan adalah penskoran holistik.

Adapun contoh penskoran holistik, misalnya yang dicontohkan pada

penilaian dengan penskoran parsial pada aspek yang diamati dari kemampuan

peserta PPG melakukan kegiatan apersepsi, jika penilaiannya dilakukan dengan

94
penskoran holistik, maka contoh penskorannya pada aspek melakukan kegiatan

apersepsi dengan menggunakan empat kategori skor yaitu skor 4 (sangat baik),

skor 3 (baik), skor 2 (kurang baik), dan skor 1 (tidak baik). Pada aplikasi penilaian

peserta PPG, akan mendapat skor 4 jika peserta mampu mengungkap kembali

materi yang telah dipelajari, mengajukan pertanyaan yang mengaitkan,

pengetahuan sebelumnya dengan materi yang akan dipelajari, mengaitkan dengan

kehidupan sehari-hari dan isu mutakhir dengan sangat baik. Peserta mendapat skor

3 jika mampu mengungkap kembali materi yang telah dipelajari, mengajukan

pertanyaan yang mengaitkan, pengetahuan sebelumnya dengan materi yang akan

dipelajari, mengaitkan dengan kehidupan sehari-hari dan isu mutakhir dengan

baik. Peserta mendapat skor 2 jika mampu mengungkap kembali materi yang telah

dipelajari, mengajukan pertanyaan yang mengaitkan, pengetahuan sebelumnya

dengan materi yang akan dipelajari, namun kurang mengaitkan dengan kehidupan

sehari-hari dan isu mutakhir. Selanjutnya peserta mendapat skor 1 jika tidak

mampu mengungkap kembali materi yang telah dipelajari, tidak mengajukan

pertanyaan yang mengaitkan, pengetahuan sebelumnya dengan materi yang

dipelajari, kehidupan sehari-hari dan isu mutakhir. Total skor yang diperoleh

peserta tersebut berdasarkan total skor yang diperoleh dari setiap aspek yang

diamati secara keseluruhan berdasarkan kategori skor.

Berbagai pendapat tersebut menunjukkan bahwa penskoran holistik adalah

berisi rubrik penskoran yang deskripsi aspek penilaiannya dibuat secara umum,

karena deskripsi aspek penilaian dibuat umum maka biasanya rubrik penskoran

holistik dapat digunakan untuk menilai berbagai jenis kinerja maupun hasil kerja.

95
Penskoran dilakukan terhadap proses keseluruhan atau kesatuan produk tanpa

menilai bagian komponen secara terpisah namun berdasarkan kategori skor secara

urut. Setiap aspek yang akan dinilai ditentukan indikator tingkatan mutu bersifat

khusus dari yang paling baik sampai yang paling tidak baik.

c. Perbandingan Penskoran Parsial dan Holistik

Penskoran yang tepat dibutuhkan untuk memperoleh hasil penilaian yang

tepat pula. Tanpa penskoran yang tepat, maka kesalahan penilaian yang ditetapkan

akan terjadi (Mardapi, 2017: 162). Mengingat penentuan skor hasil pengukuran

berbeda-beda sesuai dengan jenis alat ukur yang digunakan, karena penskoran

masing-masing memiliki kelebihan dan kelemahan, termasuk penskoran model

parsial dan holistik.

Penskoran parsial memiliki kelebihan sebagai model yang sangat

sederhana dan mudah digunakan, yaitu skor 1 dan 0 dan ini termasuk pada model

proses penskalaan stimulus. Azwar (2017: 57) mengemukakan dalam prosedur

penskalaan stimulus, skor akan diberikan pada respons positif (endorsement) yaitu

jawaban ‘Ya’ diberi skor 1 dan ‘tidak’ diberi skor 0, namun angka skornya

ditentukan lebih dahulu lewat penskalaan itemnya. Prinsip penskoran model

dikotomus, skor 1 pada jawaban benar dan 0 pada jawaban yang salah. Hal ini

menunjukkan letak stimulus (item) pada kontinum ditentukan terlebih dahulu dan

angka pada titik kontinum itu dijadikan skor bagi jawaban ‘Ya’.

Penskoran parsial dalam penilaian capaian kompetensi mahasiswa/peserta

PPG mencakup penilaian capaian kompetensi pegagogik yang menilai

kemampuan peserta PPG dalam menyusun rencana pembelajaran dan

96
melaksanakan pembelajaran, penilaian capaian kompetensi sosial dan kepribadian

mahasiswa/peserta PPG. Untuk Threshold kategori yang lebih tinggi dalam

penskoran model ini tidak selalu lebih besar dari Threshold kategori sebelumnya.

Demikian halnya dalam permasalahan penilaian capaian penguasaan kompetensi

mahasiswa/peserta PPG, tingkat kesukaran untuk mencapai kategori yang lebih

tinggi tidak selalu besar dibandingkan tingkat kesukaran untuk mencapai kategori

sebelumnya. Misalnya dalam penyusunan rencana pembelajaran, tahapan

selanjutnya dalam menyelesaikan langkah memerlukan banyak pengetahuan dan

keterampilan, tetapi bila sudah sampai pada tahapan tersebut untuk mencapai

tahapan berikutnya justru lebih sederhana.

Model penskoran parsial kurang akurat untuk menganalisis respons

instrumen yang hanya memiliki 2 kategori, karena umumnya penskoran parsial

memiliki serangkaian tahapan. Model penskoran ini tidak dapat digunakan untuk

menemukan kesalahan yang dilakukan oleh peserta, karena semua option yang

salah diberi skor 0. Padahal kenyataannya kesalahan yang dilakukan peserta dapat

berbeda-beda sehingga penskoran parsial belum memberikan penghargaan yang

adil kepada setiap respons yang dinilai.

Kelebihan penskoran holistik mampu menilai semua kinerja yang

ditunjukkan dalam kategori. Penggunaannya lebih dapat dipercaya, dan membuat

lebih mudah untuk digunakan pada waktu berikutnya untuk memilih spesimen

atau contoh-contoh yang baik dari setiap kategori penilaian. Penskoran holistik

dapat membandingkan dengan setiap tingkat kualitas yang ditetapkan dalam

kategori untuk memutuskan ke kategori mana untuk menempatkan subjek yang

97
dinilai dan kurang memakan waktu dalam penggunaannya (Brookhart & Nitko,

2008: 197, Metruk, 2018). Jika penilai ingin mempertimbangkan waktu secara

efektif dan efisien dalam melakukan penilaian, disarankan menggunakan model

penskoran holistik.

Penskoran holistik memungkinkan penilaian untuk fokus pada penilaian

keterampilan keseluruhan bukan sifat setiap individu. Jika penskoran holistik

diterapkan ke respon subjek secara keseluruhan mampu menggambarkan tingkat

kinerja, misalnya, “lengkap menjelaskan”, “sebagian dijelaskan”, atau “minimal

dijelaskan” (Jones & Vickers, 2011). Untuk penilaian skala besar, penilaian

menggunakan penskoran holistik sering menjadi pilihan, karena dapat

memberikan deskripsi dari kinerja secara keseluruhan. Selain itu, menggunakan

model penskoran ini mendukung proses penilaian yang efisien dan handal.

Penskoran holistik selain mendukung penilaian yang efisien dan handal,

juga memberikan penilaian yang lebih luas mengenai kualitas proses atau produk.

Namun dalam penskoran holistik membutuhkan pengalaman dalam menilai

kinerja, penskoran holistik memiliki kelemahan diantaranya adalah masing-

masing skor tidak memberikan informasi secara keseluruhan tentang apa yang

harus dilakukan untuk meningkatkannya (Bainer & Porter, 1992: 26, Moskal,

2000: 3, Brookhart, 2013: 7). Pendapat ini mengindikasikan bahwa penskoran

holistik memiliki makna dalam variabel yang dinilai berdasarkan kategori skor.

Ketika penilai ingin melakukan penilaian dengan penskoran holistik,

mereka pertama kali harus dengan jelas mengidentifikasi hasil yang diinginkan

untuk dinilai. Selanjutnya harus mengembangkan sebuah rubrik yang jelas dan

98
khusus membahas hasil tersebut pada setiap kategori skor. Setiap kategori skor

pada rubrik harus mencerminkan bervariasi derajat level yang dinilai, hal ini

membatasi kegunaan dari penilaian ini ke situasi atau tugas yang dikembangkan.

Selain itu, penilai harus diajarkan untuk mampu menilai dengan model penskoran

ini secara ringkas dan cepat dengan fokus pada konten dan terstruktur untuk

menilai kinerja yang diinginkan apakah itu ekspositoris atau narasi.

Kelemahan lain yang dimiliki model penskoran holistik adalah mengambil

seluruh tanggapan tertulis ke perhitungan untuk menetapkan nilai keseluruhan

untuk kinerja. Bukan menilai komponen individual, komponen-komponen

tersebut terintegrasi ke dalam satu cara skor. Umumnya penilaian holistik

menempatkan penekanan pada apa yang dilakukan dengan “baik” dan bukan pada

apa yang “kurang” atau kekurangan yang dimiliki dari subjek yang dinilai.

Skala penilaian holistik relatif pendek dan tidak mencakup beberapa

kategori kriteria nilai individu yang harus diperoleh (Bainer & Porter, 1992: 26).

Penskoran holistik hanya menyediakan skor komposit yang tidak memberikan

bukti-bukti tertentu dari mana dan berapa banyak tambahan instruksi diperlukan.

Penilaian dengan penskoran ini, penilai tetap dapat memberikan penghargaan

yang lebih akurat dan berkeadilan untuk seluruh subjek yang dinilai mungkin satu

dengan yang lain berbeda.

Mengacu pada berbagai pendapat terkait kelebihan dan kelemahan

penskoran parsial dan holistik dapat disimpulkan meskipun model penskoran

holistik memiliki kelemahan namun model penskoran ini dapat digunakan untuk

menilai kemampuan/proses secara keseluruhan tanpa ada pembagian komponen

99
secara terpisah. Penggunaannya lebih mudah dan lebih cepat, efektif bila

digunakan untuk evaluasi akhir, memberikan nilai/skor komposit untuk

performansi lengkap dan sangat efektif jika semua elemen yang dinilai saling

terkait. Jika prinsip-prinsip dan prosedur pengembangan model penilaian PPG

dengan penskoran parsial dan holistik diterapkan dengan baik, maka diasumsikan

dapat meningkatkan kualitas hasil pelaksanaan Program PPG dalam mengukur

capaian penguasaan kompetensi mahasiswa/peserta PPG.

Berdasarkan kelebihan dan kelemahan yang dimiliki masing-masing

model penskoran baik secara parsial maupun holistik sebagaimana disebutkan di

atas, maka dalam mengembangkan model penilaian Program PPG pada penelitian

ini kedua model penskoran tersebut memiliki karakteristik masing-masing dan

aturan tertentu untuk menentukan level atau kategori yang dicapai dalam

penguasaan kompetensi dari mahasiswa/peserta PPG yang dinilai. Pemilihan

penskoran parsial menggunakan kategori partial credit didasarkan pada

kompleksitas setiap pembobotan dan pemberlakukan pengurangan skor (penalty)

untuk tahapan atau bagian yang salah dari item yang dinilai dari

mahasiswa/peserta PPG. Selanjutnya pada penskoran holistik penilaiannya

berdasarkan penentuan kategori tanpa memperhatikan pembobotan dan tidak

memperlakukan penalty, karena model penskoran ini tidak menghendaki

kesamaan jumlah kategori respons antar butir dan kurva probabilitasnya

jumlahnya sebanyak jumlah kategori respons.

100
7. Teori Respons Butir dan Penerapannya

Pengukuran harus menggunakan instrumen yang akurat dan terpercaya dan

hasil pengukuran harus mampu menjelaskan aspek yang diukur tanpa dipengaruhi

oleh faktor lain yang tidak berkaitan dengan aspek yang diukur, karena instrumen

yang telah dipengaruhi oleh faktor lain tentu berisi kesalahan atau error serta

tidak memihak kepada salah satu orang atau kelompok (Kartowagiran &

Retnawati, 2008; Retnawati, 2018). Guna memeroleh instrumen penilaian yang

akurat dan terpercaya, termasuk instrumen penilaian capaian penguasaan

kompetensi mahasiswa/peserta PPG yang dikembangkan dengan penskoran

parsial dan holistik, selain dilakukan analisis item secara teoritis (telaah butir)

oleh expert judgment, perlu juga dilakukan analisis item secara empirik.

Terdapat dua metode estimasi yang dapat digunakan untuk menganalisis

item instrumen secara empirik yaitu berdasakan teori tes klasik dan teori respon

butir (Item Response Teory, IRT) yang keduanya menggunakan teknik statistika

untuk mengetahui besarnya kemampuan seseorang, validitas (kesahihan) dan

keandalan (reliabilitas hasil pengukuran, kesalahan pengukuran, penyamaan skor

dan sebagainya (Retnawati, 2016a: 113, Mardapi, 2017: 174). Asumsi yang

digunakan pada kedua teori ini ada yang sama dan ada pula yang berbeda, berikut

ini penjelasan tentang kedua teori tersebut agar memberikan gambaran perbedaan

dan kesamaan kedua asumsi tersebut, terutama dalam analisis untuk mengetahui

karakteristik item dan kemampuan seseorang berdasarkan teori tes klasik dan

berdasarkan teori respon butir.

101
a. Teori Tes Klasik

Teori tes klasik digagas oleh Charles Spearmen pada tahun 1904 dan

merupakan teori psikometri yang membolehkan untuk melakukan prediksi tentang

hasil dari suatu tes dengan mempertimbangkan beberapa parameter seperti

kemampuan orang yang dites dan tingkat kesulitan. Teori ini juga menunjukkan

hubungan antara skor amatan, skor sebenarnya, dan skor kesalahan dalam

mengestimasi kehandalan dan kesahihan suatu instrumen (Sumintono &

Widhiarso, 2014: 48, Mardapi, 2017: 175). Model pengukuran yang digunakan

pada teori ini adalah: skor amatan (X) terdiri dari skor sebenarnya (T) dan skor

kesalahan (E), sehingga pada teori ini skor tampak (amatan) merupakan

penjumlahan dari skor murni dan kesalahan pengukuran (Retnawati, 2016a: 113).

Artinya didalam skor amatan, terkandung skor murni dari atribut yang diukur dan

kesalahan pengukuran yang secara matematis dinyatakan sebagai berikut:

X T E ………………………… (1)

dengan,

X  skor tampak

T  skor murni

E  kesalahan pengukuran (error) (Allen & Yen, 1979)

Kesalahan pengukuran yang dimaksud dalam teori ini merupakan

kesalahan acak (tidak sistematis), yaitu kesalahan yang terjadi karena

penyimpangan secara teoritis dari skor tampak yang diperoleh dengan skor

tampak yang diharapkan. Kesalahan yang bersifat sistematis bukan merupakan

kesalahan pengukuran . Asumsi utamanya adalah tidak ada hubungan antara skor

102
sebenarnya dan skor kesalahan, sehingga varians skor amatan merupakan

penjumlahan varians skor sebenarnya dan varians skor kesalahan, V x = Vt + Ve

(Mardapi, 2017: 175). Asumsi lain yang perlu diketahui adalah skor kesalahan (E)

bersifat acak dan tidak berinteraksi dengan skor sebenarnya (T). Skor kesalahan

(E) tidak berkorelasi dengan skor sebenarnya (T), dan rata-rata dari skor

kesalahan sama dengan nol. Hal yang perlu diperhatikan skor amatan (X) adalah

satu-satunya skor yang tampak/nyata, sedangkan skor sebenarnya (T) dan skor

kesalahan (E) bersifat tersembunyi (latent), sehingga teori ini memiliki

keterbatasan berdasarkan asumsi yang dibuat yaitu skor sebenarnya sangat

tergantung pada pengukuran yang dilaksanakan, dan pengujiannya tidak bisa

dibandingkan jika dua jenis tes berbeda diberikan kepada dua kelompok berbeda

(Sumintono & Widhiarso, 2014: 48, Retnawati, 2016a: 113). Hal ini menunjukkan

analisis item berdasarkan teori tes klasik, skor amatan dan skor sebenarnya

berubah-ubah bergantung pada tingkat kesulitan dan pembobotan, dimana

keduanya sangat bergantung pada hasil dari karakteristik peserta yang diuji.

Teori tes klasik mengembangkan model pengukuran untuk menaksir

besarnya kemampuan dan parameter butir/item, parameter kemampuan

dinyatakan sebagai jumlah butir yang benar atau jumlah skor yang diperoleh dan

parameter butir adalah tingkat kesulitan butir, daya beda dan dugaan (Mardapi,

2017: 176). Salah satu parameter butir yang sangat berguna dalam analisis

karakteristik item adalah tingkat kesulitan butir soal. Tingkat kesulitan butir soal

merupakan proporsi peserta tes yang menjawab benar tiap butir soal terhadap

jumlah peserta tes seluruhnya. Secara matematis dirumuskan sebagai berikut.

103
pi 
B ………………………… (2)
N

dengan,
p i  proporsi menjawab benar atau tingkat kesulitan butir i

 B  jumlah peserta tes yang menjawab benar pada butir i


N  jumlah peserta tes (Crocker & Algina, 1986: 90)

Tingkat kesulitan butir digunakan untuk mengetahui seberapa baik kualitas

suatu butir soal. Jika p i mendekati 0, maka soal tersebut terlalu sulit, dan jika p i

mendekati 1, maka soal tersebut terlalu mudah sehingga kedua-duanya harus

direvisi atau dibuang karena tidak bisa memberikan informasi yang maksimum

dalam membedakan peserta tes yang berkemampuan rendah dengan peserta tes

yang berkemampuan tinggi.

Menurut Allen & Yen (1979: 121) secara umum tingkat kesulitan butir

soal sebaiknya terletak pada interval 0,3 sampai 0,7. Pada interval ini informasi

tentang kemampuan peserta tes akan diperoleh secara maksimal. Menurut

Fernandes (1984) butir soal menghasilkan rerata skor sekitar 50% dari skor

maksimum dapat dikatakan bahwa butir tersebut memiliki tingkat kesulitan yang

tepat. Sementara menurut Naga (2013: 428) secara teori, nilai parameter tingkat

kesulitan butir adalah minus tak hingga sampai plus tak hingga (    b   ),

namun secara empirik, nilai parameter tingkat kesulitan butir berkisar dari – 2,0

sampai 2,0 (  2,0  b  2,0 ). Menurut Sumintono & Widhiarso (2014: 48)

tingkat kesulitan memiliki titik tertinggi 0 berarti tidak ada satupun (0%) peserta

tes menjawab dengan benar dan jika menunjukkan angka 1 berarti peserta tes

mampu menjawab dengan benar. Dengan demikian, tingkat kesulitan berkisar

104
antara 0 dan 1, suatu butir kadang dikategorikan ke dalam ekstrim yang sukar jika

nilai tingkat kesukaran mendekati 0 dan ekstrim mudah jika nilai tingkat

kesukaran mendekati 1.

Daya pembeda butir soal merupakan parameter yang memberikan

informasi tentang dapat tidaknya suatu butir soal membedakan kelompok dalam

aspek yang diukur sesuai dengan perbedaan yang ada dalam kelompok itu. Indeks

atau besaran yang digunakan dalam membedakan antara peserta tes yang

berkemampuan tinggi dengan peserta tes yang berkemampuan rendah adalah

indeks daya pembeda butir soal (item discrimination). Semakin besar nilai indeks

daya pembeda butir, maka semakin berfungsi butir itu dalam membedakan

kemampuan peserta tes. Seperti dinyatakan Naga (2013: 428) bahwa parameter

daya beda butir berkaitan dengan probabilitas jawaban benar, makin besar nilai

parameter daya beda butir makin peka probabilitas jawaban benar terhadap

perbedaan parameter kemampuan, makin besar nilai parameter daya butir makin

curam karakteristik butirnya, sehingga pada parameter daya beda butir yang besar,

sedikit perbedaan pada parameter kemampuan yang menyebabkan perbedaan

cukup besar pada probabilitas jawaban benar.

Nilai indeks daya pembeda butir soal ( d i ) dapat bernilai positif atau

negatif. Jika d i bernilai positif, maka butir soal telah mampu berfungsi dengan

baik. Artinya, peserta tes yang berkemampuan tinggi dapat menjawab dengan

benar dan peserta tes yang berkemampuan rendah menjawab dengan salah.

Sebaliknya, jika d i bernilai negatif, maka butir soal tidak berfungsi dengan baik.

105
Artinya, peserta tes yang berkemampuan tinggi menjawab dengan salah dan

peserta tes yang berkemampuan rendah menjawab dengan benar. Secara

matematis, nilai indeks daya pembeda butir soal dapat dihitung dengan rumus:

Di  piU  piL ………………………… (3)


dengan,
Di = Daya beda butir i
piU  proporsi kelompok atas yang menjawab benar butir i

piL  proporsi kelompok bawah yang menjawab benar butir i


(Allen & Yen, 1979; Crocker & Algina, 1986)

Indeks daya pembeda butir soal didefinisikan sebagai selisih antara

proporsi jawaban benar pada kelompok atas yang merupakan kelompok peserta

tes yang berkemampuan tinggi dengan proporsi jawaban benar pada kelompok

bawah yang merupakan kelompok peserta tes yang berkemampuan rendah.

Fernandes (1984) menyatakan bahwa butir soal yang baik adalah butir soal yang

memiliki indeks daya beda lebih dari 0,2. Sedangkan Ebel (1972) menyatakan

suatu butir soal dikatakan berkualitas apabila indeks daya pembedanya paling

sedikit 0,41. Selanjutnya menurut Kelley (Crocker & Algina, 1986: 314), yang

paling stabil dan sensitif serta paling banyak digunakan adalah dengan

menentukan 27% kelompok atas dan 27% kelompok bawah. Sementara menurut

Retnawati (2016a: 115) indeks daya beda pada suatu item dikatakan baik jika

lebih besar atau sama dengan 0,3, indeks daya beda yang nilainya kecil akan

menyebabkan item tersebut tidak dapat membedakan peserta tes yang

kemampuannya tinggi dan yang kemampuannya rendah, namun pada analisis tes

106
dengan Content-References Measuremes, indeks daya pembeda tidak terlalu perlu

menjadi perhatian, asalkan tidak negatif. Menurut Sumintono & Widhiarso (2014:

113) pada teori tes klasik, biasanya tingkat kesulitan 0,5 akan menyumbang pada

bagusnya nilai indeks daya beda, yang semakin besar nilai indeksnya

menunjukkan semakin bagus, misalya tingkat kesulitan 0,50 (50%) dari kelompok

peserta yang diuji lulus, merupakan tingkat kesulitan optimal dan soal tersebut

dinyatakan memiliki tingkat pembeda kemampuan tertinggi untuk peserta tes.

b. Teori Respons Butir Unidimensi Dikotomi

Teori Responsi Butir (Item Response Theory disingkat IRT) dinamai juga

sebagai Teori Ciri Laten (Latent Trait Theory disingkat LTT) atau Lengkungan

Karakteristik Butir (Item Characteristic Curve disingkat ICC). Pada IRT, peluang

jawaban benar yang diberikan siswa, ciri atau parameter butir, dan ciri atau

parameter peserta tes dihubungkan melalui suatu model formula yang harus ditaati

baik oleh kelompok butir tes maupun kelompok peserta tes (Hambleton,

Swaminathan, & Rogers, 1991). Artinya, butir yang sama terhadap peserta tes

yang berbeda harus tunduk pada aturan rumus itu, atau peserta tes yang sama

terhadap butir tes yang berbeda juga harus patuh terhadap rumus tersebut. Dalam

proses semacam ini terjadilah apa yang disebut invariansi diantara butir tes dan

peserta tes. Pada pengukuran modern, taraf sukar butir tidak dikaitkan langsung

dengan kemampuan responden.

Perbedaan mendasar antara pengukuran klasik dengan pengukuran modern

terletak pada invariansi penskoran, dimana penskoran modern adalah invarians

(tidak berubah atau tetap) terhadap butir tes serta terhadap peserta tes (Sudaryono,

107
2011). Lebih lanjut Lorf (1990: 121) bahwa invariansi parameter-parameter butir

tes melalui kelompok peserta tes merupakan karakteristik yang paling penting dari

IRT. Indeks kesukaran butir tes sebagai proporsi jawaban yang benar sehingga

sukar untuk membayangkan bagaimana indeks kesukaran tes dapat menjadi

invarians terhadap kelompok peserta tes dari tingkat kemampuan yang berbeda.

Menurut Hambleton et al., (1991: 5) secara umum ciri-ciri teori respon

butir adalah sebagai berikut: 1) karakteristik butir tidak tergantung pada peserta

ujian, 2) skor yang digambarkan peserta ujian tidak tergantung pada tes, 3)

merupakan model yang lebih menekankan pada tingkat butir daripada tingkat tes,

4) merupakan model yang tidak mensyaratkan secara ketat tes paralel untuk

menaksir reliabilitas, dan 5) merupakan model yang menguraikan sebuah ukuran

keputusan untuk tiap skor kemampuan yakni ada hubungan fungsional antara

peserta tes dengan tingkat kemampuan yang dimiliki.

Teori respon butir juga dikembangkan atas dasar dua postulat yaitu: 1)

performansi subyek pada suatu butir dapat diprediksikan oleh seperangkat faktor

yang disebut latent trait atau kemampuan dan 2) hubungan performansi subyek

pada suatu butir dan perangkat kemampuan laten yang mendasarinya digambarkan

oleh fungsi naik monoton yang disebut Item Characteristic Curve (ICC). Selain

itu, menurut Hambleton et al., (1991: 9) bahwa asumsi-asumsi yang melandasi

teori respon butir adalah unidimensi, independensi lokal, dan fungsi karakteristik

butir atau kurva karakteristik butir.

108
Pada awalnya teori respon butir menggunakan distribusi normal, namun

dalam perkembangan selanjutnya digunakan model distribusi logistik. Hal ini

dikarenakan model distribusi logistik lebih sederhana analisis matematiknya

(Mardapi, 2017: 178). Ada tiga macam model logistik dalam teori respon butir

yaitu model logistik satu parameter, model logistik dua parameter, dan model

logistik tiga parameter. Perbedaan ketiga model tersebut terletak pada banyaknya

parameter yang digunakan untuk menggambarkan karakteristik butir dalam model

yang bersangkutan Hambleton et al., (1991: 6).

1) Model Logistik 1 Parameter / 1PL (Model Rasch)

Model logistik satu parameter merupakan model estimasi parameter butir

yang meninjau tingkat kesukaran butir dengan mengasumsikan bahwa daya beda

sama untuk semua butir dan tebakan sama dengan 0. Model 1PL dan Model Rasch

memiliki kesamaan yaitu sama-sama mengasumsikan daya beda yang sama untuk

semua butir. Adapun yang membedakan keduanya dijelaskan oleh Ayala (2008:

19) bahwa pada Model Rasch daya beda konstan pada nilai 1 sedangkan untuk

Model 1PL daya beda konstan tidak harus berada pada nilai 1. Retnawati (2014:

14) merumuskan Model logistik 1 parameter sebagai berikut:

e D ( bi )
Pi ( )  dengan i = 1, 2, 3, …..n …………… (4)
1  e D ( bi )

Keterangan:
Pi ( ) = Peluang menjawab benar peserta yang berkemampuan  pada
butir ke i
bi = Tingkat kesukaran butir ke-i
e = Bilangan natural yang bernilai 2,712
n = Jumjah butir soal
D = Kostanta bernilai 1,7 sebagai simpangan baku distribusi logistik

109
Persamaan tersebut merupakan cara yang digunakan untuk mengestimasi

butir dengan 1 parameter. Melalui persamaan tersebut juga dapat digunakan untuk

menggambarkan kurva karakteristik butir ke-i yang menggambarkan

probabilitas/peluang peserta (  ) menjawab butir soal dengan benar. Parameter bi

merupakan suatu titik pada skala kemampuan agar peluang menjawab benar

sebesar 50 %. Semakin besar nilai bi, maka semakin besar kemampuan yang

diperlukan untuk menjawab benar dengan peluang 50 % atau dengan kata lain

semakin besar nilai parameter bi, maka semakin sulit butir soal tersebut.

Hubungan peluang menjawab benar Pi ( ) dengan tingkat kemampuan

peserta (  ) dapat digambarkan sebagai kurva karakteristik butir (item

charasteristic curve, ICC). Berikut Gambar 4 ditampilkan contoh kurva

karakteristik butir untuk Model Logistik 1 Parameter.

Gambar 6. Contoh Kurva Karakteristik Butir Model Logistik 1 Parameter


Sumber: Retnawati (2014: 15)
Gambar 6 tersebut merupakan ilustrasi kurva karakteristik butir untuk

model Rasch (1 parameter, 1P), dengan butir 1(b=-0,5), butir 2 (b=0) dan butir

3(b=0,5). Menurut Hambleton et al., (1991: 13) bahwa nilai bi (tingkat kesukaran

110
butir) bervariasi dari -2 sampai +2. Nilai mendekati -2 menunjukkan bahwa butir

tersebut sangat mudah sedangkan nilai mendekati +2 menunjukkan bahwa butir

tersebut sangat sulit. Probabilitas jawaban betul pada butir ke-i berhubungan

dengan letak  terhadap bi atau terhadap (  - bi) atau Pi ( ) = f (  - b). Nilai

taraf sukar butir ke-i ditentukan oleh  - bi = 0 atau bi = 0 pada saat Pi ( ) = 0,5.

2) Model Logistik 2 Parameter / 2 PL (Birnbaum Model)

Model logistik dua parameter merupakan model yang menitik beratkan

selain pada tingkat kesukaran butir, juga menitik beratkan pada daya beda butir

soal. Faktor tebakan masih diasumsikan sama dengan 0 atau tidak ada tebakan.

Hambleton et al., (1991: 15) merumuskan Model logistik 2 parameter berikut:

e Dai ( bi )
Pi ( )  dengan i = 1, 2, 3, …..n ……………(5)
1  e Dai ( bi )
Keterangan:
Pi ( ) = Peluang menjawab benar peserta yang berkemampuan ɵ
pada butir ke i
ai = Parameter daya beda butir
bi = Tingkat kesukaran butir ke-i
e = Bilangan natural yang bernilai 2,712
n = Jumlah butir soal
D = Kostanta bernilai 1,7 sebagai simpangan baku distribusi
logistik

Sama halnya dengan Model Logistik 1 parameter, pada Model Logistik 2

Parameter hubungan peluang menjawab benar Pi ( ) dengan tingkat kemampuan

peserta (  ) dapat digambarkan sebagai kurva karakteristik butir (item

charasteristic curve, ICC) 2 Parameter. Berikut Gambar 7 ditampilkan contoh

kurva karakteristik butir untuk Model Logistik 2 Parameter dengan 2 butir soal.

111
Gambar 7. Kurva Karakteristik Butir Untuk Model Logistik 2 Parameter
Sumber: Retnawati (2014: 16)

Pada Gambar 7 disajikan kurva karakteristik butir 1 (a=0,5; b=0,5) dan

butir 2 (a=1; b=0,5). Berdasarkan gambar tersebut, jika indeks daya pembeda butir

1 lebih rendah dibandingkan butir 2, maka akan nampak bahwa kurva

karakteristik butir 1 lebih landai didbandingkan dengan butir 2. Menurut

Hambleton et al., (1991: 37) pada model logistik dua parameter probabilitas

peserta tes untuk dapat menjawab benar suatu butir soal ditentukan oleh dua

karakteristik butir, yaitu indeks kesukaran butir (bi) dan indeks daya beda butir

(ai). Parameter ai merupakan indeks daya pembeda yang dimiliki butir ke-i. Pada

kurva karakteristik, ai proporsional terhadap koefisien arah garis singgung (slope)

pada titik  = b. Butir soal yang meiliki daya pembeda yang besar mempunyai

kurva yang sangat menanjak, sedangkan butir soal yang mempunyai daya

pembeda kecil mempunyai kurva yang sangat landai. Secara teoritis, nilai a i ini

terletak antara   dan   . Pada butir yang baik nilai ini memiliki hubungan

positif dengan performan pada butir dengan kemampuan yang diukur, dan a i

terletak antara 0 dan 2.

112
3) Model Logistik 3 Parameter / 3 PL (Birbaum Model)

Model Logistik 3 merupakan salah satu model dalam IRT dimana tingkat

kesukaran, daya beda dan tebakan dikontrol secara bersama-sama. Hambleton et

al., (1991: 17) merumuskan Model logistik 3 parameter sebagai berikut:

1
Pi ( )  c  (1  c)  ai (  bi )
dengan i = 1, 2, 3, …..n …………(6)
1 e

Keterangan:
Pi ( ) = Peluang menjawab benar peserta yang berkemampuan ɵ pada
butir ke i
ai = Parameter daya beda butir
bi = Tingkat kesukaran butir ke-i
c = Parameter tebakan
e = Bilangan natural yang bernilai 2,712
n = Jumlah butir soal

Sama halnya dengan Model Logistik 1 Parameter dan 2 Parameter, pada

Model Logistik 3 Parameter hubungan peluang menjawab benar Pi ( ) dengan

tingkat kemampuan peserta (  ) dapat digambarkan sebagai kurva karakteristik

butir (item charasteristic curve, ICC) 3 Parameter. Berikut ditampilkan contoh

kurva karakteristik butir untuk Model Logistik 3 Parameter pada Gambar 8.

Gambar 8. Kurva Karakteristik Butir Untuk Model Logistik 3 Parameter


Sumber: Retnawati (2014: 17)

113
Gambar 8 tersebut merupakan kurva karakteristik butir 1 (a=1, b=0,5,

c=0), butir 2 (a=0,5, b=0,5, c=0). Menurut Hullin (Retnawati, 2014: 17)) pada

suatu butir tes, nilai ci ini berkisar antara 0 dan 1, suatu butir dikatakan baik jika

nilai ci tidak lebih dari 1/k, dengan k banyaknya pilihan misalnya pada suatu

perangkat tes pilihan ganda dengan 4 pilihan untuk setiap butir tesnya, butir ini

dikatakan baik jika nilai ci tidak lebih dari 0,25. Setelah membahas model 1PL,

2PL, dan 3PL, maka model logistik 3PL lebih baik dibandingkan dengan model

logistik lainnya. Hal tersebut juga didukung pendapat Hambleton et al., (1991)

yang menjelaskan bahwa model 3PL adalah model terbaik.

c. Teori Respons Butir Politomi

Banyak teori pengukuran baru telah berkembang selama dekade terakhir

yang dapat memberikan informasi terperinci tentang pengujian atribut laten atau

kemampuan yang dimiliki seseorang dan relevan untuk menilai penilaian yang

kompleks dan untuk mengevaluasi keakuratan skor yang dihasilkan (Templin &

Hoffman, 2013). Teori pengukuran yang berkembang saat ini dan yang lebih

populer adalah teori respon butir atau lebih dikenal dengan istilah Item Response

Theory (IRT). Metode ini berasumsi bahwa variabel laten diwakili oleh sebuah

kontinum unidimensional dan dapat memberikan informasi yang tepat dan

terperinci tentang atribut laten atau kemampuan yang dimiliki seseorang (de

Ayala, 2009; Hu, Qin, Sullivan, & Templin, 2017).

Pemikiran model IRT menurut Hambleton et al., (1991: 2-5) didasarkan

pada dua buah postulat, yaitu: 1) prestasi subjek pada suatu butir soal dapat

diprediksikan dengan seperangkat faktor yang disebut kemampuan (latent traits),

114
dan 2) hubungan antara prestasi subjek pada suatu butir dan perangkat

kemampuan yang mendasarinya digambarkan oleh fungsi naik monoton yaitu

kurva karakteristik butir (item characteristic curve, ICC). Model IRT merupakan

model logistik yang terdiri dari 1 parameter (1PL), 2 parameter (2PL), dan 3

parameter (3PL) yang memberikan perkiraan invariant item dan kemampuan

parameter (Hambleton, 2004). Model ini dapat dipakai untuk mengidentifikasi

hubungan antara pola respons individu terhadap indikator dengan faktor ukurnya.

Penskoran pada model IRT terdapat 2 model yaitu model dikotomi dan

politomi. Menurut Naga (2013: 82) sesuai dengan rentangan skala, ada skor yang

terdiri atas skor satuan dikotomi, serta ada juga yang terdiri atas skor satuan

politomi. Untuk skor satuan dikotomi hanya memiliki nilai sederhana 0 dan 1.

Model respons butir nominal dapat diterapkan pada butir yang mempunyai

alternatif jawaban yang tidak terurut (ordered) dan adanya berbagai tingkat

kemampuan yang diukur. Pada model respons ordinal terjadi pada butir yang

dapat diskor ke dalam banyaknya kategori tertentu yang tersusun dalam jawaban,

skala likert diskor berdasarkan pedoman penskorankategori respons terurut, yang

merupakan penskoran ordinal (Retnawati & Munadi, 2013). Dengan demikian

model respon butir politomi dapat dikategorikan menjadi butir nominal dan

ordinal, tergantung pada asumsi karakteristik data.

Penskoran politomi terdapat lebih dari dua nilai yang membentang dari

nilai yang terendah sampai nilai yang tertinggi, misalnya nilai yang diberikan

pada satu butir tes membentang antara nilai 0 sampai dengan 2 atau nilai yang

membentang dengan skala yang lebih luas. Model politomi memiliki keunggulan

115
karena dapat dipakai untuk menyusun model yang menjelaskan interaksi antara

subjek dengan butir (Widhiarso, 2010: 106) . Oleh karena itu model politomus

dapat diterapkan pada skala kepribadian dengan format Likert yang memiliki

alternatif respon bergradasi dari setuju hingga tidak setuju.

Terdapat 2 model IRT yaitu IRT satu dimensi atau unidimensional IRT

(UIRT) dan multidimensional IRT (MIRT). UIRT menggunakan data dikotomi

seperti benar skor 1 dan salah skor 0 dapat menggunakan model logistik 1

parameter (1PL), model logistik 2 parameter (2PL), model logistik 3 parameter

(2PL). Selanjutnya ada dua jenis pendekatan di dalam model politomus IRT

pertama adalah pendekatan tidak langsung (indirect) dan kedua adalah pendekatan

langsung (direct). Jenis pendekatan langsung adalah sebelum memasuki

persamaan utama untuk melihat fungsi respons kategori (category response

functions/CRF), harus melihat fungsi karakteristik operasi (operating

characteristic functions/OCF) tiap kategori terlebih dahulu (Retnawati, 2014).

Model dalam politomi untuk data berskala ordinal, model yang dapat

digunakan adalah graded response model (GRM), modified graded response

model (MGRM), partial credit model (PCM), generalized partial credit model

(GPCM), dan rating scale model (RSM) dan dari model tersebut yang paling

sering dipakai ahli yakni PCM, GRM, dan GPCM (Embretson & Reise, 2000: 95,

de Ayala, 2009: 162, Retnawati, 2014: 32). Model tersebut sangat tergantung dari

karakteristik parameter dan kecocokan model yang digunakan, karena semua

model penskoran respons pada politomus mendasarkan pada asumsi bahwa

respons pada suatu item tergantung pada kemampuan peserta tes yang diukur

116
dengan menggunakan skala unidimensi (Retnawati & Munadi, 2013, Retnawati,

2014: 32). Berdasarkan model penskoran yang digunakan dalam pengembangan

model penilaian ini adalah penskoran parsial dan holistik, maka model politomi

yang dipilih adalah Parcial Credit Model (PCM) dan Graded Response Model

(GRM) dengan karakteristik sebagai berikut.

1) Parcial Credit Model (PCM)

Pada awal perkembangan teori respons butir politomus, model yang lebih

dikenal yakni perluasan dari model Rasch yang disebut dengan Partial Credit

Model, PCM (Retnawati, 2018). Pemodelan Rasch diperkenalkan oleh Georg

Rasch pada tahun tahun 1960-an merupakan model IRT yang paling popular dan

berkembang dari asalnya untuk analisis data dikotomi ke bentuk data skala

peringkat (rating scale) oleh Andrich, partial model oleh Masters, sampai ke

facets model oleh Linacre. Fitur utama dari Rasch model adalah peluang

keberhasilan seseorang tergantung pada perbedaan antara kemampuan orang dan

kesulitan item (Bond & Fox, 2007: 10, Sumintono & Widhiarso, 2014: 50).

Pendapat ini mempertegas bahwa pemodelan Rasch mengakomodasi pendekatan

probabilitas dalam memandang atribut sebuah objek ukur. Hal ini menyebabkan

pemodelan Rasch mampu mengidentifikasi objek ukur lebih cermat.

PCM adalah aplikasi dari Rasch model untuk data dikotomi untuk tes

dimana tanggapan item dicatat dalam beberapa kategori dengan skor 0 1, 2,...

Ki..., sehingga pemahaman tentang model PCM tergantung pada pemahaman

Rasch model dikotomus menjadi politomus dengan 1 PL logistik yaitu tingkat

kesukaran (Nering & Ostini, 2011: 115, Istiyono et al., 2014a). Bila penskoran

117
dikotomus membagi respons peserta tes menjadi 2 kategori saja, yaitu benar (1),

dan salah (0), namun pada PCM respons peserta tes dikumpulkan dari tahap demi

tahap dan menghargai partial correct, sehingga PCM memiliki kategori lebih dari

dua dan termasuk model penskoran politomus. de Ayala (2009: 163) meyakini

bahwa jika partial correct dihargai tahap demi tahap sesuai tahapan/langkah yang

ditugaskan kepada peserta tes, dapat memberikan informasi yang berguna untuk

memperkirakan respons peserta berada pada lokasi yang mana. Hal ini tersirat

makna bahwa dalam rubrik penilaian terdapat beberapa langkah/tahapan yang

harus dilakukan oleh peserta, setiap langkah/tahapan peserta dihargai dengan

memberikan skor 1, sebaliknya jika ada langkah/tahapan yang tidak dapat

dilakukan peserta, maka peserta tersebut mendapatkan skor 0. Artinya peserta

akan dihargai skor yang diperoleh sejumlah langkah/tahapan yang dilakukan

dengan benar atau mendapat skor 1.

Model PCM dikembangkan untuk menganalisis item tes yang

memerlukan beberapa langkah penyelesaian dan PCM juga dapat diberikan pada

langkah-langkah yang dapat dikerjakan oleh individu, sehingga PCM mempunyai

kemiripan dengan Graded Response Model (GRM) pada butir yang diskor dalam

kategori berjenjang, namun indeks kesukaran dalam setiap langkah tidak perlu

terurut, suatu langkah dapat lebih sukar dibandingkan langkah berikutnya

(Istiyono et al., 2014a, Retnawati, 2016b: 37). Jika diasumsikan bahwa sebuah

butir mengikuti pola kredit parsial, maka kemampuan individu lebih tinggi

diharapkan memiliki skor yang lebih tinggi daripada individu yang memiliki

118
kemampuan rendah. Adapun bentuk rumus umum PCM menurut Muraki & Bock

(Retnawati, 2014: 37) sebagai berikut.

k
exp  (  b jv )
Pjk ( )  m
v 0
k
,k=0,1,2,...,m ………………………… (7)

h 0
exp  (  b jv )
v 0

dengan
Pjk ( ) = probabilitas peserta berkemampuan  memperoleh skor kategori k pada

butir j,

 = kemampuan peserta,

m+1 : banyaknya kategori butir j,

bjk : indeks kesukaran kategori k butir j

dan

k h h

 (  b
h 0
jh )  0 dan  (  b
h 0
jh )   (  b jh ) ………………………… (8)
h 1

Skor kategori pada PCM menunjukkan banyaknya langkah untuk

menyelesaikan dengan benar butir tersebut. Skor kategori yang lebih tinggi

menunjukkan kemampuan yang lebih besar daripada skor kategori yang lebih

rendah (Istiyono et al., 2014b). Pada PCM, jika suatu butir memiliki dua kategori,

maka persamaan 2 menjadi persamaan model Rasch. Sebagai akibat dari hal ini,

PCM dapat diterapkan pada butir politomus dan dikotomus.

Persamaan di atas, dapat dijabarkan berdasarkan jumlah kategori di dalam

butir, sehingga persamaan model Rasch yang digunakan untuk menganalisis

respons item dengan 4 pilihan, maka didapatkan kategori (j) sebanyak 4(j=0,1,2,3)

119
buah persamaan yang probabilitas individu pada tiap kategori dalam category

response function (CRF) diwujudkan dalam persamaan berikut.

Kategori 0 :
expDai (  b11 )
P10 ( )  0  Pi1* ( )  0 
1  expDai (  b11 )
Kategori 1 :
expDai (  b11 ) expDai (  b12 )
P11 ( )  0  Pi1* ( )  Pi*2 ( )  
1  expDai (  b11 ) 1  expDai (  b12 )
Kategori 2 :
expDai (  b12 ) expDai (  b13 )
P12 ( )  0  Pi*2 ( )  Pi*2 ( )  
1  expDai (  b12 ) 1  expDai (  b13 )
Kategori 3:
expDai (  b13 ) expDai (  b14 )
P13 ( )  0  Pi*3 ( )  Pi*4 ( )  
1  expDai (  b13 ) 1  expDai (  b14 )

Dengan demikian PCM adalah model penskoran bersifat politomus yang

menilai respons bagian/langkah demi bagian/langkah, dan proses penskoran

dengan PCM diperoleh sejumlah kategori lebih dari dua, sehingga setiap

mencapai bagian tertentu diberikan kategori, dengan Threshold untuk mencapai

kategori lebih tinggi pada penskoran PCM tidak terlalu selalu lebih besar

dibandingkan dengan Threshold kategori sebelumnya. Hal ini sejalan dengan

asumsi PCM yang dinyatakan oleh Widhiarso (2010) bahwa jika sebuah item

mengikuti pola kredit parsial, maka kemampuan individu lebih tinggi diharapkan

memiliki skor lebih tinggi daripada individu yang memiliki kemampuan rendah.

Berdasarkan uraian di atas, model yang cocok dipilih untuk menganalisis

respons mahasiswa/peserta PPG terhadap capaian kompetensi pedagogik,

kompetensi sosial dan kepribadian adalah model politomus dengan PCM yang

120
menggambarkan serangkaian tahapan demi tahapan yang dicapai peserta PPG,

karena proses penskoran dengan model PCM diperoleh sejumlah kategori lebih

dari dua dalam menyelesaikan tahapan demi tahapan.

2) Graded Response Model (GRM)

Model GRM menjadi sebuah kerangka pemodelan standar statistik untuk

respons skala ordinal misalnya skala likert. Model ini merupakan perluasan dari

model 2PL yang tidak menghendaki kesamaan jumlah kategori respons antar

butir, sehingga kurva probabilitasnya jumlahnya sebanyak jumlah kategori

respons (Y. Liu & Thissen, 2014). Model GRM termasuk dalam pendekatan tidak

langsung pada model IRT, sehingga sebelum masuk ke persamaan fungsi respon

kategori (CRF) harus terlebih dahulu melihat fungsi karakteristik operasi (OCF).

Mengingat model IRT merupakan komputasi bersyarat memperkirakan respons

tertentu dikategori memerlukan dua langkah proses, sehingga untuk model GRM

dalam ukuran item tidak perlu memiliki jumlah yang sama untuk kategori respon,

tidak ada pengaruh yang timbul pada estimasi parameter item atau interpretasi

parameter berikutnya karena parameter memiliki item dengan respons yang

berbeda format dan setiap kategori respons pada butir diperlakukan layaknya butir

dikotomi (Embretson & Reise, 2000: 85).

GRM merupakan ekstensi dari skala Thurstone yang muncul pada 1928

dan tepat digunakan ketika respons peserta tes terhadap item termasuk respons

kategori yang berurutan dan tingkat penyelesaiannya cenderung meningkat seperti

pada skala likert, nilai tingkat kesukaran relative kategori 1 > 2 > …> n atau urut

121
(Ridlo, 2012). Hubungan parameter butir dan kemampuan peserta tes dalam GRM

dinyatakan oleh Retnawati (2014: 35) sebagai berikut:

Pjk ( )  Pjk* ( )  Pjk* 1 ( ) ………………………… (9)

exp[ Da j (  b jk )]
Pjk ( ) 
1  exp[ Da j (  b jk )] ………………………… (10)

dengan Pjk* ( ) = 1 dan Pjm


*
1 ( )  0

aj : Indeks daya beda butir j,


 : kemampuan peserta,
bjk : Indeks kesukaran kategori k butir j
Pjk (  ) : Probabilitas peserta berkemampuan  yang memperoleh skor
kategori k pada butir j
P jk (  ) : Probabilitas peserta berkemampuan  yang memperoleh skor
*

kategori k atau lebih pada butir j


D : Faktor skala

Persamaan (9) merupakan fungsi karakteristik operasi (OCF) dalam

GRM. Persamaan tersebut identik dengan persamaan logistik pada model 2-PL,

namun lebih spesifik karena dalam butir j terdapat kategori k yang diestimasi

secara terpisah. OCF tidak dapat langsung digunakan untuk menentukan

probabilitas pada setiap kategori butir, sehingga perlu menghitung CRF butir

terlebih dahulu dengan menggunakan persamaan (10). Embretson and Reise

(2000) menyebutkan dengan category response curves (CRCs) yang mewakili

probabilitas individu dalam menanggapi dalam kategori tertentu yang tergantung

pada level traitnya.

Salah satu tujuan model GRM adalah untuk menentukan lokasi dari

threshold ini pada kontinum sifat laten. Pada model GRM, setiap item skala (i)

dijelaskan oleh satu item slope parameter (ai) dan j = 1... mi antara kategori

122
threshold parameters (bij), yang ditunjukkan mi + 1 = ki untuk menjadi sama

dengan jumlah item respon kategori dalam item. Ada dua tahap untuk komputasi

kategori respon probabilitas di GRM. Untuk memahami tahap ini, misalnya item

tes dengan K = 5 pilihan jawaban dimana item nilai x = 0... 4. dengan lima pilihan

jawaban, ada mi = ambang batas 4 (j = 1... 4) antara pilihan jawaban seperti yang

ditunjukkan pada gambar di bawah. Salah satu tujuan model GRM adalah untuk

menentukan lokasi dari ambang batas ini pada kontinum sifat laten (Embretson &

Reise, 2000: 98), sebagaimana dicontohkan pada Gambar 9 dan Gambar 10.

Gambar 9. Operating Characteristic Gambar 10. Category Response


Curves (OCF) untuk lima kategori Curves (CRF) untuk lima kategori
(Embretson & Reise, 2000: 98) (Embretson & Reise, 2000: 98)
Berdasarkan Gambar 9 dan Gambar 10 menunjukkan parameter item

dalam GRM mengikuti bentuk dan lokasi CRF dan kurva OCF. Secara umum,

semakin tinggi parameter lereng (ai), semakin curam kurva OCF (gambar 9) dan

semakin sempit dan memuncak CRF (gambar 10). Hal ini menunjukkan parameter

item dalam GRM menentukan lereng dan lokasi kategori respons kurva dan

karakteristik kurva. Lereng bukan menunjukkan daya diskriminasi seperti halnya

pada politomi. Lereng nantinya akan berkaitan dengan fungsi informasi item

123
(Embretson & Reise, 2000: 99). Dengan demikian model GRM diformulasikan

atas asumsi bahwa probabilitas sebuah respons lebih tinggi daripada yang

diberikan pada kategori k, misalnya jika sebuah item memiliki 4 kategori respons

maka fungsi dikotomus pertama adalah 0 lawan 1, 2 atau 3, fungsi kedua adalah 0

atau 1 lawan 2 atau 3, dan fungsi ketiga adalah 0, 1, atau 2 lawan 3.

Salah satu hal penting yang perlu diperhatikan dalam model penskoran

dalam IRT adalah pemilihan model yang tepat. Pemilihan model yang tepat akan

mengungkap keadaan yang sesungguhnya dari data sebagai hasil pengukuran.

Dengan demikian model PCM dan GRM dipilih dalam penelitian ini dapat

menjelaskan hal-hal penting dari data aktual penilaian capaian penguasaan

kompetensi mahasiswa/peserta PPG, yang dapat diupayakan kedua model ini

merupakan model yang paling sederhana untuk dapat menjelaskan data dengan

baik tanpa harus membandingkannya, namun mampu menemukan model yang

paling akurat dalam mengestimasi kemampuan mahasiswa/peserta PPG.

d. Nilai Fungsi Informasi dan Kesalahan Pengukuran

Istilah nilai informasi atau fungsi informasi pada model IRT merupakan

parameter kemampuan untuk menyatakan tingkat kehandalan atau tingkat

keakuratan (ukuran presisi) hasil pengukuran suatu item, karena jika fungsi

informasi sudah diketahui, maka dapat ditemukan fungsi informasi suatu item dan

juga dapat diketahui kesalahan bakunya dalam mengestimasi kemampuan peserta

tes (Lord, 2012: 65). Menurut Baker & Kim (2017: 85) fungsi informasi pada

tingkat kemampuan yang diberikan adalah memiliki hubungan timbal-balik

dengan varians. Jika nilai informasi yang besar, itu berarti bahwa kemampuan

124
peserta tes yang sebenarnya adalah pada tingkat yang dapat diperkirakan dengan

presisi; maksudnya, semua perkiraan akan cukup dekat dengan nilai sebenarnya.

Jika nilai informasi kecil, itu berarti kemampuan peserta tes tidak dapat

diperkirakan dengan ketepatan dan perkiraan akan tersebar luas. Varians terbalik

adalah ukuran presisi yang tingkat kemampuan tertentu dapat diperkirakan, nilai

informasi yang bisa dihitung untuk setiap tingkat kemampuan pada skala

kemampuan dari negatif ke positif. Jika nilai informasi yang dipetakan terhadap

kemampuan, hasilnya adalah grafik fungsi informasi seperti pada Gambar 11.

Gambar 11. Fungsi Informasi (Baker & Kim, 2017: 85)

Memperhatikan Gambar 11 menunjukkan bahwa nilai informasi memiliki

kemampuan maksimum pada level -0.1 dan 3 untuk berbagai kemampuan dari

-2.0 ≤  ≤ 0.0. Dalam kisaran ini, kemampuan diperkirakan dengan beberapa

presisi. Fungsi informasi memberikan informasi seberapa baik tingkat

kemampuan masing-masing item yang diperkirakan. Hal ini penting untuk

diketahui bahwa fungsi informasi tidak tergantung pada distribusi tes atas skala

kemampuan. Dalam hal ini, seperti kurva karakteristik item dan kurva

karakteristik tes. Dalam tes untuk keperluan secara umum, fungsi informasi secara

125
ideal akan memberikan informasi tingkat kemampuan yang dapat diperkirakan

dengan ketepatan sama.

Dengan demikian fungsi informasi dalam pengembangan model penilaian

Program PPG merupakan parameter pengukuran yang diharapkan mampu

memberikan informasi potensi suatu item dalam mengukur capaian kompetensi

peserta PPG. Jika fungsi informasi masing-masing item sudah diketahui, maka

dapat ditemukan fungsi informasi suatu tes, dan akhirnya dapat diketahui pula

kesalahan baku tes tersebut dalam mengestimasi kemampuan peserta PPG. Oleh

karena itu, dengan diketahuinya fungsi informasi item atau tes, maka dapat

menyeleksi atau membandingkan suatu item atau tes tersebut.

1) Fungsi Informasi Item (Item information function)

Fungsi informasi item merupakan salah satu hal yang perlu diperhatikan

dalam analisis item pada IRT. Fungsi informasi ini menyatakan kekuatan atau

sumbangan butir tes dalam mengungkap laten trait yang diukur pada tes tesebut.

Pada model IRT, setiap item memiliki fungsi informasi spesifik yang

menyediakan informasi tentang tingkat trait laten dianalisis pada tingkat tertentu

paling terpercaya (Zięba, 2013). Sama halnya oleh Nurcahyo (2016) dinyatakan

fungsi ini menunjukkan sumbangan yang diberikan item terhadap estimasi

kemampuan pada suatu titik dalam kontinum kemampuan. Menurut Baker &

Kim (2017: 92) fungsi informasi ini sangat berguna dalam IRT untuk

mengevaluasi ketepatan setiap item dalam tes termasuk mengukur tingkat laten

trait yang diberikan (nilai parameter i). Pendapat ini menunjukkan fungsi

informasi sangat diperlukan dalam parameter pengukuran IRT guna

126
mendeskripsikan potensi suatu item, dimana item-item yang menyusun suatu tes

dipilih berdasar fungsi informasi item tersebut dan dapat menyeleksi atau

membandingkan suatu item atau tes tersebut.

Menurut Retnawati (2014: 16) bahwa fungsi informasi item (item

information function) merupakan suatu metode untuk menjelaskan kekuatan suatu

butir pada perangkat tes, pemilihan butir tes, dan perbandingan beberapa

perangkat tes. Setiap butir memiliki fungsi informasi sendiri berbentuk suatu

kurva yang disebut fungsi informasi butir. Pada data politomi fungsi informasi

dapat dihitung dengan menggunakan rumus yang disarankan oleh (Samejima,

1974); Du Toit (2003: 613) sebagai berikut.


mj

I j ( )   A jk ( )
k 0

  ………………………… (11)
2

mj  P ( ) 

jk
 
k 0 Pjk ( )

(Sumber: Du Toit, 2003: 613)

Dengan k adalah kategori dalam data politomus, dan A jk ( ) adalah fungsi dasar

dari item response model. Untuk bentuk ogive normal dari model graded

response, fungsi dasar A jk ( ) ditulis sebagai berikut.

A jk ( )  D 2 a j
 jk ( )   j ,k 1 ( ) 
2

………………………… (12)
A jk ( )

di mana  jk ( ) adalah ordinat normal untuk Pjk ( ) . Untuk model graded

response, fungsi dasar menjadi,

127
A jk ( )  D a
2 2
j
P 
jk   
( ) 1  P  jk ( )  P  j ,k 1 ( ) 1  P  jk ( ) 
2

…………… (13)
Pjk ( )

Fungsi informasi untuk parsial kredit model sebagai berikut,

 mj  mj 2  
2

I j ( )  D a j  Tc Pjc ( )   Tc Pjc ( )  …………………… (14)


2 2 2

 c 0  c 0  

(Sumber: Du Toit, 2003: 613)

Nilai fungsi informasi item sebagai fungsi kuadrat kemiringan bersyarat

dari varians atau berbanding terbalik dengan variansi kekeliruan asimptotik

pengestimasian parameter dan fungsi informasi sebuah item merupakan hasil

penjumlahan fungsi informasi masing-masing kategori respons (de Ayala, 2009;

Hambleton, Jones, & Rogers, 1993; Nering & Ostini, 2011). Hal ini dipertegas

oleh Lord (2008: 65) menyatakan bahwa semakin besar varians, berarti semakin

lebar sebaran hasil estimasi, maka semakin kecil nilai fungsi informasinya dan

semakin tidak akurat item tersebut dalam mengestimasi kemampuan. Variansi

kekeliruan asimptotik tersebut dapat didekati dengan parameter kemampuan

peserta (). Bila diambil nilai  di bawah dan di atas titik kritis, kemudian kedua

nilai  tersebut didekatkan, maka secara limit diperoleh fungsi informasi item.

Baker & Kim (2017: 89) juga menyatakan bahwa nilai informasi pada

tingkat kemampuan yang diestimasi memiliki hubungan timbal-balik dengan

varians. Jika nilai fungsi informasinya besar, maka semakin akurat mengestimasi

kemampuan peserta tes pada tingkat yang diperkirakan dengan presisi.

Maksudnya, hasil estimasi akan cukup dengan dengan nilai sebenarnya.

128
Sebaliknya, jika nilai informasi kecil, maka berarti bahwa kemampuan peserta tes

tidak dapat diperkirakan dengan tepat dan sebaran hasil estimasi semakin lebar,

yang berakibat pada semakin kecil nilai informasi yang diberikan, sehingga

semakin tidak akurat dalam mengestimasi kemampuan peserta tes.

Nilai dari fungsi informasi ini dimungkinkan untuk mengevaluasi

bagaimana masing-masing item memberikan kontribusi dalam mengestimasi

kemampuan peserta tes. Hal ini dimungkinkan untuk memperkirakan tingkat

informasi yang diberikan oleh item dalam lingkup seluruh kemampuan peserta tes

(Zięba, 2013). Kegunaan nilai fungsi informasi dalam pengembangan tes dan

evaluasi tergantung pada kecocokan kurva karakteristik butir atau item

characterististic curves (ICCs) untuk pengujian data. Kurva informasi butir dapat

digabungkan atau ditambahkan untuk menentukan bentuk dari kurva fungsi

informasi tes. Menurut Hambleton et al., (1991: 91) fungsi informasi perangkat

tes secara matematis dapat dituliskan sebagai berikut.

n
 i ( )    i ( ) ………………………… (15)
i 1

Aspek penting dari nilai fungsi informasi yang diberikan dalam persamaan

14 adalah bahwa semakin banyak item dalam tes, semakin besar jumlah informasi.

Dicontohkan kurva dari fungsi informasi untuk tes yang dibangun atas dasar lima

pertanyaan yang dipilih menunjukkan fungsi informasi mencapai nilai maksimum

pada titik dekat dengan i=0,25 dan kemudian menurun pada kedua sisi sehingga

tes yang dibangun atas dasar lima pertanyaan yang dipilih akan mengukur sifat

laten paling terpercaya di tingkat i=0,25 seperti disajikan pada Gambar 12.

129
Gambar 12. Grafik fungsi informasi tes (Zięba, 2013)

Berdasarkan Gambar 12 menunjukkan bahwa fungsi informasi pada

dasarnya menginformasikan seberapa baik tes dilakukan dan memperkirakan

kemampuan peserta tes. Selanjutnya nilai informasi item terbagi menjadi 2 model

yaitu model dikotomus dan model politomus. Pada model dikotomus respons

peserta terbagi dalam dua kategori, yaitu bena r dengan skor 1 dan salah dengan

skor 0. Bila harga Pi ( ) menyatakan probabilitas orang dengan kemampuan  dan

Qi ( ) merupakan probabilitas jawaban salah, maka informasi yang disajikan item

i pada kemampuan  dinyatakan sebagai I i ( ) yang dinyatakan oleh :

[ Pi ( )]2
'
I i ( )  i = 1, 2, …, n ………………………… (16)
Pi ( )Qi ( )

dengan Pi ( ) menyatakan turunan pertama dari Pi ( ) terhadap  , dan Qi ( ) =1-


'

Pi ( ) . Pada persamaan di atas, Pi ( ) menunjukkan koefisien arah lengkungan


'

pada grafik respons item, secara matematis, turunan atau deviasi suatu fungsi

menyatakan titik kritis atau titik belok dari fungsi tersebut. Jika diturunkan pada

aspek tiga parameter yang ditinjau dalam karakteristik butir, maka persamaan

130
fungsi informasi butir sebagai berikut (Hambleton & Swaminathan, 1985:107;

Retnawati, 2014: 81).

2,89ai (1  c)
2

I i ( )  ……………………… (17)
(ci  exp( Dai (  bi))1  exp(  Dai (  bi )2
dengan,
I i ( ) : fungsi informasi butir-i
 : tingkat kemampuan
ai : paramater daya beda butir-i
bi : parameter indeks kesukaran butir-i
ci : indeks tebakan semu butir-i

Selanjutnya fungsi informasi item pada model politomus memperlakukan

respons peserta ke dalam kategori yang jumlahnya lebih dari dua. de Ayala (2009)

menyatakan item pada politomus berbeda dengan model dikotomus, karena

masing-masing alternatif jawaban atau kategori menghasilkan informasi tentang

kemampuan peserta tes, karena untuk item politomus model responsnya

berjenjang, sehingga untuk mengetahui informasi suatu item harus dijumlahkan

semua informasi dari setiap kategori. Model politomous juga akan terbatas dalam

cara-cara yang sudah ditetapkan, contoh yang paling umum ini adalah dimana

item politomous respons peserta menggunakan skala rating (de Ayala, 2009: 162,

Reise & Revicki, 2014: 290). Faktor yang mungkin dianggap penting dalam

menggunakan model politomous dalam IRT adalah pertanyaan tentang bagaimana

memberikan hasil pengukuran yang berbeda.

Politomus dalam model IRT untuk satu set data secara efektif

memperkirakan satu set parameter model untuk level trait dan karakteristik item.

Model ini memungkinkan jumlah kategori untuk item yang berbeda dalam tes

131
yang berbeda. Secara bersamaan memperkirakan invarian item dan parameter

peserta pada skala pengukuran yang sama. Hal ini juga memberikan informasi

tentang setiap parameter item dengan teliti dan informasi pada model politomus

IRT dapat dinilai pada tingkat item atau tingkat ategori (Nering & Ostini, 2011:

12, Reise & Revicki, 2014: 295). Penelitian Keller, Swaminathan, and Sireci

(2003) menunjukkan bahwa pilihan hasil model dikotomus vs politomus (testlet) k

tergantung pada konteks item mempengaruhi perkiraan nilai peserta tes.

Hambleton et al. (1993) menyatakan ketika item terbaik dipilih atas dasar

karakteristiknya, maka terdapat kecenderungan memperbesar kemungkinan

disebabkan error dalam ukuran taksiran item. Untuk mengatasinya ada tiga tahap

yang dilakukan untuk mengurangi masalah-masalah pada pemilihan item, yaitu:

(a) menggunakan sampel besar pada waktu mengkalibrasi item untuk memproleh

presisi dalam menaksir parameter item, dengan menaikkan ketelitian dalam

menaksir item akan mengurangi signifikansi pengaruh yang disebabkan error, (b)

melebihkan fungsi informasi target yang telah diputuskan, (c) menaksir seberapa

besar masalahnya dengan membagi sampel menjadi dua bagian.

Dengan demikian pengembangan model penilaian Program PPG dengan

penskoran parsial dan holistik memerlukan pemilihan item-item dalam instrumen

berdasarkan pertimbangan fungsi informasinya. Item-item dalam instrumen perlu

memiliki domain isi dan konsepsi yang teruji serta menyediakan taksiran yang

reliabel, meskipun tetap akan muncul masalah yang disebabkan oleh fungsi

informasi yang terdeterminasi oleh taksiran parameter itemnya yang memiliki

error (Zenisky, Hambleton, & Sired, 2002). Hal ini menunjukkan bahwa nilai-

132
nilai indeks parameter kemampuan dan item merupakan hasil penaksiran,

sehingga kebenarannya memiliki probabilitas dan tidak terlepas dari kesalahan

pengukuran.

2) Fungsi Informasi Tes

Tes digunakan untuk memperkirakan kemampuan peserta tes. Setiap

kemampuan peserta tes dapat diperoleh dari nilai informasi yang dihasilkan oleh

tes pada setiap tingkat kemampuan. Baker (2001: 107) menyatakan fungsi

informasi tes akan jauh lebih tinggi daripada untuk satu fungsi informasi item,

karena tes mengukur kemampuan lebih tepat daripada satu item. Dengan

demikian, merencanakan nilai informasi pengujian terhadap kemampuan peserta

tes menghasilkan grafik fungsi informasi tes seperti pada Gambar 13.

Gambar 13. Fungsi informasi tes (Baker, 2001: 107)

Fungsi informasi tes merupakan penjumlahan semua fungsi informasi

item-item yang membangun tes tersebut. Nurcahyo (2016) menyatakan bahwa

gabungan fungsi informasi dari keseluruhan item akan membentuk fungsi

informasi tes. Menurut de Ayala (2009: 200) pada model politomus,

dimungkinkan untuk menentukan jumlah informasi yang disediakan oleh masing-

133
masing kategori respons. Jumlah dari fungsi kategori informasi I xj (θ) yang dinilai

(atau skor kategori) adalah fungsi informasi item. Berikut ini fungsi informasi

untuk data politomus.

mj mj
I j ( )   ixj ( ) p xj  
p 
x' j
2

……………………… (18)
xj 0 xj 0 p xj

di mana pxj adalah probabilitas untuk mendapatkan kategori xj bersyarat

pada θ, dan px’j adalah turunan pertama dari pxj. Istilah pxj dapat berupa Model

Parsial Credit. Lebih lanjut jumlah dari fungsi informasi item menghasilkan

informasi total instrumen yang disajikan sebagai berikut (de Ayala, 2009: 200).

L
I i ( )   i j ( ) ……………………… (19)
j 0

Model dikotomus ada 2 kategori yaitu 1 dan 0 untuk daya pembeda (a)

sebesar 1,0 dan tingkat kesulitan pada kategori menjawab 1 sebesar -1,0 seperti

nampak pada gambar 14. Pada dikotomus model 3 kategori yaitu 0, 1 dan 2.

Untuk daya pembeda (a) sebesar 1,0 dan tingkat kesulitan pada kategori

menjawab 1 sebesar-2,0 dan 0,0 seperti nampak pada gambar 15. Pada gambar 16

disajikan model politomus dengan 4 kategori yaitu 0,1,2 dan 3 untuk daya

pembeda (a) sebesar 1,0 dan tingkat kesulitan pada kategori menjawab -2,0, 0,0

dan 2,0. Pada Gambar 17 disajikan model politomus dengan 4 kategori yaitu 0,1,2

dan 3, untuk daya pembeda (a) sebesar 1,0 dan tingkat kesulitan pada kategori

menjawab -1,5, -0,5, 0,5 dan 1,5.

134
Gambar 14. Grafik CRF untuk 2 kategori Gambar 15. CRF untuk 3 kategori

Gambar 16. Grafik CRF untuk 4 kategori Gambar 17. CRF untuk 5 kategori
(Retnawati, 2014: 35-36)

Dengan demikian ketika menginterpretasikan fungsi informasi tes, sangat

penting untuk diingat hubungan timbal balik antara nilai informasi dan variabilitas

dari perkiraan kemampuan. Sebagaimana pendapat Baker (2001: 115) untuk

mengartikan nilai informasi ke dalam kesalahan standar estimasi, satu hal yang

perlu diperhatikan hubungan timbal-balik akar kuadrat dari nilai informasi

pengujian. Demikian halnya oleh menyatakan Hambleton & Swaminathan (1985:

104) salah satu faktor yang paling penting dari fungsi informasi tes adalah

kontribusi dari setiap item untuk informasi total tes. Dengan demikian, pengaruh

135
dari setiap item dan dampaknya pada total tes dapat mudah ditentukan. Susongko

(2010) juga menyatakan jika makin tinggi ketidakpastian, maka makin rendah

nilai fungsi informasinya. Sebaliknya, makin rendah ketidakpastian, maka makin

tinggi nilai fungsi informasi tes. Hal ini menunjukkan fungsi informasi dalam

model IRT berhubungan secara terbalik dengan ketidakpastian.

3) Kesalahan Baku Estimasi

Fungsi informasi tidak terlepas dari kesalahan pengukuran, karena nilai-

nilai indeks parameter item dan kemampuan peserta merupakan hasil estimasi

yang kebenarannya bersifat probalilitas, sehingga setelah informasi tes diketahui,

tentu dapat ditemukan kesalahan baku tes tersebut dalam mengestimasi

kemampuan peserta tes. Retnawati (2014: 19) bahwa kesalahan pengukuran dalam

IRT disebut dengan kesalahan penaksiran standar atau standard error of

measurement (SEM) berkaitan erat erat dengan fungsi informasi. Kaitan antara

fungsi informasi dengan SEM memiliki hubungan yang berbanding terbalik

secara kuadratik. Sebagaimana dinyatakan Hambleton et al., (1991: 94),

Retnawati (2014: 82) dan Ridlo (2012) bahwa jika semakin besar atau tinggi

nilai fungsi informasi, maka semakin SEM atau kesalahan bakunya semakin kecil

atau sebaliknya, yang berarti semakin akurat model penskoran tersebut dalam

mengestimasi kemampuan peserta. Hubungan keduanya oleh Hambleton et al.,

(1991: 94) dan Retnawati (2014: 82) dinyatakan jika nilai fungsi informasi

^
dinyatakan dengan Ii (  ) dan estimasi SEM dinyatakan dengan SEM ( ) maka

persamaannya adalah:

136
^ 1
SEM ( )  ……………………………………………… (20)
I ( )
^ ^
Kesalahan standar baku  , SEM ( ) adalah standar deviasi distribusi

normal estimasi asimptotik maksimum pendugaan dalam mengestimasi

kemampuan peserta. Kesalahan ini dalam IRT berdasarkan pada fungsi informasi

suatu tes. Jika semakin besar fungsi informasi suatu tes, maka semakin kecil

kesalahan baku pengukuran. Semakin besar fungsi informasi tersebut, semakin

dipercaya dalam mengukur kemampuan peserta tes yang sebenarnya. Oleh karena

itu, besar kecilnya nilai fungsi informasi tes sangat memengaruhi kesalahan baku

pengukuran. Berikut ini disajikan contoh hubungan timbal balik antara nilai

fungsi informasi dengan standard error of measurement pada Gambar 18.

Gambar 18. Hubungan timbal balik antara NIF dengan SEM


Sumber: Du Toit (2003: 510).

Berdasarkan nilai fungsi informasi dan bentuk persamaannya, dapat

dikatakan bahwa semakin tinggi puncak nilai fungsi informasi yang diperoleh,

semakin memberikan informasi model yang dipilih dalam menjelaskan level

kemampuan peserta tes. Oleh karena itu, nilai fungsi informasi dalam IRT sangat

penting dalam menunjukkan sebuah fungsi yang mengukur model yang dipilih

137
mampu memberikan informasi terhadap pendugaan level kemampuan peserta tes

dan semakin kecil kesalahan bakunya berarti semakin akurat model penskoran

tersebut dalam menaksir kemampuan, sehingga dalam penelitian ini nilai fungsi

informasi butir berfungsi untuk memberikan informasi-informasi terhadap

pendugaan level kemampuan mahasiswa/peserta PPG sesuai dengan model yang

dipilih berdasarkan penskoran parsial atau holistik. Mengingat karakteristik dari

nilai fungsi informasi ini adalah independensi diantara butir mengakibatkan butir

didalam perangkat tes dapat ditambahkan, dikurangi, atau diganti secara bebas,

dan dengan menggunakan sifat aditif dari kurva fungsi informasi butir, sehingga

dengan nilai fungsi informasi ini dapat dirakit instrumen penilaian yang mengukur

capaian kompetensi mahasiswa/peserta PPG yang sesuai dengan model tertentu

mendekati model yang diinginkan.

B. Kajian Penelitian yang Relevan

Telah dilakukan berbagai penelusuran terkait penelitian yang mengkaji

tentang pengembangan model penilaian Program PPG dengan penskoran parsial

dan holistik tidak ditemukan. Namun terdapat beberapa penelitian yang relevan

dengan penelitian ini baik di luar negeri maupun di Indonesia sebagai berikut.

Penelitian Wiseman (2012) yaitu membandingkan penskoran holistik dan

analitik untuk menilai kinerja menulis mahasiswa di salah satu perguruan tinggi.

Hasil penelitian menunjukkan rubrik analitik lebih baik digunakan sebagai

instrumen penilaian kinerja menulis dibanding dengan menggunakan penskoran

holistik. Berbeda dengan penelitian Ounis (2017) yang meneliti tentang

138
perbandingan penskoran holistik dan analitik pada keterampilan berbicara,

diperoleh hasil bahwa penskoran holistik lebih baik, dapat diandalkan dan

konsisten dalam menilai keterampilan berbicara mahasiswa. Kedua penelitian

tersebut berbeda dengan penelitian ini, meskipun terdapat kesamaan pada

penskoran holistik. Kedua penelitian tersebut membandingkan penskoran holistik

dengan analitik, sementara dalam penelitian ini membandingkan penskoran parsial

dengan holistik. Selain itu objek penilaian yang dilakukan juga berbeda meskipun

subjeknya sama yaitu mahasiswa dimana dalam penelitian ini difokuskan pada

penilaian mahasiswa/peserta PPG sementara kedua penelitian tersebut fokus pada

penilaian kinerja mahasiswa dalam menulis dan menilai keterampilan berbicara.

Penelitian Kim & Kim (2016) dalam mengembangkan dan memvalidasi

indikator penilaian kompetensi mengajar di STEAM Korea menunjukkan terdapat

35 item yang dapat menjadi pedoman dalam mengukur kompetensi mengajar yang

terdiri dari 35 item dalam tujuh indikator: pemahaman mata pelajaran (lima item);

Metode pembelajaran (delapan item); memotivasi peserta didik untuk

berpartisipasi dalam belajar (lima item); pemahaman peserta didik (empat item);

lingkungan belajar dan keadaan (lima item); evaluasi peserta didik (empat item);

dan mengindentifikasi karakteristik individual peserta didik(empat item).

Penelitian Kim & Kim (2016) hanya fokus pada pengembangan salah satu

kompetensi yang dinilai dalam mengajar atau kompetensi pedagogik, sehingga

belum bisa menggambarkan kompetensi guru secara utuh. Sementara dalam

penelitian ini memfokuskan pada penilaian kompetensi mahasiswa PPG

mencakup kompetensi pedagogik, kompetensi kepribadian dan kompetensi sosial.

139
Penelitian lain yang dilakukan oleh Büyükkidik and Anil (2015) yang

membandingkan penilaian menggunakan rubrik holistik dan rubrik analitik

berdasarkan teori G (generability theory). Mereka menemukan bahwa rubrik

analitik memiliki keandalan yang lebih tinggi dibandingkan dengan penilaian

menggunakan rubrik holistik. Selanjutnya Metruk (2018) hasil penelitiannya

menunjukkan bahwa secara statistik ada perbedaan yang signifikan antara

penilaian yang menggunakan rubrik holistik dan analitis dengan p-value sebesar

0.001 (p < 0.05). Oleh karena itu, disarankan bahwa untuk menggunakan kedua

rubrik tersebut dalam proses penilaian yang mungkin dianggap tepat ketika

keduanya digunakan untuk saling melengkapi, dan bersama-sama memberikan

kontribusi terhadap penilaian lebih objektif. Kedua penelitian tersebut

memfokuskan pada perbandingan penilaian yang menggunakan rubrik penilaian

holistik dan rubrik penilaian analitik yang menunjukkan ada perbedaan keduanya

jika diterapkan dalam proses penilaian. Sementara dalam penelitian ini

mengembangkan model penilaian PPG dengan penskoran parsial dan holistik.

Model penilaian PPG yang dikembangkan berisi instrumen-instrumen penilaian

yang menilai capaian penguasaan kompetensi pedagogik, penilaian kompetensi

sosial dan penilaian kompetensi kepribadian.

Penelitian sebelumnya di Indonesia telah mengembangkan instrumen

kompetensi bidang keguruan mahasiswa calon guru oleh Suparji (2008) yang

difokuskan pada pengembangan instrumen kompetensi pedagogik, kepribadian

dan sosial. Penelitian Retnawati and Munadi (2013) mengestimasi parameter butir

dan kemampuan guru menggunakan model parsial kredit dan parsial kredit

140
tergeneralisasi dan membandingkan keduanya. Hasil penelitian menunjukkan

bahwa model parsial kredit merupakan model yang sesuai (cocok) digunakan

untuk mengestimasi parameter butir dan kemampuan guru.

Penelitian Hidayah (2013) yang mereview pelaksanaan Pendidikan Profesi

Guru (PPG) sebagai fungsi pelaksanaan manajemen mutu yang difokuskan pada

Program Studi PGSD ditemukan penilaian kualitas pelaksanaan PPG baik oleh

peserta memberikan hasil dengan kriteria “baik”, namun peningkatan mutunya

harus dilakukan secara terus menerus dan berkesinambungan. Penelitian Hasli

(2016) mengembangkan instrumen kompetensi pedagogik guru kelas sekolah

dasar, namun untuk pembuktian validitasnya hanya fokus pada validitas isi oleh

expert judgement dari segi materi yaitu menunjukkan instrumen valid.

Penelitian Sadtyadi and Kartowagiran (2014) mengembangkan instrumen

penilaian kinerja guru sekolah dasar dengan maksud untuk memperoleh

komponen, indikator dan instrumen penilaian kinerja guru sekolah dasar dengan

hasil analisis diperoleh instrumen tersebut valid dan reliabel serta menunjukkan fit

model yang cukup baik yaitu instrumen penilaian tersebut terdiri dari lima

komponen yakni mengajar, mendidik, melatih dan mengarahkan, membimbing,

serta menilai dan mengevaluasi. Selain itu, masing-masing komponen instrumen

tersebut dapat dijabarkan menjadi beberapa indikator yang relevan. Sementara

dalam penelitian ini memfokuskan pada model penilaian PPG yang

dikembangkan dengan penskoran parsial dan holistik dalam menilai kemampuan

peserta PPG menyusun rencana pelaksanaan pembelajaran, melaksanakan

pembelajaran dan menilai penguasaan kompetensi sosial dan kepribadian.

141
Penelitian Widiati and Hayati (2015) tentang Program PPG di Indonesia

yang memfokuskan pada Program Studi Bahasa Inggris ditemukan bahwa

program ini telah memberikan manfaat bagi peserta dalam hal mengembangkan

keterampilan praktik mengajar dalam merancang rencana pembelajaran, materi

pembelajaran dan media, dan prosedur penilaian sesuai dengan kurikulum sekolah

menengah. Selain itu ada juga yang mengembangkan instrumen bakat keguruan

oleh Wasidi and Mardapi (2016) hasil confirmatory factor analysis menunjukkan

bahwa instrumen bakat keguruan fit. Koefisien reliabilitas gabungan tinggi,

analisis multi trait multi method menunjukkan bahwa korelasi antara skor

kreativitas pedagogi dengan skor IQ rendah. Penelitian Hotimah and Suyanto

(2017) mendeskripsikan gambaran tentang bagaimana strategi pendidikan profesi

guru (PPG) di LPTK Universitas Negeri Surabaya dalam mengembangkan

kompetensi pedagogik dan profesional peserta PPG pasca SM3T.

Penelitian Disas (2017) tentang analisis kebijakan pendidikan mengenai

pengembangan dan peningkatan profesi guru yang menunjukan bahwa dengan

adanya kebijakan pendidikan mengenai pengembangan dan peningkatan profesi

guru, posisi guru semakin dinaungi oleh sumber hukum serta dengan adanya

Pendidikan Profesi Guru, guru menjadi lebih memiliki pengetahuan dan

profesionalitas menjadi seorang guru. Prasojo et al. (2017) menganalisis

manajemen kurikulum program profesi guru untuk program Sarjana Mendidik di

daerah Terdepan, Terluar, dan Tertinggal (SM3T) yang diselenggarakan di

Universitas Negeri Yogyakarta, yang mencakup perencanaan, pengorganisasian,

pelaksanaan, dan pengawasan kurikulum.

142
Penelitian Suparji (2008) hanya fokus pada pengembangan instrumen

kompetensi pedagogik, kepribadian dan sosial, sementara kompetensi profesional

tidak masuk dalam wilayah penelitian ini. Kompetensi profesional diasumsikan

telah dikuasai dengan baik oleh mahasiswa karena dari jumlah SKS untuk mata

kuliah bidang studi sudah cukup memadai. Selain itu, karena begitu banyak dan

spesifiknya masing-masing mata bidang studi yang diajarkan sehingga perlu ada

penelitian tersendiri untuk membuat instrumen dari masing-masing bidang studi

untuk mengukur kompetensi profesional. Demikian halnya cakupan mahasiswa

calon guru yang dimaksud belum spesipik mengarah pada bidang keahlian mata

pelajaran yang diajarkan, sementara dalam penelitian ini difokuskan kepada

model penilaian PPG yang mampu untuk menilai capaian penguasaan kompetensi

mahasiswa/peserta yaitu kompetensi pedagogik, kompetensi sosial, dan

kompetensi kepribadian. Penelitian ini juga tidak menilai capaian penguasaan

kompetensi profesional, karena pelaksanaan penilaiannya secara tertulis

menggunakan soal dari Panitia Nasional Uji Kompetensi Mahasiswa Program

PPG (Panas UKMPPG) yang terjadwal secara nasional dan tentunya item-item

pada soal tersebut telah melalui tahapan-tahapan pengembangan soal yang baku.

Penelitian Retnawati dan Munadi (2013) memfokuskan pada hasil estimasi

parameter butir dan kemampuan guru menggunakan model parsial kredit, hasil

estimasi parameter butir dan kemampuan guru menggunakan model parsial kredit

tergeneralisasi, dan melakukan perbandingan antara kecocokan model estimasi

parameter butir dan kemampuan guru menggunakan model parsial kredit.

Sementara dalam penelitian ini difokuskan pada model penilaian PPG dengan

143
penskoran parsial dan holistik. Demikian halnya pada penelitian Hasli hanya

fokus pada pengembangan instrumen pedagogik dengan subjeknya pada guru

sekolah dasar dan penelitian Wasidi & Mardapi hanya fokus kepada

pengembangan instrumen bakat keguruan dengan model fit.

Terkait dengan kajian penelitian yang relevan dengan PPG dilakukan oleh

Hidayah mereview PPG sebagai fungsi pelaksanaan manajemen mutu yang

difokuskan pada Program Studi PGSD. Widiawati & Hayati hanya memfokuskan

pada kebermanfaatan PPG pada Program Studi Bahasa Inggris. Hotimah &

Suyanto yang memfokuskan strategi penyelenggaraan Program PPG di

Universitas Negeri Surabaya dalam mengembangkan kompetensi pedagogik dan

profesional peserta PPG pasca SM3T. Penelitian Disas hanya menganalisis

kebijakan pendidikan mengenai pengembangan dan peningkatan Program PPG

dan Prasojo et.al., hanya menganalisis manajemen kurikulum Program PPG untuk

Program SM3T yang diselenggarakan di Universitas Negeri Yogyakarta.

Penelitian-penelitian tersebut terbatas pada pengembangan kompetensi dan

bakat keguruan mahasiswa calon guru secara umum dan mengkaji tentang

pelaksanaan PPG dari segi manfaat dan aspek manajemen atau pengelolaannya

pada kebijakan dan kurikulum. Pengembangan instrumen penilaian kompetensi

bidang keguruan telah banyak dilakukan, namun pengembangan model penilaian

PPG dengan penskoran parsial dan holistik belum pernah ada, sehingga penelitian

ini memenuhi unsur kebaharuan. Dengan demikian secara garis besar disimpulkan

bahwa penelitian ini berbeda dengan penelitian-penelitian sebelumnya yang ada

di Indonesia terutama yang memfokuskan pada kajian PPG sebagai isu penelitian

144
terbaru, karena dari berbagai penelitian yang telah dipaparkan lebih fokus

mengkaji efektivitas pelaksanaan Program PPG dan deskripsi profil kompetensi

lulusan serta manajemennya. Sementara penelitian ini bertujuan untuk

mengembangkan model penilaian Program PPG dengan penskoran parsial dengan

penskoran holistik.

Pengembangan model penilaian Program PPG dengan penskoran parsial

dan holistik ini sangat penting dan perlu dilakukan untuk menilai capaian

penguasaan kompetensi mahasiswa/peserta PPG yang dipersyaratkan menjadi

guru yaitu kompetensi pedagogik, kompetensi sosial, dan kompetensi kompetensi

kepribadian. Pengembangan model penilaian ini, difokuskan pada penilaian

kompetensi pedagogik yang menilai kemampuan peserta PPG dalam menyusun

Rencana Pelaksanaan Pembelajaran (RPP) dan melaksanakan pembelajaran,

penilaian kompetensi sosial dan kepribadian. Item-item yang ada dalam instrumen

yang dikembangkan menyesuaikan dengan item-item yang sudah dikembangkan

oleh Kemenristekdikti dan melengkapi item-item yang tidak ternilai. Tujuan akhir

dari penelitian ini untuk menggali informasi keakuratan model penilaian dengan

penskoran parsial dan holistik melalui fungsi informasi dan kesalahan baku

estimasi sehingga mampu mengestimasi kemampuan mahasiswa/peserta PPG

secara akurat dan terpercaya.

C. Kerangka Pikir

Model penilaian yang baik setidaknya memenuhi persyaratan sesuai

dengan prosedur pengembangan. Oleh karena itu, harapan yang tinggi untuk

mengembangkan model penilaian PPG yang ada, sesuai dengan prosedur

145
pengembangannya menjadi sebuah kebutuhan utama dan dianggap penting, agar

objektivitas dalam menilai dapat dicapai dan subjektivitas dapat diminimalisir.

Penelitian ini bertujuan untuk merumuskan konstruk instrumen model penilaian

PPG, menyusun instrumen penilaian kompetensi peserta PPG dengan penskoran

parsial dan holistik yang valid dan reliabel, mendeskripsikan karakteristik

instrumen model penilaian PPG, serta mendeskripsikan hasil penskoran parsial

dan holistik dalam pengembangan model penilaian PPG pada praktik mengajar.

Selain itu, mendeskripsikan hasil penilaian kepraktisan model penilaian PPG yang

telah dikembangkan berdasarkan survey terhadap pengguna atau penilai PPG

yang telah menggunakan model penilaian ini sebagaimana disajikan pada

kerangka pikir dalam penelitian ini pada Gambar 19.

146
Kepraktisan
Model
Penilaian
PPG

Model Penilaian:
- Sistem penilaian
- Mekanisme penilaian
- Penskoran dan interpretasi
hasil penilaian

Gambar 19. Kerangka Pikir

147
D. Pertanyaan Penelitian

Berdasarkan kajian teori dan kerangka berpikir yang telah dikonstruksi

dalam mendukung pengembangan model penilaian PPG dengan penskoran parsial

dan holistik dalam penelitian, maka selanjutnya dapat dirumuskan pertanyaan

penelitian sebagai berikut.

1. Bagaimana konstruk model penilaian PPG dengan penskoran parsial dan

holistik yang dapat digunakan dalam mengestimasi penguasaan kompetensi

peserta PPG?

2. Bagaimana bukti validitas isi model penilaian PPG dengan penskoran parsial

dan holistik?

3. Bagaimana bukti validitas konstruk model penilaian PPG dengan penskoran

parsial dan holistik?

4. Bagaimana estimasi reliabilitas model penilaian PPG dengan penskoran

parsial dan holistik?

5. Bagaimana karakteristik model penilaian PPG dengan penskoran parsial dan

holistik yang dapat digunakan dalam mengestimasi penguasaan kompetensi

peserta PPG?

6. Bagaimana perbandingan akurasi antara model penilaian melalui penskoran

parsial dengan model penilaian melalui penskoran holistik yang dapat

digunakan dalam mengestimasi penguasaan kompetensi peserta PPG?

7. Bagaimana kepraktisan model penilaian PPG dengan penskoran parsial dan

holistik berdasarkan penilaian oleh pengguna?

148
BAB III

METODE PENELITIAN

A. Model Pengembangan

Penelitian ini bertujuan untuk mengembangkan model penilaian Program

PPG dengan penskoran parsial dan holistik. Model penilaian Program PPG yang

dikembangkan menghasilkan produk berupa instrumen dan panduan model

penilaian Program PPG dengan penskoran parsial dan holistik. Oleh karena pada

penelitian ini terdapat kegiatan pengembangan yang menghasilkan produk dan

menguji efektivitas dari produk yang dihasilkan tersebut, maka jenis penelitian ini

termasuk penelitian dan pengembangan Research and Development yang

disingkat R & D.

Model R & D yang digunakan dalam penelitian ini berdasarkan tahapan R

& D yang dikemukakan Borg and Gall (1989: 781-802) yaitu: 1) research and

information collecting (studi pendahuluan: kaji pustaka dan survei awal), 2)

planning (perencanaan penelitian), 3) develop preliminary form of product

(pengembangan produk awal), 4) preliminary field testing (uji lapangan terbatas),

5) main product revision (revisi hasil uji lapangan terbatas), 6) main field testing

(uji lapangan lebih luas), 7) operational product revision (revisi hasil uji lapangan

lebih luas), 8) operational field testing (uji kelayakan), 9) final product revision

(revisi hasil uji kelayakan), 10) dissemination and implementation (diseminasi dan

sosialisasi produk akhir).

149
Berdasarkan tahapan model R & D yang dikemukakan Borg and Gall

tersebut, berikut ini digambarkan alur pengembangannya dalam penelitian ini

sebagaimana disajikan pada Gambar 20.

Research and Planning and Preliminary field


R&D information develop preliminary testing and main
Starting collecting form of product product revision

Studi pendahuluan: Tahap merencanakan Tahap ujicoba lapangan


1. Identifikasi masalah dan mengembangkan terbatas dan revisi:
di lapangan draft produk: 1. Valididasi isi oleh
2. Pengumpulan 1. Draft Instrumen validator
informasi (need 2. Draft Panduan 2. Revisi masukan
assessment) validator
3. Kajian pustaka dan 3. Ujicoba terbatas
regulasi/kebijakan 4. Analisis data
4. Kajian penelitian (validitas konstruk,
yang relevan reliabilitas)
5. Revisi produk
ujicoba terbatas

Dissemination Operational field Main field testing


and testing and final and operational
implementation product revision product revision

Tahap ujicoba Tahap ujicoba diperluas


operasional dan revisi dan revisi:
final terhadap model 1. Ujicoba diperluas
produk berdasarkan 2. Analisis data
hasil uji lapangan (validitas konstruk,
sebelumnya reliabilitas)
3. Revisi produk
ujicoba
Gambar 20. Alur Pengembangan Model R & D (Borg & Gall, 1989)

Berdasarkan model R & D pada Gambar 20, maka prosedur

pengembangan model penilaian PPG ini juga mengacu pada prosedur

150
pengembangan yang disarankan oleh Mardapi (2017: 132) dan Retnawati (2014:

3) yaitu: 1) menentukan spesifikasi/tujuan penyusunan instrumen, 2) mencari

teori yang relevan atau cakupan materi, 3) menyusun indikator item instrumen, 4)

menyusun item instrumen dan panduan penilaian dengan menggunakan penskoran

parsial dan holistik, 5) validasi isi/telaah instrumen dan panduan penilaian dengan

penskoran parsial dan holistik, 6) revisi berdasarkan masukan validator, 7)

melakukan ujicoba kepada responden yang bersesuaian untuk memperoleh data

respons peserta (uji terbatas), 8) melakukan analisis (validitas konstruk dan

reliabilitas), (9) revisi berdasarkan hasil analisis data uji coba terbatas, 10) uji

coba diperluas dan analisis datanya, 11) merakit instrumen final, 12) menafsirkan

hasil pengukuran.

Komponen penilaian capaian penguasaan kompeteni Program PPG

diadaptasi dari teori Cooper (2013: 4) yang menyatakan bahwa wilayah umum

kompetensi seorang guru meliputi pengetahuan dan keterampilan tentang

pembelajaran (kompetensi pedagogik), sikap (kompetensi sosial dan kepribadian),

dan penguasaan bidang studinya (kompetensi profesional). Hal ini juga relevan

dengan Standar capaian kompetensi Program PPG di Indonesia yang mengacu

pada tuntutan empat kompetensi guru sebagaimana dipersyaratkan dalam Undang-

Undang Nomor 14 Tahun 2005 tentang Guru dan Dosen serta tertuang pada

Permendiknas Nomor 16 Tahun 2017 tentang standar kualifikasi akademik dan

kompetensi guru, serta Permenristekdikti Nomor 55 Tahun 2017 Tentang Standar

Pendidikan Guru.

151
Model penilaian PPG yang dikembangkan difokuskan pada instrumen

penilaian kompetensi pedagogik yang menilai kemampuan peserta PPG dalam

menyusun rencana pelaksanaan pembelajaran, melaksanakan pembelajaran, dan

penguasaan kompetensi sosial dan kepribadian. Selain itu, menyusun panduan

penilaian yang mencakup sistem penilaian PPG yang menjelaskan pengertian,

prinsip, acuan penilaian serta teknik penilaian. Mekanisme penilaian Program

PPG yang meliputi lingkup penilaian berisi cakupan komponen-komponen yang

dinilai dan perumusan indikator, teknik penilaian dan bentuk instrumen.

Selanjutnya penskoran dan interpretasi hasil penilaian yang mencakup pengertian

penskoran, model penskoran, interpretasi hasil penilaian, contoh penilaian dan

tindak lanjut, skoring dan pemanfaatan hasil penilaian.

B. Prosedur Pengembangan

Penelitian ini bertujuan untuk merumuskan konstruk instrumen dari model

penilaian Program PPG, menyusun instrumen penilaian kompetensi

mahasiswa/peserta PPG dengan penskoran parsial dan holistik yang akurat dan

terpercaya, mendeskripsikan karakteristik model penilaian PPG, serta

mendeskripsikan hasil penskoran parsial dan holistik. Adapun prosedur

pengembangan yang dilakukan dikelompokkan dalam tiga tahapan besar.

Pertama, tahap penyusunan perangkat penilaian yang difokuskan pada

capaian penguasaan kompetensi pedadgogik mahasiswa/peserta PPG dalam

menyusun rencana pelaksanaan pembelajaran dan melaksanakan pembelajaran,

serta penilaian kompetensi sosial dan kepribadian, observasi dan focus group

discussion dengan dosen pengajar workshop/pembimbing lapangan/penguji UKIN

152
dan guru pamong/penguji UKIN untuk mendapat data yang lengkap dan

komprehensif. Langkah ini menghasilkan draft 1 rancangan model penilaian.

Kemudian naskah ini dikonsultasikan dengan promotor dan kopromotor, sebelum

disebarkan secara tertulis kepada expert judgment melalui metode Delphi dan

menghasilkan draft awal dari model penilaian PPG. Untuk membuktikan

sejauhmana rancangan model ini dapat dipahami oleh penilai, maka diadakan

ujicoba keterbacaan untuk memperoleh masukan untuk perbaikan. Setelah direvisi

dan dikonsultasikan dengan expert judgment, promotor dan kopromotor, maka

dihasilkan rancangan model yang siap untuk diujicoba secara terbatas.

Tahap kedua adalah tahap ujicoba terbatas (prelemininary field testing),

dimana model penilaian ini akan dipakai oleh dosen pengajar

workshop/pembimbing lapangan/penguji UKIN dan guru pamong/penguji UKIN

pada penilaian praktik mengajar. Tahap ketiga adalah penerapan model secara

luas (main field testing) dengan prosedur pengembangan seperti disajikan pada

Gambar 21.

153
Model Dissemination
and
Praktis implementation

Research and
information
collecting
Operational
field testing
and final
Identifikasi masalah product
di lapangan revision
Pengumpulan
informasi (need
assessment)

Main field
testing and
Planning and operational
develop preliminary product
form of product revision

Preliminary field
testing and main
product revision

Gambar 21. Prosedur Pengembangan Model Penilaian PPG

154
C. Desain Uji Coba Produk

Uji coba produk dilakukan untuk mengumpulkan data yang digunakan

sebagai dasar dalam menetapkan kelyakan produk yang dikembangkan meliputi:

1) Desain uji coba, 2) Subjek coba, 3) Instrumen pengumpulan data, 4) Teknik

analisis data.

1. Desain Uji Coba

Desain uji coba dilakukan melalui tahapan yaitu: tahap pertama setelah

melalui kajian teoritis, telaah Permendikbud, telaah Buku Pedoman

Penyelenggaraan PPG dan instrumen penilaian PPG yang digunakan selama ini.

Hasil dari penelaahan teori dan masalah lapangan disusunlah draf awal. Draf ini

berisi rumusan komponen beserta indikator yang telah tersusun lengkap dengan

kisi-kisi dan item didiskusikan dengan expert judgment beserta sistem

penskorannya.

Tahapan pengembangan ini terdapat dua kegiatan yang dilakukan secara

bersamaan yaitu pengembangan instrumen penilaian beserta sistem penskoran

dengan menggunakan penskoran parsial dan holistik serta dilengkapi dengan

panduan penilaian. Pengembangan instrumen penilaian berisi kisi-kisi instrumen

dan petunjuk pengerjaan atau pemberian respons, instrumen penilaian dan

pedoman penskoran. Instrumen penilaian yang dikembangkan yaitu: 1) instrumen

penilaian rencana pelaksanaan pembelajaran (IP-RPP) terdiri dari instrumen

penilaian rencana pelaksanaan pembelajaran parsial (IP-RPP/P-01) dan instrumen

penilaian rencana pelaksanaan pembelajaran holistik (IP-RPP/H-01), 2) instrumen

155
penilaian pelaksanaan pembelajaran (IP-PP) terdiri dari instrumen penilaian

pelaksanaan parsial (IP-PP/P-02) dan instrumen penilaian pelaksanaan holistik

(IP-PP/H-02), 3) instrumen penilaian kompetensi sosial dan kepribadian (IP-

KSKK) terdiri dari instrumen penilaian kompetensi sosial dan kepribadian parsial

(IP-KSKK/P-03) dan instrumen penilaian kompetensi sosial dan kepribadian

holistik (IP-KSKK/H-03). Selanjutnya untuk penyusunan panduan penilaian berisi

komponen-komponen yang dinilai, mekanisme penilaian yang dilakukan beserta

instrumennya, penskoran yang digunakan, analisis dan interpretasi hasil penilaian.

Draft instrumen dan panduan penilaian yang telah dikembangkan direviu oleh 7

orang pakar (expert judgment) yang relevan dengan bidang yang dikembangkan,

yaitu:

1. Prof. Anik Gufron, M.Pd., guru besar di Universitas Negeri Yogyakarta pada

bidang pengembangan kurikulum, sekaligus sebagai Ketua Lembaga

Pengembangan dan Penjaminan Mutu Pendidikan di Universitas Negeri

Yogyakarta.

2. Prof. Sudji Munadi., guru besar di Universitas Negeri Yogyakarta pada

bidang penelitian dan evaluasi pendidikan, sekaligus sebagai Kepala Pusat

Studi Sistem Pengujian Pendidikan di Universitas Negeri Yogyakarta.

3. Prof. Mansyur, M.Si., guru besar di Universitas Negeri Makassar pada bidang

penelitian dan evaluasi pendidikan, sekaligus sebagai penggagas Testing

Centre Universitas Negeri Makassar (TC-UNM) dalam layanan pengukuran

dan pengujian seperti: merancang dan mengembangkan instrumen tes

maupun nontes, membuat bank soal, merancang dan mengembangkan

156
instrumen kinerja, memberikan pelayanan tes, merancang system pengujian

dan pengukuran berbasis Computer Adaptive Testing (CAT), memberikan

layanan pelatihan dan pengembanan evaluasi, asesmen, pengukuran dan

pengujian dan sebagainya.

4. Prof. Ruslan, M.Pd., guru besar di Universitas Negeri Makassar pada bidang

penelitian dan evaluasi pendidikan.

5. Prof. Patta Bundu, M.Pd., guru besar di Universitas Negeri Makassar pada

bidang penelitian dan evaluasi pendidikan, sekaligus sebagai reviewer

instrumen pemantauan kinerja guru BSNP, reviewer panduan pembelajaran

tematik terpadu SD-MI, reviuwer standar pengelolaan pendidikan nasional.

6. Dr. Hermanto, M.Pd., pakar pendidikan di Universitas Negeri Yogyakarta

pada bidang manajemen pendidikan konsentrasi supervisi pembelajaran,

sekaligus sebagai Ketua Pusat Layanan Praktik Pengalaman Lapangan dan

Praktik Kerja Lapangan di Universitas Negeri Yogyakarta.

7. Dr. Paidi, M.Pd., pakar pendidikan di Universitas Negeri Yogyakarta pada

bidang pendidikan biologi dengan keahlian metodologi penelitian pendidikan

sains, lesson study, teknologi pembelajaran, evaluasi proses dan evaluasi hasil

belajar, sekaligus sebagai tim penyusun buku Pedoman PPG

Kemenristekdikti.

Tim ahli yang dilibatkan kesemuanya berlatar belakang keahlian yang

relevan yaitu ahli pendidikan, ahli penilaian dan pengukuran, ahli psikologi dan

psikometri, selain itu juga melibatkan dosen pembimbing dan guru pamong untuk

melihat keterbacaan instrumen. Untuk membuktikan validitas isi ditentukan

157
menggunakan kesepakatan ahli dengan menggunakan indeks validitas oleh Aiken

(Retnawati, 2014: 18). Indeks Aiken dipilih untuk melihat indeks kesepakatan

rater terhadap kesesuaian item (atau sesuai tidaknya item) dengan indikator yang

diukur menggunakan item tersebut.

Penskoran yang digunakan untuk melihat relevansi butir dengan indikator

mengacu format penilaian ahli untuk mengetahui kesesuaian butir dan indikator

yang dikemukakan Retnawati (2016a: 30) menggunakan 5 kriteria yaitu, skor 1=

tidak relevan, skor 2= kurang relevan, skor 3= cukup relevan, skor 4= relevan dan

skor 5=sangat relevan. Selanjutnya hasil penilaian tersebut dihitung dengan

formula Aiken dari masing-masing item untuk mendapatkan indeks kesepakatan

ahli mengenai validitas item, dari hasil tersebut diinterpretasikan. Tahap awal ini

menghasilkan kisi-kisi dan item instrumen yang lebih baik dan bersesuaian

dengan instrumen penilaian PPG yang mampu menilaian capaian penguasaan

kompetensi mahasiswa/peserta PPG sesuai dengan instrumen penilaian yang

dikembangkan.

Selanjutnya dilakukan perakitan instrumen berdasarkan kisi-kisi dan

keterbacaan oleh expert judgment dilanjutkan dengan mengestimasi reliabilitas

instrumen menggunakan reliabilitas inter-rater. Menurut Mardapi (2017: 78)

reliabilitas inter-rater atau konsistensi antar penilai pada dasarnya menggunakan

teknik analisis varians, salah satunya menggunakan koefisien kesepakatan

penilaian atau korelasi intrakelas (correlation intraclass) dengan mencari varians

skor tampak dan varians skor murni dengan analisis varians. Nilai harapan rerata

kuadrat antar ratees (MSRS) adalah varians antar ratees, sedang nilai harapan

158
rerata kuadrat kesalahan (MS e) adalah varians skor kesalahan, dimana varians kor

murni bisa dicari bila varians antar ratees dan varians kesalahan (reminder)

diketahui. Adapun korelasi intraklas dihitung dengan formula berikut.

MSRrs  MSe
 ……………………………………………… (21)
MSr  (k  1) MSe

Keterangan:

MSrs : rerata kuadrat antar baris, tiap baris ada satu orang
MSe : rerata kuadrat residu atau kesalahan
k : jumlah kolom atau jumlah penilai
(Sumber: Mardapi, 2017: 79)

Selanjutnya hasil instrumen yang sudah didapat dilakukan uji coba terbatas

untuk menghasilkan indikator yang kuat untuk mengukur masing-masing

komponen sebagai pembentuk penilaian PPG yang digunakan. Data hasil uji coba

terbatas dianalisis dengan menggunakan analisis faktor Confirmatory Factor

analysis (CFA) dengan model Second Order Confirmatory Factor Analysis

sampai memeroleh model yang fit.

Analisis CFA dengan model Second Order Confirmatory Factor Analysis

dipilih karena model teori yang ada dapat diuji dan keterkaitan antar faktor dapat

dilihat, peneliti dapat memeroleh muatan faktor (factor loading) tiap indikator

yang menyusun instrumen (λ) dan indeks kesalahan unik dari tiap indikator (δ).

Artinya untuk meyakini model penilaian PPG yang dikembangkan mengukur

capaian penguasaan kompetensi mahasiswa/peserta PPG, perlu adanya

pembuktian validitas konstruk instrumen untuk menguji apakah indikator-

indikator yang sudah dikelompokkan berdasarkan variabel latennya (konstruknya)

159
konsisten berada dalam konstruknya tersebut atau tidak. Selanjutnya untuk

mengestimasi reliabilitas konstruk menggunakan estimasi CR (construct

reliability) muatan faktor (factor loading) tiap indikator menyusun instrumen (λ)

dan indeks kesalahan unik dari tiap indikator (δ) (Geldhof, Preacher, & Zyphur,

2014). Untuk mengestimasi reliabilitas konstruk dalam penelitian ini

menggunakan estimasi dengan reliabilitas  sebagaimana dinyatakan Retnawati

(2016: 93) estimasi dengan reliabilitas  dilakukan hanya dengan menggunakan

muatan faktor (λ) saja.

2. Subjek Uji Coba

Subjek uji coba dalam penelitian adalah sesuai lingkup PPG yang diteliti

yaitu Lingkup PPG yang diteliti yaitu PPG Prajabatan bersubsidi dan PPG Dalam

Jabatan tahun akademik 2018/2019 yang diselenggarakan Rayon LPTK

Universitas Negeri Yogyakarta (UNY), LPTK Universitas Negeri Gorontalo

(UNG), dan LPTK Universitas Islam Negeri Alauddin Makassar (UINAM) yaitu

sebanyak 236 orang peserta PPG pada uji coba tahap I (uji coba terbatas) dan 516

orang peserta PPG pada uji coba tahap II (uji coba diperluas) menggunakan teknik

purposive sampling dengan pertimbangan jumlah peserta yang diambil

bersesuaian dan pada uji coba tahap II dua kali lebih banyak dari uji coba

sebelumnya. Lingkup Program Studi PPG yang diteliti disesuaikan dengan

program studi yang ada pada saat penyelenggaraan PPG Prajabatan bersubsidi dan

PPG Dalam Jabatan tahun akademik 2018/2019 di Rayon LPTK UNY, LPTK

UNG, dan LPTK UINAM.

160
Mekanisme penelitian di lapangan dilakukan dengan cara memberikan

instrumen yang telah dikembangkan kepada penilai yaitu: 1) dosen (Dosen

Pengajar Workshop (DPW)/Dosen Pembimbing Lapangan (DPL)/Dosen Penguji

UKIN, DPU) dengan kode instrumen IP-RPP/P-01/DPW/DPL/DPU (instrumen

penilaian rencana pelaksanaan pembelajaran parsial), IP-RPP/H-01/

DPW/DPL/DPU (instrumen penilaian rencana pelaksanaan pembelajaran

holistik), IP-PP/P-02/DPW/DPL/DPU (instrumen penilaian pelaksanaan

pembelajaran parsial), IP-PP/H-02/DPW/DPL/DPU (instrumen penilaian

pelaksanaan pembelajaran holistik), dan IP-KSKK/P-03/DPW/DPL/DPU

(instrumen penilaian kompetensi sosial dan kepribadian parsial), IP- KSKK /H-

03/ DPW/DPL/DPU (instrumen penilaian kompetensi sosial dan kepribadian

holistik) yang dilengkapi dengan rubrik dan petunjuk penilaian untuk masing-

masing instrumen, (2) guru (Guru Pamong (GP)/Guru Penguji UKIN, GPU)

dengan kode instrumen IP-RPP/P-01/GP/GPU (instrumen penilaian rencana

pelaksanaan pembelajaran parsial), IP-RPP/H-01/GP/GPU (instrumen penilaian

rencana pelaksanaan pembelajaran holistik), IP-PP/P-02/GP/GPU (instrumen

penilaian pelaksanaan pembelajaran parsial), IP-PP/H-02/GP/GPU (instrumen

penilaian pelaksanaan pembelajaran holistik), dan IP-KSKK/P-03/GP/GPU

(instrumen penilaian kompetensi sosial dan kepribadian parsial), IP-KSKK/H-

03/GP/GPU (instrumen penilaian kompetensi sosial dan kepribadian holistik)

yang juga dilengkapi dengan rubrik dan petunjuk penilaian.

Pelaksanaan penelitian uji coba tahap I (uji coba terbatas) dari bulan

Desember 2018 sampai bulan Pebruari 2019 pada peserta PPG Prajabatan

161
bersubsidi pada P4TKN UNY tahun akademik 2018/2019 dengan Program Studi

PGSD, Pendidikan Matematika, Pendidikan Bahasa Inggris, dan Pendidikan

Teknik Otomotif. Selanjutnya penyelenggaraan PPG di UNG tahun 2018 pada

peserta PPG Prajabatan bersubsidi Program Studi Bahasa Inggris, PPG Dalam

Jabatan Program Studi PGSD, Bahasa Inggris, dan PJKR. Untuk penyelenggaraan

PPG di UINAM tahun 2018/2019 PPG Dalam Jabatan dengan Program

Studi/Mata Pelajaran diantaranya: Fikih, Qur’an Hadis, Akidah Akhlak, Bahasa

Arab, Sejarah Kebudayaan Islam dan Guru Kelas Madrasah Ibtidaiyah (MI).

Pelaksanaan uji coba tahap II (uji coba diperluas) dilaksanakan pada bulan

Maret 2019 sampai bulan Awal Mei 2019 pada penyelenggaraan PPG UNY tahun

2019 yaitu PPG Dalam Jabatan tahap 1 pada Program Studi PGSD, PJKR,

Pendidikan IPA, Pendidikan IPS, Pendidikan Matematika, Pendidikan Bahasa

Inggris, Pendidikan Bahasa Indonesia dan Pendidikan Guru PAUD.

Penyelenggaraan PPG UNG yaitu PPG Dalam Jabatan tahap I pada Prodi PGSD,

Bahasa Inggris, dan PJKR, dan penyelenggaraan PPG UINAM yaitu PPG Dalam

Jabatan dengan Program Studi/Mata Pelajaran diantaranya: Fikih, Qur’an Hadis,

Akidah Akhlak, Bahasa Arab, Sejarah Kebudayaan Islam dan Guru Kelas

Madrasah Ibtidaiyah (MI). Adapun jumlah peserta PPG pada pelaksanaan uji coba

tahap I dan uji coba tahap II disajikan pada Tabel 9.

162
Tabel 9. Subjek Uji Coba

Tahap Kelompok PPG/Pogram Pelaksanaan Jumlah


No LPTK Total
Uji Coba Studi Penilaian Peserta
1 Tahap I UNY PPG Prajabatan Bersubsidi:
- PGSD
- Pendidikan Bahasa Inggris
- Pendidikan Matematika PPL 48
- Pendidikan Teknik
Otomotif

UNG PPG Prajabatan bersubsidi: Praktik Mengajar


- Pendidikan Bahasa Inggris UKIN
PPG Dalam Jabatan
Program Studi: 85 236
- PGSD
- Pendidikan Bahasa Inggris
- PJKR
UINAM PPG Dalam Jabatan Workshop 103
Bersubsidi: PPL
- Fikih
- Qur’an Hadis
- Akidah Akhlak
- Bahasa Arab
- Sejarah Kebudayaan Islam
- Guru Kelas MI
2 Tahap II UNY PPG Dalam Jabatan Tahap 1 PPL
Tahun 2019: Praktik Mengajar
- PGSD UKIN 158
- Pendidikan Matematika
- PJKR
UNG PPG Dalam Jabatan Tahap 1 Praktik Mengajar
Tahun 2019: PPL
- PGSD 119
- Pendidikan Bahasa Inggris
516
- PJKR
UINAM PPG Dalam Jabatan Praktik Mengajar
Bersubsidi: UKIN
- Fikih
- Qur’an Hadis
239
- Akidah Akhlak
- Bahasa Arab
- Sejarah Kebudayaan Islam
- Guru Kelas MI

163
Pelaksanaan Uji Coba I di LPTK UNY tahun akademik 2018/2019

dilakukan pada 48 peserta PPG Prajabatan bersubsidi dengan Program Studi

PGSD, Pendidikan Matematika, Pendidikan Bahasa Inggris, dan Pendidikan

Teknik Otomotif. Pelaksanaan penilaian dilakukan pada saat peserta PPG

Prajabatan bersubsidi melaksanakan PPL di lokasi sekolah yang ditunjuk P4TKN

UNY. Pelaksanaan penilaian ini melibatkan 21 dosen pembimbing lapangan dan

22 guru pamong pada 13 sekolah yang menjadi lokasi PPL yaitu: SDN 1 Jarakan,

SDN Giwangan Yogyakarta, SDN Bantul Timur, SDN Percobaan 2, SMPN 1

Yogyakarta, SMPN 6 Yogyakarta, SMAN 1 Yogyakarta, SMAN 2 Yogyakarta,

SMAN 6 Yogyakarta, SMKN 2 Depok, SMKN 2 Yogyakarta dan SMKN 3

Yogyakarta.

Pelaksanaan Uji Coba I di LPTK UNG tahun akademik 2018 dilakukan

pada 85 peserta PPG Prajabatan bersubsidi Program Studi Bahasa Inggris, PPG

Dalam Jabatan Program Studi PGSD, Bahasa Inggris, dan PJKR. Pelaksanaan

penilaian dilakukan pada saat peserta PPG Prajabatan bersubsidi melaksanakan

Praktik Mengajar UKIN. Pelaksanaan penilaian ini melibatkan 10 dosen penguji

UKIN dan 12 guru Penguji UKIN pada Sekolah Binaan LPTK UNG yaitu: SDN

84 Kota Tengah, SDN 85 Kota Tengah, SD Laboratorium UNG, SDN 30 Kota

Selatan, SDN 29 Kota Selatan, SMPN 1 Gorontalo, SMPN 2 Gorontalo dan

SMAN 3 Gorontalo.

Selanjutnya pelaksanaan Uji Coba I di Rayon LPTK UINAM tahun

2018/2019 pada 103 Peserta PPG Dalam Jabatan dengan Program Studi/Mata

Pelajaran diantaranya: Fikih, Qur’an Hadis, Akidah Akhlak, Bahasa Arab, Sejarah

164
Kebudayaan Islam dan Guru Kelas Madrasah Ibtidaiyah (MI). Pelaksanaan

penilaian dilakukan pada saat peserta PPG melaksanakan workshop dan PPL.

Pelaksanaan penilaian ini melibatkan 8 dosen pengajar lokakarya/workshop dan

12 guru pamong pada lokasi yang ditunjuk LPTK UINAM yaitu: MIN 1

Makassar, MI Madani Alauddin Pao-Pao, MI Ash-Shalihin, MTs Guppi Samata,

MTs Madani Alauddin Pao-Pao, MA Guppi Samata, MI Ash-Shalihin, MAS

Nadhlatul Wathan.

Hasil Uji Coba I kemudian menjadi dasar untuk menerapkan model

penilaian PPG pada Uji Coba II dengan subjek skala besar dengan jumlah 516

peserta PPG. Pelaksanaan Uji Coba II di LPTK UNY tahun 2019 dilakukan pada

158 peserta PPG Dalam Jabatan dengan Program Studi PGSD, Pendidikan

Matematika, PJKR. Pelaksanaan penilaian dilakukan pada saat peserta PPG PPL

dan UKIN. Pelaksanaan penilaian uji coba tahap II ini melibatkan 21 dosen

pembimbing lapangan dan 22 guru pamong pada 13 sekolah yang menjadi lokasi

PPL yaitu: SD Muh. Karangkajen, SDN Keputran 1, SDN Keputran 2, SD,

Suryodiningratan 3, SDN I Padokan, SDN Giwangan, SDN Jarakan, SDN Bantul

Timur, SDIT Lukman Al-Hakim, SDN Percobaan 2, SDN Surakarsan, SDN

Monggang, SDN Model Sleman, SMPN 2 Mlati, SMPN 7 Yogyakarta, dan

SMPN 8 Yogyakarta.

Pelaksanaan Uji Coba II di LPTK UNG tahun akademik 2019 dilakukan

pada 119 peserta PPG Dalam Jabatan Program Studi Bahasa Inggris, PPG Dalam

Jabatan Program Studi PGSD, Bahasa Inggris, dan PJKR. Pelaksanaan penilaian

dilakukan pada saat peserta PPG melaksanakan PPL. Pelaksanaan penilaian ini

165
melibatkan 10 dosen penguji UKIN dan 12 guru Penguji UKIN pada Sekolah

Binaan LPTK UNG yaitu: SDN 84 Kota Tengah, SDN 85 Kota Tengah, SD

Laboratorium UNG, SDN 30 Kota Selatan, SDN 29 Kota Selatan, SMPN 1

Gorontalo, SMPN 2 Gorontalo dan SMAN 3 Gorontalo.

Pelaksanaan Uji Coba II di Rayon LPTK UINAM tahun 2018/2019 pada

239 Peserta PPG Dalam Jabatan dengan Program Studi/Mata Pelajaran

diantaranya: Fikih, Qur’an Hadis, Akidah Akhlak, Bahasa Arab, Sejarah

Kebudayaan Islam dan Guru Kelas Madrasah Ibtidaiyah (MI). Pelaksanaan

penilaian dilakukan pada saat peserta PPG melaksanakan UKIN. Pelaksanaan

penilaian ini melibatkan 13 dosen pengajar lokakarya/workshop dan 13 guru

penguji UKIN pada lokasi yang ditunjuk LPTK UINAM yaitu: MI Bahrul Ulum,

MI Al-Bashira, MI Insan Cendekia, MI Al-Abrar, MTs Negeri 1 Kota Makassar,

MTs Madani Alauddin PaoPao, MTs Negeri Gowa, MAN 2 Kota Makassar.

3. Teknik dan Instrumen Pengumpulan Data

Jenis data dalam penelitian ini terdiri atas data kuantitatif dan data

kualitatif. Data utama dalam penelitian ini adalah data kuantitatif, sementara data

kualitatif digunakan sebagai data penunjang. Data kuantitatif meliputi data

tentang penilaian capaian kompetensi pedagogik, kompetensi profesional,

kompetensi kepribadian, dan kompetensi sosial peserta PPG yang diperoleh

dengan menggunakan instrumen penilaian dari masing-masing kompetensi yang

dinilai. Selain itu, data kuantitatif didasarkan atas penskoran yang telah

166
ditetapkan pada instrumen penilaian PPG yang dikembangkan dengan

menggunakan penskoran parsial dan holistik.

Data kualitatif adalah data yang diperoleh dari Focus Group Discussion,

uji keterbacaan instrumen dari expert judgment serta hasil konsultasi dari

promotor dan kopromtor. Data kualitatif digunakan untuk mengembangkan

konstruk penilaian PPG dari kompetensi pedagogik, kompetensi sosial dan

kompetensi kepribadian peserta PPG, dan validitas isi dari expert judgement.

Teknik pengumpulan data menggunakan Focus Group Discussion, teknik

observasi, dan dokumentasi melalui analisis dokumen. Focus Group Discussion

untuk mengidentifikasi permasalahan yang dihadapi dalam penilaian PPG serta

apa yang diharapkan untuk mengatasi permasalahan tersebut. Teknik observasi

digunakan untuk menilai capaian penguasaan kompetensi pedagogik, kompetensi

sosial dan kompetensi kepribadian mahasiswa/peserta PPG berdasarkan instrumen

yang telah dikembangkan. Dokumentasi digunakan untuk menelaah instrumen

penilaian PPG yang digunakan selama ini. Selain itu, teknik ini digunakan untuk

menelaah rencana pelaksanaan pembelajaran (RPP) yang disusun

mahasiswa/peserta PPG pada saat lokakarya, PPL dan UKIN.

4. Teknik Analisis Data

Analisis yang digunakan dalam penelitian ini terbagi dalam tiga tahap.

Tahap pertama adalah teknik analisis untuk menilai model penskoran parsial dan

holistik yang dikembangkan dari sisi validitas isi dan reliabilitas.

167
Tahap kedua adalah analisis hasil uji coba instrumen berdasarkan

penskoran yang digunakan. Tahap ketiga adalah analisis deskriptif atau analisis

profil terhadap hasil penilaian untuk mendeskripsikan capaian penguasaan

kompetensi mahasiswa/peserta PPG berdasarkan kemampuan dengan penskoran

parsial dan holistik.

a. Tahap Pertama

Tahap ini digunakan menjawab permasalahan ke-1 yaitu konstruk model

penilaian PPG dengan penskoran parsial dan holistik yang dapat digunakan dalam

mengestimasi penguasaan kompetensi peserta PPG. Analisis dilakukan secara

kualitatif dengan mendeskripsikan prosedur/cara mengembangkan model

penilaian dengan penskoran parsial dan holistik berdasarkan kajian teoritis, telaah

Permendikbud, telaah Buku Pedoman Penyelenggaraan PPG dan instrumen

penilaian PPG yang digunakan selama ini, yang menghasilkan draft pertama

konstruk instrumen yang dikemas dalam kisi-kisi dan sistem penskorannya.

b. Tahap Kedua

Tahap ini digunakan menjawab permasalahan ke-2 tentang bagaimana

validitas dan reliabilitas model penilaian PPG dengan penskoran parsial dan

holistik yang dapat digunakan dalam mengestimasi penguasaan kompetensi

peserta PPG. Untuk membuktikan validitas model penilaian PPG melalui validitas

isi dan validitas konstruk. Validitas isi diperlukan untuk meyakini model penilaian

yang dikembangkan mengukur penguasaan kompetensi peserta PPG yang

didefinisikan dalam domain ataupun konstruk yang diukur dengan melibatkan 7

expert judgment. Hasil penilaian dari expert judgment tersebut, kemudian

168
dianalisis menggunakan indeks Aiken atau yang diusulkan oleh Aiken (Aiken,

1980, Retnawati, 2016a: 18) dengan formula berikut.

V
s ……………………………………………… (22)
n(c  1)
dengan,

V : Indeks kesepakatan rater mengenai validitas butir


s : Skor yang ditetapkan setiap rater dikurangi skor terendah kategori yang

dipakai (s = r – l) dengan r skor kategori pilihan rater dan l skor terendah

dalam kategori

n : Banyaknya rater/ahli

c : Banyaknya kategori yang dapat dipilih rater.

Untuk memaknai hasil perhitungan dengan menggunakan Aiken V, Aiken

(1985) memberi panduan dengan menggunakan tabel koefisien validitas Aiken’s

V untuk menentukan apakah suatu item tersebut diterima atau tidak setelah

dilakukan perhitungan dan menghasilkan indeks V, pada tabel tersebut

menunjukkan untuk jumlah rater yang berbeda, nilai minimum indeks V juga

berbeda sehingga semakin banyak rater yang digunakan, maka semakin kecil

indeks V yang disyaratkan. Pada tabel juga memberikan dua pilihan nilai p yang

ditetapkan yaitu baris pertama p<0,01 dan baris kedua p<0,05, jika menetapkan

nilai p<0,01 yang artinya peluang error sebesar 1%, maka indeks V dilihat pada

baris pertama tiap jumlah rater. Namun jika menetapkan nilai p<0,05 yang

artinya peluang error sebesar 5%, maka indeks V dilihat pada baris kedua tiap

jumlah rater. Berdasarkan format penelaahan expert judgment dengan 5

kriteria/kategori yaitu, skor 1= tidak relevan, skor 2= kurang relevan, skor 3=

169
cukup relevan, skor 4= relevan dan skor 5=sangat relevan yang dinilai oleh 7

expert judgment dengan p<0,05, jika merujuk pada tabel Aiken’s V sebagaimana

terlampir pada Lampiran 1, maka diperoleh indeks Aiken V=0,75, sehingga setiap

item dinyatakan valid jika memenuhi indeks Aiken yang dipersyaratkan (>0,75),

sebaliknya item instrumen dinyatakan tidak valid jika dibawah dari nilai indeks

Aiken yang dipersyaratkan (<0,75). Hal ini juga didukung oleh pendapat

Retnawati (2016a: 19) yaitu: V ≤ 0.4 untuk validitas kurang, 0.4 – 0.8 untuk

validitas sedang serta V > 0.8 untuk kategori sangat valid. Proses ini menghasilkan

draft instrumen penilaian dan buku panduan penilaian yang sudah siap diujicoba

Selanjutnya untuk membuktikan validitas konstruk digunakan analisis

konfirmatori (confirmatory factor analysis, CFA) untuk memeroleh informasi

apakah faktor/komponen yang terbentuk didukung oleh data dengan teknik

Second Order Confirmatory Factor Analysis sampai memeroleh model yang fit.

Terkait dengan analisis CFA menggunakan Structural Equation Modeling (SEM)

yang dioperasikan melalui software Lisrel versi 8.70 (Ghozali & Fuad, 2014;

Joreskog & Sorbom, 2006) . Model standar mengacu pada Retnawati (2016a: 64)

merupakan model yang diharapkan, karena menunjukkan muatan faktor (koefisien

jalur dari variabel ke variabel). Beberapa ahli mengatakan, bahwa koefisien

memiliki arti jika besarnya tidak kurang dari 0,4 dan signifikan yang ditunjukkan

t-value tidak berwarna merah (untuk taraf signifikansi 0,05, t-value < 1,96).

Penentuan goodness of fit model, dilakukan dengan cara melihat besarnya indeks

chi-Square empiris <2 df; signifikansi (p) ≥ 0.05; dan Root Mean Square

Approximation (RMSEA) ≤ 0,08.

170
Selanjutnya untuk mengestimasi reliabilitas penilaian dari expert

judgement menggunakan reliabilitas inter-rater, instrumen dikatakan reliabel jika

memenuhi kriteria ≥ 0,70 (Gronlund & Linn, 1965; Nunnally, 1994). Sementara

untuk mengestimasi reliabilitas konstruk yang menjelaskan besarnya proporsi

indikator dalam menjelaskan konstruk ukur yang diestimasi menggunakan

reliabilitas  . Adapun formula untuk mendapatkan koefisien reliabilitas konstruk

dengan reliabilitas  adalah:


2
 i 
  i  ………………………………… (23)
  i 1 
2
 i   i 2 
  i    1  i 
 i 1   i 1 

Keterangan

 = Koefisien reliabilitas,
i = Faktor loading terstandarisasi (Retnawati, 2016a: 93)

c. Tahap Ketiga

Tahap ini dilakukan untuk menjawab permasalahan ke-3, ke-4 dan

permasalahan ke-5. Untuk menjawab permasalahan ke-3 tentang bagaimana

karakteristik model penilaian dengan penskoran parsial dan holistik yang dapat

digunakan untuk mengestimasi penguasaan kompetensi peserta PPG dianalisis

dengan menggunakan pendekatan politomus item response theory yaitu untuk

model penskoran parsial diestimasi dengan metode partial credit model (PCM)

melalui Program R dengan Extended Rasch Modeling (eRm) package, sedangkan

penskoran holistik diestimasi dengan metode graded response model (GRM)

melalui Program R dengan latent trait model (ltm) package.

171
Selanjutnya untuk menjawab permasalahan ke-4 tentang bagaimana

deskripsi hasil penskoran parsial dan holistik dalam model penilaian PPG

terhadap akurasi estimasi kemampuan peserta PPG dilakukan dengan

membandingkan nilai fungsi informasi (item information function) yang

dihubungkan dengan kesalahan baku pengukuran (Standard Error of

Measurement, SEM). Hambleton et al., 1991: 94; Retnawati (2014: 19)

menyatakan bahwa nilai fungsi informasi memiliki hubungan yang berbanding

terbalik dengan SEM, semakin besar nilai informasi maka SEM akan semakin

kecil atau sebaliknya. Jika nilai fungsi informasi telah diketahui, maka secara

langsung SEM dapat diperoleh,

^ 1
SEM ( )  ………………………………… (24)
I ( )
dengan,
I ( ) : Nilai fungsi informasi

(Hambleton et al., 1991: 94; Retnawati, 2014: 19).

Menjawab permasalahan ke-5 tentang bagaimana kepraktisan model

penilaian PPG dengan penskoran parsial dan holistik berdasarkan penilaian oleh

pengguna, analisisnya dilakukan melalui analisis statistik deskriptif berdasarkan

kategorisasi hasil penilaian dan efektifitas penggunaan model penilaian PPG dari

indikator yang dinilai. Adapun indikator yang dinilai yaitu: mampu dipahami

oleh pengguna, dapat diterapkan di lapangan, relevansi dengan Program PPG,

memberi manfaat pada kegiatan PPG.

172
BAB IV

HASIL PENELITIAN DAN PENGEMBANGAN

A. Hasil Pengembangan Produk Awal

Penelitian ini mengembangkan model penilaian PPG dengan penskoran

parsial dan holistik. Pada model penilaian PPG yang telah dikembangkan terdapat

tiga komponen yang diukur yaitu: Rencana Pelaksanaan Pembelajaran (RPP),

Pelaksanaan Pembelajaran (PP), serta Kompetensi Sosial dan Kompetensi

Kepribadian (KSKK). Model penilaian PPG yang dikembangkan berupa

instrumen dan panduan penilaian PPG dengan penskoran parsial dan holistik.

Pada bab ini diuraikan hasil pengembangan model penilaian penilaian PPG

yang diterapkan pada Rayon LPTK Universitas Negeri Yogyakarta (UNY), LPTK

Universitas Negeri Gorontalo (UNG), dan LPTK Universitas Islam Negeri

Alauddin Makassar (UINAM) dengan lingkup Program Studi PPG Prajabatan

bersubsidi dan PPG Dalam Jabatan tahun akademik 2018/2019. Hasil penelitian

terkait fase-fase pengembangan model penilaian PPG dideskripsikan berikut.

1. Konstruk Model Penilaian PPG

Model penilaian PPG yang telah dikembangkan pada penelitian ini secara

konstruk mencakup instrumen penilaian Rencana Pelaksanaan Pembelajaran

(IPRPP) diukur oleh empat indikator yaitu: perumusan indikator pencapaian

kompetensi dan capaian pembelajaran (PIPKC), pengorganisasian materi, metode,

media dan sumber belajar (PMMMS), pengorganisasian proses, penilaian dan

173
evaluasi pembelajaran (PPPEP), serta penerapan prinsip techno pedagogical

content knowledge (PTPCK).

Indikator perumusan indikator pencapaian kompetensi dan capaian

pembelajaran (PIPKC) diukur dengan 6 item, yaitu kelengkapan penulisan

identitas RPP, kelengkapan penulisan KI, kesesesuaian dan kejelasan rumusan

indikator pencapaian kompetensi dengan kompetensi dasar (KD), kejelasan

rumusan indikator pencapaian kompetensi menggunakan kata kerja yang dapat

diukur dan/atau diamati, kesesuaian dan kejelasan rumusan tujuan pembelajaran

dengan indikator pencapaian kompetensi, serta kelengkapan rumusan tujuan

pembelajaran memenuhi kriteria ABCD (Audience, Behavior, Condition, Degree).

Indikator pengorganisasian materi, metode, media dan sumber belajar

(PMMMS) diukur dengan 6 item, yaitu: kesesuaian dan kejelasan materi dengan

tujuan pembelajaran, ketepatan dan kelengkapan penyusunan materi dan bahan

ajar, kesesuaian pemilihan metode pembelajaran dengan KD, karakteristik materi

dan karakteristik peserta didik, kesesuaian langkah-langkah/sintaks pembelajaran

dengan strategi pembelajaran dan materi yang diajarkan, kesesuaian media dan

sumber belajar dengan tujuan pembelajaran, materi, kondisi kelas dan ketepatan

pemilihan spesifikasinya, kelayakan media dan sumber belajar yang digunakan.

Indikator pengorganisasian proses, penilaian dan evaluasi pembelajaran

(PPPEP) diukur dengan 6 item, yaitu: kelengkapan dan kejelasan langkah-langkah

kegiatan pembelajaran, kejelasan skenario pembelajaran menggambarkan active

learning, kejelasan skenario pembelajaran mencerminkan saintific learning,

kesesuaian teknik penilaian dengan indikator pencapaian kompetensi dan

174
kejelasan lingkup penilaian, kelengkapan komponen penilaian yang digunakan,

serta kejelasan rencana kegiatan pengayaan dan/atau remedial.

Indikator penerapan prinsip techno pedagogical content knowledge

(PTPCK) diukur dengan 7 item, yaitu: kejelasan technological knowledge,

pedagogical knowledge, content knowledge, technological pedagogical

knowledge, technological content knowledge, pedagogical content knowledge,

serta kejelasan technological pedagogical content knowledge. Berikut ini konstruk

penilaian RPP pada model penilaian PPG dapat digambarkan sebagai berikut.

Gambar 22. Konstruk Penilaian Rencana Pelaksanaan Pembelajaran (RPP)

175
Keterangan:
PIPKC : Perumusan indikator pencapaian kompetensi dan capaian
pembelajaran
PMMMS : Pengorganisasian materi, metode, media dan sumber belajar
PPPEP : Pengorganisasian proses, penilaian dan evaluasi pembelajaran
PTPCK : Penerapan prinsip techno pedagogical content knowledge

Berdasarkan konstruk yang disajikan pada Gambar 22, maka dapat

dijelaskan bahwa pada komponen penilaian rencana pelaksanaan pembelajaran

RPP diukur melalui 4 indikator serta 25 item. IndIkator perumusan indikator

pencapaian kompetensi dan capaian pembelajaran (PIPKC) sebanyak 6 item (item

1-6), indikator pengorganisasian materi, metode, media dan sumber belajar

(PMMMS) sebanyak enam item (item 7-12), indikator pengorganisasian proses,

penilaian dan evaluasi pembelajaran (PPPEP) sebanyak enam item (item 13-18),

serta indikator penerapan prinsip techno pedagogical content knowledge (PTPCK)

sebanyak tujuh item (item19-25) yang terlampir pada Lampiran 1 halaman 457.

Komponen kedua dalam model penilaian PPG yang dikembangkan ialah

komponen penilaian pelaksanaan pembelajaran (PP). Komponen ini diukur

melalui empat indikator yaitu: melaksanakan pembelajaran yang mendidik

(MPMD), melaksanakan pembelajaran yang mencerdaskan (MPMC),

memfasilitasi pengembangan potensi diri dan karakter peserta didik (MPDK),

serta menilai dan mengevaluasi pembelajaran (MDMP). Indikator melaksanakan

pembelajaran yang mendidik (MPMD) diukur oleh empat item yaitu: menyiapkan

peserta didik secara fisik dan mental, memotivasi peserta didik, melakukan

kegiatan appersepsi, menyampaikan tujuan pembelajaran dan cakupan materi.

176
Indikator melaksanakan pembelajaran yang mencerdaskan (MPMC)

diukur oleh tujuh item. Item tersebut antara lain: menunjukkan penguasaan materi

pembelajaran, mengaitkan materi dengan sains, lingkungan, teknologi dan realitas

kehidupan, melaksanakan pembelajaran yang menggambarkan pendekatan active

learning, melaksanakan pembelajaran yang mencerminkan pendekatan saintific

learning, melaksanakan pembelajaran yang mencerminkan pendekatan problem

based learning, Menggunakan alat/bahan, media dan TIK secara efektif dan

efisien, serta menggunakan alat/bahan, media dan TIK yang menghasilkan pesan

menarik. Indikator memfasilitasi pengembangan potensi diri dan karakter peserta

didik (MPDK) diukur oleh empat item. Item tersebut antara lain: menunjukkan

sikap terbuka dan respon terhadap peserta didik, menunjukkan hubungan yang

kondusif dan kerjasama antar peserta didik, menggunakan bahasa yang santun,

serta menyampaikan pesan dengan gaya (gesture) yang sesuai.

Indikator menilai dan mengevaluasi pembelajaran (MDMP) diukur dengan

lima item. Item tersebut antara lain: memantau kemajuan belajar peserta didik

selama proses pembelajaran, melakukan penilaian proses dan hasil sesuai rencana

dan tujuan pembelajaran, menindaklanjuti hasil penilaian selama pembelajaran,

melakukan refleksi, serta melakukan tindak lanjut. Dengan demikian konstruk

penilaian pelaksanaan pembelajaran pada penilaian PPG digambarkan berikut.

177
Gambar 23. Konstruk Penilaian Pelaksanaan Pembelajaran (PP)
Keterangan:
MPMD : Melaksanakan pembelajaran yang mendidik
MPMC : Melaksanakan pembelajaran yang mencerdaskan
MPDK : Memfasilitasi pengembangan potensi diri dan karakter
MDMP : Menilai dan mengevaluasi pembelajaran

Berdasarkan konstruk yang disajikan pada Gambar 23, maka dapat

dijelaskan bahwa pada komponen penilaian pelaksanaan pembelajaran PP diukur

melalui 4 indikator serta 20 item. Indikator melaksanakan pembelajaran yang

mendidik (MPMD) diukur oleh empat item (item 1-4), indikator melaksanakan

pembelajaran yang mencerdaskan (MPMC) diukur oleh tujuh item (item 5-11),

178
indikator memfasilitasi pengembangan potensi diri dan karakter peserta didik

(MPDK) diukur oleh empat item (item 12-15), serta indikator menilai dan

mengevaluasi pembelajaran (MDMP) diukur dengan lima item (item16-20) yang

terlampir pada Lampiran 1 halaman 457.

Komponen ketiga dalam model penilaian PPG yang dikembangkan ialah

komponen penilaian kompetensi sosial dan kompetensi kepribadian (KSKK).

Komponen ini diukur melalui empat indikator yaitu: bekerjasama dan memiliki

jiwa kepemimpinan (BMJK), bersikap inklusif, toleran dan peduli (BITP),

berkomunikasi dengan sesama (BKDS), bersikap sopan/ santun, mandiri, kreatif

dan disiplin (BSMKD). Indikator bekerjasama dan memiliki jiwa kepemimpinan

(BMJK) diukur oleh lima item. Item tersebut antara lain: menunjukkan sikap

bekerjasama, menunjukkan sikap berpartisipasi aktif, menunjukkan sikap dapat

mengatur dan mau diatur orang lain, menunjukkan sikap aktif dan bijaksana, serta

menunjukkan perilaku yang demokratis.

Indikator bersikap inklusif, toleran dan peduli (BITP) diukur oleh lima

item. Item tersebut antara lain: menunjukkan sikap menghargai perbedaan,

menunjukkan sikap empati terhadap sesama, menunjukkan sikap adil dan objektif,

menunjukkan sikap respon cepat tanggap, serta menunjukkan sikap suka

menolong. Indikator berkomunikasi dengan sesama (BKDS) diukur oleh lima

item. Item tersebut antara lain: menunjukkan sikap santun dalam berkomunikasi,

menunjukkan sikap lemah lembut dalam berbicara, menunjukkan kemampuan

berbicara yang efektif, menunjukkan sikap supel dalam pergaulan, serta

menunjukkan sikap ramah dalam pergaulan.

179
Indikator bersikap sopan/ santun, mandiri, kreatif dan disiplin (BSMKD)

diukur oleh lima item. Item tersebut antara lain: menunjukkan kesopanan

berpakaian dan berpenampilan, menunjukkan kesantunan berperilaku dengan

sesama, menunjukkan kemandirian dalam pembelajaran, menunjukkan kreativitas

dalam pembelajaran, serta menunjukkan kedisiplinan dalam pembelajaran.

Adapun konstruk penilaian pada kompetensi ini tampak pada Gambar 24 berikut.

Gambar 24. Konstruk Penilaian Kompetensi Sosial Kepribadian (KSKK)


Keterangan:
BMJK : Bekerjasama dan memiliki jiwa kepemimpinan
BITP : Bersikap inklusif, toleran dan peduli
BKDS : Berkomunikasi dengan sesama
BSMKD : Bersikap sopan/ santun, mandiri, kreatif dan disiplin

180
Berdasarkan konstruk yang disajikan pada Gambar 24, maka dapat

dijelaskan bahwa pada komponen penilaian kompetensi sosial dan kompetensi

kepribadian (KSKK) diukur melalui 4 indikator serta 20 item. Indikator

bekerjasama dan memiliki jiwa kepemimpinan (BMJK) diukur oleh lima item

(item 1-5), indikator bersikap inklusif, toleran dan peduli (BITP) diukur oleh lima

item (item 6-10), indikator berkomunikasi dengan sesama (BKDS) diukur oleh

lima item (item 11-15), serta indikator bersikap sopan/ santun, mandiri, kreatif

dan disiplin (BSMKD) diukur oleh lima item (item16-20) yang terlampir pada

Lampiran 1 halaman 458.

2. Hasil Penilaian Model Oleh Ahli/Pakar

Penilaian model oleh ahli atau expert judgment yang dimaksud dalam

penelitian ini adalah model yang telah ditentukan konstruknya pada fase

sebelumnya kemudian diberikan kepada expert judgment untuk dinilai. Penilaian

tersebut dilakukan untuk membuktikan validitas isi (content validity) dari

konstruk yang telah dikembangkan secara teoretik. Pada penelitian ini terdapat 7

expert judgment dipilih secara purposive sampling berdasarkan pertimbangan

keahlian dimiliki sesuai bidang penelitian yang dikembangkan.

Tahapan pembuktian validitas isi yang telah dilakukan pada penelitian ini

mengacu pada saran atau pandangan Retnawati (2016a: 27) yang meliputi

beberapa tahapan. Tahapan pertama yang telah dilakukan dalam pembuktian

validitas ini instrumen penilaian PPG pada penelitian ini adalah memberikan kisi-

kisi dan item instrumen, berikut rubrik penskorannya kepada ke-7 ahli atau pakar

181
yang telah dipilih sesuai dengan bidang yang diteliti untuk memohon masukan

tekait pendapat keahliannya. Tahapan selanjutnya adalah masukan yang

diharapkan dari ahli berupa kesesuaian komponen instrumen dengan indikator,

indikator dengan itemnya, benarnya substansi item, kalimat, format penulisan,

simbol dan hal lain yang dianggap subtansial oleh ahli. Proses ini disebut dengan

telaah kualitatif yang meliputi aspek subtansi, bahasa dan budaya. Berdasarkan

masukan ahli tersebut, instrumen kemudian diperbaiki.

Hasil pembuktian validitas isi oleh 7 expert judgment diuraikan

berdasarkan ketiga komponen instrumen yaitu: instrumen penilaian rencana

pelaksanaan pembelajaran (RPP), instrumen penilaian pelaksanaan pembelajaran

(PP), dan instrumen penilaian kompetensi sosial dan kepribadian (KSKK), serta

panduan penilaian. Terkait dengan hasil penilaian expert judgment serta analisis

validitas isi berdasarkan Aiken V pada 25 item yang terdapat pada instrumen

penilaian rencana pelaksanaan pembelajaran (RPP) yang terlampir pada Lampiran

2 halaman 459 diperoleh beberapa koefisien V, maka interpretasi koefisien

tersebut dibuat pengkategorian sebagaimana disajikan pada Tabel 10:

Tabel 10. Pengkategorian Validitas Isi Instrumen Penilaian RPP

Tabel Aiken V
Indikator
Valid Tidak Valid
(> 0,75) (< 0,75)
PIPCK A1, A2, A3, A4, A5, A6 -
PMMMS B7, B8, B9, B10,B11, B12 -
PPPEP C13,C14, C15, C16, C17, C18 -
PTPCK D19, D20, D21, D22, D23, D24 D25 -
Total / % 25/100% 0 / 0%

182
Berdasarkan data Tabel 10, dapat dijelaskan bahwa secara umum validitas

isi instrumen penilaian RPP jika mengacu pada tabel Aiken’s V menunjukkan

semua item yang dikembangkan dalam instrumen penilaian RPP dengan

penskoran parsial dan holistik dinyatakan valid karena memenuhi indeks Aiken

yang dipersyaratkan yaitu > 0,75 (Aiken, 1985). Selanjutnya jika mengacu pada

saran Retnawati (2016a: 19) instrumen penilaian RPP yang berada pada kategori

sangat valid yaitu terdapat 15 item atau 75% yang memiliki nilai validitas > 0.8,

dan selebihnya ada 10 item atau 25% berada pada kategori sedang. Hal ini

menunjukkan bahwa instrumen penilaian RPP telah akurat memenuhi syarat dari

aspek validitas isi, meskipun masih terdapat beberapa item yang diperbaiki

berdasarkan saran atau masukan dari expert judgment pada aspek materi, konstruk

dan bahasa yang digunakan, diantaranya pembetulan beberapa tulisan yang

kurang lengkap pada instrumen dan panduan penilaian, mengkombinasikan

dengan instrumen penilaian RPP yang digunakan Ditjen Belama terhadap

beberapa item yang belum ternilai, serta memperbaiki item/butir yang menilai

aspek penilaian dengan mempertimbangkan penilaian proses dan hasil sebagai

kegiatan penilaian yang berbeda.

Komponen kedua yang dibuktikan validitas isinya adalah instrumen

penilaian pelaksanaan pembelajaran (PP). Pada instrumen ini memuat empat

indikator dengan sebaran item sebanyak 20 item. Terkait dengan hasil penilaian

ketujuh expert judgment serta analisis validitas isi berdasarkan Aiken V pada 20

item yang terdapat pada instrumen penilaian pelaksanaan pembelajaran (PP) yang

terlampir pada Lampiran 2 halaman 460 diperoleh beberapa koefisien V, maka

183
interpretasi koefisien tersebut dibuat pengkategorian sebagaimana disajikan pada

Tabel 11 sebagai berikut.

Tabel 11. Pengkategorian Validitas Isi Instrumen Penilaian PP

Tabel Aiken V
Indikator Valid Tidak Valid
(> 0,75) (< 0,75)
MPMD A1, A2, A3, A4 -
MPMC B5,B6,B7,B8 B9, B10, B11 -
MPDK C12, C13 C14, C15 -
MDMP D16,D17,D18D19, D20 -
Total / % 20/100% 0 / 0%

Berdasarkan data pada Tabel 11, maka dapat dijelaskan bahwa secara

umum validitas isi yang dinilai oleh expert judgment pada instrumen penilaian

pelaksanaan pembelajaran (PP) jika mengacu pada pada tabel Aiken’s V

menunjukkan semua item yang dikembangkan dalam instrumen penilaian

pelaksanaan pembelajaran (PP) dengan penskoran parsial dan holistik dinyatakan

valid. Hal ini menunjukkan bahwa instrumen penilaian pelaksanaan pembelajaran

(PP) telah akurat memenuhi syarat dari aspek validitas isi, meskipun masih

terdapat beberapa item yang diperbaiki berdasarkan saran atau masukan dari

expert judgment diantaranya perlu menyederhanakan beberapa butir pada

instrumen dengan memperhatikan skor setiap butir disesuaikan dengan deskriptor

dari aspek yang dinilai dan deskriptor setiap butir disarankan sebaiknya yang

dapat diamati serta disesuaikan dengan teori-teori yang mendasarinya.

Komponen ketiga pada model penilaian PPG yang dibuktikan validitas

isinya adalah instrumen penilaian kompetensi sosial dan kompetensi kepribadian

(KSKK). Pada instrumen ini memuat empat indikator dengan sebaran item

184
sebanyak 20 item. Terkait dengan hasil penilaian ketujuh expert judgment serta

analisis validitas isi berdasarkan Aiken V pada 20 item yang terdapat pada

instrumen penilaian kompetensi sosial dan kompetensi kepribadian (KSKK) yang

terlampir pada Lampiran 2 halaman 461 diperoleh beberapa koefisien V, maka

interpretasi koefisien tersebut dibuat pengkategorian pada Tabel 12.

Tabel 12. Pengkategorian Validitas Isi Instrumen Penilaian KSKK

Tabel Aiken V
Indikator Valid Tidak Valid
(> 0,75) (< 0,75)
BMJK A1, A2, A3, A4, A5 -
BITP B6, B7 B8, B9, B10 -
BKDS C11, C12, C13, C14, 15 -
BSMKD D16,D17,D18 D19, D20 -
Total / % 20/100% 0 / 0%

Berdasarkan data yang disajikan pada Tabel 12, maka dapat dijelaskan

bahwa secara umum validitas isi yang dinilai oleh expert judgment pada instrumen

penilaian kompetensi sosial dan kompetensi kepribadian (KSKK) jika mengacu

pada pada tabel Aiken’s V menunjukkan semua item yang dikembangkan dalam

instrumen penilaian kompetensi sosial dan kompetensi kepribadian (KSKK)

dengan penskoran parsial dan holistik dinyatakan valid. Hal ini menunjukkan

bahwa instrumen penilaian kompetensi sosial dan kompetensi kepribadian

(KSKK) telah akurat memenuhi syarat dari aspek validitas isi, meskipun masih

terdapat beberapa item yang diperbaiki berdasarkan saran atau masukan dari

expert judgment diantaranya perlu penyelarasan dari aspek bahasa, masih banyak

huruf yang hilang pada sejumlah kata, dan deskripsi pilihan jawaban dari masing-

185
masing item dibuat singkat, jelas dan menyesuaikan dengan komponen dan

indikator yang diharapkan ternilai dari kompetensi ini.

Komponen keempat pada model penilaian PPG yang dibuktikan validitas

isinya adalah buku panduan model penilaian dengan penskoran parsial dan

holistik. Pada instrumen ini memuat tujuh indikator dengan sebaran item

sebanyak 46 item dengan rincian indikator menilai komponen pendahuluan

dengan sebaran item sebanyak 6 item dari item 1.1 - 1.6, menilai sistem penilaian

Program PPG dengan sebaran item sebanyak 4 item dari item 2.1 - 2.4, menilai

mekanisme penilaian Program PPG dengan sebaran item sebanyak 5 item dari

item 3.1 - 2.5, menilai penskoran dan interpretasi hasil penilaian Program PPG

dengan sebaran item sebanyak 13 item dari item 4.1 - 4.13, menilai komponen

pendukung penyajian panduan penilaian dengan sebaran item sebanyak 5 item

dari item 5.1-5.5, menilai akurasi dan kemutakhiran panduan penilaian dengan

sebaran item sebanyak 6 item dari item 6.1 - 6.6, dan menilai komponen bahasa

dari panduan penilaian dengan sebaran item sebanyak 7 item dari item 7.1 - 7.7.

Terkait dengan hasil penilaian ketujuh expert judgment serta analisis validitas isi

berdasarkan Aiken V pada 46 item yang terdapat pada format penelaahan panduan

model penilaian dengan penskoran parsial dan holistik dengan hasil penilaian

sebagaimana terlampir pada Lampiran 2 halaman 462 diperoleh beberapa

koefisien V, maka interpretasi koefisien tersebut dibuat pengkategorian

sebagaimana disajikan pada Tabel 13 sebagai berikut.

186
Tabel 13. Pengkategorian Validitas Isi Panduan Model Penilaian PPG

Tabel Aiken V
Indikator Valid Tidak Valid
(> 0,75) (< 0,75)
Pendahuluan 1.1,1.2,1.3, 1.4,1.5,1.6 -
Sistem Penilaian Program PPG 2.1, 2.2, 2.3, 2.4 -
Mekanisme Penilaian Program PPG 3.1,3.2,3.3, 3.4,3.5 -
Penskoran dan Interpretasi Hasil 4.1,4.2,4.3, 4.4,4.5,4.6, 4.7
-
Penilaian Program PPG 4.8,4.9,4.10,4.11, 4.12,4.13
Pendukung Penyajian 5.1,5.2,5.3, 5.4,5.5
Akurasi dan kemutakhiran 6.1,6.2,6.3, 6.4,6.5,6.6
Bahasa 7.1,7.2,7.3, 7.4,7.5,7.6,7.7
Total / % 46/100% 0 / 0%

Berdasarkan data pada Tabel 13, dapat dijelaskan bahwa secara umum

validitas isi yang dinilai oleh expert judgment pada panduan model penilaian

dengan penskoran parsial dan holistik jika mengacu pada pada tabel Aiken’s V

menunjukkan semua item pada komponen panduan model penilaian dengan

penskoran parsial dan holistik dinyatakan valid. Hal ini menunjukkan bahwa

panduan model penilaian dengan penskoran parsial dan holistik telah akurat

memenuhi syarat dari aspek validitas isi berdasarkan penilaian expert judgment,

meskipun masih terdapat beberapa saran atau masukan diantaranya panduan

penilaian perlu disederhanakan, dibuat contoh penilaian yang menggambarkan

penguasaan kompetensi peserta PPG dengan penskoran parsial dan holistik.

Selanjutnya untuk melihat konsistensi atau reliabilitas penilaian dari

ketujuh expert judgment, dilakukan estimasi reliabilitas dengan menggunakan

teknik reliabilitas inter-rater terhadap hasil penilaian ketujuh expert judgment pada

instrumen penilaian rencana pelaksanaan pembelajaran (RPP), instrumen

penilaian pelaksanaan pembelajaran (PP), instrumen penilaian kompetensi sosial

187
dan kepribadian (KSKK) dan panduan model penilaian. Berikut ini disajikan hasil

estimasi reliabilitas inter-rater pada Tabel 14.

Tabel 14. Hasil Estimasi Reliabilitas dengan Inter-Rater

Koefisien
Instrumen Kriteria Keterangan
Reliabilitas
Rencana Pelaksanaan
≥ 0,70 0,84 Reliabel
Pembelajaran (RPP)
Pelaksanaan Penilaian
≥ 0,70 0,81 Reliabel
(PP)
Kompetensi Sosial dan
≥ 0,70 0,78 Reliabel
Kepribadian (KSKK)
Panduan Penilaian ≥ 0,70 0,86 Reliabel

Berdasarkan data pada Tabel 14 tersebut, maka dapat dijelaskan bahwa

secara umum semua instrumen yang ditanggapi oleh rater telah memiliki koefisien

inter-klas yang reliabel. Hal ini didasari pada semua koefisien telah melebihi

kriteria ≥ 0,70 instrumen dikatakan reliabel (Gronlund & Linn, 1965; Nunnally,

1994). Dengan demikian hasil estimasi reliabilitas dengan inter-rater tersebut

bermakna bahwa pengukuran yang dilakukan oleh rater pada instrumen penilaian

rencana pelaksanaan pembelajaran (RPP), instrumen penilaian pelaksanaan

pembelajaran (PP), instrumen penilaian kompetensi sosial dan kepribadian

(KSKK) serta buku panduan model penilaian konsisten/ajeg. Lebih jelasnya hasil

pembuktian relibilitas inter-rater dapat diamati pada Lampiran 2 halaman 463.

B. Hasil Ujicoba Produk

Pelaksanaan uji coba dimaksudkan untuk memperoleh informasi dan

membuktikan kualitas model penilaian PPG secara empirik melalui hasil uji coba

lapangan. Kualitas secara empirik yang dimaksud meliputi: validitas konstruk

188
instrumen, Goodness of Fit Model, karakteristik item dan tes berdasarkan

politomus item response theory, serta reliabilitas instrumen. Pada uji coba pertama

penggunaan subjek masih skala kecil yaitu sebanyak 236 peserta. Pembuktian

kualitas model penilaian PPG secara empirik pada uji coba I sebagai berikut.

1. Pembuktian Validitas Konstruk

Pembuktian validitas konstruk pada instrumen penilaian PPG dilakukan

melalui analisis faktor konfirmatori atau confirmatory factor analysis (CFA).

Pengujian CFA dilakukan untuk semua komponen penilaian yaitu: instrumen

penilaian rencana pelaksanaan pembelajaran (RPP), instrumen penilaian

pelaksanaan pembelajaran (PP), instrumen serta penilaian kompetensi sosial dan

kompetensi kepribadian (KSKK). Ketiga komponen instrumen terbagi atas dua

metode penskoran yaitu penskoran parsial dan penskoran holistik. Selain itu, data

penilaian dikelompokkan menjadi dua kelompok yaitu data hasil penilaian oleh

dosen dan data hasil penilaian oleh guru pamong/penguji UKIN. Hasil analisis

pembuktian validitas konstruk dikemukakan sebagai berikut.

a. Validitas Konstruk Instrumen Penilaian Rencana Pelaksanaan

Pembelajaran (RPP)

Instrumen penilaian rencana pelaksanaan pembelajaran (RPP) diukur

melalui empat indikator dengan sebaran item sebanyak 25 item. Keempat indkator

tersebut adalah indkator perumusan indikator pencapaian kompetensi dan capaian

pembelajaran (PIPKC) sebanyak 6 item (item 1-6), indikator pengorganisasian

materi, metode, media dan sumber belajar (PMMMS) sebanyak enam item (item

7-12), indikator pengorganisasian proses, penilaian dan evaluasi pembelajaran

189
(PPPEP) sebanyak enam item (item 13-18), serta indikator penerapan prinsip

techno pedagogical content knowledge (PTPCK) sebanyak tujuh item (item19-

25). Penyajian hasil pembuktian validitas konstruk instrumen penilaian rencana

pelaksanaan pembelajaran (RPP) dikelompokkan berdasarkan dua kelompok data

ditinjau dari penskorannya, yaitu kelompok parsial dan kelompok holistik.

1) Validitas Konstruk Pada Instrumen Penilaian RPP dengan Penskoran

Parsial

Hasil pembuktian validitas konstruk instrumen penilaian rencana

pelaksanaan pembelajaran (RPP) melalui analisis faktor konfirmatori dengan

penskoran parsial untuk penilai dosen diperoleh informasi bahwa koefisien Barlet

dengan nilai p 0,000 serta KMO sebesar 0,9. Jika hasil pengujian Barlet

menunjukkan nilai p yang lebih kecil dari 0,01 serta koefisien KMO yang lebih

dari 0,05 maka kecukupan sampel untuk analisis faktor telah terpenuhi

(Retnawati, 2016a: 47). Lebih lanjut sebanyak 25 item menunjukkan muatan

faktor masing-masing berdasarkan indikatornya. Dari 25 item tersebut

menunjukkan seluruh koefisien muatan faktor lebih dari 0,4. Jika hal tersebut

dikonfirmasikan dengan saran Retnawati (2016a: 64) yang menyatakan bahwa

koefisien jalur muatan faktor akan memiliki arti (meaningful) jika besarnya tidak

kurang dari 0,4. Hasil analisis menunjukkan bahwa semua variabel observable

memberikan sumbangan berarti untuk mengukur variabel latennya. Hal tersebut

bermakna bahwa ke-25 item pada instrumen penilaian rencana pelaksanaan

pembelajaran (RPP) penskoran parsial untuk penilai dosen telah valid secara

konstruk. Hal lain yang dapat dijelaskan bahwa model konstruk yang dirancang

190
telah memenuhi Goodness of Fit Model. Hal ini ditunjukkan melalui koefisien p-

value sebesar 0,104 yang melebih cut-of value 0,05 serta koefisien RMSEA

sebesar 0,022 yang lebih kecil dari cut-of value 0,08. Hal tersebut diperoleh

setelah mengkorelasikan eror antara item 7 dan item 14, serta item 22 dan item 25

sebagaimana terlampir pada Lampiran 3 halaman 466. Adanya korelasi error

tersebut disebabkan karena item-item tersebut secara empirik mengukur konstruk

yang tidak tunggal, sehingga untuk memperoleh model yang fit maka error dalam

item-tem tersebut harus dikorelasikan. Hal ini sesuai dengan pendapat Pan, Ip, &

Dubé (2017) bahwa mengoperasionalkan model pengukuran dalam analisis faktor

konfirmatori memerlukan asumsi yang kuat untuk menemukan kecocokan antara

model dengan data empirik. Untuk itu, pendekatan modifikasi merupakan cara

untuk meningkatkan kecocokan (fit) CFA melalui penggunaan indeks modifikasi

dengan mengkorelasikan antara kesalahaan pengukuran yang signifikan

Selain data dari instrumen penilaian rencana pelaksanaan pembelajaran

(RPP) penskoran parsial untuk penilai dosen, dilakukan pula pembuktian validitas

konstruk dengan menggunakan kelompok data dari penilai guru pamong/penguji

UKIN yang diperoleh informasi bahwa koefisien Barlet dengan nilai p 0,000 serta

KMO sebesar 0,9. Jika hasil pengujian Barlet menunjukkan nilai p yang lebih

kecil dari 0,01 serta koefisien KMO yang lebih dari 0,05 maka kecukupan sampel

untuk analisis faktor telah terpenuhi. Lebih lanjut sebanyak 25 item menunjukkan

muatan faktor masing-masing berdasarkan indikatornya. Dari 25 item tersebut

menunjukkan seluruh koefisien muatan faktor lebih dari 0,4. Jika hal tersebut

dikonfirmasikan dengan saran Retnawati (2016a: 64) koefisien jalur muatan

191
faktor akan memiliki arti (meaningful) jika besarnya tidak kurang dari 0,4. Artinya

semua variabel observable memberikan sumbangan berarti untuk mengukur

variabel latennya. Hal tersebut bermakna sama seperti analisis sebelumnya bahwa

ke-25 item pada instrumen penilaian rencana pelaksanaan pembelajaran (RPP)

penskoran parsial untuk penilai guru pamong/penguji UKIN telah valid secara

konstruk. Hal lain yang dapat dijelaskan pada aspek Goodness of Fit Model

diperoleh informasi bahwa model konstruk yang dirancang telah memenuhi

Goodness of Fit Model. Hal ini ditunjukkan melalui koefisien p-value sebesar

0,055 yang melebih cut-of value 0,05 serta koefisien RMSEA sebesar 0,025 yang

lebih kecil dari cut-of value 0,08. Hal tersebut diperoleh setelah mengkorelasikan

error antara item 6 dan item 18 serta item 7 dan item 14 sebagaimana terlampir

pada Lampiran 3 halaman 465.

Berdasarkan beberapa hasil analisis yang telah dikemukakan, baik yang

berasal dari data penilaian dosen, maupun data yang berasal dari penilaian guru

pamong/penguji UKIN, maka dapat disimpulkan bahwa instrumen penilaian

rencana pelaksanaan pembelajaran (RPP) dengan penskoran parsial yang

digunakan pada uji coba I telah valid secara konstruk. Begitu pula ke-25 item

instrumen tersebut telah memenuhi aspek validitas secara konstruk.

2) Validitas Konstruk Instrumen Penilaian RPP dengan Penskoran Holistik

Seperti halnya pada penskoran parsial, hasil pembuktian validitas konstruk

konstruk instrumen penilaian rencana pelaksanaan pembelajaran (RPP) pada

kelompok penskoran holistik dibagi atas dua kelompok data yaitu data dari hasil

penilai dosen dan data dari hasil penilai guru pamong/penguji UKIN. Hasil

192
analisis validitas konstruk melalui analisis faktor konfirmatori untuk penilai dosen

diperoleh informasi bahwa koefisien Barlet dengan nilai p 0,000 serta KMO

sebesar 0,9. Jika hasil pengujian Barlet menunjukkan nilai p yang lebih kecil dari

0,01 serta koefisien KMO yang lebih dari 0,05 maka kecukupan sampel untuk

analisis faktor telah terpenuhi. Lebih lanjut sebanyak 25 item menunjukkan

muatan faktor masing-masing berdasarkan indikatornya. Dari 25 item tersebut

menunjukkan seluruh koefisien muatan faktor lebih dari 0,4. Jika hal tersebut

dikonfirmasikan dengan saran Retnawati (2016a: 64) koefisien jalur muatan

faktor akan memiliki arti (meaningful) jika besarnya tidak kurang dari 0,4. Artinya

semua variabel observable memberikan sumbangan berarti untuk mengukur

variabel latennya. Hal tersebut bermakna bahwa ke-25 item pada instrumen

penilaian rencana pelaksanaan pembelajaran (RPP) penskoran holistik untuk

penilai dosen telah valid secara konstruk. Hal lain yang dapat dijelaskan adalah

pada aspek Goodness of Fit Model diperoleh informasi bahwa model konstruk

yang dirancang juga telah memenuhi Goodness of Fit Model yang dibuktikandarii

koefisien p-value sebesar 0,067 yang melebih cut-of value 0,05 serta koefisien

RMSEA sebesar 0,024 yang lebih kecil dari cut-of value 0,08. Hal tersebut

diperoleh setelah mengkorelasikan eror antara item 16 dan item 17 serta item 19

dan item 24 sebagaimana terlampir pada Lampiran 3 halaman 466.

Selain data dari instrumen penilaian rencana pelaksanaan pembelajaran

(RPP) penskoran holistik untuk penilai dosen, dilakukan pula pembuktian

validitas konstruk dengan menggunakan kelompok data dari penilai guru

pamong/penguji UKIN. Hasil analisis faktor konfirmatori dari instrumen penilaian

193
rencana pelaksanaan pembelajaran (RPP) penskoran holistik untuk penilai guru

pamong/penguji UKIN. Pada dasarnya instrumen yang digunakan adalah sama,

begitu pula subjek yang dinilai adalah orang yang sama, hanya penilainya saja

yang berbeda yaitu dosen dan guru pamong/penguji UKIN. Berdasarkan

penyajian tersebut, diperoleh informasi bahwa koefisien Barlet dengan nilai p

0,000 serta KMO sebesar 0,9. Jika mengacu pada saran Retnawati (2016a: 47)

hasil pengujian Barlet menunjukkan nilai p yang lebih kecil dari 0,01 serta

koefisien KMO yang lebih dari 0,05 maka kecukupan sampel untuk analisis faktor

telah terpenuhi. Lebih lanjut sebanyak 25 item menunjukkan muatan faktor

masing-masing berdasarkan indikatornya dan menunjukkan seluruh koefisien

muatan faktor lebih dari 0,4. Jika hal tersebut dikonfirmasikan dengan saran

Retnawati (2016a: 64) koefisien jalur muatan faktor akan memiliki arti

(meaningful) jika besarnya tidak kurang dari 0,4. Artinya semua variabel

observable memberikan sumbangan berarti untuk mengukur variabel latennya.

Hal tersebut bermakna sama seperti analisis sebelumnya bahwa ke-25 item pada

instrumen penilaian rencana pelaksanaan pembelajaran (RPP) penskoran holistik

untuk penilai guru pamong/penguji UKIN telah valid secara konstruk. Selain itu,

berdasarkan hasil analisis diperoleh informasi bahwa model konstruk yang

dirancang telah memenuhi Goodness of Fit Model ditunjukkan melalui koefisien

p-value sebesar 0,07 yang melebih cut-of value 0,05 serta koefisien RMSEA

sebesar 0,024 yang lebih kecil dari cut-of value 0,08. Hal tersebut diperoleh

setelah mengkorelasikan eror antara item 1 dan item 7 serta item 13 dan item 14

sebagaimana terlampir pada Lampiran 3 halaman 467.

194
Berdasarkan beberapa hasil analisis yang telah dikemukakan, baik yang

berasal dari data penilaian dosen, maupun data yang berasal dari penilaian guru

pamong/penguji UKIN, maka dapat disimpulkan bahwa instrumen penilaian

rencana pelaksanaan pembelajaran (RPP) dengan penskoran holistik yang

digunakan pada uji coba I telah valid secara konstruk. Begitu pula ke-25 item

instrumen tersebut telah memenuhi aspek validitas secara konstruk.

b. Validitas Konstruk Instrumen Pelaksanaan pembelajaran (PP)

Instrumen penilaian pelaksanaan pembelajaran (PP) diukur melalui empat

indikator dengan sebaran item sebanyak 20 item. Seperti halnya pembuktian

validitas konstruk pada instrumen penilaian RPP, penyajian hasil pembuktian

validitas konstruk instrumen penilaian pelaksanaan pembelajaran (PP)

dikelompokkan berdasarkan dua kelompok data ditinjau dari penskorannya, yaitu

kelompok data dengan penskoran parsial dan kelompok penskoran holistik.

1) Validitas Konstruk Pada Instrumen Penilaian Pelaksanaan Pembelajaran

(PP) dengan Penskoran Parsial

Hasil pembuktian validitas konstruk instrumen penilaian pelaksanaan

pembelajaran (PP) pada kelompok penskoran parsial dibagi atas dua kelompok

data yaitu data dari hasil penilai dosen dan data dari hasil penilai guru

pamong/penguji UKIN. Hasil analisis faktor konfirmatori dari instrumen penilaian

pelaksanaan pembelajaran (PP) dengan penskoran parsial untuk penilai dosen

diperoleh informasi bahwa koefisien Barlet dengan nilai p 0,000 serta KMO

sebesar 0,9. Jika mengacu pada kriteria Retnawati (2016a: 47) hasil pengujian

Barlet menunjukkan nilai p yang lebih kecil dari 0,01 serta koefisien KMO yang

195
lebih dari 0,05, maka kecukupan sampel untuk analisis faktor telah terpenuhi.

Lebih lanjut sebanyak 20 item menunjukkan muatan faktor masing-masing

berdasarkan indikatornya yang menunjukkan seluruh koefisien muatan faktor

lebih dari 0,4. Jika hal tersebut dikonfirmasikan dengan saran Retnawati (2016a:

64) koefisien jalur muatan faktor besarnya tidak kurang dari 0,4. Artinya semua

variabel observable memberikan sumbangan berarti untuk mengukur variabel

latennya. Hal tersebut bermakna bahwa ke-20 item pada instrumen penilaian

pelaksanaan pembelajaran (PP) penskoran parsial untuk penilai dosen telah valid

secara konstruk. Berdasarkan hasil analisis diperoleh informasi bahwa model

konstruk yang dirancang telah memenuhi Goodness of Fit Model yang

ditunjukkan oleh koefisien p-value sebesar 0,065 yang melebih cut-of value 0,05

serta koefisien RMSEA sebesar 0,027 yang lebih kecil dari cut-of value 0,08. Hal

tersebut diperoleh setelah mengkorelasikan eror antara item 8 dan item 12

terlampir pada Lampiran 3 halaman 470.

Selain data dari instrumen penilaian pelaksanaan pembelajaran (PP)

penskoran parsial untuk penilai dosen, dilakukan pula pembuktian validitas

konstruk dengan menggunakan kelompok data dari penilai guru pamong/penguji

UKIN. Berdasarkan hasil analisis diperoleh informasi bahwa koefisien Barlet

dengan nilai p 0,000 serta KMO sebesar 0,9. Jika hasil pengujian Barlet mengacu

pada kriteria Retnawati (2016a: 47) menunjukkan nilai p yang lebih kecil dari

0,01 serta koefisien KMO yang lebih dari 0,05 maka kecukupan sampel untuk

analisis faktor telah terpenuhi. Lebih lanjut sebanyak 20 item menunjukkan

muatan faktor masing-masing berdasarkan indikatornya yang ditunjukkan oleh

196
seluruh koefisien muatan faktor lebih dari 0,4. Jika hal tersebut dikonfirmasikan

dengan saran Retnawati (2016a: 64) koefisien jalur muatan faktor tidak kurang

dari 0,4. Artinya semua variabel observable memberikan sumbangan berarti untuk

mengukur variabel latennya. Hal tersebut bermakna sama seperti analisis

sebelumnya bahwa ke-20 item pada instrumen penilaian pelaksanaan

pembelajaran (PP) penskoran parsial untuk penilai guru pamong/penguji UKIN

telah valid secara konstruk. Hal lain yang dapat dijelaskan bahwa model konstruk

yang dirancang telah memenuhi Goodness of Fit Model yang ditunjukkan

koefisien p-value sebesar 0,066 yang melebih cut-of value 0,05 serta koefisien

RMSEA sebesar 0,027 yang lebih kecil dari cut-of value 0,08. Hal tersebut

diperoleh setelah mengkorelasikan error antara item 14 dan item 15 terlampir

pada Lampiran 3 halaman 471.

Berdasarkan beberapa hasil analisis yang telah dikemukakan, baik yang

berasal dari data penilaian dosen, maupun data yang berasal dari penilaian guru

pamong/penguji UKIN, maka dapat disimpulkan bahwa instrumen penilaian

pelaksanaan pembelajaran (PP) dengan penskoran parsial yang digunakan pada uji

coba I telah valid secara konstruk. Begitu pula ke-20 item instrumen tersebut telah

memenuhi aspek validitas secara konstruk.

2) Validitas Konstruk Pada Instrumen Penilaian Pelaksanaan

Pembelajaran (PP) dengan Penskoran Holistik

Seperti halnya pada penskoran parsial, hasil pembuktian validitas konstruk

instrumen penilaian pelaksanaan pembelajaran (PP) pada model penskoran

holistik juga dibagi atas dua kelompok data yaitu data dari hasil penilai dosen dan

197
data dari hasil penilai guru pamong/penguji UKIN. Hasil analisis faktor

konfirmatori dari instrumen penilaian pelaksanaan pembelajaran (PP) dengan

penskoran holistik untuk penilai dosen diperoleh informasi bahwa koefisien Barlet

dengan nilai p 0,000 serta KMO sebesar 0,9. Jika mengacu pada kriteria pengujian

Retnawati (2016a: 47) hasil pengujian Barlet menunjukkan nilai p yang lebih kecil

dari 0,01 serta koefisien KMO yang lebih dari 0,05 maka kecukupan sampel untuk

analisis faktor telah terpenuhi. Lebih lanjut sebanyak 20 item menunjukkan

muatan faktor masing-masing berdasarkan indikatornya dan menunjukkan seluruh

koefisien muatan faktor lebih dari 0,4. Jika hal tersebut dikonfirmasikan dengan

saran Retnawati (2017: 64) koefisien jalur muatan faktor akan memiliki arti

(meaningful) jika besarnya tidak kurang dari 0,4.

Hasil analisis menunjukkan bahwa semua variabel observable memberikan

sumbangan berarti untuk mengukur variabel latennya. Hal tersebut bermakna

bahwa ke-20 item pada instrumen penilaian pelaksanaan pembelajaran (PP)

penskoran holistik untuk penilai dosen telah valid secara konstruk. Hal lain yang

dapat dijelaskan bahwa model konstruk yang dirancang telah memenuhi Goodness

of Fit Model yang ditunjukkan koefisien p-value sebesar 0,11 melebih cut-of value

0,05 serta koefisien RMSEA sebesar 0,024 yang lebih kecil dari cut-of value 0,08.

Hal tersebut diperoleh setelah mengkorelasikan error antara item 7 dan item 10

serta item 14 dan item 15 terlampir pada Lampiran 3 halaman 468.

Berdasarkan hasil analisis faktor konfirmatori dari instrumen penilaian

pelaksanaan pembelajaran (PP) penskoran holistik untuk penilai guru

pamong/penguji UKIN diperoleh informasi bahwa koefisien Barlet dengan nilai p

198
0,000 serta KMO sebesar 0,9. Jika mengacu pada kriteria pengujian Retnawati

(2016a: 47) bahwa nilai p yang lebih kecil dari 0,01 serta koefisien KMO yang

lebih dari 0,05 maka kecukupan sampel untuk analisis faktor telah terpenuhi.

Lebih lanjut sebanyak 20 item menunjukkan muatan faktor masing-masing

berdasarkan indikatornya dan seluruh koefisien muatan faktor lebih dari 0,4. Jika

hal tersebut dikonfirmasikan dengan kriteria Retnawati (2016a: 64) koefisien jalur

muatan faktor tidak kurang dari 0,4 menunjukkan semua variabel observable

memberikan sumbangan berarti untuk mengukur variabel latennya. Hal tersebut

bermakna sama seperti analisis sebelumnya bahwa ke-20 item pada instrumen

penilaian pelaksanaan pembelajaran (PP) penskoran holistik untuk penilai guru

pamong/penguji UKIN telah valid secara konstruk. Hal lain yang dapat dijelaskan

bahwa model konstruk yang dirancang telah memenuhi Goodness of Fit Model

yang ditunjukkan melalui koefisien p-value sebesar 0,07 melebihi cut-of value

0,05 serta koefisien RMSEA sebesar 0,026 yang lebih kecil dari cut-of value 0,08.

Hal tersebut diperoleh setelah mengkorelasikan eror antara item 7 dan 10 serta

item 8 dan item 12 sebagaimana terlampir pada Lampiran 3 halaman 469.

Berdasarkan beberapa hasil analisis yang telah dikemukakan, baik yang

berasal dari data penilaian dosen, maupun data yang berasal dari penilaian guru

pamong/penguji UKIN, maka dapat disimpulkan bahwa instrumen penilaian

pelaksanaan pembelajaran (PP) dengan penskoran holistik yang digunakan pada

uji coba I telah valid secara konstruk. Begitu pula ke-20 item instrumen tersebut

telah memenuhi aspek validitas secara konstruk.

199
c. Validitas Konstruk Instrumen Kompetensi Sosial dan Kompetensi

Kepribadian (KSKK)

Instrumen penilaian kompetensi sosial dan kompetensi kepribadian

(KSKK) diukur melalui empat indikator dengan sebaran item sebanyak 20 item.

Seperti halnya pembuktian validitas konstruk pada instrumen penilaian RPP dan

pelaksanaan pembelajaran, penyajian hasil pembuktian validitas konstruk

instrumen penilaian kompetensi sosial dan kompetensi kepribadian (KSKK)

dikelompokkan berdasarkan data penilaian dengan penskoran parsial dan holistik.

1) Kompetensi Kepribadian (KSKK) dengan Penskoran Parsial

Berdasarkan hasil analisis faktor konfirmatori dari instrumen penilaian

kompetensi sosial dan kompetensi kepribadian (KSKK) dengan penskoran parsial

untuk penilai dosen, diperoleh informasi bahwa koefisien Barlet dengan nilai p

0,000 serta KMO sebesar 0,9. Jika mengacu pada kriteria pengujian Retnawati

(2016a: 47) bahwa nilai p yang lebih kecil dari 0,01 serta koefisien KMO yang

lebih dari 0,05 maka kecukupan sampel untuk analisis faktor telah terpenuhi.

Lebih lanjut sebanyak 20 item menunjukkan muatan faktor masing-masing

berdasarkan indikatornya dan seluruh koefisien muatan faktor lebih dari 0,4. Jika

hasil tersebut dikonfirmasikan dengan kriteria Retnawati (2016a: 64) koefisien

jalur muatan faktor tidak kurang dari 0,4 menunjukkan bahwa semua variabel

observable memberikan sumbangan berarti untuk mengukur variabel latennya.

Hal tersebut bermakna bahwa ke-20 item pada instrumen penilaian kompetensi

sosial dan kompetensi kepribadian (KSKK) penskoran parsial untuk penilai dosen

telah valid secara konstruk. Hal lain yang dapat dijelaskan dari hasil analisis

200
Goodness of Fit Model diperoleh informasi bahwa model konstruk yang dirancang

telah memenuhi Goodness of Fit Model. Hal ini ditunjukkan melalui koefisien p-

value sebesar 0,071 yang melebih cut-of value 0,05 serta koefisien RMSEA

sebesar 0,027 yang lebih kecil dari cut-of value 0,08. Hal tersebut diperoleh

setelah mengkorelasikan eror antara item 2 dan item 14, item 5 dan item 20, serta

item 12 dan item 15 sebagaimana terlampir pada Lampiran 3 halaman 474.

Berdasarkan hasil analisis faktor konfirmatori dari instrumen penilaian

kompetensi sosial dan kompetensi kepribadian (KSKK) penskoran parsial untuk

penilai guru pamong/penguji UKIN, diperoleh informasi bahwa koefisien Barlet

dengan nilai p 0,000 serta KMO sebesar 0,9. Jika mengacu pada kriteria pengujian

Retnawati (2016a: 47) bahwa nilai p yang lebih kecil dari 0,01 serta koefisien

KMO yang lebih dari 0,05 maka kecukupan sampel untuk analisis faktor telah

terpenuhi. Lebih lanjut sebanyak 20 item menunjukkan muatan faktor masing-

masing berdasarkan indikatornya dan seluruh koefisien muatan faktor lebih dari

0,4. Jika dikonfirmasikan dengan saran Retnawati (2017: 64) koefisien jalur

besarnya tidak kurang dari 0,4 menunjukkan semua variabel observable

memberikan sumbangan berarti untuk mengukur variabel latennya. Hal tersebut

bermakna sama seperti analisis sebelumnya bahwa ke-20 item pada instrumen

penilaian kompetensi sosial dan kompetensi kepribadian (KSKK) penskoran

parsial untuk penilai guru pamong/penguji UKIN telah valid secara konstruk. Hal

lain yang dapat dijelaskan bahwa model konstruk yang dirancang telah memenuhi

Goodness of Fit Model yang ditunjukkan melalui koefisien p-value sebesar 0,14

melebihi cut-of value 0,05 serta koefisien RMSEA sebesar 0,022 yang lebih kecil

201
dari cut-of value 0,08. Hal tersebut diperoleh setelah mengkorelasikan error

antara item 2 dan item 14 serta item 5 dan item 20 sebagaimana terlampir pada

Lampiran 3 halaman 475.

Berdasarkan beberapa hasil analisis yang telah dikemukakan, baik yang

berasal dari data penilaian dosen, maupun data yang berasal dari penilaian guru

pamong/penguji UKIN, maka dapat disimpulkan bahwa instrumen penilaian

kompetensi sosial dan kompetensi kepribadian (KSKK) dengan penskoran parsial

yang digunakan pada uji coba I telah valid secara konstruk. Begitu pula ke-20

item instrumen tersebut telah memenuhi aspek validitas secara konstruk.

2) Validitas Konstruk Pada Instrumen Kompetensi Sosial dan Kompetensi

Kepribadian (KSKK) dengan Penskoran Holistik

Berdasarkan hasil analisis faktor konfirmatori dari instrumen penilaian

kompetensi sosial dan kompetensi kepribadian (KSKK) dengan penskoran holistik

untuk penilai dosen, diperoleh informasi bahwa koefisien Barlet dengan nilai p

0,000 serta KMO sebesar 0,9. Jika mengacu pada kriteria pengujian Retnawati

(2016a: 47) bahwa nilai p yang lebih kecil dari 0,01 serta koefisien KMO yang

lebih dari 0,05 maka kecukupan sampel untuk analisis faktor telah terpenuhi.

Lebih lanjut sebanyak 20 item menunjukkan muatan faktor masing-masing

berdasarkan indikatornya dan seluruh koefisien muatan faktor lebih dari 0,4. Jika

dikonfirmasikan dengan saran Retnawati (2017: 64) koefisien jalur besarnya tidak

kurang dari 0,4 sehingga hasil analisis menunjukkan semua variabel observable

memberikan sumbangan berarti untuk mengukur variabel latennya. Hal tersebut

bermakna bahwa ke-20 item pada instrumen penilaian kompetensi sosial dan

202
kompetensi kepribadian (KSKK) penskoran holistik untuk penilai dosen telah

valid secara konstruk. Hal lain yang dapat dijelaskan bahwa model konstruk yang

dirancang telah memenuhi Goodness of Fit Model yang ditunjukkan melalui

koefisien p-value sebesar 0,14 yang melebihi cut-of value 0,05 serta koefisien

RMSEA sebesar 0,023 yang lebih kecil dari cut-of value 0,08. Hal tersebut

diperoleh setelah mengkorelasikan error antara item 2 dan item 14 serta item 5

dan item 20 sebagaimana terlampir pada Lampiran 3 halaman 476.

Berdasarkan hasil analisis faktor konfirmatori dari instrumen penilaian

kompetensi sosial dan kompetensi kepribadian (KSKK) penskoran holistik untuk

penilai guru pamong/penguji UKIN, diperoleh informasi bahwa sebanyak 20 item

menunjukkan muatan faktor masing-masing berdasarkan indikatornya dan seluruh

koefisien muatan faktor lebih dari 0,4. Jika dikonfirmasikan dengan saran

Retnawati (2017: 64) koefisien jalur besarnya tidak kurang dari 0,4, maka hasil

analisis menunjukkan semua variabel observable memberikan sumbangan berarti

untuk mengukur variabel latennya. Hal tersebut bermakna sama seperti analisis

sebelumnya bahwa ke-20 item pada instrumen penilaian kompetensi sosial dan

kompetensi kepribadian (KSKK) penskoran holistik untuk penilai guru

pamong/penguji UKIN telah valid secara konstruk. Hal lain yang dapat dijelaskan

bahwa model konstruk yang dirancang telah memenuhi Goodness of Fit Model

yang ditunjukkan melalui koefisien p-value sebesar 0,28 yang melebihi cut-of

value 0,05 serta koefisien RMSEA sebesar 0,016 yang lebih kecil dari cut-of value

0,08. Hal tersebut diperoleh setelah mengkorelasikan error antara item 10 dan

203
item 15, item 11 dan item13 serta item 11 dan item 16 terlampir pada Lampiran 3

halaman 476.

Berdasarkan beberapa hasil analisis yang telah dikemukakan, baik yang

berasal dari data penilaian dosen, maupun data yang berasal dari penilaian guru

pamong/penguji UKIN, maka dapat disimpulkan bahwa instrumen penilaian

kompetensi sosial dan kompetensi kepribadian (KSKK) dengan penskoran holistik

yang digunakan pada uji coba I telah valid secara konstruk. Begitu pula ke-20

item instrumen tersebut telah memenuhi aspek validitas secara konstruk.

2. Reliabilitas Instrumen

Selain hasil pembuktian validitas konstruk melalui analisis faktor

konfirmatori, pada uji coba I ini juga dilakukan estimasi reliabilitas instrumen

untuk melihat keajegan instrumen model penilaian PPG yang telah dikembangkan

dalam menjelaskan konstruk ukur untuk semua komponen instrumen. Estimasi

reliabilitas instrumen untuk komponen dimaksud diuraikan sebagai berikut.

a. Reliabilitas Instrumen Penilaian RPP

Reliabilitas instrumen penilaian RPP dibagi menjadi empat kelompok data,

yaitu instrumen penilaian RPP dengan penskoran parsial untuk penilai dosen,

penilai guru pamong/penguji UKIN, instrumen penilaian RPP dengan penskoran

holistik untuk penilai dosen, dan penilai guru pamong/penguji UKIN. Uraian

keempat kelompok data tersebut dikemukakan sebagai berikut.

1) Reliabilitas Instrumen Penilaian RPP Penskoran Parsial Penilai Dosen

Reliabilitas instrumen penilaian rencana pelaksanaan pembelajaran (RPP)

penskoran parsial untuk penilai dosen dianalisis menggunakan reliabilitas 

204
koefisien muatan faktor untuk semua variabel observasi terhadap variabel

latennya sebagaimana terlampir pada Lampiran 4 halaman 478.

Tabel 15. Muatan Faktor Variabel Observasi pada Instrumen Penilaian


RPP Penskoran Parsial Penilai Dosen

Item i i 2 1  i
2

A1 0,76 0,5776 0,4224


A2 0,74 0,5476 0,4524
A3 0,75 0,5625 0,4375
A4 0,72 0,5184 0,4816
A5 0,77 0,5929 0,4071
A6 0,77 0,5929 0,4071
B7 0,84 0,7056 0,2944
B8 0,75 0,5625 0,4375
B9 0,77 0,5929 0,4071
B10 0,80 0,6400 0,3600
B11 0,70 0,4900 0,5100
B12 0,78 0,6084 0,3916
C13 0,72 0,5184 0,4816
C14 0,78 0,6084 0,3916
C15 0,76 0,5776 0,4224
C16 0,74 0,5476 0,4524
C17 0,73 0,5329 0,4671
C18 0,83 0,6889 0,3111
D19 0,81 0,6561 0,3439
D20 0,78 0,6084 0,3916
D21 0,82 0,6724 0,3276
D22 0,85 0,7225 0,2775
D23 0,78 0,6084 0,3916
D24 0,80 0,6400 0,3600
D25 0,80 0,6400 0,3600
∑ 19,35 9,98

Tabel 15 menunjukkan informasi tentang muatan faktor valiabel observasi

atau item instrumen penilaian RPP penskoran parsial untuk penilai dosen serta

koefisien muatan faktor yang dikuadratkan. Hal ini digunakan untuk melakukan

i
perhitungan koefisien reliabilitas  . Pada tabel tersebut dapat diketahui 
i 1
i

205
i

1  
2
sebesar 19,35, serta i sebasar 9,98. Hasil perhitungan reliabilitas
i 1

diperoleh koefisien omega (  ) yang menunjukkan koefisien reliabilitas instrumen

sebesar 0,97. Jika didasari pada pendapat Mehrens and Lehmann (1973) dan

Retnawati (2016a: 87) menyatakan untuk dapat diterima koefisien reliabilitas

harus memiliki kriteria minimal sebesar 0,85. Dengan demikian dapat

disimpulkan bahwa instrumen penilaian RPP dengan penskoran parsial untuk

penilai dosen reliabel.

2) Reliabilitas Instrumen Penilaian RPP Penskoran Parsial untuk Penilai

Guru pamong/penguji UKIN

Hasil analisis reliabilitas instrumen penilaian rencana pelaksanaan

pembelajaran (RPP) dengan penskoran parsial untuk penilai guru pamong/penguji

UKIN juga dianalisis menggunakan reliabilitas  dengan koefisien muatan faktor

untuk semua variabel observasi terhadap variabel latennya sebagaimana terlampir

pada Lampiran 4 halaman 484 disajikan pada Tabel 16 berikut.

206
Tabel 16. Muatan Faktor Variabel Observasi pada Instrumen Penilaian
RPP Penskoran Parsial Penilai Guru pamong/penguji UKIN

Item i i 2 1  i
2

A1 0,76 0,5776 0,4224


A2 0,74 0,5476 0,4524
A3 0,75 0,5625 0,4375
A4 0,72 0,5184 0,4816
A5 0,77 0,5929 0,4071
A6 0,76 0,5776 0,4224
B7 0,84 0,7056 0,2944
B8 0,75 0,5625 0,4375
B9 0,77 0,5929 0,4071
B10 0,79 0,6241 0,3759
B11 0,78 0,6084 0,3916
B12 0,77 0,5929 0,4071
C13 0,72 0,5184 0,4816
C14 0,77 0,5929 0,4071
C15 0,76 0,5776 0,4224
C16 0,74 0,5476 0,4524
C17 0,73 0,5329 0,4671
C18 0,82 0,6724 0,3276
D19 0,81 0,6561 0,3439
D20 0,77 0,5929 0,4071
D21 0,83 0,6889 0,3111
D22 0,84 0,7056 0,2944
D23 0,79 0,6241 0,3759
D24 0,80 0,6400 0,3600
D25 0,78 0,6084 0,3916
∑ 19,36 9,9792

Tabel 16 menunjukkan informasi tentang muatan faktor valiabel observasi

serta koefisien muatan faktor yang dikuadratkan. Hasil perhitungan reliabilitas

diperoleh koefisien omega (  )sebesar 0,97. Jika didasari pada kriteria minimal

koefisien reliabilitas sebesar 0,85 yang disarankan oleh Mehrens and Lehmann

(1973) dan Retnawati (2016a: 87) dapat disimpulkan bahwa instrumen penilaian

RPP dengan penskoran parsial untuk penilai guru pamong/penguji UKIN reliabel.

207
3) Reliabilitas Instrumen Penilaian RPP Penskoran Holistik Penilai Dosen

Reliabilitas instrumen penilaian rencana pelaksanaan pembelajaran (RPP)

penskoran holistik penilai dosen sebagaimana terlampir pada Lampiran 4 halaman

481, diperoleh hasil analisis reliabilitas seperti tersaji pada Tabel 17.

Tabel 17. Muatan Faktor Variabel Observasi pada Instrumen Penilaian


RPP Penskoran Holistik untuk Penilai Dosen

Item i i 2 1  i
2

A1 0,65 0,4225 0,5775


A2 0,60 0,3600 0,6400
A3 0,60 0,3600 0,6400
A4 0,55 0,3025 0,6975
A5 0,61 0,3721 0,6279
A6 0,63 0,3969 0,6031
B7 0,72 0,5184 0,4816
B8 0,58 0,3364 0,6636
B9 0,62 0,3844 0,6156
B10 0,68 0,4624 0,5376
B11 0,55 0,3025 0,6975
B12 0,62 0,3844 0,6156
C13 0,57 0,3249 0,6751
C14 0,61 0,3721 0,6279
C15 0,61 0,3721 0,6279
C16 0,61 0,3721 0,6279
C17 0,59 0,3481 0,6519
C18 0,72 0,5184 0,4816
D19 0,85 0,7225 0,2775
D20 0,79 0,6241 0,3759
D21 0,82 0,6724 0,3276
D22 0,83 0,6889 0,3111
D23 0,76 0,5776 0,4224
D24 0,82 0,6724 0,3276
D25 0,78 0,6084 0,3916
∑ 16,77 13,52

Berdasarkan Tabel 17 diperoleh informasi koefisien muatan faktor serta

koefisien muatan faktor yang dikuadratkan. Hasil perhitungan reliabilitas

diperoleh koefisien omega (  ) sebesar 0,95. Jika didasari pada kriteria minimal

koefisien reliabilitas sebesar 0,85 yang disarankan oleh Mehrens and Lehmann

208
(1973) dan Retnawati (2016a: 87) dapat disimpulkan bahwa instrumen penilaian

RPP penskoran holistik untuk penilai dosen reliabel.

4) Reliabilitas Instrumen Penilaian RPP Penskoran Holistik untuk Penilai

Guru pamong/penguji UKIN

Reliabilitas instrumen penilaian rencana RPP penskoran holistik untuk

penilai guru pamong/penguji UKIN diperoleh hasil analisis sebagaimana disajikan

pada Tabel 18.

Tabel 18. Muatan Faktor Variabel Observasi pada Instrumen Penilaian


RPP Penskoran Holistik Penilai Guru pamong/penguji UKIN

Item i i 2 1  i
2

A1 0,66 0,4356 0,5644


A2 0,64 0,4096 0,5904
A3 0,64 0,4096 0,5904
A4 0,60 0,3600 0,6400
A5 0,63 0,3969 0,6031
A6 0,59 0,3481 0,6519
B7 0,73 0,5329 0,4671
B8 0,67 0,4489 0,5511
B9 0,74 0,5476 0,4524
B10 0,63 0,3969 0,6031
B11 0,67 0,4489 0,5511
B12 0,64 0,4096 0,5904
C13 0,63 0,3969 0,6031
C14 0,64 0,4096 0,5904
C15 0,56 0,3136 0,6864
C16 0,58 0,3364 0,6636
C17 0,56 0,3136 0,6864
C18 0,71 0,5041 0,4959
D19 0,75 0,5625 0,4375
D20 0,69 0,4761 0,5239
D21 0,77 0,5929 0,4071
D22 0,66 0,4356 0,5644
D23 0,76 0,5776 0,4224
D24 0,60 0,3600 0,6400
D25 0,69 0,4761 0,5239
∑ 16,44 14,1004

209
Tabel 18 menunjukkan informasi tentang muatan faktor valiabel observasi

atau item instrumen penilaian RPP penskoran holistik untuk penilai guru

i i

 i sebesar 16,44, serta 1  


2
pamong/penguji UKIN, diketahui i sebasar
i 1 i 1

14,1. Berdasarkan hasil perhitungan reliabilitas diperoleh koefisien omega (  )

yang menunjukkan koefisien reliabilitas instrumen sebesar 0,95. Jika didasari

pada kriteria minimal koefisien reliabilitas sebesar 0,85 yang disarankan oleh

Mehrens and Lehmann (1973) dan Retnawati (2016a: 87) dapat disimpulkan

bahwa instrumen penilaian RPP penskoran holistik untuk penilai guru

pamong/penguji UKIN reliabel.

b. Reliabilitas Instrumen Penilaian Pelaksanaan Pembelajaran (PP)

Seperti halnya pada reliabilitas instrumen penilaian RPP, pada reliabilitas

instrumen penilaian pelaksanaan pembelajaran (PP) juga dikelompokkan

berdasarkan model penskoran untuk penilai dosen dan penilai guru

pamong/penguji UKIN dengan deskripsi sebagai berikut.

a) Reliabilitas Instrumen Penilaian Pelaksanaan Pembelajaran (PP)

Penskoran Parsial untuk Penilai Dosen

Reliabilitas instrumen penilaian pelaksanaan pembelajaran (PP) penskoran

parsial untuk penilai dosen juga dianalisis menggunakan pendekatan Reliabilitas

 dengan koefisien muatan faktor untuk semua variabel observasi terhadap

variabel latennya sebagaimana terlampir pada Lampiran 4 halaman 479. Berikut

ini disajikan hasil analisisnya pada Tabel 19:

210
Tabel 19. Muatan Faktor Variabel Observasi pada Instrumen Penilaian
Pelaksanaan Pembelajaran (PP) Penskoran Parsial Penilai Dosen

Item i i 2 1  i
2

A1 0,75 0,5625 0,4375


A2 0,76 0,5776 0,4224
A3 0,80 0,6400 0,3600
A4 0,80 0,6400 0,3600
B5 0,77 0,5929 0,4071
B6 0,77 0,5929 0,4071
B7 0,75 0,5625 0,4375
B8 0,82 0,6724 0,3276
B9 0,78 0,6084 0,3916
B10 0,78 0,6084 0,3916
B11 0,70 0,4900 0,5100
C12 0,76 0,5776 0,4224
C13 0,81 0,6561 0,3439
C14 0,81 0,6561 0,3439
C15 0,82 0,6724 0,3276
D16 0,79 0,6241 0,3759
D17 0,76 0,5776 0,4224
D18 0,79 0,6241 0,3759
D19 0,77 0,5929 0,4071
D20 0,78 0,6084 0,3916
∑ 15,57 7,8631

Berdasarkan Tabel 19 diperoleh hasil perhitungan reliabilitas koefisien

omega (  ) yang menunjukkan koefisien reliabilitas instrumen sebesar 0,96. Jika

didasari pada kriteria minimal koefisien reliabilitas sebesar 0,85 yang disarankan

oleh Mehrens and Lehmann (1973) dan Retnawati (2016a: 87) dapat disimpulkan

bahwa instrumen instrumen penilaian pelaksanaan pembelajaran (PP) penskoran

parsial untuk penilai dosen reliabel.

211
b) Reliabilitas Instrumen Penilaian Pelaksanaan Pembelajaran (PP)

Penskoran Parsial untuk Penilai Guru pamong/penguji UKIN

Berikut ini disajikan hasil analisis reliabilitas instrumen penilaian

pelaksanaan pembelajaran (PP) penskoran parsial untuk penilai guru

pamong/penguji UKIN sebagaimana terlampir pada Lampiran 4 halaman 485.

Tabel 20. Muatan Faktor Variabel Observasi pada Instrumen Penilaian


Pelaksanaan Pembelajaran (PP) Penskoran Parsial Penilai Guru
Pamong/Penguji UKIN

Item i i 2 1  i
2

A1 0,75 0,5625 0,4375


A2 0,75 0,5625 0,4375
A3 0,79 0,6241 0,3759
A4 0,79 0,6241 0,3759
B5 0,77 0,5929 0,4071
B6 0,77 0,5929 0,4071
B7 0,75 0,5625 0,4375
B8 0,81 0,6561 0,3439
B9 0,78 0,6084 0,3916
B10 0,78 0,6084 0,3916
B11 0,70 0,4900 0,5100
C12 0,77 0,5929 0,4071
C13 0,82 0,6724 0,3276
C14 0,82 0,6724 0,3276
C15 0,82 0,6724 0,3276
D16 0,77 0,5929 0,4071
D17 0,75 0,5625 0,4375
D18 0,78 0,6084 0,3916
D19 0,77 0,5929 0,4071
D20 0,78 0,6084 0,3916
∑ 15,52 7,9404

Berdasarkan Tabel 20 diperoleh hasil perhitungan reliabilitas koefisien

omega (  ) yang menunjukkan koefisien reliabilitas instrumen sebesar 0,96. Jika

didasari pada kriteria minimal koefisien reliabilitas sebesar 0,85 yang disarankan

oleh Mehrens and Lehmann (1973) dan Retnawati (2016a: 87) dapat disimpulkan

212
bahwa instrumen penilaian pelaksanaan pembelajaran (PP) penskoran parsial

untuk penilai guru pamong/penguji UKIN reliabel.

c) Reliabilitas Instrumen Penilaian Pelaksanaan Pembelajaran (PP)

Penskoran Holistik untuk Penilai Dosen

Berikut ini disajikan hasil analisis reliabilitas instrumen penilaian

pelaksanaan pembelajaran (PP) penskoran holistik untuk penilai dosen

sebagaimana terlampir pada Lampiran 4 halaman 482.

Tabel 21. Muatan Faktor Variabel Observasi pada Instrumen Penilaian


Pelaksanaan Pembelajaran (PP) Penskoran Holistik Penilai Dosen

Item i i 2 1  i
2

A1 0,75 0,5625 0,4375


A2 0,77 0,5929 0,4071
A3 0,81 0,6561 0,3439
A4 0,80 0,6400 0,3600
B5 0,79 0,6241 0,3759
B6 0,78 0,6084 0,3916
B7 0,80 0,6400 0,3600
B8 0,81 0,6561 0,3439
B9 0,78 0,6084 0,3916
B10 0,77 0,5929 0,4071
B11 0,77 0,5929 0,4071
C12 0,78 0,6084 0,3916
C13 0,81 0,6561 0,3439
C14 0,81 0,6561 0,3439
C15 0,83 0,6889 0,3111
D16 0,80 0,6400 0,3600
D17 0,75 0,5625 0,4375
D18 0,77 0,5929 0,4071
D19 0,78 0,6084 0,3916
D20 0,78 0,6084 0,3916
∑ 15,74 7,604

Berdasarkan Tabel 21 diperoleh hasil perhitungan reliabilitas koefisien

omega (  ) yang menunjukkan koefisien reliabilitas instrumen sebesar 0,97. Jika

213
didasari pada kriteria minimal koefisien reliabilitas sebesar 0,85 yang disarankan

oleh Mehrens and Lehmann (1973) dan Retnawati (2016a: 87) dapat disimpulkan

bahwa instrumen penilaian pelaksanaan pembelajaran (PP) penskoran holistik

untuk penilai dosen reliabel.

d) Reliabilitas Instrumen Penilaian Pelaksanaan Pembelajaran (PP)

Penskoran Holistik untuk Penilai Guru pamong/penguji UKIN

Berikut ini disajikan hasil analisis reliabilitas instrumen penilaian

pelaksanaan pembelajaran (PP) dengan penskoran holistik untuk penilai guru

pamong/penguji UKIN sebagaimana terlampir pada Lampiran 4 halaman 488.

Tabel 22. Muatan Faktor Variabel Observasi pada Instrumen Penilaian


Pelaksanaan Pembelajaran (PP) Penskoran Holistik untuk Penilai
Guru pamong/penguji UKIN

Item i i 2 1  i
2

A1 0,75 0,5625 0,4375


A2 0,77 0,5929 0,4071
A3 0,81 0,6561 0,3439
A4 0,80 0,6400 0,3600
B5 0,79 0,6241 0,3759
B6 0,78 0,6084 0,3916
B7 0,80 0,6400 0,3600
B8 0,81 0,6561 0,3439
B9 0,78 0,6084 0,3916
B10 0,77 0,5929 0,4071
B11 0,76 0,5776 0,4224
C12 0,79 0,6241 0,3759
C13 0,80 0,6400 0,3600
C14 0,78 0,6084 0,3916
C15 0,80 0,6400 0,3600
D16 0,79 0,6241 0,3759
D17 0,76 0,5776 0,4224
D18 0,77 0,5929 0,4071
D19 0,78 0,6084 0,3916
D20 0,78 0,6084 0,3916
∑ 15,67 7,7171

214
Berdasarkan Tabel 22 diperoleh hasil perhitungan reliabilitas koefisien

omega (  ) yang menunjukkan koefisien reliabilitas instrumen sebesar sebesar

0,96. Jika didasari pada kriteria minimal koefisien reliabilitas sebesar 0,85 yang

disarankan oleh Mehrens and Lehmann (1973) dan Retnawati (2016a: 87) dapat

disimpulkan bahwa instrumen penilaian pelaksanaan pembelajaran (PP)

penskoran holistik untuk penilai guru pamong/penguji UKIN reliabel.

c. Reliabilitas Instrumen Penilaian Kompetensi Sosial dan Kompetensi

Kepribadian

Reliabilitas instrumen penilaian penilaian kompetensi sosial dan

kompetensi kepribadian (KSKK) juga dibagi menjadi empat kelompok data. Data

pertama adalah instrumen penilaian KSKK dengan penskoran parsial untuk

penilai dosen. Data kedua adalah instrumen penilaian KSKK dengan penskoran

parsial untuk penilai guru pamong/penguji UKIN. Data ketiga adalah instrumen

penilaian KSKK dengan penskoran holistik untuk penilai dosen, dan data keempat

adalah instrumen penilaian KSKK dengan penskoran holistik untuk penilai guru

pamong/penguji UKIN. Uraian dari keempat kelompok data tersebut

dikemukakan sebagai berikut.

a) Reliabilitas Instrumen Penilaian Kompetensi Sosial dan Kompetensi

Kepribadian Penskoran Parsial untuk Penilai Dosen

Berikut ini disajikan hasil analisis reliabilitas instrumen penilaian

kompetensi sosial dan kompetensi kepribadian (KSKK) penskoran parsial untuk

penilai dosen pada Tabel 23:

215
Tabel 23. Muatan Faktor Variabel Observasi pada Instrumen Penilaian
KSKK Penskoran Parsial Penilai Dosen

Item i i 2 1  i
2

A1 0,70 0,4900 0,5100


A2 0,78 0,6084 0,3916
A3 0,73 0,5329 0,4671
A4 0,75 0,5625 0,4375
A5 0,81 0,6561 0,3439
B6 0,76 0,5776 0,4224
B7 0,82 0,6724 0,3276
B8 0,85 0,7225 0,2775
B9 0,76 0,5776 0,4224
B10 0,81 0,6561 0,3439
C11 0,79 0,6241 0,3759
C12 0,69 0,4761 0,5239
C13 0,79 0,6241 0,3759
C14 0,83 0,6889 0,3111
C15 0,72 0,5184 0,4816
D16 0,75 0,5625 0,4375
D17 0,75 0,5625 0,4375
D18 0,72 0,5184 0,4816
D19 0,76 0,5776 0,4224
D20 0,77 0,5929 0,4071
∑ 15,34 8,1984

Berdasarkan Tabel 23 diperoleh hasil perhitungan reliabilitas koefisien

omega (  ) yang menunjukkan koefisien reliabilitas instrumen sebesar 0,96. Jika

didasari pada kriteria minimal koefisien reliabilitas sebesar 0,85 yang disarankan

oleh Mehrens and Lehmann (1973) dan Retnawati (2016a: 87) dapat disimpulkan

bahwa instrumen penilaian kompetensi sosial dan kompetensi kepribadian

penskoran parsial untuk penilai dosen reliabel.

216
b) Reliabilitas Instrumen Penilaian Kompetensi Sosial dan Kompetensi

Kepribadian Penskoran Parsial Penilai Guru pamong/penguji UKIN

Berikut ini disajikan hasil analisis reliabilitas instrumen penilaian

kompetensi sosial dan kompetensi kepribadian penskoran parsial (KSKK) untuk

penilai guru pamong/penguji UKIN sebagaimana terlampir pada Lampiran 4

halaman 486.

Tabel 24. Muatan Faktor Variabel Observasi pada Instrumen Penilaian


KSKK Penskoran Parsial Penilai Guru pamong/penguji UKIN

Item i i 2 1  i
2

A1 0,70 0,4900 0,5100


A2 0,78 0,6084 0,3916
A3 0,74 0,5476 0,4524
A4 0,74 0,5476 0,4524
A5 0,82 0,6724 0,3276
B6 0,76 0,5776 0,4224
B7 0,82 0,6724 0,3276
B8 0,86 0,7396 0,2604
B9 0,77 0,5929 0,4071
B10 0,82 0,6724 0,3276
C11 0,78 0,6084 0,3916
C12 0,71 0,5041 0,4959
C13 0,78 0,6084 0,3916
C14 0,83 0,6889 0,3111
C15 0,74 0,5476 0,4524
D16 0,74 0,5476 0,4524
D17 0,73 0,5329 0,4671
D18 0,72 0,5184 0,4816
D19 0,76 0,5776 0,4224
D20 0,77 0,5929 0,4071
∑ 15,37 8,1523

Berdasarkan Tabel 24 diperoleh hasil perhitungan reliabilitas koefisien

omega (  ) yang menunjukkan koefisien reliabilitas instrumen sebesar 0,96. Jika

didasari pada kriteria minimal koefisien reliabilitas sebesar 0,85 yang disarankan

217
oleh Mehrens and Lehmann (1973) dan Retnawati (2016a: 87) dapat disimpulkan

bahwa instrumen penilaian kompetensi sosial dan kompetensi kepribadian

(KSKK) penskoran parsial untuk penilai guru pamong/penguji UKIN reliabel.

c) Reliabilitas Instrumen Penilaian Kompetensi Sosial dan Kompetensi

Kepribadian Penskoran Holistik untuk Penilai Dosen

Hasil analisis reliabilitas instrumen penilaian kompetensi sosial dan

kompetensi kepribadian (KSKK) penskoran holistik untuk penilai dosen

sebagaimana terlampir pada Lampiran 4 halaman 483 disajikan pada Tabel 25.

Tabel 25. Muatan Faktor Variabel Observasi pada Instrumen Penilaian


KSKK Penskoran Holistik untuk Penilai Dosen

Item i i 2 1  i
2

A1 0,54 0,2916 0,7084


A2 0,63 0,3969 0,6031
A3 0,6 0,36 0,64
A4 0,59 0,3481 0,6519
A5 0,72 0,5184 0,4816
B6 0,78 0,6084 0,3916
B7 0,81 0,6561 0,3439
B8 0,84 0,7056 0,2944
B9 0,75 0,5625 0,4375
B10 0,83 0,6889 0,3111
C11 0,67 0,4489 0,5511
C12 0,57 0,3249 0,6751
C13 0,63 0,3969 0,6031
C14 0,72 0,5184 0,4816
C15 0,59 0,3481 0,6519
D16 0,61 0,3721 0,6279
D17 0,59 0,3481 0,6519
D18 0,54 0,2916 0,7084
D19 0,61 0,3721 0,6279
D20 0,63 0,3969 0,6031
∑ 13,25 11,0455

Berdasarkan Tabel 25 diperoleh hasil perhitungan reliabilitas koefisien

omega (  ) yang menunjukkan koefisien reliabilitas instrumen sebesar 0,94. Jika

218
didasari pada kriteria minimal koefisien reliabilitas sebesar 0,85 yang disarankan

oleh Mehrens and Lehmann (1973) dan Retnawati (2016a: 87) dapat disimpulkan

bahwa instrumen penilaian kompetensi sosial dan kompetensi kepribadian

(KSKK) penskoran holistik untuk penilai dosen reliabel.

d) Reliabilitas Instrumen Penilaian Kompetensi Sosial dan Kompetensi

Kepribadian Penskoran Holistik Penilai Guru pamong/penguji UKIN

Hasil analisis reliabilitas instrumen penilaian KSKK penskoran holistik

untuk penilai guru pamong/penguji UKIN sebagaimana terlampir pada Lampiran

4 halaman 489 disajikan pada Tabel 26 sebagai berikut.

Tabel 26. Muatan Faktor Variabel Observasi pada Instrumen Penilaian


KSKK Penskoran Holistik Penilai Guru pamong/penguji UKIN

Item i i 2 1  i
2

A1 0,54 0,2916 0,7084


A2 0,60 0,3600 0,6400
A3 0,58 0,3364 0,6636
A4 0,63 0,3969 0,6031
A5 0,74 0,5476 0,4524
B6 0,68 0,4624 0,5376
B7 0,76 0,5776 0,4224
B8 0,72 0,5184 0,4816
B9 0,68 0,4624 0,5376
B10 0,79 0,6241 0,3759
C11 0,73 0,5329 0,4671
C12 0,51 0,2601 0,7399
C13 0,55 0,3025 0,6975
C14 0,52 0,2704 0,7296
C15 0,59 0,3481 0,6519
D16 0,58 0,3364 0,6636
D17 0,53 0,2809 0,7191
D18 0,51 0,2601 0,7399
D19 0,64 0,4096 0,5904
D20 0,74 0,5476 0,4524
∑ 12,62 11,874

219
Berdasarkan Tabel 26 diperoleh hasil perhitungan reliabilitas koefisien

omega (  ) yang menunjukkan koefisien reliabilitas instrumen sebesar 0,93. Jika

didasari pada kriteria minimal koefisien reliabilitas sebesar 0,85 yang disarankan

oleh Mehrens and Lehmann (1973) dan Retnawati (2016a: 87) dapat disimpulkan

bahwa instrumen penilaian kompetensi sosial dan kompetensi kepribadian

(KSKK) penskoran holistik untuk penilai guru pamong/penguji UKIN reliabel.

3. Karakteristik Item Berdasarkan Politomus Item Response Theory (Uji

Coba I)

Karakteristik item merupakan salah satu fase penting dalam

pengembangan model penilaian PPG. Melalui karakterisitk item, dapat dikenali

kualitas item baik ditinjau dari aspek instrumen maupun ditinjau dari aspek

kemampuan peserta. Model penilaian PPG telah dirancang untuk penskoran

politomi dengan penskoran parsial dan instrumen dengan penskoran holistik

sehingga dalam menganalisis karakteristik itemnya digunakan pendekatan

politomus item response theory. Penskoran parsial diestimasi dengan metode

partial credit model (PCM), sedangkan penskoran holistik diestimasi dengan

metode graded response model (GRM). Selain itu setiap instrumen tersebut

memiliki dua kelompok penilai yaitu dosen dan guru pamong/penguji UKIN.

Berikut ini karakteristik item pada model penilaian PPG.

a. Karakteristik Penilaian RPP

Pada karakteristik instrumen penilaian RPP dibagi dalam kelompok data

instrumen penilaian RPP dengan penskoran parsial untuk penilai dosen dan

220
penilai guru pamong/penguji UKIN. Data instrumen penilaian RPP dengan

penskoran holistik untuk penilai dosen dan penilai guru pamong/penguji UKIN

dengan deskripsi sebagai berikut.

1) Karakteristik Penilaian RPP Penskoran Parsial Penilai Dosen

Instrumen penilaian rencana pelaksanaan pembelajaran penskoran parsial

dengan penilai dosen dianalisis menggunakan pendekatan partial credit model

(PCM) dengan penskoran 0, 1, 2, 3, dan 4. Melalui Program R dengan Extended

Rasch Modeling (eRm) package diperoleh karakteristik item pada Tabel 27.

Tabel 27. Hasil Analisis Karakteristik Item Instrumen Penilaian RPP


Penskoran Pasial untuk Penilai Dosen

Item Location Threshold ᵟ1 Threshold ᵟ2 Threshold ᵟ3 Threshold ᵟ4


A1 0,36 -0,79 -0,24 0,85 1,66
A2 0,51 -0,60 -0,37 0,92 2,12
A3 0,15 -1,82 -0,05 0,59 1,92
A4 0,26 -1,41 -0,06 1,02 1,53
A5 0,38 -1,54 0,04 0,70 2,32
A6 0,36 -1,35 0,12 0,56 2,12
B7 0,37 -1,12 0,28 0,29 2,04
B8 0,37 -1,17 -0,18 1.00 1,83
B9 0,36 -1,30 0,20 0,54 2,00
B10 0,47 -0,94 -0,08 0,71 2,22
B11 0,36 -0,67 -0,42 0,76 1,79
B12 0,45 -1,09 0,14 0,97 1,78
C13 0,58 -0,93 0,06 1,08 2,13
C14 0,50 -1,33 0,16 0,83 2,34
C15 0,53 -0,96 0,01 0,94 2,12
C16 0,44 -1,64 0,23 0,78 2,39
C17 0,47 -1,24 0,05 1,28 1,81
C18 0,43 -0,97 0,31 0,61 1,79
D19 0,71 -0,36 0,51 0,91 1,78
D20 0,51 -1,01 -0,05 1,09 2,03
D21 0,76 -0,19 0,29 1,08 1,86
D22 0,55 -0,86 0,06 1,09 1,92
D23 0,81 -0,03 0,31 0,83 2,12
D24 0,69 -0,29 0,15 0,84 2,07
D25 0,56 -0,73 0,41 0,82 1,75

221
Berdasarkan data hasil analisis yang disajikan pada Tabel 27 diperoleh

informasi bahwa parameter lokasi setiap item bervariasi dari 0,15 hingga 0,81.

Selain itu parameter threshold ᵟi sebanyak empat kelompok atau empat

perpotongan. Hal tersebut merupakan parameter tingkat kesulitan peserta

memperoleh skor tertentu ketika merespon butir i. Ditinjau dari peluang

pencapaian skornya, maka koefisien parameter threshold ᵟi untuk setiap kategori

berbeda-beda. Semakin tinggi kategori pencapaian maka semakin tinggi koefisien

threshold ᵟi.. Hal tersebut dijelaskan oleh Embretson and Reise (2000) bahwa item

location mencerminkan tentang tingkat kemudahan atau kesukaran item tersebut,

sementara threshold merupakan ambang batas antar kategori tertentu yang akan

dicapai. Hal ini berarti bahwa semakin tinggi koefisien location maka semakin

sulit item tersebut dengan sebaran threshold yang merupakan kategori tingkat

pencapaiannya. Semakin tinggi threshold maka semakin sulit dicapai ambang

batas tersebut, sehingga peserta PPG yang memiliki kemampuan rendah tentu

hanya mampu mencapai threshold (ambang kategori) yang rendah pula, peserta

yang memiliki kemampuan menengah hanya mampu mencapai threshold (ambang

kategori) yang menengah hingga pada peserta yang berkemampuan tinggi tentu

mampu mencapai kategori ambang batas yang tinggi pula.

Hal lain yang dapat dijelaskan berdasarkan hasil analisis item dengan

partial credit model adalah kurva karakteristik item. Kurva karakteristik item

digambarkan untuk memudahkan memahami hubungan antara setiap threshold ᵟi

yang merupakan tingkat kesulitan dengan kemampuan peserta untuk mencapai

skor atau kategori tertentu. Berikut ini disajikan salah satu contoh kurva

222
karakteristik item dari instrumen penilaian rencana pelaksanaan pembelajaran

(RPP) penskoran parsial untuk penilai dosen.

Gambar 25. Kurva Karakteristik Item 10 dari Instrumen Penilaian RPP


Penskoran Parsial untuk Penilai Dosen

Gambar 25 adalah salah satu contoh kurva karakteristik item dari

instrumen penilaian rencana pelaksanaan pembelajaran (RPP) penskoran parsial

untuk penilai dosen yaitu pada item 10. Jika dikaitkan dengan hasil kaliberasi item

pada Tabel 27, dapat dijelaskan bahwa pada dasarnya item 10 ini memiliki

parameter lokasi sebesar 0,47 dengan parameter threshold ᵟ1 sebesar -0,94,

threshold ᵟ2 sebesar -0,08, threshold ᵟ3 sebesar 0,71, serta threshold ᵟ4 sebesar

2,22. Secara grafis threshold ᵟi dapat diinterpretasikan sebagai perpotongan kurva

setiap kategori. Dari gambar tersebut dapat dijelaskan bahwa untuk mencapai

kategori 2 atau untuk memperoleh skor 2 pada item 10 maka diperlukan

kemampuan (  ) sekitar -0,08 hingga 0,71. Untuk lebih jelasnya kurva

karakteristik untuk semua item pada instrumen penilaian rencana pelaksanaan

pembelajaran (RPP) penskoran parsial untuk penilai dosen disajikan pada Gambar

26 berikut.

223
Gambar 26. Fungsi Informasi Instrumen RPP Penskoran Parsial Penilai Dosen

Gambar 26 menyajikan kurva fungsi informasi dari akumulasi 25 item

pada instrumen penilaian RPP penskoran parsial untuk penilai dosen. Hal lain

yang dapat dijelaskan adalah nilai fungsi informasi instrumen sebesar 17,8 pada

skala kemampuan (  ) -0,6. Jika dihubungkan dengan Standard Error of

Measurement mengacu pada pendapat Hambleton, Swaminathan & Rogers

(1991: 94); Retnawati (2014: 19) menyatakan bahwa nilai fungsi informasi (NIF)

memiliki hubungan yang berbanding terbalik dengan Standard Error of

Measurement (SEM), semakin besar nilai informasi maka SEM akan semakin

kecil atau sebaliknya, maka dapat dijelaskan bahwa dengan diketahuinya nilai

fungsi informasi sebesar 17,8, maka koefisien kesalahan pengukuran diperoleh

sebesar 0,23 yang menunjukkan nilai informasi lebih tinggi dibanding kesalahan

pengukuran sebagaimana disajikan pada Gambar 27:

224
Gambar 27. Hubungan timbal balik antara NIF dengan SEM Instrumen
Penilaian RPP Penskoran Parsial Penilai Dosen

Gambar 27 menunjukkan hubungan timbal balik antara NIF dengan SEM

dari penilaian RPP penskoran parsial yang dinilai oleh dosen. Kedua grafik fungsi

ini bertemu pada skala kemampuan -3 dan 1,9. Di antara dua kemampuan ini,

instrumen memiliki nilai informasi yang lebih tinggi dibandingkan dengan

kesalahan pengukurannya. Sebaliknya, ketika skala kemampuan kurang dari -3

dan lebih dari 1,9, maka instrumen ini memiliki kesalahan pengukuran yang lebih

besar dibandingkan dengan informasi yang diberikannya.

2) Karakteristik Penilaian RPP Penskoran Parsial Penilai Guru Pamong/

Penguji UKIN

Berikut ini disajikan karakteristik item penilaian rencana pelaksanaan

pembelajaran (RPP) penskoran parsial untuk penilai guru pamong/penguji UKIN

yang dianalisis dengan menggunakan pendekatan partial credit model (PCM)

melalui Program R dengan Extended Rasch Modeling (eRm) package pada Tabel

28 sebagai berikut.

225
Tabel 28. Hasil Analisis Karakteristik Item Instrumen Penilaian RPP
Penskoran Pasial untuk Penilai Guru pamong/penguji UKIN

Item Location Threshold ᵟ1 Threshold ᵟ2 Threshold ᵟ3 Threshold ᵟ4


A1 0,35 -0,77 -0,16 0,71 1,67
A2 0,50 -0,43 -0,39 0,91 1,94
A3 0,16 -1,73 -0,01 0,54 1,88
A4 0,27 -1,41 0,07 0,99 1,44
A5 0,37 -1,51 0,16 0,60 2,24
A6 0,36 -1,32 0,18 0,52 2,08
B7 0,34 -1,05 0,29 0,15 1,97
B8 0,33 -1,07 -0,24 0,90 1,75
B9 0,33 -1,22 0,19 0,42 1,96
B10 0,43 -0,85 -0,15 0,62 2,11
B11 0,33 -0,61 -0,43 0,64 1,74
B12 0,43 -1,06 0,18 0,87 1,75
C13 0,56 -0,94 0,17 0,95 2,08
C14 0,52 -1,11 0,17 0,70 2,35
C15 0,50 -0,95 0,11 0,81 2,04
C16 0,43 -1,59 0,31 0,64 2,36
C17 0,45 -1,24 0,17 1,14 1,72
C18 0,41 -0,96 0,38 0,54 1,70
D19 0,65 -0,32 0,46 0,78 1,70
D20 0,47 -0,95 -0,08 0,97 1,96
D21 0,71 -0,16 0,23 0,96 1,81
D22 0,51 -0,80 0,02 0,97 1,85
D23 0,75 -0,00 0,27 0,70 2,05
D24 0,64 -0,25 0,11 0,72 2,00
D25 0,51 -0,68 0,38 0,70 1,67

Berdasarkan data Tabel 28 diperoleh informasi bahwa parameter lokasi

setiap item bervariasi dari 0,16 hingga 0,71. Selain itu parameter threshold ᵟi

sebanyak empat kelompok atau empat perpotongan. Hal tersebut merupakan

parameter tingkat kesulitan peserta memperoleh skor tertentu ketika merespon

butir i. Ditinjau dari peluang pencapaian skornya, maka koefisien parameter

threshold ᵟi untuk setiap kategori berbeda-beda. Semakin tinggi kategori

pencapaian maka semakin tinggi koefisien threshold ᵟi. Hal ini berarti bahwa pada

instrumen penilaian RPP semakin tinggi koefisien location maka semakin sulit

226
item tersebut dengan sebaran threshold yang merupakan kategori tingkat

pencapaiannya. Semakin tinggi threshold maka semakin sulit dicapai ambang

batas tersebut, sehingga peserta yang memiliki kemampuan rendah tentu hanya

mampu mencapai threshold (ambang kategori) yang rendah pula, sebaliknya

peserta yang berkemampuan tinggi tentu mampu mencapai kategori ambang batas

yang tinggi pula. Untuk memudahkan memahami hubungan antara setiap

threshold ᵟi yang merupakan tingkat kesulitan dengan kemampuan peserta untuk

mencapai skor atau kategori tertentu. Berikut ini disajikan salah satu contoh kurva

karakteristik item 20 dari instrumen penilaian rencana pelaksanaan pembelajaran

(RPP) penskoran parsial untuk penilai guru pamong/penguji UKIN.

Gambar 28. Kurva Karakteristik Item 20 dari Instrumen Penilaian RPP


Penskoran Parsial untuk Penilai Guru pamong/penguji UKIN

Gambar 28 adalah kurva karakteristik item 20 dari instrumen penilaian

rencana pelaksanaan pembelajaran (RPP) penskoran parsial untuk penilai guru

pamong/penguji UKIN, jika dikaitkan dengan hasil kaliberasi item pada Tabel 28

dapat dijelaskan bahwa pada dasarnya item 20 ini memiliki parameter lokasi

sebesar 0,47 dengan parameter threshold ᵟ1 sebesar -0,95, threshold ᵟ2 sebesar -

227
0,08, threshold ᵟ3 sebesar 0,97, serta threshold ᵟ4 sebesar 1,96. Secara grafis

threshold ᵟi dapat diinterpretasikan sebagai perpotongan kurva setiap kategori.

Dari gambar tersebut dapat dijelaskan bahwa untuk mencapai kategori 2 atau

untuk memperoleh skor 2 pada item 20 maka diperlukan kemampuan (  ) sekitar -

0,08 hingga 0,97. Untuk lebih jelasnya kurva karakteristik untuk semua item pada

instrumen penilaian rencana pelaksanaan pembelajaran (RPP) penskoran parsial

untuk penilai guru pamong/penguji UKIN disajikan pada Gambar 29.

Gambar 29. Fungsi Informasi Instrumen RPP Penskoran Parsial Penilai Guru
Pamong/Penguji UKIN

Gambar 29 menyajikan kurva fungsi informasi dari akumulasi 25 item

pada instrumen penilaian RPP penskoran parsial untuk penilai guru

pamong/penguji UKIN yang menunjukkan nilai fungsi informasi maksimum

instrumen sebesar 17,8 pada skala kemampuan (  ) -0,6. Jika dihubungkan dengan

Standard Error of Measurement mengacu pada pendapat Hambleton,

Swaminathan & Rogers (1991: 94); Retnawati (2014: 19) menyatakan bahwa nilai

fungsi informasi (NIF) memiliki hubungan yang berbanding terbalik dengan

228
Standard Error of Measurement (SEM), semakin besar nilai informasi maka SEM

akan semakin kecil atau sebaliknya, maka dapat dijelaskan bahwa dengan

diketahuinya nilai fungsi informasi sebesar sebesar 17,8, maka koefisien

kesalahan pengukuran (SEM) diperoleh sebesar 0,23 yang menunjukkan nilai

informasi lebih tinggi dibanding kesalahan pengukuran sebagaimana disajikan

pada Gambar 30 sebagai berikut.

Gambar 30. Hubungan timbal balik antara NIF dengan SEM Instrumen Penilaian
RPP Penskoran Parsial Penilai Guru pamong/penguji UKIN

Gambar 30 menunjukkan grafik nilai informasi (NIF) dan kesalahan

pengukuran (SEM) dimana kedua grafik fungsi ini bertemu pada skala

kemampuan -3 dan 1,9. Di antara dua kemampuan ini, instrumen memiliki nilai

informasi yang lebih tinggi dibandingkan dengan kesalahan pengukurannya.

Sebaliknya, ketika skala kemampuan kurang dari -3 dan lebih dari 1,9, maka

instrumen ini memiliki kesalahan pengukuran yang lebih besar dibandingkan

dengan informasi yang diberikannya.

229
3) Karakteristik Instrumen Penilaian Rencana Pelaksanaan Pembelajaran

(RPP) Penskoran Holistik untuk Penilai Dosen

Berikut ini hasil analisis karakteristik item instrumen penilaian RPP

dengan penskoran holistik untuk penilai dosen dianalisis dengan menggunakan

pendekatan graded response modeling (GRM) dengan penskoran 1, 2, 3, dan 4

melalui Program R dengan latent trait model (ltm) package seperti tersaji pada

Tabel 29 berikut.

Tabel 29. Hasil Analisis Karakteristik Item Instrumen Penilaian RPP


Penskoran Holistik untuk Penilai Dosen

Item a b1 b2 b3
A1 1,46 -2,35 -0,44 0,93
A2 1,32 -2,38 -0,29 1,37
A3 1,42 -3,05 -0,56 1,07
A4 1,24 -2,97 -0,48 1,00
A5 1,24 -3,05 -0,32 1,52
A6 1,53 -2,55 -0,39 1,17
B7 1,55 -2,39 -0,46 1,06
B8 1,33 -2,70 -0,22 1,17
B9 1,31 -2,73 -0,40 1,18
B10 1,42 -2,44 -0,26 1,31
B11 1,11 -2,75 -0,45 1,22
B12 1,41 -2,44 -0,24 1,09
C13 1,03 -2,85 -0,13 1,70
C14 1,30 -2,74 -0,16 1,52
C15 1,20 -2,64 -0,15 1,48
C16 1,22 -3,08 -0,23 1,62
C17 1,25 -2,73 -0,05 1,31
C18 1,65 -2,17 -0,32 0,92
D19 2,07 -1,62 -0,13 0,92
D20 2,02 -2,05 -0,08 1,06
D21 1,77 -1,63 -0,05 1,06
D22 2,38 -1,85 -0,07 0,94
D23 1,84 -1,58 -0,16 1,14
D24 2,05 -1,67 -0,19 1,03
D25 2,13 -1,79 -0,22 0,86

230
Berdasarkan hasil analisis pada Tabel 29 diperoleh informasi bahwa

parameter ai setiap item bervariasi dari 1,11 hingga 2,05. Selain itu parameter bi

sebanyak tiga kelompok atau tiga perpotongan. Hal tersebut merupakan parameter

tingkat kesulitan peserta memperoleh skor tertentu ketika merespon butir i.

Ditinjau dari peluang pencapaian skornya, maka koefisien parameter bi untuk

setiap kategori berbeda-beda. Semakin tinggi kategori pencapaian maka semakin

tinggi koefisien bi. Berikut ini disajikan salah satu contoh kurva karakteristik item

dari instrumen penilaian rencana pelaksanaan pembelajaran (RPP) penskoran

holistik untuk penilai dosen.

Gambar 31. Kurva Karakteristik Item 23 dari Instrumen Penilaian RPP


Penskoran Holistik untuk Penilai Dosen

Gambar 31 adalah salah satu contoh kurva karakteristik item dari item 23.

Jika dikaitkan dengan hasil kaliberasi item pada Tabel 29, dapat dijelaskan bahwa

pada dasarnya item 23 ini memiliki parameter daya beda ai sebesar 1,84 dengan

parameter b1 sebesar -1,58, b2 sebesar -0,16, serta b3 sebesar 1,14. Secara grafis bi

atau tingkat kesulitan dapat diinterpretasikan sebagai perpotongan kurva setiap

231
kategori. Dari gambar tersebut dapat dijelaskan bahwa untuk mencapai kategori 2

atau untuk memperoleh skor 2 pada item 23 maka diperlukan kemampuan (  )

sekitar -1,58 hingga -0,16. Pada bagian ini hanya diberikan contoh untuk item 23.

Untuk lebih jelasnya kurva karakteristik untuk semua item pada instrumen

penilaian rencana pelaksanaan pembelajaran (RPP) penskoran holistik untuk

penilai dosen dapat diamati pada Lampiran 5 halaman 503 dan karakteristik

instrumen disajikan dalam bentuk fungsi informasi sebagai berikut.

Gambar 32. Fungsi Informasi Instrumen RPP Penskoran Holistik Penilai Dosen

Gambar 32 menyajikan kurva fungsi informasi dari akumulasi 25 item

pada instrumen penilaian RPP penskoran holistik untuk penilai dosen yang

diperoleh nilai fungsi informasi instrumen sebesar 12,1 pada skala kemampuan

(  ) -0,4. Jika dihubungkan dengan Standard Error of Measurement mengacu

pada pendapat Hambleton, Swaminathan & Rogers (1991: 94); Retnawati (2014:

19) menyatakan bahwa nilai fungsi informasi (NIF) memiliki hubungan yang

berbanding terbalik dengan Standard Error of Measurement (SEM), semakin

besar nilai informasi maka SEM akan semakin kecil atau sebaliknya, maka dapat

dijelaskan bahwa dengan diketahuinya nilai fungsi informasi sebesar 12,1, maka

232
koefisien kesalahan pengukuran (SEM) diperoleh sebesar 0,28 yang menunjukkan

nilai informasi lebih tinggi dibanding kesalahan pengukuran sebagaimana

disajikan pada Gambar 33 berikut

Gambar 33. Hubungan timbal balik antara NIF dengan SEM Instrumen Penilaian
RPP Penskoran Holistik untuk Penilai Dosen

Gambar 33 menyajikan hubungan timbali balik antara fungsi informasi

dari akumulasi 25 item pada instrumen penilaian RPP penskoran holistik untuk

penilai dosen dan kesalahan pengukuran (SEM) dimana kedua grafik fungsi ini

bertemu pada skala kemampuan -2,7 dan 1,8. Di antara dua kemampuan ini,

instrumen memiliki nilai informasi yang lebih tinggi dibandingkan dengan

kesalahan pengukurannya. Sebaliknya, ketika skala kemampuan kurang dari -2,7

dan lebih dari 1,8, maka kesalahan pengukuran instrumen ini lebih besar

dibandingkan informasi yang diberikannya

4) Karakteristik Penilaian Rencana Pelaksanaan Pembelajaran (RPP)

Penskoran Holistik untuk Penilai Guru pamong/penguji UKIN

Berikut ini hasil analisis bkarakteristik item penilaian rencana pelaksanaan

pembelajaran (RPP) dengan penskoran holistik untuk penilai guru

233
pamong/penguji UKIN dianalisis dengan menggunakan pendekatan graded

response modeling (GRM) melalui Program R dengan latent trait model (ltm)

package seperti tersaji pada Tabel 30:

Tabel 30. Hasil Analisis Karakteristik Item Instrumen Penilaian RPP


Penskoran Holistik untuk Penilai Guru pamong/penguji UKIN

Item a b1 b2 b3
A1 1,31 -2,43 -0,45 1,16
A2 1,26 -2,37 -0,24 1,60
A3 1,31 -3,14 -0,71 1,32
A4 1,15 -3,07 -0,42 1,22
A5 1,20 -3,03 -0,36 1,39
A6 1,20 -2,87 -0,66 1,39
B7 1,54 -2,32 -0,79 1,00
B8 1,30 -2,68 -0,41 1,15
B9 1,79 -2,26 -0,58 1,00
B10 1,26 -2,53 -0,48 1,32
B11 1,25 -2,49 -0,86 0,89
B12 1,49 -2,31 -0,28 1,11
C13 1,30 -2,49 -0,17 1,36
C14 1,42 -3,12 -0,16 1,18
C15 1,06 -2,79 -0,39 1,13
C16 1,16 -3,08 -0,40 1,19
C17 0,99 -3,11 -0,34 1,49
C18 1,59 -2,14 -0,15 0,93
D19 1,67 -1,76 0,00 1,03
D20 1,36 -2,71 -0,26 1,13
D21 1,48 -1,79 -0,02 1,23
D22 1,16 -2,73 -0,48 1,22
D23 1,65 -1,63 -0,15 1,11
D24 1,07 -2,40 -0,37 1,39
D25 1,37 -2,36 -0,54 0,86

Berdasarkan hasil analisis pada Tabel 30 diperoleh informasi bahwa

parameter ai setiap item bervariasi dari 0,99 hingga 1,79. Selain itu, parameter bi

sebanyak tiga kelompok atau tiga perpotongan. Hal tersebut merupakan parameter

tingkat kesulitan peserta memperoleh skor tertentu ketika merespon butir i.

Ditinjau dari peluang pencapaian skornya, maka koefisien parameter bi untuk

234
setiap kategori berbeda-beda. Semakin tinggi kategori pencapaian maka semakin

tinggi koefisien bi. Hal lain yang dapat dijelaskan berdasarkan hasil analisis item

dengan graded response model adalah kurva karakteristik item. Berikut ini

disajikan salah satu contoh kurva karakteristik item dari instrumen penilaian

rencana pelaksanaan pembelajaran (RPP) penskoran holistik penilai guru

pamong/penguji UKIN.

Gambar 34. Kurva Karakteristik Item 21 dari Instrumen Penilaian RPP


Penskoran Holistik untuk Penilai Guru pamong/penguji UKIN

Gambar 34 adalah salah satu contoh kurva karakteristik item dari

instrumen penilaian rencana pelaksanaan pembelajaran (RPP) penskoran Holistik

untuk penilai guru pamong/penguji UKIN yaitu item 21. Jika dikaitkan dengan

hasil kaliberasi item pada Tabel 30, dapat dijelaskan bahwa pada dasarnya item 21

ini memiliki parameter daya beda ai sebesar 1,48 dengan parameter b1 sebesar -

1,79, b2 sebesar -0,02, serta b3 sebesar 1,23. Secara grafis bi atau tingkat kesulitan

dapat diinterpretasikan sebagai perpotongan kurva setiap kategori. Dari gambar

tersebut dapat dijelaskan bahwa untuk mencapai kategori 2 atau untuk

memperoleh skor 2 pada item 21 maka diperlukan kemampuan (  ) sekitar -1,79

hingga -0,02. Pada bagian ini hanya diberikan contoh untuk item 21. Secara lebih

235
jelasnya kurva karakteristik untuk semua item pada instrumen penilaian rencana

pelaksanaan pembelajaran (RPP) penskoran holistik untuk penilai guru

pamong/penguji UKIN dapat diamati pada Lampiran 5 halaman 507. Lebih lanjut

karakteristik instrumen disajikan dalam kurva fungsi informasi sebagai berikut.

Gambar 35. Fungsi Informasi Instrumen RPP Penskoran Holistik Penilai Guru
Pamong/Penguji UKIN

Gambar 35 menyajikan kurva fungsi informasi dari akumulasi semua item

pada instrumen penilaian RPP penskoran holistik untuk penilai untuk Penilai

Guru pamong/penguji UKIN diperoleh nilai fungsi informasi maksimum

instrumen sebesar 12,1 pada skala kemampuan (  ) -0,4. Jika dihubungkan dengan

Standard Error of Measurement mengacu pada pendapat Hambleton,

Swaminathan & Rogers (1991: 94); Retnawati (2014: 19) menyatakan bahwa nilai

fungsi informasi (NIF) memiliki hubungan yang berbanding terbalik dengan

Standard Error of Measurement (SEM), semakin besar nilai informasi maka SEM

akan semakin kecil atau sebaliknya, maka dapat dijelaskan bahwa dengan

diketahuinya nilai fungsi informasi sebesar 12,1, maka koefisien kesalahan

236
pengukuran (SEM) diperoleh sebesar 0,28 yang menunjukkan nilai informasi

lebih tinggi dibanding kesalahan pengukuran sebagaimana pada Gambar 36:

Gambar 36. Fungsi Informasi Instrumen Penilaian RPP Penskoran Holistik


Penilai Guru pamong/penguji UKIN

Gambar 36 menunjukkan hubungan timbal balik antara NIF dengan SEM

dari penilaian RPP penskoran holistik untuk penilai guru pamong/penguji UKIN

dimana kedua grafik fungsi ini bertemu pada skala kemampuan -2,7 dan 1,8. Di

antara dua kemampuan ini, instrumen memiliki nilai informasi yang lebih tinggi

dibandingkan dengan kesalahan pengukurannya. Sebaliknya, ketika skala

kemampuan kurang dari -2,7 dan lebih dari 1,8, maka instrumen ini memiliki

kesalahan pengukuran yang lebih besar dibandingkan dengan informasi yang

diberikannya.

b. Karakteristik Instrumen Penilaian Pelaksanaan Pembelajaran (PP)

Karakteristik instrumen penilaian pelaksanaan pembelajaran (PP) juga

dikelompokkan berdasarkan penskoran dan penilai yaiyu data instrumen penilaian

pelaksanaan pembelajaran (PP) dengan penskoran parsial penilai dosen dan guru

237
pamong/penguji UKIN, dan data instrumen penilaian pelaksanaan pembelajaran

(PP) dengan penskoran holistik penilai dosen dan guru pamong/penguji UKIN

sebagaimana dideskripsikan sebagai berikut.

1) Karakteristik Instrumen Penilaian Pelaksanaan Pembelajaran (PP)

Penskoran Parsial untuk Penilai Dosen

Berikut ini disajikan karakteristik instrumen penilaian pelaksanaan

pembelajaran (PP) penskoran parsial untuk penilai dosen dianalisis menggunakan

pendekatan partial credit model (PCM) untuk penskoran 0, 1, 2, 3, dan 4 dengan

bantuan Program R melalui Extended Rasch Modeling (eRm) package

sebagaimana tampak pada Tabel 31 berikut.

Tabel 31. Hasil Analisis Karakteristik Item Instrumen Penilaian Pelaksanaan


Pembelajaran (PP) Penskoran Pasial untuk Penilai Dosen

Item Location Threshold ᵟ1 Threshold ᵟ2 Threshold ᵟ3 Threshold ᵟ4


A1 0,45 -1,45 0,05 0,74 2,45
A2 0,68 -1,27 0,24 0,68 3,06
A3 0,70 -1,51 0,53 0,90 2,91
A4 0,58 -1,31 0,20 0,96 2,48
B5 0,64 -1,35 0,35 0,73 2,84
B6 0,54 -1,68 0,43 0,66 2,77
B7 0,60 -1,67 0,29 0,93 2,86
B8 0,67 -1,60 0,75 0,78 2,76
B9 0,69 -1,16 0,45 0,70 2,78
B10 0,73 -1,18 -0,00 0,94 3,16
B11 0,72 -1,40 0,20 1,31 2,76
C12 0,67 -1,48 0,52 0,82 2,82
C13 0,70 -0,95 0,00 1,01 2,74
C14 0,58 -0,71 -0,14 0,63 2,58
C15 0,69 -1,30 0,11 1,10 2,86
D16 0,62 -1,39 0,37 0,83 2,69
D17 0,73 -1,35 0,40 0,60 3,29
D18 0,64 -1,18 0,01 0,94 2,78
D19 0,72 -1,43 0,24 1,34 2,72
D20 0,61 -1,43 0,53 0,61 2,74

238
Berdasarkan Tabel 31 diperoleh informasi bahwa parameter lokasi setiap

item bervariasi dari 0,45 hingga 0,73. Selain itu parameter threshold ᵟi sebanyak

empat kelompok atau empat perpotongan. Hal ini menunjukkan parameter tingkat

kesulitan peserta memperoleh skor tertentu ketika merespon butir i. Ditinjau dari

peluang pencapaian skornya, maka koefisien parameter threshold ᵟi untuk setiap

kategori berbeda-beda. Semakin tinggi kategori pencapaian maka semakin tinggi

koefisien threshold ᵟi. yang berarti item location mencerminkan tentang tingkat

kemudahan atau kesukaran item tersebut. Hal ini berarti bahwa pada instrumen

penilaian pelaksanaan pembelajaran semakin tinggi koefisien location maka

semakin sulit item tersebut dengan sebaran threshold yang merupakan kategori

tingkat pencapaiannya. Semakin tinggi threshold maka semakin sulit dicapai

ambang batas tersebut, sehingga peserta yang berkemampuan tinggi tentu mampu

mencapai kategori ambang batas yang tinggi pula. Berikut ini disajikan salah satu

contoh kurva karakteristik item dari instrumen penilaian pelaksanaan

pembelajaran (PP) penskoran parsial untuk penilai dosen.

Gambar 37. Kurva Karakteristik Item 4 dari Instrumen Penilaian Pelaksanaan


Pembelajaran Penskoran Parsial untuk Penilai Dosen

239
Gambar 37 adalah salah satu contoh kurva karakteristik item dari

instrumen penilaian pelaksanaan pembelajaran (PP) penskoran parsial untuk

penilai dosen yaitu item 4. Jika dikaitkan dengan hasil kaliberasi item pada Tabel

31, dapat dijelaskan bahwa pada dasarnya item 4 ini memiliki parameter lokasi

sebesar 0,58 dengan parameter threshold ᵟ1 sebesar -1,31, threshold ᵟ2 sebesar

0,20, threshold ᵟ3 sebesar 0,96, serta threshold ᵟ4 sebesar 2,48. Secara grafis

threshold ᵟi dapat diinterpretasikan sebagai perpotongan kurva setiap kategori.

Dari gambar tersebut dapat dijelaskan bahwa untuk mencapai kategori 2 atau

untuk memperoleh skor 2 pada item 4 maka diperlukan kemampuan (  ) sekitar

0,20 hingga 0,96. Pada bagian ini hanya diberikan contoh untuk item 4. Secara

lebih jelasnya kurva karakteristik untuk semua item pada instrumen penilaian

pelaksanaan pembelajaran (PP) penskoran parsial untuk penilai dosen dapat

diamati pada Lampiran 5 halaman 510. Lebih lanjut karakteristik instrumen

disajikan dalam kurva fungsi informasi sebagai berikut.

Gambar 38. Fungsi Informasi Instrumen PP Penskoran Parsial Penilai Dosen

Gambar 38 menyajikan kurva fungsi informasi keselurahan item pada

instrumen penilaian PP penskoran parsial untuk penilai dosen dengan nilai fungsi

240
informasi maksimum instrumen sebesar 14,27 pada skala kemampuan ( ) -1,3.

Jika dihubungkan dengan Standard Error of Measurement mengacu pada

pendapat Hambleton, Swaminathan & Rogers (1991: 94); Retnawati (2014: 19)

menyatakan bahwa nilai fungsi informasi (NIF) memiliki hubungan yang

berbanding terbalik dengan Standard Error of Measurement (SEM), semakin

besar nilai informasi maka SEM akan semakin kecil atau sebaliknya, maka dapat

dijelaskan bahwa dengan diketahuinya nilai fungsi informasi sebesar 14,27, maka

koefisien kesalahan pengukuran (SEM) diperoleh sebesar 0,26 yang menunjukkan

nilai informasi lebih tinggi dibanding kesalahan pengukuran sebagaimana

disajikan pada Gambar 39:

Gambar 39. Hubungan timbal balik antara NIF dengan SEM Instrumen Penilaian
Pelaksanaan Pembelajaran (PP) Penskoran Parsial Penilai Dosen

Gambar 39 menyajikan kurva fungsi informasi dari akumulasi 20 item

pada instrumen penilaian pelaksanaan pembelajaran (PP) penskoran parsial untuk

penilai dosen dimana kedua grafik fungsi ini bertemu pada skala kemampuan -3,6

dan 1,2. Di antara dua kemampuan ini, instrumen memiliki nilai informasi yang

241
lebih tinggi dibandingkan dengan kesalahan pengukurannya. Sebaliknya, ketika

skala kemampuan kurang dari -3,6 dan lebih dari 1,2, maka instrumen ini

memiliki kesalahan pengukuran yang lebih besar dibandingkan dengan informasi

yang diberikannya.

2) Karakteristik Instrumen Penilaian Pelaksanaan Pembelajaran (PP)

Penskoran Parsial untuk Penilai Guru pamong/penguji UKIN

Instrumen penilaian pelaksanaan pembelajaran (PP) penskoran parsial

untuk penilai guru pamong/penguji UKIN yang dianalisis menggunakan

pendekatan partial credit model (PCM) melalui diperoleh hasil analisis berupa

karakteristik item seperti terlihat pada Tabel 32 berikut.

Tabel 32. Hasil Analisis Karakteristik Item Penilaian Pelaksanaan


Pembelajaran (PP) Penskoran Pasial Penilai Guru
pamong/penguji UKIN

Item Location Threshold ᵟ1 Threshold ᵟ2 Threshold ᵟ3 Threshold ᵟ4


A1 0,42 -1,23 -0,04 0,65 2,31
A2 0,63 -1,12 0,15 0,58 2,94
A3 0,66 -1,33 0,37 0,82 2,79
A4 0,54 -1,16 0,13 0,81 2,40
B5 0,59 -1,20 0,25 0,63 2,69
B6 0,50 -1,47 0,36 0,52 2,63
B7 0,57 -1,46 0,19 0,83 2,74
B8 0,63 -1,46 0,65 0,67 2,67
B9 0,64 -1,02 0,28 0,62 2,66
B10 0,69 -0,98 -0,16 0,84 3,10
B11 0,68 -1,26 0,11 1,19 2,70
C12 0,62 -1,34 0,45 0,66 2,73
C13 0,65 -0,84 -0,09 0,90 2,65
C14 0,54 -0,60 -0,21 0,47 2,52
C15 0,65 -1,15 0,02 0,99 2,77
D16 0,58 -1,24 0,27 0,72 2,60
D17 0,69 -1,20 0,30 0,49 3,20
D18 0,60 -1,03 -0,07 0,83 2,69
D19 0,68 -1,29 0,15 1,23 2,63
D20 0,58 -1,28 0,44 0,50 2,68

242
Berdasarkan Tabel 23 diperoleh informasi bahwa parameter lokasi setiap

item bervariasi dari 0,42 hingga 0,69. Selain itu parameter threshold ᵟi sebanyak

empat kelompok atau empat perpotongan. Hal tersebut merupakan parameter

tingkat kesulitan peserta memperoleh skor tertentu ketika merespon butir i.

Ditinjau dari peluang pencapaian skornya, maka koefisien parameter threshold ᵟi

untuk setiap kategori berbeda-beda. Semakin tinggi kategori pencapaian maka

semakin tinggi koefisien threshold ᵟi. Hal ini berarti bahwa pada instrumen

pelaksanaan pembelajaran semakin tinggi koefisien location maka semakin sulit

item tersebut dengan sebaran threshold yang merupakan kategori tingkat

pencapaiannya. Berikut ini disajikan salah satu contoh kurva karakteristik item

dari instrumen penilaian pelaksanaan pembelajaran (PP) penskoran parsial untuk

penilai guru pamong/penguji UKIN.

Gambar 40. Kurva Karakteristik Item 15 dari Instrumen Penilaian PP Penskoran


Parsial Penilai Guru pamong/penguji UKIN

Gambar 40 adalah salah satu contoh kurva karakteristik item dari

instrumen penilaian pelaksanaan pembelajaran (PP) penskoran parsial untuk

penilai guru pamong/penguji UKIN yaitu item 15. Jika dikaitkan dengan hasil

243
kaliberasi item pada Tabel 32, dapat dijelaskan bahwa pada dasarnya item 15 ini

memiliki parameter lokasi sebesar 0,65 dengan parameter threshold ᵟ1 sebesar -

1,15, threshold ᵟ2 sebesar 0,02, threshold ᵟ3 sebesar 0,99, serta threshold ᵟ4 sebesar

2,77. Secara grafis threshold ᵟi dapat diinterpretasikan sebagai perpotongan kurva

setiap kategori. Dari gambar tersebut dapat dijelaskan bahwa untuk mencapai

kategori 2 atau untuk memperoleh skor 2 pada item 15 maka diperlukan

kemampuan (  ) sekitar 0,02 hingga 0,99. Pada bagian ini hanya diberikan contoh

untuk item 15. Secara lebih jelasnya kurva karakteristik untuk semua item pada

instrumen penilaian pelaksanaan pembelajaran (PP) penskoran parsial untuk

penilai guru pamong/penguji UKIN dapat diamati pada Lampiran 5 halaman 516.

Lebih lanjut karakteristik instrumen disajikan dalam fungsi informasi berikut.

Gambar 41. Fungsi Informasi Instrumen Pelaksanaan Pembelajaran Penskoran


Parsial Penilai Guru Pamong/Penguji UKIN

Gambar 41 menyajikan kurva fungsi informasi dari akumulasi seluruh

item pada instrumen penilaian RPP penskoran parsial untuk guru pamong/penguji

UKIN yang menunjukkan nilai fungsi informasi instrumen sebesar 14,27 pada

skala kemampuan (  ) -1,3. Jika dihubungkan dengan Standard Error of

244
Measurement mengacu pada pendapat Hambleton, Swaminathan & Rogers

(1991: 94); Retnawati (2014: 19) menyatakan bahwa nilai fungsi informasi (NIF)

memiliki hubungan yang berbanding terbalik dengan Standard Error of

Measurement (SEM), semakin besar nilai informasi maka SEM akan semakin

kecil atau sebaliknya, maka dapat dijelaskan bahwa dengan diketahuinya nilai

fungsi informasi sebesar 14,27, maka koefisien kesalahan pengukuran diperoleh

sebesar 0,26 yang menunjukkan nilai informasi lebih tinggi dibanding kesalahan

pengukuran sebagaimana disajikan pada Gambar 42 berikut.

Gambar 42. Hubungan timbal balik antara NIF dengan SEM Instrumen Penilaian
Pelaksanaan Pembelajaran Penskoran Parsial Penilai Guru
pamong/penguji UKIN

Gambar 42 menyajikan kurva fungsi informasi dari akumulasi 20 item

pada instrumen penilaian pelaksanaan pembelajaran (PP) penskoran parsial untuk

penilai guru pamong/penguji UKIN yang dihubungkan dengan kesalahan

pengukuran (SEM) dimana kedua grafik fungsi ini bertemu pada skala

kemampuan -3,6 dan 1,2. Di antara dua kemampuan ini, instrumen memiliki nilai

informasi yang lebih tinggi dibandingkan dengan kesalahan pengukurannya.

245
Sebaliknya, ketika skala kemampuan kurang dari -3,6 dan lebih dari 1,2, maka

instrumen ini memiliki kesalahan pengukuran yang lebih besar dibandingkan

dengan informasi yang diberikannya.

3) Karakteristik Instrumen Penilaian Pelaksanaan Pembelajaran Penskoran

Holistik untuk Penilai Dosen

Instrumen penilaian pelaksanaan pembelajaran (PP) penskoran holistik

untuk penilai dosen dianalisis menggunakan pendekatan graded response

modeling (GRM) dengan penskoran 1, 2, 3, dan 4. Melalui Program R dengan

latent trait model (ltm) package diperoleh karakteristik item sebagai berikut.

Tabel 33. Hasil Analisis Karakteristik Item Instrumen Penilaian Pelaksanaan


Pembelajaran Penskoran Holistik untuk Penilai Dosen

Item a b1 b2 b3
A1 1,32 -2,18 0,55 1,32
A2 1,38 -1,97 0,95 1,38
A3 1,64 -1,61 0,82 1,64
A4 1,71 -1,76 0,56 1,71
B5 1,92 -1,70 0,71 1,92
B6 1,97 -1,68 0,65 1,97
B7 2,05 -1,48 0,70 2,05
B8 2,02 -1,48 0,67 2,02
B9 2,00 -1,59 0,66 2,00
B10 2,19 -1,71 0,86 2,19
B11 1,73 -1,63 0,74 1,73
C12 1,75 -1,59 0,72 1,75
C13 1,70 -1,84 0,71 1,70
C14 1,60 -2,08 0,57 1,60
C15 1,91 -1,70 0,76 1,91
D16 1,77 -1,68 0,64 1,77
D17 1,66 -1,76 1,01 1,66
D18 1,83 -1,80 0,71 1,83
D19 1,57 -1,58 0,76 1,57
D20 1,89 -1,64 0,66 1,89

246
Berdasarkan data hasil analisis yang disajikan pada Tabel 33 diperoleh

informasi bahwa parameter ai setiap item bervariasi dari 1,32 hingga 2,19. Selain

itu parameter bi sebanyak tiga kelompok atau tiga perpotongan. Hal tersebut

merupakan parameter tingkat kesulitan peserta memperoleh skor tertentu ketika

merespon butir i. Ditinjau dari peluang pencapaian skornya, maka koefisien

parameter bi untuk setiap kategori berbeda-beda. Semakin tinggi kategori

pencapaian maka semakin tinggi koefisien bi. Hal lain yang dapat dijelaskan

berdasarkan hasil analisis item dengan graded response model adalah kurva

karakteristik item yang dicontohkan pada item 10 dari instrumen penilaian

pelaksanaan pembelajaran (PP) penskoran holistik untuk penilai dosen.

Gambar 43. Kurva Karakteristik Item 10 dari Instrumen Penilaian Pelaksanaan


Pembelajaran (PP) Penskoran Holistik untuk Penilai Dosen

Gambar 43 menunjukkan kurva karakteristik item 10 dari instrumen

penilaian pelaksanaan pembelajaran (PP) penskoran holistik untuk penilai dosen,

jika dikaitkan dengan hasil kaliberasi item pada Tabel 33, dapat dijelaskan bahwa

pada dasarnya item 10 ini memiliki parameter daya beda ai sebesar 2,19 dengan

parameter b1 sebesar -1,71, b2 sebesar 0,86, serta b3 sebesar 2,19. Secara grafis bi

247
atau tingkat kesulitan dapat diinterpretasikan sebagai perpotongan kurva setiap

kategori. Dari gambar tersebut dapat dijelaskan bahwa untuk mencapai kategori 2

atau untuk memperoleh skor 2 pada item 10 maka diperlukan kemampuan (  )

sekitar -1,71 hingga 0,86. Pada bagian ini hanya diberikan contoh untuk item 10.

Secara lebih jelasnya kurva karakteristik untuk semua item pada instrumen

penilaian pelaksanaan pembelajaran (PP) penskoran holistik untuk penilai dosen

dapat diamati pada Lampiran 5 halaman 519. Lebih lanjut karakteristik instrumen

disajikan dalam fungsi informasi sebagai berikut.

Gambar 44. Fungsi Informasi Instrumen Pelaksanaan Pembelajaran Penskoran


Holistik Penilai Dosen

Gambar 44 menyajikan kurva fungsi informasi dari akumulasi 20 item

pada instrumen penilaian PP penskoran holistik untuk penilai dosen yang

diperoleh nilai fungsi informasi maksimum instrumen sebesar 12,88 pada skala

kemampuan (  ) -0,7. Jika dihubungkan dengan Standard Error of Measurement

mengacu pada pendapat Hambleton, Swaminathan & Rogers (1991: 94);

Retnawati (2014: 19) menyatakan bahwa nilai fungsi informasi (NIF) memiliki

hubungan yang berbanding terbalik dengan Standard Error of Measurement

248
(SEM), semakin besar nilai informasi maka SEM akan semakin kecil atau

sebaliknya, sehingga dapat dijelaskan bahwa dengan diketahuinya nilai fungsi

informasi sebesar 12,88, maka koefisien kesalahan pengukuran (SEM) diperoleh

sebesar 0,27 yang menunjukkan nilai informasi lebih tinggi dibanding kesalahan

pengukuran sebagaimana disajikan pada Gambar 45 berikut.

Gambar 45. Hubungan timbal balik antara NIF dengan SEM Instrumen Penilaian
Pelaksanaan Pembelajaran (PP) Penskoran Holistik Penilai Dosen

Gambar 45 menyajikan kurva fungsi informasi dari akumulasi 20 item

pada instrumen penilaian pelaksanaan pembelajaran (PP) penskoran holistik untuk

penilai dosen dimana kedua grafik fungsi ini bertemu pada skala kemampuan -3

dan 1,7. Di antara dua kemampuan ini, instrumen memiliki nilai informasi yang

lebih tinggi dibandingkan dengan kesalahan pengukurannya. Sebaliknya, ketika

skala kemampuan kurang dari -3 dan lebih dari 1,7, maka instrumen ini memiliki

kesalahan pengukuran yang lebih besar dibandingkan dengan informasi yang

diberikannya.

249
4) Karakteristik Instrumen Penilaian Pelaksanaan Pembelajaran (PP)

Penskoran Holistik untuk Penilai Guru pamong/penguji UKIN

Instrumen penilaian pelaksanaan pembelajaran (PP) penskoran holistik

untuk penilai guru pamong/penguji UKIN dianalisis menggunakan pendekatan

graded response modeling (GRM) diperoleh karakteristik item berikut.

Tabel 34. Hasil Analisis Karakteristik Item Instrumen Penilaian PP


Penskoran Holistik untuk Penilai Guru pamong/penguji UKIN

Item a b1 b2 b3
A1 1,37 -2,08 -0,83 0,50
A2 1,42 -1,89 -0,74 0,84
A3 1,70 -1,53 -0,48 0,77
A4 1,71 -1,69 -0,65 0,54
B5 2,08 -1,59 -0,65 0,62
B6 1,93 -1,62 -0,66 0,59
B7 2,24 -1,38 -0,61 0,66
B8 1,96 -1,42 -0,54 0,67
B9 2,11 -1,50 -0,59 0,62
B10 2,24 -1,63 -0,48 0,80
B11 1,87 -1,53 -0,50 0,73
C12 1,74 -1,54 -0,55 0,64
C13 1,71 -1,77 -0,59 0,63
C14 1,54 -2,06 -0,96 0,49
C15 1,91 -1,65 -0,56 0,71
D16 1,79 -1,62 -0,73 0,56
D17 1,65 -1,71 -0,76 0,94
D18 1,86 -1,73 -0,64 0,70
D19 1,73 -1,48 -0,47 0,68
D20 1,88 -1,58 -0,77 0,57

Berdasarkan data hasil analisis yang disajikan pada Tabel 34 diperoleh

informasi bahwa parameter ai setiap item bervariasi dari 1,37 hingga 2,24. Selain

itu, parameter bi sebanyak tiga kelompok atau tiga perpotongan. Hal tersebut

merupakan parameter tingkat kesulitan peserta memperoleh skor tertentu ketika

merespon butir i. Ditinjau dari peluang pencapaian skornya, maka koefisien

250
parameter bi untuk setiap kategori berbeda-beda. Semakin tinggi kategori

pencapaian maka semakin tinggi koefisien bi. Hal lain yang dapat dijelaskan

berdasarkan hasil analisis item dengan graded response model adalah kurva

karakteristik item yang dicontohkan pada item 2 dari instrumen penilaian

pelaksanaan pembelajaran penskoran holistik penilai guru pamong/penguji UKIN.

Gambar 46. Kurva Karakteristik Item 2 dari Penilaian Pelaksanaan Pembelajaran


Penskoran Holistik Penilai Guru pamong/penguji UKIN

Gambar 46 menunjukkan kurva karakteristik item 2 dari instrumen

penilaian pelaksanaan pembelajaran (PP) penskoran holistik untuk penilai guru

pamong/penguji UKIN. Jika dihubungkan dengan hasil kaliberasi item pada Tabel

34, dapat dijelaskan bahwa pada dasarnya item 2 ini memiliki parameter daya

beda ai sebesar 1,42 dengan parameter b1 sebesar -1,89, b2 sebesar -0,74, serta b3

sebesar 0,84. Secara grafis bi atau tingkat kesulitan dapat diinterpretasikan sebagai

perpotongan kurva setiap kategori. Dari gambar tersebut dapat dijelaskan bahwa

untuk mencapai kategori 2 atau untuk memperoleh skor 2 pada item 2 maka

diperlukan kemampuan (  ) sekitar -1,89 hingga -0,74. Pada bagian ini hanya

diberikan contoh untuk item 2. Secara lebih jelasnya kurva karakteristik untuk

251
semua item pada instrumen penilaian pelaksanaan pembelajaran (PP) penskoran

holistik untuk penilai guru pamong/penguji UKIN dapat diamati pada Lampiran 5

halaman 522. Lebih lanjut disajikan dalam fungsi informasi sebagai berikut.

Gambar 47. Fungsi Informasi Instrumen Pelaksanaan Pembelajaran Penskoran


Holistik Penilai Guru Pamong/Penguji UKIN

Gambar 26 menyajikan kurva fungsi informasi dari akumulasi 25 item

pada instrumen penilaian pelaksanaan pembelajaran (PP) dengan penskoran

parsial untuk penilai guru pamong/penguji UKIN diperoleh nilai fungsi informasi

instrumen sebesar 12,88 pada skala kemampuan (  ) -0,7. Jika dihubungkan

dengan Standard Error of Measurement mengacu pada pendapat Hambleton,

Swaminathan & Rogers (1991: 94); Retnawati (2014: 19) menyatakan bahwa nilai

fungsi informasi (NIF) memiliki hubungan yang berbanding terbalik dengan

Standard Error of Measurement (SEM), semakin besar nilai informasi maka SEM

akan semakin kecil atau sebaliknya, maka dapat dijelaskan bahwa dengan

diketahuinya nilai fungsi informasi sebesar 12,88, maka koefisien kesalahan

pengukuran (SEM) diperoleh sebesar 0,27 yang menunjukkan nilai informasi

lebih tinggi dibanding kesalahan pengukuran sebagaimana pada Gambar 27:

252
Gambar 48. Hubungan timbal balik antara NIF dengan SEM Instrumen Penilaian
PP Penskoran Holistik Penilai Guru pamong/penguji UKIN

Gambar 48 menyajikan hubungan kurva fungsi informasi dari akumulasi

20 item pada instrumen penilaian pelaksanaan pembelajaran (PP) penskoran

holistik untuk penilai guru pamong/penguji UKIN dengan kesalahan pengukuran

(SEM) dimana kedua grafik fungsi ini bertemu pada skala kemampuan -3 dan 1,7.

Di antara dua kemampuan ini, instrumen memiliki nilai informasi yang lebih

tinggi dibandingkan dengan kesalahan pengukurannya. Sebaliknya, ketika skala

kemampuan kurang dari -3 dan lebih dari 1,7, maka instrumen ini memiliki

kesalahan pengukuran yang lebih besar dibanding informasi yang diberikannya.

c. Karakteristik Instrumen Penilaian Kompetensi Sosial dan Kompetensi

Kepribadian (KSKK)

Karakteristik instrumen penilaian kompetensi sosial dan kompetensi

kepribadian (KSKK) juga dikelompokkan berdasarkan model penskoran dari hasil

penilaian baik dosen maupun guru pamong/penguji UKIN dengan deskripsi

sebagai berikut.

253
1) Karakteristik Instrumen Penilaian Kompetensi Sosial dan Kompetensi

Kepribadian (KSKK) Penskoran Parsial untuk Penilai Dosen

Instrumen penilaian kompetensi sosial dan kompetensi kepribadian

(KSKK) penskoran parsial untuk penilai dosen dianalisis dengan menggunakan

pendekatan partial credit model (PCM) dengan penskoran 0, 1, 2, 3, dan 4.

Melalui Program R dengan Extended Rasch Modeling (eRm) package diperoleh

hasil analisis berupa karakteristik item sebagai berikut.

Tabel 35. Hasil Analisis Karakteristik Item Instrumen Penilaian KSKK


Penskoran Pasial untuk Penilai Dosen

Item Location Threshold ᵟ1 Threshold ᵟ2 Threshold ᵟ3 Threshold ᵟ4


A1 0,59 -0,93 0,07 1,10 2,14
A2 0,51 -1,33 0,17 0,85 2,35
A3 0,54 -0,96 0,03 0,96 2,14
A4 0,48 -1,25 0,07 1,30 1,82
A5 0,44 -0,97 0,32 0,63 1,80
B6 0,52 -1,02 -0,04 1,11 2,04
B7 0,77 -0,19 0,31 1,10 1,87
B8 0,56 -0,86 0,07 1,11 1,93
B9 0,82 -0,03 0,33 0,85 2,13
B10 0,70 -0,29 0,16 0,87 2,08
C11 0,48 -0,95 -0,07 0,73 2,23
C12 0,37 -0,68 -0,41 0,78 1,80
C13 0,46 -1,09 0,15 1,00 1,79
C14 0,38 -1,13 0,29 0,31 2,05
C15 0,38 -1,17 -0,17 1,02 1,84
D16 0,52 -0,60 -0,36 0,94 2,14
D17 0,16 -1,83 -0,04 0,61 1,93
D18 0,27 -1,41 -0,05 1,04 1,54
D19 0,39 -1,54 0,05 0,72 2,33
D20 0,37 -1,36 0,13 0,58 2,14

Berdasarkan data hasil analisis yang disajikan pada Tabel 35 diperoleh

informasi bahwa parameter lokasi setiap item bervariasi dari 0,16 hingga 0,77.

Selain itu parameter threshold ᵟi sebanyak empat kelompok atau empat

254
perpotongan. Ditinjau dari peluang pencapaian skornya, maka koefisien parameter

threshold ᵟi untuk setiap kategori berbeda-beda. Semakin tinggi kategori

pencapaian maka semakin tinggi koefisien threshold ᵟi. Hal ini berarti bahwa pada

instrumen penilaian kompetensi sosial dan kompetensi kepribadian semakin tinggi

koefisien location maka semakin sulit item tersebut dengan sebaran threshold

yang merupakan kategori tingkat pencapaiannya, misalnya peserta yang memiliki

kemampuan menengah hanya mampu mencapai threshold yang menengah dan

pada peserta yang berkemampuan tinggi tentu mampu mencapai kategori ambang

batas yang tinggi pula. Sebagaimana dicontohkan pada salah satu kurva

karakteristik item 17 dari instrumen penilaian kompetensi sosial dan kompetensi

kepribadian penskoran parsial untuk penilai dosen.

Gambar 49. Kurva Karakteristik Item 17 dari Instrumen Penilaian Kompetensi


Sosial dan Kompetensi Kepribadian (KSKK) Penskoran Parsial
Penilai Dosen

Gambar 49 adalah salah satu contoh kurva karakteristik item dari

instrumen penilaian kompetensi sosial dan kompetensi kepribadian (KSKK)

penskoran parsial untuk penilai dosen yaitu item 17. Jika dikaitkan dengan hasil

kaliberasi item pada Tabel 35, dapat dijelaskan bahwa pada dasarnya item 17 ini

255
memiliki parameter lokasi sebesar 0,16 dengan parameter threshold ᵟ1 sebesar -

1,83, threshold ᵟ2 sebesar -0,04, threshold ᵟ3 sebesar 0,61, serta threshold ᵟ4

sebesar 1,93. Secara grafis threshold ᵟi dapat diinterpretasikan sebagai

perpotongan kurva setiap kategori. Dari gambar tersebut dapat dijelaskan bahwa

untuk mencapai kategori 2 atau untuk memperoleh skor 2 pada item 4 maka

diperlukan kemampuan (  ) sekitar -0,04 hingga 0,61. Pada bagian ini hanya

diberikan contoh untuk item 17. Secara lebih jelasnya kurva karakteristik untuk

semua item pada instrumen penilaian kompetensi sosial dan kompetensi

kepribadian (KSKK) dengan penskoran parsial untuk penilai dosen dapat diamati

pada Lampiran 5 halaman 528. Lebih lanjut karakteristik instrumen disajikan

berdasarkan fungsi informasi sebagai berikut.

Gambar 50. Fungsi Informasi Instrumen KSKK Penskoran Parsial Penilai Dosen

Gambar 50 menyajikan kurva fungsi informasi dari keseluruhan item pada

instrumen penilaian kompetensi sosial dan kompetensi kepribadian (KSKK)

dengan penskoran parsial untuk penilai dosen diperoleh nilai fungsi informasi

instrumen sebesar 13,46 pada skala kemampuan (  ) -0,6. Jika dihubungkan

256
dengan Standard Error of Measurement mengacu pada pendapat Hambleton,

Swaminathan & Rogers (1991: 94); Retnawati (2014: 19) menyatakan bahwa nilai

fungsi informasi (NIF) memiliki hubungan yang berbanding terbalik dengan

Standard Error of Measurement (SEM), semakin besar nilai informasi maka SEM

akan semakin kecil atau sebaliknya, sehingga dapat dijelaskan dengan

diketahuinya nilai fungsi informasi sebesar 13,46, maka koefisien kesalahan

pengukuran (SEM) diperoleh sebesar 0,27 yang menunjukkan nilai informasi

lebih tinggi dibanding kesalahan pengukuran seperti tampak pada Gambar 51:

Gambar 51. Hubungan timbal balik antara NIF dengan SEM Instrumen Penilaian
KSKK Penskoran Parsial Penilai Dosen

Gambar 51 menunjukkan grafik nilai informasi (NIF) dan kesalahan

pengukuran (SEM) dimana kedua grafik fungsi ini bertemu pada skala

kemampuan -2,9 dan 1,8. Di antara dua kemampuan ini, instrumen memiliki nilai

informasi yang lebih tinggi dibandingkan dengan kesalahan pengukurannya.

Sebaliknya, ketika skala kemampuan kurang dari -2,9 dan lebih dari 1,8, maka

instrumen ini memiliki kesalahan pengukuran yang lebih besar dibandingkan

dengan informasi yang diberikannya.

257
2) Karakteristik Instrumen Penilaian Kompetensi Sosial dan Kompetensi

Kepribadian Penskoran Parsial Penilai Guru pamong/penguji UKIN

Instrumen penilaian kompetensi sosial dan kompetensi kepribadian

(KSKK) penskoran parsial untuk penilai guru pamong/penguji UKIN dengan

pendekatan partial credit model (PCM) melalui Program R dengan Extended

Rasch Modeling (eRm) package diperoleh karakteristik item sebagai berikut.

Tabel 36. Hasil Analisis Karakteristik Item Instrumen Penilaian KSKK


Penskoran Pasial Penilai Guru pamong/penguji UKIN

Item Location Threshold ᵟ1 Threshold ᵟ2 Threshold ᵟ3 Threshold ᵟ4


A1 0,48 -0,81 0,00 0,88 1,86
A2 0,43 -1,26 0,25 0,62 2,13
A3 0,48 -0,91 0,26 0,69 1,87
A4 0,43 -1,14 0,20 1,08 1,59
A5 0,39 -0,92 0,55 0,42 1,50
B6 0,42 -0,93 -0,00 0,84 1,77
B7 0,65 -0,17 0,30 0,86 1,63
B8 0,48 -0,80 0,25 0,87 1,62
B9 0,73 -0,00 0,39 0,60 1,94
B10 0,62 -0,31 0,41 0,57 1,82
C11 0,38 -0,86 -0,02 0,52 1,91
C12 0,32 -0,66 -0,24 0,56 1,63
C13 0,39 -1,01 0,34 0,74 1,51
C14 0,34 -1,02 0,44 0,19 1,76
C15 0,34 -1,10 0,06 0,82 1,58
D16 0,41 -0,53 -0,31 0,74 1,78
D17 0,12 -1,69 0,01 0,50 1,67
D18 0,24 -1,31 0,17 0,85 1,26
D19 0,35 -1,40 0,23 0,54 2,06
D20 0,35 -1,26 0,32 0,47 1,89

Berdasarkan data hasil analisis yang disajikan pada Tabel 36 diperoleh

informasi bahwa parameter lokasi setiap item bervariasi dari 0,12 hingga 0,73.

Selain itu parameter threshold ᵟi sebanyak empat kelompok atau empat

perpotongan. Hal tersebut merupakan parameter tingkat kesulitan peserta

258
memperoleh skor tertentu ketika merespon butir i. Ditinjau dari peluang

pencapaian skornya, maka koefisien parameter threshold ᵟi untuk setiap kategori

berbeda-beda. Semakin tinggi kategori pencapaian maka semakin tinggi koefisien

threshold ᵟi. Hal ini berarti bahwa pada instrumen penilaian kompetensi sosial dan

kompetensi kepribadian semakin tinggi koefisien location, maka semakin sulit

item tersebut dengan sebaran threshold yang merupakan kategori tingkat

pencapaiannya. Semakin tinggi threshold maka semakin sulit dicapai ambang

batas tersebut, sehingga peserta yang memiliki kemampuan rendah tentu hanya

mampu mencapai threshold (ambang kategori) yang rendah pula, demikian pula

sebaliknya seperti dicontohkan pada kurva karakteristik item 11 pada Gambar 51.

Gambar 52. Kurva Karakteristik Item 11 dari Instrumen Penilaian KSKK


Penskoran Parsial untuk Penilai Guru pamong/penguji UKIN

Gambar 52 adalah salah satu contoh kurva karakteristik item dari

instrumen penilaian kompetensi sosial dan kompetensi kepribadian (KSKK)

penskoran parsial untuk penilai guru pamong/penguji UKIN yaitu item 11. Jika

dikaitkan dengan hasil kaliberasi item pada Tabel 36, dapat dijelaskan bahwa pada

dasarnya item 11 ini memiliki parameter lokasi sebesar 0,38 dengan parameter

259
threshold ᵟ1 sebesar -0,86, threshold ᵟ2 sebesar -0,02, threshold ᵟ3 sebesar 0,52,

serta threshold ᵟ4 sebesar 1,91. Secara grafis threshold ᵟi dapat diinterpretasikan

sebagai perpotongan kurva setiap kategori. Dari gambar tersebut dapat dijelaskan

bahwa untuk mencapai kategori 2 atau untuk memperoleh skor 2 pada item 11

maka diperlukan kemampuan (  ) sekitar -0,02 hingga 0,52 Pada bagian ini hanya

diberikan contoh untuk item 11. Kurva karakteristik untuk semua item pada

instrumen penilaian ini dapat diamati pada Lampiran 5 halaman 531. Lebih lanjut

karakteristik instrumen disajikan berdasarkan fungsi informasi sebagai berikut.

Gambar 53. Fungsi Informasi Instrumen KSKK Penskoran Parsial Penilai


Guru pamong/penguji UKIN

Gambar 53 menyajikan kurva fungsi informasi dari keseluruhan item pada

instrumen penilaian kompetensi sosial dan kompetensi kepribadian dengan

penskoran parsial untuk penilai guru pamong/penguji UKIN diperoleh nilai fungsi

informasi maksimum instrumen sebesar 13,46 pada skala kemampuan ( ) -0,6.

Jika dihubungkan dengan Standard Error of Measurement mengacu pada

pendapat Hambleton, Swaminathan & Rogers (1991: 94); Retnawati (2014: 19)

menyatakan bahwa nilai fungsi informasi (NIF) memiliki hubungan yang

260
berbanding terbalik dengan Standard Error of Measurement (SEM), semakin

besar nilai informasi maka SEM akan semakin kecil atau sebaliknya, sehingga

dapat dijelaskan bahwa dengan diketahuinya nilai fungsi informasi sebesar 13,46,

maka koefisien kesalahan pengukuran (SEM) diperoleh sebesar 0,27 yang

menunjukkan nilai informasi lebih tinggi dibanding kesalahan pengukuran

sebagaimana disajikan pada Gambar 54 berikut.

Gambar 54. Hubungan timbal balik antara NIF dengan SEM Instrumen Penilaian
KSKK Penskoran Parsial untuk Penilai Guru pamong/penguji UKIN

Gambar 54 menunjukkan hubungan grafik nilai informasi dan kesalahan

pengukuran yaitu kedua grafik fungsi ini bertemu pada skala kemampuan -2,9 dan

1,8. Di antara dua kemampuan ini, instrumen memiliki nilai informasi yang lebih

tinggi dibandingkan dengan kesalahan pengukurannya. Sebaliknya, ketika skala

kemampuan kurang dari -2,9 dan lebih dari 1,8, maka instrumen ini memiliki

kesalahan pengukuran yang lebih besar dibandingkan dengan informasi yang

diberikannya.

261
3) Karakteristik Instrumen Penilaian Kompetensi Sosial dan Kompetensi

Kepribadian (KSKK) Penskoran Holistik untuk Penilai Dosen

Instrumen penilaian kompetensi sosial dan kompetensi kepribadian

(KSKK) penskoran holistik untuk penilai dosen dianalisis dengan menggunakan

pendekatan graded response modeling (GRM) dengan penskoran 1, 2, 3, dan 4.

Melalui Program R dengan latent trait model (ltm) package diperoleh hasil

analisis berupa karakteristik item sebagai berikut.

Tabel 37. Hasil Analisis Karakteristik Item Instrumen Penilaian KSKK


Pembelajaran Penskoran Holistik untuk Penilai Dosen

Item a b1 b2 b3
A1 1,06 -2,81 0,00 1,74
A2 1,52 -2,56 -0,06 1,52
A3 1,30 -2,56 0,00 1,30
A4 1,33 -2,67 0,02 1,33
A5 1,76 -2,16 -0,16 1,76
B6 1,97 -2,15 0,07 1,97
B7 1,76 -1,69 0,09 1,76
B8 2,21 -1,96 0,07 2,21
B9 1,56 -1,72 -0,02 1,56
B10 2,05 -1,72 -0,04 2,05
C11 1,33 -2,57 -0,12 1,33
C12 1,05 -2,89 -0,25 1,05
C13 1,43 -2,47 -0,08 1,43
C14 1,49 -2,49 -0,33 1,49
C15 1,21 -2,90 -0,15 1,21
D16 1,30 -2,44 -0,00 1,30
D17 1,17 -3,51 -0,32 1,17
D18 1,20 -3,08 -0,34 1,20
D19 1,27 -3,04 -0,10 1,27
D20 1,48 -2,65 -0,20 1,48

Berdasarkan data hasil analisis pada Tabel 37 diperoleh informasi bahwa

parameter ai setiap item bervariasi dari 1,06 hingga 2,21. Selain itu parameter bi

sebanyak tiga kelompok atau tiga perpotongan. Hal tersebut merupakan parameter

262
tingkat kesulitan peserta memperoleh skor tertentu ketika merespon butir i.

Ditinjau dari peluang pencapaian skornya, maka koefisien parameter bi untuk

setiap kategori berbeda-beda. Semakin tinggi kategori pencapaian maka semakin

tinggi koefisien bi. Berikut ini disajikan salah satu contoh kurva karakteristik item

9 dari instrumen penilaian kompetensi sosial dan kompetensi kepribadian (KSKK)

penskoran holistik untuk penilai dosen.

Gambar 55. Kurva Karakteristik Item 9 dari Instrumen Penilaian KSKK


Penskoran Holistik untuk Penilai Dosen

Gambar 55 menunjukkan kurva karakteristik item 9 dari instrumen

penilaian kompetensi sosial dan kompetensi kepribadian (KSKK) penskoran

holistik untuk penilai dosen. Jika dikaitkan dengan hasil kaliberasi item pada

Tabel 37, dapat dijelaskan bahwa pada dasarnya item 9 ini memiliki parameter

daya beda ai sebesar 1,56 dengan parameter b1 sebesar -1,56, b2 sebesar -0,02,

serta b3 sebesar 1,56. Secara grafis bi atau tingkat kesulitan dapat diinterpretasikan

sebagai perpotongan kurva setiap kategori. Dari gambar tersebut dapat dijelaskan

bahwa untuk mencapai kategori 2 atau untuk memperoleh skor 2 pada item 9

maka diperlukan kemampuan (  ) sekitar -1,56 hingga -0,02. Secara lebih jelasnya

263
kurva karakteristik untuk semua item pada instrumen penilaian kompetensi sosial

dan kompetensi kepribadian (KSKK) dengan penskoran holistik untuk penilai

dosen dapat diamati pada Lampiran 5 halaman 535. Labih lanjut karakteristik

instrumen disajikan berdasarkan fungsi informasi sebagai berikut.

Gambar 56. Fungsi Informasi Instrumen KSKK Penskoran Holistik Penilai Dosen

Gambar 56 menyajikan kurva fungsi informasi dari akumulasi 20 item

pada instrumen penilaian kompetensi sosial dan kompetensi kepribadian (KSKK)

dengan penskoran holistik untuk penilai dosen diperoleh nilai fungsi informasi

instrumen sebesar 10,72 pada skala kemampuan (  ) -0,3. Jika dihubungkan

dengan Standard Error of Measurement mengacu pada pendapat Hambleton,

Swaminathan & Rogers (1991: 94); Retnawati (2014: 19) menyatakan bahwa nilai

fungsi informasi (NIF) memiliki hubungan yang berbanding terbalik dengan

Standard Error of Measurement (SEM), semakin besar nilai informasi maka SEM

akan semakin kecil atau sebaliknya, maka dapat dijelaskan bahwa dengan

diketahuinya nilai fungsi informasi sebesar 10,72, maka koefisien kesalahan

264
pengukuran (SEM) diperoleh sebesar 0,30 yang menunjukkan nilai informasi

lebih tinggi dibanding kesalahan pengukuran sebagaimana pada Gambar 27:

Gambar 57. Hubungan timbal balik antara NIF dengan SEM Instrumen Penilaian
Kompetensi Sosial dan Kepribadian Penskoran Holistik Penilai
Dosen

Gambar 57 menunjukkan hubungan nilai informasi (NIF) dan kesalahan

pengukuran (SEM) dimana kedua grafik fungsi ini bertemu pada skala

kemampuan -2,4 dan 1,9. Di antara dua kemampuan ini, instrumen memiliki nilai

informasi yang lebih tinggi dibandingkan dengan kesalahan pengukurannya.

Sebaliknya, ketika skala kemampuan kurang dari -2,4 dan lebih dari 1,9, maka

instrumen ini memiliki kesalahan pengukuran lebih besar dibandingkan dengan

informasi diberikannya.

4) Karakteristik Instrumen Penilaian Kompetensi Sosial Kepribadian

(KSKK) Penskoran Holistik untuk Penilai Guru pamong/penguji UKIN

Instrumen penilaian kompetensi sosial dan kompetensi kepribadian

penskoran holistik untuk penilai guru pamong/penguji UKIN dianalisis dengan

menggunakan pendekatan graded response modeling (GRM) dengan penskoran 1,

265
2, 3, dan 4. Melalui Program R dengan latent trait model (ltm) package diperoleh

hasil analisis berupa karakteristik item sebagai berikut.

Tabel 38. Hasil Analisis Karakteristik Item Instrumen Penilaian KSKK


Penskoran Holistik untuk Penilai Guru pamong/penguji UKIN

Item a b1 b2 b3
A1 1,37 -2,08 -0,83 0,50
A2 1,42 -1,89 -0,74 0,84
A3 1,70 -1,53 -0,48 0,77
A4 1,71 -1,69 -0,65 0,54
A5 2,08 -1,59 -0,65 0,62
B6 1,93 -1,62 -0,66 0,59
B7 2,24 -1,38 -0,61 0,66
B8 1,96 -1,42 -0,54 0,67
B9 2,11 -1,50 -0,59 0,62
B10 2,24 -1,63 -0,48 0,80
C11 1,87 -1,53 -0,50 0,73
C12 1,74 -1,54 -0,55 0,64
C13 1,71 -1,77 -0,59 0,63
C14 1,54 -2,06 -0,96 0,49
C15 1,91 -1,65 -0,56 0,71
D16 1,79 -1,62 -0,73 0,56
D17 1,65 -1,71 -0,76 0,94
D18 1,86 -1,73 -0,64 0,70
D19 1,73 -1,48 -0,47 0,68
D20 1,88 -1,58 -0,77 0,57

Berdasarkan data hasil analisis yang disajikan pada Tabel 38 diperoleh

informasi bahwa parameter ai setiap item bervariasi dari 1,37 hingga 2,24. Selain

itu, parameter bi sebanyak tiga kelompok atau tiga perpotongan. Hal tersebut

merupakan parameter tingkat kesulitan peserta memperoleh skor tertentu ketika

merespon butir i. Ditinjau dari peluang pencapaian skornya, maka koefisien

parameter bi untuk setiap kategori berbeda-beda. Semakin tinggi kategori

pencapaian maka semakin tinggi koefisien bi. Berikut ini disajikan salah satu

266
contoh kurva karakteristik item 5 dari instrumen penilaian ini dengan penilai guru

pamong/penguji UKIN.

Gambar 58. Kurva Karakteristik Item 5 dari Instrumen Penilaian KSKK


Penskoran Holistik Penilai Guru pamong/penguji UKIN

Gambar 58 menunjukkan kurva karakteristik item 5 dari instrumen

penilaian kompetensi sosial dan kompetensi kepribadian (KSKK) dengan

penskoran holistik untuk penilai guru pamong/penguji UKIN. Apabila

dihubungkan dengan hasil kaliberasi item pada Tabel 38, dapat dijelaskan bahwa

pada dasarnya item 5 ini memiliki parameter daya beda ai sebesar 2,08 dengan

parameter b1 sebesar -1,59, b2 sebesar -0,65, serta b3 sebesar 0,54. Secara grafis bi

atau tingkat kesulitan dapat diinterpretasikan sebagai perpotongan kurva setiap

kategori. Dari gambar tersebut dapat dijelaskan bahwa untuk mencapai kategori 2

atau untuk memperoleh skor 2 pada item 2 maka diperlukan kemampuan (  )

sekitar -1,59 hingga -0,65. Secara lebih jelasnya kurva karakteristik untuk semua

item pada instrumen penilaian kompetensi sosial dan kompetensi kepribadian

(KSKK) penskoran holistik untuk penilai guru pamong/penguji UKIN dapat

267
diamati pada Lampiran 5 halaman 536. Lebih lanjut karakteristik instrumen

disajikan berdasarkan fungsi informasi sebagai berikut.

Gambar 59. Fungsi Informasi Instrumen KSKK Penskoran Holistik Penilai Guru
Pamong/Penguji UKIN

Gambar 59 menyajikan kurva fungsi informasi dari akumulasi 20 item

pada instrumen penilaian kompetensi sosial dan kompetensi kepribadian (KSKK)

penskoran holistik untuk penilai guru pamong/penguji UKIN diperoleh nilai

fungsi informasi instrumen sebesar 10,72 pada skala kemampuan (  ) -0,3. Jika

dihubungkan dengan Standard Error of Measurement mengacu pada pendapat

Hambleton, Swaminathan & Rogers (1991: 94); Retnawati (2014: 19) menyatakan

bahwa nilai fungsi informasi (NIF) memiliki hubungan yang berbanding terbalik

dengan Standard Error of Measurement (SEM), semakin besar nilai informasi

maka SEM akan semakin kecil atau sebaliknya, maka dapat dijelaskan bahwa

dengan diketahuinya nilai fungsi informasi sebesar 10,72, maka koefisien

kesalahan pengukuran (SEM) diperoleh sebesar 0,30 yang menunjukkan nilai

informasi lebih tinggi dibanding kesalahan pengukuran sebagaimana disajikan

pada Gambar 60 berikut.

268
Gambar 60. Hubungan timbal balik antara NIF dengan SEM Instrumen Penilaian
Kompetensi Sosial Kepribadian (KSKK) Penskoran Holistik Penilai
Guru pamong/penguji UKIN

Gambar 60 menunjukkan grafik nilai informasi (NIF) dan kesalahan

pengukuran (SEM) dimana kedua grafik fungsi ini bertemu pada skala

kemampuan -2,4 dan 1,9. Di antara dua kemampuan ini, instrumen memiliki nilai

informasi yang lebih tinggi dibandingkan dengan kesalahan pengukurannya.

Sebaliknya, ketika skala kemampuan kurang dari -2,4 dan lebih dari 1,9, maka

instrumen ini memiliki kesalahan pengukuran yang lebih besar dibandingkan

dengan informasi yang diberikannya.

C. Revisi Produk

Pelaksanaan uji coba II dimaksudkan untuk memperoleh informasi dan

membuktikan kualitas model penilaian PPG secara empirik melalui hasil uji coba

lapangan II, seperti halnya yang telah dilakukan pada uji coba I. Kualitas secara

empirik yang dimaksud meliputi: validitas konstruk instrumen, Goodness of Fit

269
Model, karakteristik item dan tes berdasarkan politomus item response theory,

serta reliabilitas instrumen. Pada uji coba tahap II penggunaan subjek telah

diperluas yaitu sebanyak 516 peserta/mahasiswa PPG. Pembuktian model

penilaian PPG secara empirik pada uji coba II diuraikan sebagai berikut.

1. Pembuktian Validitas Konstruk Instrumen Uji Coba II

Pembuktian validitas konstruk pada uji coba II, seperti halnya pada uji

coba I, dilakukan melalui analisis faktor konfirmatori atau confirmatory factor

analysis (CFA). Pengujian CFA dilakukan untuk semua komponen penilaian

yaitu: instrumen penilaian rencana pelaksanaan pembelajaran (RPP), instrumen

penilaian pelaksanaan pembelajaran (PP), instrumen serta penilaian kompetensi

sosial dan kompetensi kepribadian (KSKK). Ketiga komponen instrumen terbagi

atas dua metode penskoran yaitu penskoran parsial dan penskoran holistik. Selain

itu, data penilaian dikelompokkan menjadi dua kelompok yaitu data hasil

penilaian oleh dosen dan data hasil penilaian oleh guru pamong/penguji UKIN.

Hasil analisis untuk pembuktian validitas konstruk pada uji coba II untuk model

penilaian PPG dikemukakan sebagai berikut.

a. Validitas Konstruk Instrumen Penilaian Rencana Pelaksanaan

Pembelajaran (RPP)

Instrumen penilaian rencana pelaksanaan pembelajaran (RPP) pada uji

coba II, sama halnya pada ujicoba I diukur melalui empat indikator dengan

sebaran item sebanyak 25 item. Keempat indkator tersebut adalah indkator

perumusan indikator pencapaian kompetensi dan capaian pembelajaran (PIPKC)

sebanyak 6 item (item 1-6), indikator pengorganisasian materi, metode, media dan

270
sumber belajar (PMMMS) sebanyak enam item (item 7-12), indikator

pengorganisasian proses, penilaian dan evaluasi pembelajaran (PPPEP) sebanyak

enam item (item 13-18), serta indikator penerapan prinsip techno pedagogical

content knowledge (PTPCK) sebanyak tujuh item (item19-25). Penyajian hasil

pembuktian validitas konstruk instrumen penilaian rencana pelaksanaan

pembelajaran (RPP) dikelompokkan berdasarkan dua kelompok data ditinjau dari

penskorannya, yaitu kelompok parsial dan kelompok holistik.

1) Validitas Konstruk Pada Instrumen Penilaian RPP dengan Penskoran

Parsial

Hasil pembuktian validitas konstruk konstruk instrumen penilaian rencana

pelaksanaan pembelajaran (RPP) pada kelompok penskoran parsial dibagi atas

dua kelompok data yaitu data dari hasil penilai dosen dan data dari hasil penilai

guru pamong/penguji UKIN. Berdasarkan hasil analisis faktor konfirmatori dari

instrumen penilaian rencana pelaksanaan pembelajaran (RPP) dengan penskoran

parsial untuk penilai dosen pada uji coba II, diperoleh informasi bahwa koefisien

Barlet dengan nilai p 0,000 serta KMO sebesar 0,9. Jika hasil pengujian Barlet

menunjukkan nilai p yang lebih kecil dari 0,01 serta koefisien KMO yang lebih

dari 0,05 maka kecukupan sampel untuk analisis faktor telah terpenuhi

(Retnawati, 2016a: 47). Lebih lanjut sebanyak 25 item menunjukkan muatan

faktor masing-masing berdasarkan indikatornya. Dari 25 item tersebut

menunjukkan seluruh koefisien muatan faktor lebih dari 0,4. Jika hal tersebut

dikonfirmasikan dengan saran Retnawati (2017a: 64) yang menyatakan bahwa

koefisien jalur muatan faktor akan memiliki arti (meaningful) jika besarnya tidak

271
kurang dari 0,4. Dengan demikian, hasil analisis menunjukkan bahwa semua

variabel observable memberikan sumbangan berarti untuk mengukur variabel

latennya. Hal tersebut bermakna bahwa ke-25 item pada instrumen penilaian

rencana pelaksanaan pembelajaran (RPP) penskoran parsial untuk penilai dosen

telah valid secara konstruk.

Hal lain yang dapat dijelaskan dari analisis faktor konfirmatori tersebut

adalah pada aspek Goodness of Fit Model. Berdasarkan hasil analisis diperoleh

informasi bahwa model konstruk yang dirancang telah memenuhi Goodness of Fit

Model. Hal ini ditunjukkan melalui koefisien p-value sebesar 0,052 yang melebih

cut-of value 0,05 serta koefisien RMSEA sebesar 0,017 yang lebih kecil dari cut-

of value 0,08. Hal tersebut diperoleh setelah mengkorelasikan error antara item 4

dan item 15 serta item 11 dan item 19 yang dapat diamati pada Lampiran 6

halaman 542.

Selain data dari instrumen penilaian rencana pelaksanaan pembelajaran

(RPP) penskoran parsial untuk penilai dosen, dilakukan pula pembuktian validitas

konstruk dengan menggunakan kelompok data dari penilai guru pamong/penguji

UKIN. Pada dasarnya instrumen yang digunakan adalah sama, begitu pula subjek

yang dinilai adalah orang yang sama, hanya penilainya saja yang berbeda yaitu

dosen dan guru pamong/penguji UKIN.

Berdasarkan hasil analisis faktor konfirmatori dari instrumen penilaian

rencana pelaksanaan pembelajaran (RPP) penskoran parsial untuk penilai guru

pamong/penguji UKIN uji coba tahap II, diperoleh informasi bahwa koefisien

Barlet dengan nilai p 0,000 serta KMO sebesar 0,9. Jika hasil pengujian Barlet

272
menunjukkan nilai p yang lebih kecil dari 0,01 serta koefisien KMO yang lebih

dari 0,05 maka kecukupan sampel untuk analisis faktor telah terpenuhi

(Retnawati, 2016: 47). Lebih lanjut sebanyak 25 item menunjukkan muatan faktor

masing-masing berdasarkan indikatornya. Dari 25 item tersebut menunjukkan

seluruh koefisien muatan faktor lebih dari 0,4. Jika hal tersebut dikonfirmasikan

dengan saran Retnawati (2016a: 64) yang menyatakan bahwa koefisien jalur

muatan faktor akan memiliki arti (meaningful) jika besarnya tidak kurang dari 0,4.

Dengan demikian, hasil analisis menunjukkan bahwa semua variabel observable

memberikan sumbangan berarti untuk mengukur variabel latennya. Hal tersebut

bermakna sama seperti analisis sebelumnya bahwa ke-25 item pada instrumen

penilaian rencana pelaksanaan pembelajaran (RPP) penskoran parsial untuk

penilai guru pamong/penguji UKIN telah valid secara konstruk. Hal lain yang

dapat dijelaskan dari analisis faktor konfirmatori tersebut adalah pada aspek

Goodness of Fit Model. Berdasarkan hasil analisis diperoleh informasi bahwa

model konstruk yang dirancang telah memenuhi Goodness of Fit Model. Hal ini

ditunjukkan melalui koefisien p-value sebesar 0,13 yang melebih cut-of value 0,05

serta koefisien RMSEA sebesar 0,014 yang lebih kecil dari cut-of value 0,08. Hal

tersebut diperoleh setelah mengkorelasikan eror antara item 11 dan item 19 serta

item 16 dan item 22 yang dapat diamati pada Lampiran 6 halaman 548.

Berdasarkan beberapa hasil analisis yang telah dikemukakan, baik yang

berasal dari data penilaian dosen, maupun data yang berasal dari penilaian guru

pamong/penguji UKIN, maka dapat disimpulkan bahwa instrumen penilaian

rencana pelaksanaan pembelajaran (RPP) dengan penskoran parsial yang

273
digunakan pada uji coba II telah valid secara konstruk. Begitu pula ke-25 item

instrumen tersebut telah memenuhi aspek validitas secara konstruk.

2) Validitas Konstruk Pada Instrumen Penilaian RPP dengan Penskoran

Holistik

Hasil pembuktian validitas konstruk konstruk instrumen penilaian rencana

pelaksanaan pembelajaran (RPP) pada kelompok penskoran holistik, seperti

halnya pada penskoran parsial dibagi atas dua kelompok data yaitu data dari hasil

penilai dosen dan data dari hasil penilai guru pamong/penguji UKIN. Berdasarkan

hasil analisis faktor konfirmatori dari instrumen penilaian rencana pelaksanaan

pembelajaran (RPP) dengan penskoran holistik untuk penilai dosen uji coba II,

diperoleh informasi bahwa koefisien Barlet dengan nilai p 0,000 serta KMO

sebesar 0,9. Jika hasil pengujian Barlet menunjukkan nilai p yang lebih kecil dari

0,01 serta koefisien KMO yang lebih dari 0,05 maka kecukupan sampel untuk

analisis faktor telah terpenuhi (Retnawati, 2016a: 47). Lebih lanjut sebanyak 25

item menunjukkan muatan faktor masing-masing berdasarkan indikatornya. Dari

25 item tersebut menunjukkan seluruh koefisien muatan faktor lebih dari 0,4. Jika

hal tersebut dikonfirmasikan dengan saran Retnawati (2016a: 64) yang

menyatakan bahwa koefisien jalur muatan faktor akan memiliki arti (meaningful)

jika besarnya tidak kurang dari 0,4. Dengan demikian, hasil analisis menunjukkan

bahwa semua variabel observable memberikan sumbangan berarti untuk

mengukur variabel latennya. Hal tersebut bermakna bahwa ke-25 item pada

instrumen penilaian rencana pelaksanaan pembelajaran (RPP) penskoran holistik

untuk penilai dosen telah valid secara konstruk. Hal lain yang dapat dijelaskan

274
dari analisis faktor konfirmatori tersebut adalah pada aspek Goodness of Fit

Model. Berdasarkan hasil analisis diperoleh informasi bahwa model konstruk

yang dirancang telah memenuhi Goodness of Fit Model. Hal ini ditunjukkan

melalui koefisien p-value sebesar 0,19 yang melebih cut-of value 0,05 serta

koefisien RMSEA sebesar 0,012 yang lebih kecil dari cut-of value 0,08. Hal

tersebut diperoleh setelah mengkorelasikan eror antara item 12 dan item 18 serta

item 16 dan item 22 yang dapat diamati pada Lampiran 6 halaman 545.

Selain data dari instrumen penilaian rencana pelaksanaan pembelajaran

(RPP) penskoran holistik untuk penilai dosen, dilakukan pula pembuktian

validitas konstruk dengan menggunakan kelompok data dari penilai guru

pamong/penguji UKIN. Pada dasarnya instrumen yang digunakan adalah sama,

begitu pula subjek yang dinilai adalah orang yang sama, hanya penilainya saja

yang berbeda yaitu dosen dan guru pamong/penguji UKIN.

Berdasarkan hasil analisis faktor konfirmatori dari instrumen penilaian

rencana pelaksanaan pembelajaran (RPP) penskoran holistik untuk penilai guru

pamong/penguji UKIN uji coba II, diperoleh informasi bahwa koefisien Barlet

dengan nilai p 0,000 serta KMO sebesar 0,9. Jika hasil pengujian Barlet

menunjukkan nilai p yang lebih kecil dari 0,01 serta koefisien KMO yang lebih

dari 0,05 maka kecukupan sampel untuk analisis faktor telah terpenuhi

(Retnawati, 2016a: 47). Lebih lanjut sebanyak 25 item menunjukkan muatan

faktor masing-masing berdasarkan indikatornya. Dari 25 item tersebut

menunjukkan seluruh koefisien muatan faktor lebih dari 0,4. Jika hal tersebut

dikonfirmasikan dengan saran Retnawati (2016b: 64) yang menyatakan bahwa

275
koefisien jalur muatan faktor akan memiliki arti (meaningful) jika besarnya tidak

kurang dari 0,4. Dengan demikian, hasil analisis menunjukkan bahwa semua

variabel observable memberikan sumbangan berarti untuk mengukur variabel

latennya. Hal tersebut bermakna sama seperti analisis sebelumnya bahwa ke-25

item pada instrumen penilaian rencana pelaksanaan pembelajaran (RPP)

penskoran holistik untuk penilai guru pamong/penguji UKIN telah valid secara

konstruk. Hal lain yang dapat dijelaskan dari analisis faktor konfirmatori tersebut

adalah pada aspek Goodness of Fit Model. Berdasarkan hasil analisis diperoleh

informasi bahwa model konstruk yang dirancang telah memenuhi Goodness of Fit

Model. Hal ini ditunjukkan melalui koefisien p-value sebesar 0,19 yang melebih

cut-of value 0,05 serta koefisien RMSEA sebesar 0,012 yang lebih kecil dari cut-

of value 0,08. Hal tersebut diperoleh setelah mengkorelasikan error antara item 4

dan item 15 serta item 16 dan item 22 yang dapat diamati pada Lampiran 6

halaman 551.

Berdasarkan beberapa hasil analisis yang telah dikemukakan, baik yang

berasal dari data penilaian dosen, maupun data yang berasal dari penilaian guru

pamong/penguji UKIN, maka dapat disimpulkan bahwa instrumen penilaian

rencana pelaksanaan pembelajaran (RPP) dengan penskoran holistik yang

digunakan pada uji coba II telah valid secara konstruk. Begitu pula ke-25 item

instrumen tersebut telah memenuhi aspek validitas secara konstruk.

b. Validitas Konstruk Instrumen Pelaksanaan pembelajaran (PP)

Instrumen penilaian pelaksanaan pembelajaran (PP) pada uji coba II

diukur melalui empat indikator dengan sebaran item sebanyak 20 item. Keempat

276
indkator tersebut adalah melaksanakan pembelajaran yang mendidik (MPMD),

melaksanakan pembelajaran yang mencerdaskan (MPMC), memfasilitasi

pengembangan potensi diri dan karakter peserta didik (MPDK), serta menilai dan

mengevaluasi pembelajaran (MDMP). Seperti halnya pembuktian validitas

konstruk pada instrumen penilaian RPP, penyajian hasil pembuktian validitas

konstruk instrumen penilaian pelaksanaan pembelajaran (PP) dikelompokkan

berdasarkan dua kelompok data ditinjau dari penskorannya, yaitu kelompok

parsial dan kelompok holistik.

1) Validitas Konstruk Pada Instrumen Penilaian Pelaksanaan Pembelajaran

(PP) dengan Penskoran Parsial

Hasil pembuktian validitas konstruk instrumen penilaian pelaksanaan

pembelajaran (PP) pada uji coba II untuk kelompok penskoran parsial dibagi atas

dua kelompok data yaitu data dari hasil penilai dosen dan data dari hasil penilai

guru pamong/penguji UKIN. Berdasarkan hasil analisis faktor konfirmatori dari

instrumen penilaian pelaksanaan pembelajaran (PP) dengan penskoran parsial

untuk penilai dosen uji coba II, diperoleh informasi bahwa koefisien Barlet

dengan nilai p 0,000 serta KMO sebesar 0,9. Jika hasil pengujian Barlet

menunjukkan nilai p yang lebih kecil dari 0,01 serta koefisien KMO yang lebih

dari 0,05 maka kecukupan sampel untuk analisis faktor telah terpenuhi

(Retnawati, 2016a: 47). Lebih lanjut sebanyak 20 item menunjukkan muatan

faktor masing-masing berdasarkan indikatornya. Dari 20 item tersebut

menunjukkan seluruh koefisien muatan faktor lebih dari 0,4. Jika hal tersebut

dikonfirmasikan dengan saran Retnawati (2016a: 64) yang menyatakan bahwa

277
koefisien jalur muatan faktor akan memiliki arti (meaningful) jika besarnya tidak

kurang dari 0,4. Dengan demikian, hasil analisis menunjukkan bahwa semua

variabel observable memberikan sumbangan berarti untuk mengukur variabel

latennya. Hal tersebut bermakna bahwa ke-20 item pada instrumen penilaian

pelaksanaan pembelajaran (PP) penskoran parsial untuk penilai dosen telah valid

secara konstruk. Hal lain yang dapat dijelaskan dari analisis faktor konfirmatori

tersebut adalah pada aspek Goodness of Fit Model. Berdasarkan hasil analisis

diperoleh informasi bahwa model konstruk yang dirancang telah memenuhi

Goodness of Fit Model. Hal ini ditunjukkan melalui koefisien p-value sebesar

0,09 yang melebih cut-of value 0,05 serta koefisien RMSEA sebesar 0,017 yang

lebih kecil dari cut-of value 0,08. Hal tersebut diperoleh setelah mengkorelasikan

eror antara item 8 dan item 15 yang dapat diamati pada Lampiran 6 halaman 543.

Selain data dari instrumen penilaian pelaksanaan pembelajaran (PP)

penskoran parsial untuk penilai dosen, dilakukan pula pembuktian validitas

konstruk dengan menggunakan kelompok data dari penilai guru pamong/penguji

UKIN. Pada dasarnya instrumen yang digunakan adalah sama, begitu pula subjek

yang dinilai adalah orang yang sama, hanya penilainya saja yang berbeda yaitu

dosen dan guru pamong/penguji UKIN. Berdasarkan hasil analisis faktor

konfirmatori dari instrumen penilaian pelaksanaan pembelajaran (PP) penskoran

parsial untuk penilai guru pamong/penguji UKIN uji coba II, diperoleh informasi

bahwa koefisien Barlet dengan nilai p 0,000 serta KMO sebesar 0,9. Jika hasil

pengujian Barlet menunjukkan nilai p yang lebih kecil dari 0,01 serta koefisien

KMO yang lebih dari 0,05 maka kecukupan sampel untuk analisis faktor telah

278
terpenuhi (Retnawati, 2016a: 47). Lebih lanjut sebanyak 20 item menunjukkan

muatan faktor masing-masing berdasarkan indikatornya. Dari 20 item tersebut

menunjukkan seluruh koefisien muatan faktor lebih dari 0,4. Jika hal tersebut

dikonfirmasikan dengan saran Retnawati (2016a: 64) yang menyatakan bahwa

koefisien jalur muatan faktor akan memiliki arti (meaningful) jika besarnya tidak

kurang dari 0,4. Dengan demikian, hasil analisis menunjukkan bahwa semua

variabel observable memberikan sumbangan berarti untuk mengukur variabel

latennya. Hal tersebut bermakna sama seperti analisis sebelumnya bahwa ke-20

item pada instrumen penilaian pelaksanaan pembelajaran (PP) penskoran parsial

untuk penilai guru pamong/penguji UKIN telah valid secara konstruk. Hal lain

yang dapat dijelaskan dari analisis faktor konfirmatori tersebut adalah pada aspek

Goodness of Fit Model. Berdasarkan hasil analisis diperoleh informasi bahwa

model konstruk yang dirancang telah memenuhi Goodness of Fit Model. Hal ini

ditunjukkan melalui koefisien p-value sebesar 0,08 yang melebih cut-of value 0,05

serta koefisien RMSEA sebesar 0,017 yang lebih kecil dari cut-of value 0,08. Hal

tersebut diperoleh setelah mengkorelasikan error antara item 6 dan item 10 serta

item 8 dan item 15 yang dapat diamati pada Lampiran 6 halaman 549.

Berdasarkan beberapa hasil analisis yang telah dikemukakan, baik yang

berasal dari data penilaian dosen, maupun data yang berasal dari penilaian guru

pamong/penguji UKIN, maka dapat disimpulkan bahwa instrumen penilaian

pelaksanaan pembelajaran (PP) dengan penskoran parsial yang digunakan pada uji

coba II telah valid secara konstruk. Begitu pula ke-20 item instrumen tersebut

telah memenuhi aspek validitas secara konstruk.

279
2) Validitas Konstruk Pada Instrumen Penilaian Pelaksanaan Pembelajaran

(PP) dengan Penskoran Holistik

Seperti halnya pada penskoran parsial, hasil pembuktian validitas konstruk

instrumen penilaian pelaksanaan pembelajaran (PP) pada uji coba II untuk

kelompok penskoran holistik dibagi atas dua kelompok data yaitu data dari hasil

penilai dosen dan data dari hasil penilai guru pamong/penguji UKIN. Berdasarkan

hasil analisis faktor konfirmatori dari instrumen penilaian pelaksanaan

pembelajaran (PP) dengan penskoran holistik untuk penilai dosen pada uji coba II,

diperoleh informasi bahwa sebanyak koefisien Barlet dengan nilai p 0,000 serta

KMO sebesar 0,9. Jika hasil pengujian Barlet menunjukkan nilai p yang lebih

kecil dari 0,01 serta koefisien KMO yang lebih dari 0,05 maka kecukupan sampel

untuk analisis faktor telah terpenuhi (Retnawati, 2016a: 47). Lebih lanjut 20 item

menunjukkan muatan faktor masing-masing berdasarkan indikatornya. Dari 20

item tersebut menunjukkan seluruh koefisien muatan faktor lebih dari 0,4. Jika hal

tersebut dikonfirmasikan dengan saran Retnawati (2017: 64) yang menyatakan

bahwa koefisien jalur muatan faktor akan memiliki arti (meaningful) jika besarnya

tidak kurang dari 0,4. Dengan demikian, hasil analisis menunjukkan bahwa semua

variabel observable memberikan sumbangan berarti untuk mengukur variabel

latennya. Hal tersebut bermakna bahwa ke-20 item pada instrumen penilaian

pelaksanaan pembelajaran (PP) penskoran holistik untuk penilai dosen telah valid

secara konstruk. Hal lain yang dapat dijelaskan dari analisis faktor konfirmatori

tersebut adalah pada aspek Goodness of Fit Model. Berdasarkan hasil analisis

diperoleh informasi bahwa model konstruk yang dirancang telah memenuhi

280
Goodness of Fit Model. Hal ini ditunjukkan melalui koefisien p-value sebesar

0,12 yang melebih cut-of value 0,05 serta koefisien RMSEA sebesar 0,016 yang

lebih kecil dari cut-of value 0,08. Hal tersebut diperoleh setelah mengkorelasikan

error antara item 1 dan item 20 serta item 13 dan item 16 yang dapat diamati pada

Lampiran 6 halaman 546.

Selain data dari instrumen penilaian pelaksanaan pembelajaran (PP)

penskoran holistik untuk penilai dosen, dilakukan pula pembuktian validitas

konstruk dengan menggunakan kelompok data dari penilai guru pamong/penguji

UKIN. Pada dasarnya instrumen yang digunakan juga sama, begitu pula subjek

yang dinilai adalah orang yang sama, hanya penilainya saja yang berbeda yaitu

dosen dan guru pamong/penguji UKIN. Berdasarkan hasil analisis faktor

konfirmatori dari instrumen penilaian pelaksanaan pembelajaran (PP) penskoran

holistik untuk penilai guru pamong/penguji UKIN pada uji coba II, diperoleh

informasi bahwa koefisien Barlet dengan nilai p 0,000 serta KMO sebesar 0,9.

Jika hasil pengujian Barlet menunjukkan nilai p yang lebih kecil dari 0,01 serta

koefisien KMO yang lebih dari 0,05 maka kecukupan sampel untuk analisis faktor

telah terpenuhi (Retnawati, 2016a: 47). Lebih lanjut sebanyak 20 item

menunjukkan muatan faktor masing-masing berdasarkan indikatornya. Dari 20

item tersebut menunjukkan seluruh koefisien muatan faktor lebih dari 0,4. Jika hal

tersebut dikonfirmasikan dengan saran Retnawati (2017: 64) yang menyatakan

bahwa koefisien jalur muatan faktor akan memiliki arti (meaningful) jika besarnya

tidak kurang dari 0,4. Dengan demikian, hasil analisis menunjukkan bahwa semua

variabel observable memberikan sumbangan berarti untuk mengukur variabel

281
latennya. Hal tersebut bermakna sama seperti analisis sebelumnya bahwa ke-20

item pada instrumen penilaian pelaksanaan pembelajaran (PP) penskoran holistik

untuk penilai guru pamong/penguji UKIN telah valid secara konstruk. Hal lain

yang dapat dijelaskan dari analisis faktor konfirmatori tersebut adalah pada aspek

Goodness of Fit Model. Berdasarkan hasil analisis diperoleh informasi bahwa

model konstruk yang dirancang telah memenuhi Goodness of Fit Model. Hal ini

ditunjukkan melalui koefisien p-value sebesar 0,09 yang melebih cut-of value 0,05

serta koefisien RMSEA sebesar 0,017 yang lebih kecil dari cut-of value 0,08. Hal

tersebut diperoleh setelah mengkorelasikan error antara item 8 dan item 15 serta

item 11 dan item 16 yang dapat diamati pada Lampiran 6 halaman 552.

Berdasarkan beberapa hasil analisis yang telah dikemukakan, baik yang

berasal dari data penilaian dosen, maupun data yang berasal dari penilaian guru

pamong/penguji UKIN, maka dapat disimpulkan bahwa instrumen penilaian

pelaksanaan pembelajaran (PP) dengan penskoran holistik yang digunakan pada

uji coba II telah valid secara konstruk. Begitu pula ke-20 item instrumen tersebut

telah memenuhi aspek validitas secara konstruk.

c. Validitas Konstruk Instrumen Kompetensi Sosial dan Kompetensi

Kepribadian (KSKK)

Pada uji coba II, instrumen penilaian kompetensi sosial dan kompetensi

kepribadian (KSKK) diukur melalui empat indikator dengan sebaran item

sebanyak 20 item. Keempat indkator tersebut adalah bekerjasama dan memiliki

jiwa kepemimpinan (BMJK), bersikap inklusif, toleran dan peduli (BITP),

berkomunikasi dengan sesama (BKDS), bersikap sopan/ santun, mandiri, kreatif

282
dan disiplin (BSMKD). Seperti halnya pembuktian validitas konstruk pada

instrumen penilaian RPP dan pelaksanaan pembelajaran, penyajian hasil

pembuktian validitas konstruk instrumen penilaian kompetensi sosial dan

kompetensi kepribadian (KSKK) dikelompokkan berdasarkan dua kelompok data

ditinjau dari penskorannya, yaitu kelompok parsial dan kelompok holistik.

1) Validitas Konstruk Pada Instrumen Penilaian Kompetensi Sosial dan

Kompetensi Kepribadian (KSKK) dengan Penskoran Parsial

Hasil pembuktian validitas konstruk instrumen penilaian kompetensi

sosial dan kompetensi kepribadian (KSKK) pada uji coba II untuk kelompok

penskoran parsial dibagi atas dua kelompok data yaitu data dari hasil penilai

dosen dan data dari hasil penilai guru pamong/penguji UKIN. Berdasarkan hasil

analisis faktor konfirmatori dari instrumen penilaian kompetensi sosial dan

kompetensi kepribadian (KSKK) dengan penskoran parsial untuk penilai dosen uji

coba II, diperoleh informasi bahwa koefisien Barlet dengan nilai p 0,000 serta

KMO sebesar 0,9. Jika hasil pengujian Barlet menunjukkan nilai p yang lebih

kecil dari 0,01 serta koefisien KMO yang lebih dari 0,05 maka kecukupan sampel

untuk analisis faktor telah terpenuhi (Retnawati, 2016a: 47). Lebih lanjut

sebanyak 20 item menunjukkan muatan faktor masing-masing berdasarkan

indikatornya. Dari 20 item tersebut menunjukkan seluruh koefisien muatan faktor

lebih dari 0,4. Jika hal tersebut dikonfirmasikan dengan saran Retnawati (2016a:

64) yang menyatakan bahwa koefisien jalur muatan faktor akan memiliki arti

(meaningful) jika besarnya tidak kurang dari 0,4. Dengan demikian, hasil analisis

menunjukkan bahwa semua variabel observable memberikan sumbangan berarti

283
untuk mengukur variabel latennya. Hal tersebut bermakna bahwa ke-20 item pada

instrumen penilaian kompetensi sosial dan kompetensi kepribadian (KSKK)

penskoran parsial untuk penilai dosen telah valid secara konstruk. Hal lain yang

dapat dijelaskan dari hasil analisis faktor konfirmatori adalah pada aspek

Goodness of Fit Model. Berdasarkan hasil analisis diperoleh informasi bahwa

model konstruk yang dirancang telah memenuhi Goodness of Fit Model. Hal ini

ditunjukkan melalui koefisien p-value sebesar 0,056 yang melebih cut-of value

0,05 serta koefisien RMSEA sebesar 0,019 yang lebih kecil dari cut-of value 0,08.

Hal tersebut diperoleh setelah mengkorelasikan error antara item 4 dan item 8

serta item 4 dan item 18 yang dapat diamati pada Lampiran 6 halaman 544.

Selain data dari instrumen penilaian kompetensi sosial dan kompetensi

kepribadian (KSKK) penskoran parsial untuk penilai dosen, dilakukan pula

pembuktian validitas konstruk dengan menggunakan kelompok data dari penilai

guru pamong/penguji UKIN. Pada dasarnya instrumen yang digunakan adalah

sama, begitu pula subjek yang dinilai adalah orang yang sama, hanya penilainya

saja yang berbeda yaitu dosen dan guru pamong/penguji UKIN.

Berdasarkan hasil analisis faktor konfirmatori dari instrumen penilaian

kompetensi sosial dan kompetensi kepribadian (KSKK) penskoran parsial untuk

penilai guru pamong/penguji UKIN pada uji coba II, diperoleh informasi bahwa

koefisien Barlet dengan nilai p 0,000 serta KMO sebesar 0,9. Jika hasil pengujian

Barlet menunjukkan nilai p yang lebih kecil dari 0,01 serta koefisien KMO yang

lebih dari 0,05 maka kecukupan sampel untuk analisis faktor telah terpenuhi

(Retnawati, 2016a: 47). Lebih lanjut sebanyak 20 item menunjukkan muatan

284
faktor masing-masing berdasarkan indikatornya. Dari 20 item tersebut

menunjukkan seluruh koefisien muatan faktor lebih dari 0,4. Jika hal tersebut

dikonfirmasikan dengan saran Retnawati (2017a: 64) yang menyatakan bahwa

koefisien jalur muatan faktor akan memiliki arti (meaningful) jika besarnya tidak

kurang dari 0,4. Dengan demikian, hasil analisis menunjukkan bahwa semua

variabel observable memberikan sumbangan berarti untuk mengukur variabel

latennya. Hal tersebut bermakna sama seperti analisis sebelumnya bahwa ke-20

item pada instrumen penilaian kompetensi sosial dan kompetensi kepribadian

(KSKK) penskoran parsial untuk penilai guru pamong/penguji UKIN telah valid

secara konstruk. Hal lain yang dapat dijelaskan dari hasil analisis faktor

konfirmatori adalah pada aspek Goodness of Fit Model. Berdasarkan hasil analisis

diperoleh informasi bahwa model konstruk yang dirancang telah memenuhi

Goodness of Fit Model. Hal ini ditunjukkan melalui koefisien p-value sebesar

0,07 yang melebih cut-of value 0,05 serta koefisien RMSEA sebesar 0,018 yang

lebih kecil dari cut-of value 0,08. Hal tersebut diperoleh setelah mengkorelasikan

eror antara item 8 dan item 11 yang dapat diamati pada Lampiran 6 halaman 552.

Berdasarkan beberapa hasil analisis yang telah dikemukakan, baik yang

berasal dari data penilaian dosen, maupun data yang berasal dari penilaian guru

pamong/penguji UKIN, maka dapat disimpulkan bahwa instrumen penilaian

kompetensi sosial dan kompetensi kepribadian (KSKK) dengan penskoran parsial

yang digunakan pada uji coba II telah valid secara konstruk. Begitu pula ke-20

item instrumen tersebut telah memenuhi aspek validitas secara konstruk.

285
2) Validitas Konstruk Pada Instrumen Kompetensi Sosial dan Kompetensi

Kepribadian (KSKK) dengan Penskoran Holistik

Seperti halnya pada penskoran parsial, hasil pembuktian validitas konstruk

instrumen penilaian kompetensi sosial dan kompetensi kepribadian (KSKK) pada

uji coba II untuk kelompok penskoran holistik dibagi atas dua kelompok data

yaitu data dari hasil penilai dosen dan data dari hasil penilai guru pamong/penguji

UKIN. Berdasarkan hasil analisis faktor konfirmatori dari instrumen penilaian

kompetensi sosial dan kompetensi kepribadian (KSKK) dengan penskoran holistik

untuk penilai dosen pada uji coba II, diperoleh informasi bahwa koefisien Barlet

dengan nilai p 0,000 serta KMO sebesar 0,9. Jika hasil pengujian Barlet

menunjukkan nilai p yang lebih kecil dari 0,01 serta koefisien KMO yang lebih

dari 0,05 maka kecukupan sampel untuk analisis faktor telah terpenuhi

(Retnawati, 2016a: 47). Lebih lanjut sebanyak 20 item menunjukkan muatan

faktor masing-masing berdasarkan indikatornya. Dari 20 item tersebut

menunjukkan seluruh koefisien muatan faktor lebih dari 0,4. Jika hal tersebut

dikonfirmasikan dengan saran Retnawati (2016a: 64) yang menyatakan bahwa

koefisien jalur muatan faktor akan memiliki arti (meaningful) jika besarnya tidak

kurang dari 0,4. Dengan demikian, hasil analisis menunjukkan bahwa semua

variabel observable memberikan sumbangan berarti untuk mengukur variabel

latennya. Hal tersebut bermakna bahwa ke-20 item pada instrumen penilaian

kompetensi sosial dan kompetensi kepribadian (KSKK) penskoran holistik untuk

penilai dosen telah valid secara konstruk. Hal lain yang dapat dijelaskan dari hasil

analisis faktor konfirmatori adalah pada aspek Goodness of Fit Model.

286
Berdasarkan hasil analisis diperoleh informasi bahwa model konstruk yang

dirancang telah memenuhi Goodness of Fit Model. Hal ini ditunjukkan melalui

koefisien p-value sebesar 0,13 yang melebih cut-of value 0,05 serta koefisien

RMSEA sebesar 0,015 yang lebih kecil dari cut-of value 0,08. Hal tersebut

diperoleh setelah mengkorelasikan eror antara item 4 dan item 8, serta item 5 dan

item 12 yang dapat diamati pada Lampiran 6 halaman 547.

Selain data dari instrumen penilaian pelaksanaan pembelajaran (PP)

penskoran holistik untuk penilai dosen, dilakukan pula pembuktian validitas

konstruk dengan menggunakan kelompok data dari penilai guru pamong/penguji

UKIN. Pada dasarnya instrumen yang digunakan juga sama, begitu pula subjek

yang dinilai adalah orang yang sama, hanya penilainya saja yang berbeda yaitu

dosen dan guru pamong/penguji UKIN.

Berdasarkan hasil analisis faktor konfirmatori dari instrumen penilaian

kompetensi sosial dan kompetensi kepribadian (KSKK) penskoran holistik untuk

penilai guru pamong/penguji UKIN pada uji coba II, diperoleh informasi bahwa

koefisien Barlet dengan nilai p 0,000 serta KMO sebesar 0,9. Jika hasil pengujian

Barlet menunjukkan nilai p yang lebih kecil dari 0,01 serta koefisien KMO yang

lebih dari 0,05 maka kecukupan sampel untuk analisis faktor telah terpenuhi

(Retnawati, 2016a: 47). Lebih lanjut sebanyak 20 item menunjukkan muatan

faktor masing-masing berdasarkan indikatornya. Dari 20 item tersebut

menunjukkan seluruh koefisien muatan faktor lebih dari 0,4. Jika hal tersebut

dikonfirmasikan dengan saran Retnawati (2016b: 64) yang menyatakan bahwa

koefisien jalur muatan faktor akan memiliki arti (meaningful) jika besarnya tidak

287
kurang dari 0,4. Dengan demikian, hasil analisis menunjukkan bahwa semua

variabel observable memberikan sumbangan berarti untuk mengukur variabel

latennya. Hal tersebut bermakna sama seperti analisis sebelumnya bahwa ke-20

item pada instrumen penilaian kompetensi sosial dan kompetensi kepribadian

(KSKK) penskoran holistik untuk penilai guru pamong/penguji UKIN telah valid

secara konstruk. Hal lain yang dapat dijelaskan dari hasil analisis faktor

konfirmatori adalah pada aspek Goodness of Fit Model. Berdasarkan hasil analisis

diperoleh informasi bahwa model konstruk yang dirancang telah memenuhi

Goodness of Fit Model. Hal ini ditunjukkan melalui koefisien p-value sebesar

0,095 yang melebih cut-of value 0,05 serta koefisien RMSEA sebesar 0,017 yang

lebih kecil dari cut-of value 0,08. Hal tersebut diperoleh setelah mengkorelasikan

error antara item 4 dan item 8 yang dapat diamati pada Lampiran 6 halaman 553.

Berdasarkan beberapa hasil analisis yang telah dikemukakan, baik yang

berasal dari data penilaian dosen, maupun data yang berasal dari penilaian guru

pamong/penguji UKIN, maka dapat disimpulkan bahwa instrumen penilaian

kompetensi sosial dan kompetensi kepribadian (KSKK) dengan penskoran holistik

yang digunakan pada uji coba II telah valid secara konstruk. Begitu pula ke-20

item instrumen tersebut telah memenuhi aspek validitas secara konstruk.

2. Reliabilitas Instrumen

Selain hasil pembuktian validitas konstruk melalui analisis faktor

konfirmatori dan karakteristik item instrumen berdasarkan politomus item

response theory, pada uji coba II ini juga dilakukan pembuktian reliabilitas

288
instrumen. Pembuktian reliabilitas instrumen tersebut dilakukan untuk melihat

keajegan instrumen model penilaian PPG yang telah dikembangkan berdasarkan

hasil pengukuran pada uji coba II. Pembuktian reliabilitas pada uji coba II juga

dilakukan untuk semua komponen instrumen yang telah dikembangkan yaitu:

instrumen penilaian rencana pelaksanaan pembelajaran (RPP), instrumen

penilaian pelaksanaan pembelajaran (PP), serta instrumen penilaian kompetensi

sosial dan kompetensi kepribadian (KSKK). Pembuktian reliabilitas instrumen

untuk semua komponen instrumen yang dimaksud diuraikan sebagai berikut.

a. Reliabilitas Instrumen Penilaian RPP

Reliabilitas instrumen penilaian RPP dibagi menjadi empat kelompok data,

seperti pada validitas dan karakteristik instrumen. Data pertama adalah instrumen

penilaian RPP dengan penskoran parsial untuk penilai dosen. Data kedua adalah

instrumen penilaian RPP dengan penskoran parsial untuk penilai guru

pamong/penguji UKIN. Data ketiga adalah instrumen penilaian RPP dengan

penskoran holistik untuk penilai dosen, dan data keempat adalah instrumen

penilaian RPP dengan penskoran holistik untuk penilai guru pamong/penguji

UKIN. Uraian keempat kelompok data tersebut dikemukakan sebagai berikut.

1) Reliabilitas Instrumen Penilaian RPP Penskoran Parsial Penilai Dosen

Reliabilitas instrumen penilaian rencana pelaksanaan pembelajaran (RPP)

penskoran parsial untuk penilai dosen pada uji coba II dianalisis dengan

menggunakan pendekatan reliabilitas  dengan menggunakan koefisien muatan

faktor untuk semua variabel observasi terhadap variabel latennya. Berikut ini

289
disajikan hasil analisis reliabilitas instrumen penilaian RPP penskoran parsial

untuk penilai dosen sebagaimana terlampir pada Lampiran 7 halaman 554.

Tabel 39. Muatan Faktor Variabel Observasi pada Instrumen Penilaian RPP
Penskoran Parsial untuk Penilai Dosen pada Uji Coba II

Item i i 2 1  i
2

A1 0,61 0,3721 0,6279


A2 0,66 0,4356 0,5644
A3 0,53 0,2809 0,7191
A4 0,62 0,3844 0,6156
A5 0,58 0,3364 0,6636
A6 0,65 0,4225 0,5775
B7 0,56 0,3136 0,6864
B8 0,54 0,2916 0,7084
B9 0,56 0,3136 0,6864
B10 0,54 0,2916 0,7084
B11 0,58 0,3364 0,6636
B12 0,49 0,2401 0,7599
C13 0,59 0,3481 0,6519
C14 0,57 0,3249 0,6751
C15 0,57 0,3249 0,6751
C16 0,61 0,3721 0,6279
C17 0,57 0,3249 0,6751
C18 0,58 0,3364 0,6636
D19 0,53 0,2809 0,7191
D20 0,53 0,2809 0,7191
D21 0,58 0,3364 0,6636
D22 0,50 0,2500 0,7500
D23 0,52 0,2704 0,7296
D24 0,52 0,2704 0,7296
D25 0,54 0,2916 0,7084
∑ 14,13 16,9693

Tabel 54 menunjukkan informasi tentang muatan faktor valiabel observasi

atau item instrumen penilaian RPP penskoran parsial untuk penilai dosen pada uji

coba II. Berdasarkan tabel tersebut diperoleh informasi koefisien muatan faktor

i
serta koefisien muatan faktor yang dikuadratkan, diketahui 
i 1
i sebesar 14,13,

290
i

1  
2
serta i sebasar 16,96. Berdasarkan hasil perhitungan reliabilitas diperoleh
i 1

koefisien omega (  ) yang menunjukkan koefisien reliabilitas instrumen sebesar

0,92. Jika didasari pada kriteria minimal koefisien reliabilitas sebesar 0,85 yang

disarankan oleh Mehrens and Lehmann (1973) dan Retnawati (2016a: 87) dapat

disimpulkan bahwa instrumen penilaian RPP penskoran parsial untuk penilai

dosen pada uji coba II reliabel.

2) Reliabilitas Instrumen Penilaian RPP Penskoran Parsial untuk Penilai

Guru pamong/penguji UKIN

Reliabilitas instrumen penilaian rencana pelaksanaan pembelajaran (RPP)

penskoran parsial untuk penilai guru pamong/penguji UKIN pada uji coba II

dianalisis menggunakan pendekatan reliabilitas  dengan koefisien muatan faktor

untuk semua variabel observasi terhadap variabel latennya. Berikut ini disajikan

hasil analisis reliabilitas instrumen penilaian rencana pelaksanaan pembelajaran

(RPP) penskoran parsial untuk penilai guru pamong/penguji UKIN sebagaimana

terlampir pada Lampiran 7 halaman 560.

291
Tabel 40. Muatan Faktor Variabel Observasi pada Instrumen Penilaian
RPP Penskoran Parsial Penilai Guru pamong/penguji UKIN Uji
Coba II

Item i i 2 1  i
2

A1 0,69 0,4761 0,5239


A2 0,71 0,5041 0,4959
A3 0,61 0,3721 0,6279
A4 0,72 0,5184 0,4816
A5 0,67 0,4489 0,5511
A6 0,72 0,5184 0,4816
B7 0,64 0,4096 0,5904
B8 0,62 0,3844 0,6156
B9 0,62 0,3844 0,6156
B10 0,61 0,3721 0,6279
B11 0,63 0,3969 0,6031
B12 0,58 0,3364 0,6636
C13 0,65 0,4225 0,5775
C14 0,64 0,4096 0,5904
C15 0,64 0,4096 0,5904
C16 0,68 0,4624 0,5376
C17 0,64 0,4096 0,5904
C18 0,65 0,4225 0,5775
D19 0,62 0,3844 0,6156
D20 0,62 0,3844 0,6156
D21 0,65 0,4225 0,5775
D22 0,6 0,36 0,64
D23 0,61 0,3721 0,6279
D24 0,63 0,3969 0,6031
D25 0,64 0,4096 0,5904
∑ 16,09 14,6121

Tabel 40 menunjukkan informasi tentang muatan faktor valiabel observasi

atau item instrumen penilaian RPP penskoran parsial untuk penilai guru

pamong/penguji UKIN pada uji coba II, berdasarkan hasil perhitungan reliabilitas

diperoleh koefisien omega (  ) yang menunjukkan koefisien reliabilitas instrumen

sebesar 0,94. Jika didasari pada kriteria minimal koefisien reliabilitas sebesar 0,85

yang disarankan oleh Mehrens and Lehmann (1973) dan Retnawati (2016a: 87)

292
dapat disimpulkan bahwa instrumen penilaian RPP penskoran parsial untuk

penilai guru pamong/penguji UKIN pada uji coba II reliabel.

3) Reliabilitas Instrumen Penilaian RPP Penskoran Holistik Penilai Dosen

Hasil analisis reliabilitas instrumen penilaian rencana pelaksanaan

pembelajaran (RPP) penskoran holistik untuk penilai dosen pada uji coba II

sebagaimana terlampir pada Lampiran 7 halaman 557 disajikan pada Tabel 41.

Tabel 41. Muatan Faktor Variabel Observasi pada Instrumen Penilaian RPP
Penskoran Holistik untuk Penilai Dosen pada Uji Coba II

Item i i 2 1  i
2

A1 0,67 0,4489 0,5511


A2 0,72 0,5184 0,4816
A3 0,61 0,3721 0,6279
A4 0,72 0,5184 0,4816
A5 0,67 0,4489 0,5511
A6 0,72 0,5184 0,4816
B7 0,62 0,3844 0,6156
B8 0,62 0,3844 0,6156
B9 0,62 0,3844 0,6156
B10 0,63 0,3969 0,6031
B11 0,65 0,4225 0,5775
B12 0,60 0,3600 0,6400
C13 0,65 0,4225 0,5775
C14 0,63 0,3969 0,6031
C15 0,63 0,3969 0,6031
C16 0,67 0,4489 0,5511
C17 0,63 0,3969 0,6031
C18 0,65 0,4225 0,5775
D19 0,60 0,3600 0,6400
D20 0,63 0,3969 0,6031
D21 0,66 0,4356 0,5644
D22 0,63 0,3969 0,6031
D23 0,63 0,3969 0,6031
D24 0,67 0,4489 0,5511
D25 0,67 0,4489 0,5511
∑ 16,2 14,4736

293
Tabel 41 menunjukkan informasi tentang muatan faktor valiabel observasi

atau item instrumen penilaian RPP penskoran holistik untuk penilai dosen pada uji

i i

 i sebesar 16,2, serta 1  


2
coba II, diketahui i sebasar 14,47. Berdasarkan
i 1 i 1

hasil perhitungan reliabilitas diperoleh koefisien omega (  ) yang menunjukkan

koefisien reliabilitas instrumen sebesar 0,94. Jika didasari pada kriteria minimal

koefisien reliabilitas sebesar 0,85 yang disarankan oleh Mehrens and Lehmann

(1973) dan Retnawati (2016a: 87) dapat disimpulkan bahwa instrumen penilaian

RPP penskoran holistik untuk penilai dosen pada uji coba II telah reliabel.

4) Reliabilitas Instrumen Penilaian RPP Penskoran Holistik untuk Penilai

Guru pamong/penguji UKIN

Hasil analisis reliabilitas instrumen penilaian rencana pelaksanaan

pembelajaran (RPP) penskoran holistik untuk penilai guru pamong/penguji UKIN

pada uji coba II dianalisis menggunakan pendekatan Reliabilitas  dengan

koefisien muatan faktor untuk semua variabel observasi terhadap variabel

latennya disajikan pada Tabel 42.

294
Tabel 42. Muatan Faktor Variabel Observasi pada Instrumen Penilaian RPP
Penskoran Holistik Penilai Guru pamong/penguji UKIN pada Uji
Coba II

Item i i 2 1  i
2

A1 0,67 0,4489 0,5511


A2 0,72 0,5184 0,4816
A3 0,61 0,3721 0,6279
A4 0,72 0,5184 0,4816
A5 0,67 0,4489 0,5511
A6 0,71 0,5041 0,4959
B7 0,62 0,3844 0,6156
B8 0,61 0,3721 0,6279
B9 0,61 0,3721 0,6279
B10 0,60 0,3600 0,6400
B11 0,62 0,3844 0,6156
B12 0,56 0,3136 0,6864
C13 0,64 0,4096 0,5904
C14 0,63 0,3969 0,6031
C15 0,63 0,3969 0,6031
C16 0,67 0,4489 0,5511
C17 0,63 0,3969 0,6031
C18 0,65 0,4225 0,5775
D19 0,61 0,3721 0,6279
D20 0,61 0,3721 0,6279
D21 0,64 0,4096 0,5904
D22 0,60 0,3600 0,6400
D23 0,59 0,3481 0,6519
D24 0,63 0,3969 0,6031
D25 0,63 0,3969 0,6031
∑ 15,88 14,8752

Tabel 42 menunjukkan informasi tentang muatan faktor valiabel observasi

atau item instrumen penilaian RPP penskoran holistik untuk penilai guru

i
pamong/penguji UKIN pada uji coba II, diketahui 
i 1
i sebesar 15,88, serta

1  
2
i sebasar 14,87. Berdasarkan hasil perhitungan reliabilitas diperoleh
i 1

koefisien omega (  ) yang menunjukkan koefisien reliabilitas instrumen sebesar

295
0,94. Jika didasari pada kriteria minimal koefisien reliabilitas sebesar 0,85 yang

disarankan oleh Mehrens and Lehmann (1973) dan Retnawati (2016a: 87) dapat

disimpulkan bahwa instrumen penilaian RPP penskoran holistik untuk penilai

guru pamong/penguji UKIN pada uji coba II telah reliabel.

b. Reliabilitas Instrumen Penilaian Pelaksanaan Pembelajaran (PP)

Reliabilitas instrumen penilaian pelaksanaan pembelajaran (PP) juga

dibagi menjadi empat kelompok data. Data pertama adalah instrumen penilaian

pelaksanaan pembelajaran dengan penskoran parsial untuk penilai dosen. Data

kedua adalah instrumen penilaian pelaksanaan pembelajaran dengan penskoran

parsial untuk penilai guru pamong/penguji UKIN. Data ketiga adalah instrumen

penilaian pelaksanaan pembelajaran dengan penskoran holistik untuk penilai

dosen, dan data keempat adalah instrumen penilaian pelaksanaan pembelajaran

dengan penskoran holistik untuk penilai guru pamong/penguji UKIN. Uraian dari

keempat kelompok data tersebut dikemukakan sebagai berikut.

a) Reliabilitas Instrumen Penilaian Pelaksanaan Pembelajaran (PP)

Penskoran Parsial untuk Penilai Dosen

Reliabilitas instrumen penilaian pelaksanaan pembelajaran (PP) penskoran

parsial untuk penilai dosen pada uji coba II dianalisis menggunakan pendekatan

reliabilitas  dengan koefisien muatan faktor untuk semua variabel observasi

terhadap variabel latennya. Berikut ini disajikan hasil analisis reliabilitas

instrumen tersebut pada Tabel 58.

296
Tabel 43. Muatan Faktor Variabel Observasi pada Instrumen Penilaian
Pelaksanaan Pembelajaran Penskoran Parsial Penilai Dosen Uji
Coba II

Item i i 2 1  i
2

A1 0,69 0,4761 0,5239


A2 0,73 0,5329 0,4671
A3 0,73 0,5329 0,4671
A4 0,73 0,5329 0,4671
B5 0,72 0,5184 0,4816
B6 0,73 0,5329 0,4671
B7 0,74 0,5476 0,4524
B8 0,74 0,5476 0,4524
B9 0,68 0,4624 0,5376
B10 0,76 0,5776 0,4224
B11 0,73 0,5329 0,4671
C12 0,79 0,6241 0,3759
C13 0,75 0,5625 0,4375
C14 0,72 0,5184 0,4816
C15 0,72 0,5184 0,4816
D16 0,76 0,5776 0,4224
D17 0,75 0,5625 0,4375
D18 0,7 0,49 0,51
D19 0,75 0,5625 0,4375
D20 0,64 0,4096 0,5904
∑ 14,56 9,3802

Tabel 43 menunjukkan informasi tentang muatan faktor valiabel observasi

atau item instrumen penilaian pelaksanaan pembelajaran (PP) penskoran parsial

i
untuk penilai dosen pada uji coba II, diketahui 
i 1
i sebesar 14,56, serta

1  
2
i sebasar 9,38. Berdasarkan hasil perhitungan reliabilitas diperoleh
i 1

koefisien omega (  ) yang menunjukkan koefisien reliabilitas instrumen sebesar

0,95. Jika didasari pada kriteria minimal koefisien reliabilitas sebesar 0,85 yang

disarankan oleh Mehrens and Lehmann (1973) dan Retnawati (2016a: 87) dapat

297
disimpulkan bahwa instrumen penilaian pelaksanaan pembelajaran penskoran

parsial untuk penilai dosen pada uji coba II telah reliabel.

b) Reliabilitas Instrumen Penilaian Pelaksanaan Pembelajaran (PP)

Penskoran Parsial untuk Penilai Guru pamong/penguji UKIN

Pada uji coba II, reliabilitas instrumen penilaian pelaksanaan pembelajaran

(PP) penskoran parsial untuk penilai guru pamong/penguji UKIN dianalisis

menggunakan pendekatan reliabilitas  dengan koefisien muatan faktor untuk

semua variabel observasi terhadap variabel latennya. Berikut ini disajikan hasil

analisis reliabilitas instrumen penilaian tersebut.

Tabel 44. Muatan Faktor Variabel Observasi pada Instrumen Penilaian


Pelaksanaan Pembelajaran (PP) Penskoran Parsial Penilai Guru
pamong/penguji UKIN pada Uji Coba II

Item i i 2 1  i
2

A1 0,73 0,5329 0,4671


A2 0,73 0,5329 0,4671
A3 0,68 0,4624 0,5376
A4 0,74 0,5476 0,4524
B5 0,69 0,4761 0,5239
B6 0,75 0,5625 0,4375
B7 0,75 0,5625 0,4375
B8 0,76 0,5776 0,4224
B9 0,73 0,5329 0,4671
B10 0,76 0,5776 0,4224
B11 0,72 0,5184 0,4816
C12 0,77 0,5929 0,4071
C13 0,74 0,5476 0,4524
C14 0,73 0,5329 0,4671
C15 0,72 0,5184 0,4816
D16 0,77 0,5929 0,4071
D17 0,78 0,6084 0,3916
D18 0,70 0,4900 0,5100
D19 0,73 0,5329 0,4671
D20 0,69 0,4761 0,5239
∑ 14,67 9,2245

298
Tabel 44 menunjukkan informasi tentang muatan faktor valiabel observasi

atau item instrumen penilaian pelaksanaan pembelajaran (PP) penskoran parsial

i
untuk penilai guru pamong/penguji UKIN pada uji coba II, diketahui 
i 1
i

1  
2
sebesar 14,67, serta i sebasar 9,22. Berdasarkan hasil perhitungan
i 1

reliabilitas diperoleh koefisien omega (  ) yang menunjukkan koefisien

reliabilitas instrumen sebesar 0,95. Jika didasari pada kriteria minimal koefisien

reliabilitas sebesar 0,85 yang disarankan oleh Mehrens and Lehmann (1973) dan

Retnawati (2016a: 87) dapat disimpulkan bahwa instrumen penilaian pelaksanaan

pembelajaran (PP) penskoran parsial untuk penilai guru pamong/penguji UKIN

pada uji coba II reliabel.

c) Reliabilitas Instrumen Penilaian Pelaksanaan Pembelajaran (PP)

Penskoran Holistik untuk Penilai Dosen

Reliabilitas instrumen penilaian pelaksanaan pembelajaran (PP) penskoran

holistik untuk penilai dosen pada uji coba II dianalisis menggunakan pendekatan

reliabilitas  dengan koefisien muatan faktor untuk semua variabel observasi

terhadap variabel latennya. Berikut ini disajikan hasil analisis reliabilitas

instrumen penilaian pelaksanaan pembelajaran (PP) penskoran parsial untuk

penilai dosen sebagaimana terlampir pada Lampiran 7 halaman 558.

299
Tabel 45. Muatan Faktor Variabel Observasi pada Instrumen Penilaian
Pelaksanaan Pembelajaran Penskoran Holistik Penilai Dosen Uji
Coba II

Item i i 2 1  i
2

A1 0,73 0,5329 0,4671


A2 0,73 0,5329 0,4671
A3 0,71 0,5041 0,4959
A4 0,71 0,5041 0,4959
B5 0,72 0,5184 0,4816
B6 0,74 0,5476 0,4524
B7 0,74 0,5476 0,4524
B8 0,74 0,5476 0,4524
B9 0,70 0,4900 0,5100
B10 0,75 0,5625 0,4375
B11 0,73 0,5329 0,4671
C12 0,78 0,6084 0,3916
C13 0,75 0,5625 0,4375
C14 0,72 0,5184 0,4816
C15 0,72 0,5184 0,4816
D16 0,75 0,5625 0,4375
D17 0,76 0,5776 0,4224
D18 0,69 0,4761 0,5239
D19 0,73 0,5329 0,4671
D20 0,69 0,4761 0,5239
∑ 14,59 9,3465

Tabel 45 menunjukkan informasi tentang muatan faktor valiabel observasi

atau item instrumen penilaian pelaksanaan pembelajaran (PP) penskoran holistik

i
untuk penilai dosen pada uji coba II, diketahui 
i 1
i sebesar 14,59, serta

1  
2
i sebasar 9,34. Berdasarkan hasil perhitungan reliabilitas diperoleh
i 1

koefisien omega (  ) yang menunjukkan koefisien reliabilitas instrumen sebesar

0,96. Jika didasari pada kriteria minimal koefisien reliabilitas sebesar 0,85 yang

disarankan oleh Mehrens and Lehmann (1973) dan Retnawati (2016a: 87) dapat

300
disimpulkan bahwa instrumen penilaian pelaksanaan pembelajaran (PP)

penskoran holistik untuk penilai dosen pada uji coba II telah reliabel.

d) Reliabilitas Instrumen Penilaian Pelaksanaan Pembelajaran Penskoran

Holistik Penilai Guru pamong/penguji UKIN

Reliabilitas instrumen penilaian pelaksanaan pembelajaran (PP) penskoran

holistik untuk penilai guru pamong/penguji UKIN pada uji coba II dianalisis

menggunakan pendekatan reliabilitas  sebagaimana terlampir pada Lampiran 7

halaman 564 dan disajikan pada Tabel 46.

Tabel 46. Muatan Faktor Variabel Observasi pada Instrumen Penilaian


Pelaksanaan Pembelajaran Penskoran Holistik Penilai Guru
Pamong/penguji UKIN Uji Coba II

Item i i 2 1  i
2

A1 0,73 0,5329 0,4671


A2 0,74 0,5476 0,4524
A3 0,72 0,5184 0,4816
A4 0,73 0,5329 0,4671
B5 0,73 0,5329 0,4671
B6 0,74 0,5476 0,4524
B7 0,75 0,5625 0,4375
B8 0,75 0,5625 0,4375
B9 0,72 0,5184 0,4816
B10 0,74 0,5476 0,4524
B11 0,72 0,5184 0,4816
C12 0,79 0,6241 0,3759
C13 0,74 0,5476 0,4524
C14 0,72 0,5184 0,4816
C15 0,72 0,5184 0,4816
D16 0,76 0,5776 0,4224
D17 0,77 0,5929 0,4071
D18 0,69 0,4761 0,5239
D19 0,73 0,5329 0,4671
D20 0,70 0,4900 0,5100
∑ 14,69 9,2003

301
Tabel 46 menunjukkan informasi tentang muatan faktor valiabel observasi

atau item instrumen penilaian pelaksanaan pembelajaran (PP) penskoran holistik

i
untuk penilai guru pamong/penguji UKIN, diketahui 
i 1
i sebesar 14,69, serta

1  
2
i sebasar 9,20. Berdasarkan hasil perhitungan reliabilitas diperoleh
i 1

koefisien omega (  ) yang menunjukkan koefisien reliabilitas instrumen sebesar

0,95. Jika didasari pada kriteria minimal koefisien reliabilitas sebesar 0,85 yang

disarankan oleh Mehrens and Lehmann (1973) dan Retnawati (2016a: 87) dapat

disimpulkan bahwa instrumen penilaian pelaksanaan pembelajaran (PP)

penskoran holistik untuk penilai guru pamong/penguji UKIN pada uji coba II

telah reliabel.

c. Reliabilitas Instrumen Penilaian Kompetensi Sosial dan Kompetensi

Kepribadian

Seperti halnya pada reliabilitas instrumen penilaian RPP dan pelaksanaan

pemblajaran (PP), pada uji coba II reliabilitas instrumen penilaian penilaian

kompetensi sosial dan kompetensi kepribadian (KSKK) dibagi menjadi empat

kelompok data. Data pertama adalah instrumen penilaian kompetensi sosial dan

kompetensi kepribadian (KSKK) dengan penskoran parsial untuk penilai dosen.

Data kedua adalah instrumen penilaian kompetensi sosial dan kompetensi

kepribadian (KSKK) dengan penskoran parsial untuk penilai guru

pamong/penguji UKIN. Data ketiga adalah instrumen penilaian kompetensi sosial

dan kompetensi kepribadian (KSKK) dengan penskoran holistik untuk penilai

302
dosen, dan data keempat adalah instrumen penilaian kompetensi sosial dan

kompetensi kepribadian (KSKK) dengan penskoran holistik untuk penilai guru

pamong/penguji UKIN dengan deskripsi sebagai berikut.

a) Reliabilitas Instrumen Penilaian Kompetensi Sosial dan Kompetensi

Kepribadian Penskoran Parsial untuk Penilai Dosen

Pada uji coba II, reliabilitas instrumen penilaian kompetensi sosial dan

kompetensi kepribadian (KSKK) penskoran parsial untuk penilai dosen dianalisis

menggunakan pendekatan reliabilitas  sebagaimana terlampir pada Lampiran 7

halaman 556 disajikan pada Tabel 47 berikut.

Tabel 47. Muatan Faktor Variabel Observasi pada Instrumen Penilaian


Kompetensi Sosial dan Kompetensi Kepribadian Penskoran
Parsial Penilai Dosen pada Uji Coba II

Item i i 2 1  i
2

A1 0,72 0,5184 0,4816


A2 0,71 0,5041 0,4959
A3 0,73 0,5329 0,4671
A4 0,70 0,4900 0,5100
A5 0,71 0,5041 0,4959
B6 0,73 0,5329 0,4671
B7 0,74 0,5476 0,4524
B8 0,71 0,5041 0,4959
B9 0,72 0,5184 0,4816
B10 0,75 0,5625 0,4375
C11 0,71 0,5041 0,4959
C12 0,72 0,5184 0,4816
C13 0,71 0,5041 0,4959
C14 0,66 0,4356 0,5644
C15 0,73 0,5329 0,4671
D16 0,75 0,5625 0,4375
D17 0,72 0,5184 0,4816
D18 0,70 0,4900 0,5100
D19 0,76 0,5776 0,4224
D20 0,74 0,5476 0,4524
∑ 14,42 9,5938

303
Tabel 47 menunjukkan informasi tentang muatan faktor valiabel observasi

atau item instrumen penilaian kompetensi sosial dan kompetensi kepribadian

i
(KSKK) penskoran parsial untuk penilai dosen pada uji coba II, diketahui 
i 1
i

1  
2
sebesar 14,42, serta i sebasar 9,59. Berdasarkan hasil perhitungan
i 1

reliabilitas diperoleh koefisien omega (  ) yang menunjukkan koefisien

reliabilitas instrumen sebesar 0,95. Jika didasari pada kriteria minimal koefisien

reliabilitas sebesar 0,85 yang disarankan oleh Mehrens and Lehmann (1973) dan

Retnawati (2016a: 87) dapat disimpulkan bahwa instrumen penilaian kompetensi

sosial dan kompetensi kepribadian (KSKK) penskoran parsial untuk penilai dosen

pada uji coba II telah reliabel.

b) Reliabilitas Instrumen Penilaian Kompetensi Sosial dan Kompetensi

Kepribadian Penskoran Parsial Penilai Guru pamong/penguji UKIN

Reliabilitas instrumen penilaian kompetensi sosial dan kompetensi

kepribadian (KSKK) penskoran parsial untuk penilai guru pamong/penguji UKIN

pada uji coba II dianalisis menggunakan pendekatan Reliabilitas  sebagaimana

terlampir pada Lampiran 7 halaman 562 disajikan pada Tabel 48.

304
Tabel 48. Muatan Faktor Variabel Observasi pada Instrumen Penilaian
Kompetensi Sosial dan Kompetensi Kepribadian Penskoran
Parsial Penilai Guru pamong/penguji UKIN

Item i i 2 1  i
2

A1 0,72 0,5184 0,4816


A2 0,72 0,5184 0,4816
A3 0,71 0,5041 0,4959
A4 0,71 0,5041 0,4959
A5 0,72 0,5184 0,4816
B6 0,72 0,5184 0,4816
B7 0,74 0,5476 0,4524
B8 0,71 0,5041 0,4959
B9 0,73 0,5329 0,4671
B10 0,75 0,5625 0,4375
C11 0,71 0,5041 0,4959
C12 0,70 0,4900 0,5100
C13 0,67 0,4489 0,5511
C14 0,66 0,4356 0,5644
C15 0,72 0,5184 0,4816
D16 0,75 0,5625 0,4375
D17 0,72 0,5184 0,4816
D18 0,70 0,4900 0,5100
D19 0,79 0,6241 0,3759
D20 0,74 0,5476 0,4524
∑ 14,39 9,6315

Tabel 48 menunjukkan informasi tentang muatan faktor valiabel observasi

atau item instrumen penilaian penilaian kompetensi sosial dan kompetensi

kepribadian (KSKK) penskoran parsial untuk penilai guru pamong/penguji UKIN

i i

 1  
2
pada uji coba II, diketahui i sebesar 14,39, serta i sebesar 9,63.
i 1 i 1

Berdasarkan hasil perhitungan reliabilitas diperoleh koefisien omega (  ) yang

menunjukkan koefisien reliabilitas instrumen sebesar 0,95. Jika didasari pada

kriteria minimal koefisien reliabilitas sebesar 0,85 yang disarankan oleh Mehrens

and Lehmann (1973) dan Retnawati (2016a: 87) dapat disimpulkan bahwa

305
instrumen penilaian kompetensi sosial dan kompetensi kepribadian (KSKK)

penskoran parsial untuk penilai guru pamong/penguji UKIN pada uji coba II telah

reliabel.

c) Reliabilitas Instrumen Penilaian Kompetensi Sosial dan Kompetensi

Kepribadian Penskoran Holistik untuk Penilai Dosen

Reliabilitas instrumen penilaian kompetensi sosial dan kompetensi

kepribadian (KSKK) penskoran holistik untuk penilai dosen pada uji coba II,

dianalisis menggunakan pendekatan reliabilitas  sebagaimana terlampir pada

Lampiran 7 halaman 559 disajikan pada Tabel 49 berikut

Tabel 49. Muatan Faktor Variabel Observasi pada Instrumen Penilaian


Kompetensi Sosial dan Kompetensi Kepribadian Penskoran
Holistik Penilai Dosen

Item i i 2 1  i
2

A1 0,73 0,5329 0,4671


A2 0,70 0,4900 0,5100
A3 0,73 0,5329 0,4671
A4 0,70 0,4900 0,5100
A5 0,72 0,5184 0,4816
B6 0,74 0,5476 0,4524
B7 0,74 0,5476 0,4524
B8 0,71 0,5041 0,4959
B9 0,72 0,5184 0,4816
B10 0,77 0,5929 0,4071
C11 0,70 0,4900 0,5100
C12 0,72 0,5184 0,4816
C13 0,70 0,4900 0,5100
C14 0,66 0,4356 0,5644
C15 0,74 0,5476 0,4524
D16 0,75 0,5625 0,4375
D17 0,72 0,5184 0,4816
D18 0,72 0,5184 0,4816
D19 0,79 0,6241 0,3759
D20 0,74 0,5476 0,4524
∑ 14,5 9,4726

306
Tabel 49 menunjukkan informasi tentang muatan faktor valiabel observasi

atau item instrumen penilaian kompetensi sosial dan kompetensi kepribadian

i
(KSKK) penskoran holistik untuk penilai dosen pada uji coba II, diketahui 
i 1
i

1  
2
sebesar 14,5, serta i sebasar 9,47. Berdasarkan hasil perhitungan
i 1

reliabilitas diperoleh koefisien omega (  ) yang menunjukkan koefisien

reliabilitas instrumen sebesar 0,95. Jika didasari pada kriteria minimal koefisien

reliabilitas sebesar 0,85 yang disarankan oleh Mehrens and Lehmann (1973) dan

Retnawati (2016a: 87) dapat disimpulkan bahwa instrumen penilaian kompetensi

sosial dan kompetensi kepribadian (KSKK) penskoran holistik untuk penilai

dosen pada uji coba II telah reliabel.

d) Reliabilitas Instrumen Penilaian Kompetensi Sosial dan Kompetensi

Kepribadian Penskoran Holistik Penilai Guru pamong/penguji UKIN

Reliabilitas instrumen penilaian kompetensi sosial dan kompetensi

kepribadian (KSKK) penskoran holistik untuk penilai guru pamong/penguji UKIN

pada uji coba II dianalisis dengan pendekatan reliabilitas  menggunakan

koefisien muatan faktor untuk semua variabel observasi terhadap variabel

latennya. Berikut ini disajikan hasil analisis reliabilitas instrumen penilaian

kompetensi sosial dan kompetensi kepribadian (KSKK) penskoran holistik untuk

penilai guru pamong/penguji UKIN sebagaimana terlampir pada Lampiran 7

halaman 565.

307
Tabel 50. Muatan Faktor Variabel Observasi pada Instrumen Penilaian
Kompetensi Sosial dan Kompetensi Kepribadian Penskoran
Holistik Penilai Guru pamong/penguji UKIN

Item i i 2 1  i
2

A1 0,73 0,5329 0,4671


A2 0,71 0,5041 0,4959
A3 0,73 0,5329 0,4671
A4 0,70 0,4900 0,5100
A5 0,73 0,5329 0,4671
B6 0,74 0,5476 0,4524
B7 0,74 0,5476 0,4524
B8 0,71 0,5041 0,4959
B9 0,73 0,5329 0,4671
B10 0,77 0,5929 0,4071
C11 0,72 0,5184 0,4816
C12 0,72 0,5184 0,4816
C13 0,71 0,5041 0,4959
C14 0,66 0,4356 0,5644
C15 0,74 0,5476 0,4524
D16 0,76 0,5776 0,4224
D17 0,73 0,5329 0,4671
D18 0,72 0,5184 0,4816
D19 0,79 0,6241 0,3759
D20 0,75 0,5625 0,4375
∑ 14,59 9,3425

Tabel 50 menunjukkan informasi tentang muatan faktor valiabel observasi

atau item instrumen penilaian kompetensi sosial dan kompetensi kepribadian

(KSKK) penskoran holistik untuk penilai guru pamong/penguji UKIN pada uji

i i

 1  
2
coba II, diketahui i sebesar 14,59, serta i sebasar 9,34. Berdasarkan
i 1 i 1

hasil perhitungan reliabilitas diperoleh koefisien omega (  ) yang menunjukkan

koefisien reliabilitas instrumen sebesar 0,95. Jika didasari pada kriteria minimal

koefisien reliabilitas sebesar 0,85 yang disarankan oleh Mehrens and Lehmann

(1973) dan Retnawati (2016a: 87) dapat disimpulkan bahwa instrumen penilaian

308
penilaian kompetensi sosial dan kompetensi kepribadian (KSKK) penskoran

holistik untuk penilai guru pamong/penguji UKIN pada uji coba II telah reliabel.

3. Karakteristik Item Berdasarkan Politomus Item Response Theory (Uji

Coba II)

Seperti halnya pada uji coba I, karakteristik item pada uji coba II juga

merupakan salah satu fase penting dalam pengembangan model penilaian ini.

Model penilaian PPG telah dirancang untuk penskoran politomi sehingga dalam

menganalisis karakteristik itemnya pada penelitian ini digunakan pendekatan

politomus item response theory. Penskoran parsial diestimasi dengan metode

partial credit model (PCM), sedangkan penskoran holistik diestimasi dengan

metode graded response model (GRM). Selain itu setiap instrumen tersebut

memiliki dua kelompok penilai yaitu penilai untuk dosen serta penilai untuk guru

pamong/penguji UKIN. Berikut ini diuraikan karakteristik item pada model

penilaian PPG.

a. Karakteristik Instrumen Penilaian RPP

Pada uji coba II, karakteristik instrumen penilaian RPP dibagi menjadi

empat kelompok data. Data pertama adalah instrumen penilaian RPP dengan

penskoran parsial untuk penilai dosen. Data kedua adalah instrumen penilaian

RPP dengan penskoran parsial untuk penilai guru pamong/penguji UKIN. Data

ketiga adalah instrumen penilaian RPP dengan penskoran holistik untuk penilai

dosen, dan data keempat adalah instrumen penilaian RPP dengan penskoran

holistik untuk penilai guru pamong/penguji UKIN. Uraian keempat kelompok

data tersebut dikemukakan sebagai berikut.

309
1) Karakteristik Instrumen Penilaian RPP Penskoran Parsial Penilai Dosen

Seperti halnya pada uji coba I, pada uji coba II instrumen penilaian

rencana pelaksanaan pembelajaran (RPP) penskoran parsial untuk penilai dosen

dianalisis menggunakan pendekatan partial credit model (PCM) dengan

penskoran 0, 1, 2, 3, dan 4. Melalui Program R dengan Extended Rasch Modeling

(eRm) package diperoleh hasil analisis berupa karakteristik item sebagai berikut.

Tabel 51. Hasil Analisis Karakteristik Item Instrumen Penilaian RPP


Penskoran Pasial untuk Penilai Dosen

Item Location Threshold ᵟ1 Threshold ᵟ2 Threshold ᵟ3 Threshold ᵟ4


A1 0,77 -1,54 0,54 1,33 2,75
A2 0,62 -1,96 0,45 1,54 2,47
A3 0,70 -1,95 0,48 1,34 2,94
A4 0,61 -1,66 -0,03 1,51 2,62
A5 0,61 -1.83 0,29 1,39 2,60
A6 0,79 -1,06 0,19 1,60 2,43
B7 0,73 -1,35 0,23 1,33 2,71
B8 0,60 -1,67 0,02 1,38 2,69
B9 0,70 -1,31 0,15 1,42 2,57
B10 0,67 -1,02 -0,31 1,51 2,52
B11 0,72 -1,36 0,16 1,61 2,50
B12 0,74 -1,06 -0,27 1,47 2,84
C13 0,81 -1,34 0,09 1,64 2,85
C14 0,78 -1,43 0,32 1,37 2,85
C15 0,82 -1,35 0,15 1,47 3,02
C16 0,81 -1,41 0,25 1,49 2,93
C17 0,77 -1,40 0,26 1,41 2,82
C18 0,65 -1,75 0,08 1,54 2,74
D19 0,57 -1,68 0,09 1,27 2,62
D20 0,66 -1,19 0,02 1,22 2,61
D21 0,67 -1,30 0,18 1,26 2,54
D22 0,52 -1,54 -0,06 1,13 2,56
D23 0,51 -1,68 0,19 1,03 2,50
D24 0,49 -1,57 0,08 0,88 2,59
D25 0,65 -1,05 -0,15 1,19 2,63

310
Berdasarkan data hasil analisis yang disajikan pada Tabel 51 diperoleh

informasi bahwa parameter lokasi setiap item bervariasi dari 0,49 hingga 0,82.

Selain itu parameter threshold ᵟi sebanyak empat kelompok atau empat

perpotongan. Hal tersebut merupakan parameter tingkat kesulitan peserta

memperoleh skor tertentu ketika merespon butir i. Ditinjau dari peluang

pencapaian skornya, maka koefisien parameter threshold ᵟi untuk setiap kategori

berbeda-beda. Semakin tinggi kategori pencapaian maka semakin tinggi koefisien

threshold ᵟi. Hal tersebut dijelaskan oleh Embretson (2000) bahwa item location

mencerminkan tentang tingkat kemudahan atau kesukaran item tersebut,

sementara threshold merupakan ambang batas antar kategori tertentu yang akan

dicapai. Hal ini berarti bahwa pada instrumen RPP semakin tinggi koefisien

location maka semakin sulit item tersebut dengan sebaran threshold yang

merupakan kategori tingkat pencapaiannya. Semakin tinggi threshold maka

semakin sulit dicapai ambang batas tersebut, sehingga peserta yang memiliki

kemampuan rendah tentu hanya mampu mencapai threshold (ambang kategori)

yang rendah pula, peserta yang memiliki kemampuan menengah hanya mampu

mencapai threshold (ambang kategori) yang menengah hingga pada peserta yang

berkemampuan tinggi tentu mampu mencapai kategori ambang batas yang tinggi.

Selanjutnya hal lain yang dapat dijelaskan berdasarkan hasil analisis item

dengan partial credit model adalah kurva karakteristik item. Kurva karakteristik

item digambarkan untuk memudahkan memahami hubungan antara setiap

threshold ᵟi yang merupakan tingkat kesulitan dengan kemampuan peserta untuk

mencapai skor atau kategori tertentu. Berikut ini disajikan salah satu contoh kurva

311
karakteristik item dari instrumen penilaian rencana pelaksanaan pembelajaran

(RPP) penskoran parsial untuk penilai dosen.

Gambar 61. Kurva Karakteristik Item 4 dari Instrumen Penilaian RPP


Penskoran Parsial untuk Penilai Dosen

Gambar 61 adalah salah satu contoh kurva karakteristik item dari

instrumen penilaian rencana pelaksanaan pembelajaran (RPP) penskoran parsial

untuk penilai dosen yaitu item 4 pada uji coba II. Jika dikaitkan dengan hasil

kaliberasi item pada Tabel 51, dapat dijelaskan bahwa pada dasarnya item 4 ini

memiliki parameter lokasi sebesar 0,61 dengan parameter threshold ᵟ1 sebesar -

1,66, threshold ᵟ2 sebesar -0,03, threshold ᵟ3 sebesar 1,51, serta threshold ᵟ4

sebesar 2,62. Secara grafis threshold ᵟi dapat diinterpretasikan sebagai

perpotongan kurva setiap kategori. Dari gambar tersebut dapat dijelaskan bahwa

untuk mencapai kategori 2 atau untuk memperoleh skor 2 pada item 4 maka

diperlukan kemampuan (  ) sekitar -0,03 hingga 1,51. Pada bagian ini hanya

diberikan contoh untuk item 4. Lebih jelasnya kurva karakteristik untuk semua

item pada instrumen penilaian ini dapat diamati pada Lampiran 8 halaman 566.

Untuk karakteristik instrumen disajikan berdasarkan fungsi informasi berikut.

312
Gambar 62. Fungsi Informasi Instrumen RPP Penskoran Parsial Penilai Dosen

Selain kurva karakteristik item, maka hal lain yang dapat dijelaskan dari

kualitas instrumen penilaian rencana pelaksanaan pembelajaran (RPP) penskoran

parsial untuk penilai dosen adalah nilai fungsi informasi instrumen. Berikut ini

disajikan fungsi informasi (NIF) instrumen penilaian rencana pelaksanaan

pembelajaran (RPP) penskoran parsial untuk penilai dosen yang dihubungkan

dengan Standard Error of Measurement (SEM).

Gambar 63. Hubungan timbal balik antara NIF dengan SEM Instrumen Penilaian
RPP Penskoran Parsial untuk Penilai Dosen

313
Gambar 50 menyajikan kurva fungsi informasi dari akumulasi 25 item

pada instrumen penilaian RPP penskoran parsial untuk penilai dosen. Gambar

tersebut menunjukkan grafik nilai informasi (NIF) dan kesalahan pengukuran

(SEM) dimana pada kurva untuk NIF ditunjukkan oleh garis melengkung ke atas

dan SEM ditunjukkan oleh garis putus-putus. Kedua grafik fungsi ini bertemu

pada skala kemampuan -4,3 dan 0,7. Di antara dua kemampuan ini, instrumen

memiliki nilai informasi yang lebih tinggi dibandingkan dengan kesalahan

pengukurannya. Sebaliknya, ketika skala kemampuan kurang dari -4,3 dan lebih

dari 0,7, maka instrumen ini memiliki kesalahan pengukuran yang lebih besar

dibandingkan dengan informasi yang diberikannya.

Hal lain yang dapat dijelaskan dari Gambar 50 tersebut adalah nilai fungsi

informasi instrumen sebesar 16,36 pada skala kemampuan (  ) -1,8. Hambleton,

Swaminathan & Rogers (1991: 94); Retnawati (2014: 19) menyatakan bahwa nilai

fungsi informasi memiliki hubungan yang berbanding terbalik dengan Standard

Error of Measurement (SEM), semakin besar nilai informasi maka SEM akan

semakin kecil atau sebaliknya. Jika berdasar pada pendapat tersebut, maka dapat

dijelaskan bahwa dengan diketahuinya nilai fungsi informasi sebesar 16,36 maka

koefisien kesalahan pengukuran (SEM) diperoleh sebesar 0,24.

2) Karakteristik Instrumen Penilaian RPP Penskoran Parsial untuk Penilai

Guru pamong/penguji UKIN

Seperti yang telah dilakukan pada uji coba I, instrumen penilaian rencana

pelaksanaan pembelajaran (RPP) penskoran parsial untuk penilai guru

pamong/penguji UKIN pada uji coba II dianalisis dengan menggunakan

314
pendekatan partial credit model (PCM) dengan penskoran 0, 1, 2, 3, dan 4.

Melalui Program R dengan Extended Rasch Modeling (eRm) package diperoleh

hasil analisis berupa karakteristik item sebagai berikut.

Tabel 52. Hasil Analisis Karakteristik Item Instrumen Penilaian RPP


Penskoran Parsial untuk Penilai Guru pamong/penguji UKIN

Item Location Threshold ᵟ1 Threshold ᵟ2 Threshold ᵟ3 Threshold ᵟ4


A1 0,77 -1,74 0,96 1,21 2,72
A2 0,63 -2,06 0,66 1,47 2,45
A3 0,71 -2,05 0,69 1,28 2,92
A4 0,62 -1,81 0,23 1,44 2,62
A5 0,62 -1,98 0,58 1,31 2,58
A6 0,79 -1,19 0,43 1,54 2,41
B7 0,72 -1,33 0,22 1,30 2,69
B8 0,59 -1,65 0,01 1,37 2,65
B9 0,69 -1,30 0,14 1,40 2,55
B10 0,66 -1,00 -0,32 1,49 2,50
B11 0,71 -1,35 0,14 1,59 2,47
B12 0,73 -1,04 -0,28 1,45 2,81
C13 0,79 -1,33 0,08 1,60 2,83
C14 0,77 -1,41 0,31 1,35 2,82
C15 0,81 -1,33 0,14 1,45 3,00
C16 0,80 -1,40 0,24 1,47 2,91
C17 0,76 -1,38 0,25 1,38 2,80
C18 0,64 -1,73 0,08 1,51 2,72
D19 0,56 -1,67 0,08 1,24 2,60
D20 0,65 -1,17 0,02 1,20 2,58
D21 0,66 -1,28 0,18 1,23 2,54
D22 0,51 -1,52 -0,07 1,11 2,54
D23 0,50 -1,66 0,19 1,01 2,48
D24 0,48 -1,55 0,07 0,86 2,57
D25 0,64 -1,04 -0,16 1,17 2,60

Berdasarkan data hasil analisis yang disajikan pada Tabel 52 diperoleh

informasi bahwa parameter lokasi setiap item bervariasi dari 0,48 hingga 0,81.

Selain itu parameter threshold ᵟi sebanyak empat kelompok atau empat

315
perpotongan. Hal tersebut merupakan parameter tingkat kesulitan peserta

memperoleh skor tertentu ketika merespon butir i. Ditinjau dari peluang

pencapaian skornya, maka koefisien parameter threshold ᵟi untuk setiap kategori

berbeda-beda. Semakin tinggi kategori pencapaian maka semakin tinggi koefisien

threshold ᵟi. Hal tersebut dijelaskan oleh Embretson (2000) bahwa item location

mencerminkan tentang tingkat kemudahan atau kesukaran item tersebut,

sementara threshold merupakan ambang batas antar kategori tertentu yang akan

dicapai. Hal ini berarti bahwa pada instrumen RPP semakin tinggi koefisien

location maka semakin sulit item tersebut dengan sebaran threshold yang

merupakan kategori tingkat pencapaiannya. Semakin tinggi threshold maka

semakin sulit dicapai ambang batas tersebut, sehingga peserta yang memiliki

kemampuan rendah tentu hanya mampu mencapai threshold (ambang kategori)

yang rendah pula, peserta yang memiliki kemampuan menengah hanya mampu

mencapai threshold (ambang kategori) yang menengah hingga pada peserta yang

berkemampuan tinggi tentu mampu mencapai kategori ambang batas yang tinggi

pula.

Hal lain yang dapat dijelaskan berdasarkan hasil analisis item dengan

partial credit model adalah kurva karakteristik item. Kurva karakteristik item

digambarkan untuk memudahkan memahami hubungan antara setiap threshold ᵟi

yang merupakan tingkat kesulitan dengan kemampuan peserta untuk mencapai

skor atau kategori tertentu. Berikut ini disajikan salah satu contoh kurva

karakteristik item dari instrumen penilaian rencana pelaksanaan pembelajaran

(RPP) penskoran parsial untuk penilai guru pamong/penguji UKIN.

316
Gambar 64. Kurva Karakteristik Item 7 dari Instrumen Penilaian RPP
Penskoran Parsial untuk Penilai Guru pamong/penguji UKIN

Gambar 64 adalah salah satu contoh kurva karakteristik item dari

instrumen penilaian rencana pelaksanaan pembelajaran (RPP) penskoran parsial

untuk penilai guru pamong/penguji UKIN yaitu item 7. Jika dikaitkan dengan

hasil kaliberasi item pada Tabel 52, dapat dijelaskan bahwa pada dasarnya item 7

ini memiliki parameter lokasi sebesar 0,72 dengan parameter threshold ᵟ1 sebesar -

1,33, threshold ᵟ2 sebesar 0,22, threshold ᵟ3 sebesar 1,30, serta threshold ᵟ4 sebesar

2,69. Secara grafis threshold ᵟi dapat diinterpretasikan sebagai perpotongan kurva

setiap kategori. Dari gambar tersebut dapat dijelaskan bahwa untuk mencapai

kategori 2 atau untuk memperoleh skor 2 pada item 20 maka diperlukan

kemampuan (  ) sekitar 0,22 hingga 1,30. Pada bagian ini hanya diberikan contoh

untuk item 7. Untuk lebih jelasnya kurva karakteristik untuk semua item pada

instrumen penilaian rencana pelaksanaan pembelajaran (RPP) penskoran parsial

untuk penilai guru pamong/penguji UKIN dapat diamati pada Lampiran 8

halaman 572. Lebih lanjut karakteristik instrumen disajikan berdasarkan fungsi

informasi sebagai berikut.

317
Gambar 65. Fungsi Informasi Instrumen RPP Penskoran Parsial Penilai Penguji
UKIN

Selain kurva karakteristik item, maka hal lain yang dapat dijelaskan dari

kualitas instrumen penilaian rencana pelaksanaan pembelajaran (RPP) penskoran

parsial untuk penilai guru pamong/penguji UKIN adalah nilai fungsi informasi

instrumen. Berikut ini disajikan fungsi informasi (NIF) instrumen penilaian

rencana pelaksanaan pembelajaran (RPP) penskoran parsial untuk penilai guru

pamong/penguji UKIN yang dihubungkan dengan Standard Error of

Measurement (SEM).

Gambar 66. Hubungan timbal balik antara NIF dengan SEM Instrumen Penilaian

318
RPP Penskoran Parsial untuk Penilai Guru pamong/penguji UKIN

Gambar 52 menyajikan kurva fungsi informasi dari akumulasi 25 item

pada instrumen penilaian RPP penskoran parsial untuk penilai guru

pamong/penguji UKIN. Gambar tersebut menunjukkan grafik nilai informasi dan

kesalahan pengukuran. Kedua grafik fungsi ini bertemu pada skala kemampuan -

4,3 dan 0,7. Di antara dua kemampuan ini, instrumen memiliki nilai informasi

yang lebih tinggi dibandingkan dengan kesalahan pengukurannya. Sebaliknya,

ketika skala kemampuan kurang dari -4,3 dan lebih dari 0,7, maka instrumen ini

memiliki kesalahan pengukuran yang lebih besar dibandingkan dengan informasi

yang diberikannya. Hal lain yang dapat dijelaskan dari Gambar 52 tersebut adalah

nilai fungsi informasi maksimum instrumen sebesar 16,36 pada skala kemampuan

(  ) -1,8. Hambleton, Swaminathan & Rogers (1991: 94); Retnawati (2014: 19)

menyatakan bahwa nilai fungsi informasi memiliki hubungan yang berbanding

terbalik dengan Standard Error of Measurement (SEM), semakin besar nilai

informasi maka SEM akan semakin kecil atau sebaliknya. Jika berdasar pada

pendapat tersebut, maka dapat dijelaskan bahwa dengan diketahuinya nilai fungsi

informasi sebesar 16,36, maka koefisien kesalahan pengukuran (SEM) diperoleh

sebesar 0,24.

3) Karakteristik Instrumen Penilaian RPP Penskoran Holistik Penilai Dosen

Instrumen penilaian RPP penskoran holistik untuk penilai dosen pada uji

coba II dianalisis dengan menggunakan pendekatan graded response modeling

(GRM) dengan penskoran 1, 2, 3, dan 4. Melalui Program R dengan latent trait

model (ltm) package diperoleh hasil analisis karakteristik item sebagai berikut.

319
Tabel 53. Hasil Analisis Karakteristik Item Instrumen Penilaian RPP
Penskoran Holistik untuk Penilai Dosen

Item a b1 b2 b3
A1 1,30 -2,18 -1,03 0,72
A2 1,38 -2,23 -0,89 0,52
A3 1,06 -2,70 -1,15 0,97
A4 1,28 -2,67 -1,00 0,67
A5 1,13 -2,71 -1,17 0,65
A6 1,28 -2,64 -0,96 0,53
B7 0,93 -3,46 -1,33 0,76
B8 0,92 -3,68 -1,33 0,77
B9 0,94 -3,23 -1,31 0,63
B10 0,98 -3,23 -1,26 0,63
B11 0,94 -3,17 -1,17 0,61
B12 0,88 -3,60 -1,31 0,92
C13 1,21 -2,87 -0,83 0,89
C14 1,19 -2,83 -1,02 0,83
C15 1,22 -2,84 -0,88 0,99
C16 1,12 -2,94 -0,96 0,96
C17 1,11 -2,99 -1,05 0,86
C18 1,31 -2,81 -0,87 0,75
D19 1,31 -2,94 -1,13 0,61
D20 1,18 -2,90 -1,24 0,60
D21 1,38 -2,60 -1,06 0,56
D22 1,20 -2,85 -1,32 0,56
D23 1,16 -2,89 -1,42 0,51
D24 1,34 -2,76 -1,42 0,50
D25 1,32 -2,65 -1,15 0,59

Berdasarkan data hasil analisis yang disajikan pada Tabel 53 diperoleh

informasi bahwa parameter ai setiap item bervariasi dari 0,88 hingga 1,34. Selain

itu parameter bi sebanyak tiga kelompok atau tiga perpotongan. Hal tersebut

merupakan parameter tingkat kesulitan peserta memperoleh skor tertentu ketika

merespon butir i. Ditinjau dari peluang pencapaian skornya, maka koefisien

parameter bi untuk setiap kategori berbeda-beda. Semakin tinggi kategori

pencapaian maka semakin tinggi koefisien bi.

320
Hal lain yang dapat dijelaskan berdasarkan hasil analisis item dengan

graded response model adalah kurva karakteristik item. Berikut ini disajikan salah

satu contoh kurva karakteristik item dari instrumen penilaian rencana pelaksanaan

pembelajaran (RPP) penskoran holistik untuk penilai dosen pada uji coba II.

Gambar 67. Kurva Karakteristik Item 14 dari Instrumen Penilaian RPP


Penskoran Holistik untuk Penilai Dosen

Gambar 67 adalah salah satu contoh kurva karakteristik item dari

instrumen penilaian rencana pelaksanaan pembelajaran (RPP) pada uji coba II

penskoran holistik untuk penilai dosen yaitu item 14. Jika dikaitkan dengan hasil

kaliberasi item pada Tabel 53, dapat dijelaskan bahwa pada dasarnya item 14 ini

memiliki parameter daya beda ai sebesar 1,19 dengan parameter b1 sebesar -2,83,

b2 sebesar -1,02, serta b3 sebesar 0,83. Secara grafis bi atau tingkat kesulitan dapat

diinterpretasikan sebagai perpotongan kurva setiap kategori. Dari gambar tersebut

dapat dijelaskan bahwa untuk mencapai kategori 2 atau untuk memperoleh skor 2

pada item 23 maka diperlukan kemampuan (  ) sekitar -2,83 hingga -1,02. Pada

bagian ini hanya diberikan contoh untuk item 14. Untuk lebih jelasnya kurva

321
karakteristik untuk semua item pada instrumen penilaian rencana pelaksanaan

pembelajaran (RPP) penskoran holistik untuk penilai dosen dapat diamati pada

Lampiran 8 halaman 577. Lebih lanjut karakteristik instrumen disajikan

berdasarkan fungsi informasi sebagai berikut.

Gambar 68. Fungsi Informasi Instrumen RPP Penskoran Holistik Penilai Dosen

Selain kurva karakteristik item, maka hal lain yang dapat dijelaskan dari

kualitas instrumen penilaian rencana pelaksanaan pembelajaran (RPP) penskoran

holistik untuk penilai dosen adalah nilai fungsi informasi instrumen. Fungsi

informasi pada dasarnya menunjukkan sejauhmana instrumen yang telah

dikembangkan dapat memberi informasi maksimal jika dikenakan pada

kemampuan (  ) tertentu. Berikut ini disajikan fungsi informasi (NIF) instrumen

penilaian rencana pelaksanaan pembelajaran (RPP) penskoran holistik untuk

penilai dosen yang dihubungkan dengan Standard Error of Measurement (SEM).

322
Gambar 69. Hubungan timbal balik antara NIF dengan SEM Instrumen Penilaian
RPP Penskoran Holistik untuk Penilai Dosen

Gambar 69 menunjukkan grafik nilai informasi (NIF) dan kesalahan

pengukuran (SEM) dimana kedua grafik fungsi ini bertemu pada skala

kemampuan -3,5 dan 1,3. Di antara dua kemampuan ini, instrumen memiliki nilai

informasi yang lebih tinggi dibandingkan dengan kesalahan pengukurannya.

Sebaliknya, ketika skala kemampuan kurang dari -3,5 dan lebih dari 1,3, maka

instrumen ini memiliki kesalahan pengukuran yang lebih besar dibandingkan

dengan informasi yang diberikannya. Hal lain yang dapat dijelaskan dari Gambar

54 tersebut adalah nilai fungsi informasi instrumen sebesar 14,15 pada skala

kemampuan (  ) -1,1. Hambleton, Swaminathan & Rogers (1991: 94); Retnawati

(2014: 19) menyatakan bahwa nilai fungsi informasi memiliki hubungan yang

berbanding terbalik dengan Standard Error of Measurement (SEM), semakin

besar nilai informasi maka SEM akan semakin kecil atau sebaliknya. Jika berdasar

pada pendapat tersebut, maka dapat dijelaskan bahwa dengan diketahuinya nilai

fungsi informasi sebesar 14,15, maka koefisien kesalahan pengukuran (SEM)

323
diperoleh sebesar 0,26. Hal ini dapat diinterpretasikan bahwa koefisien kesalahan

pengukuran sebesar 0,26.

4) Karakteristik Instrumen Penilaian RPP Penskoran Holistik untuk Penilai

Guru pamong/penguji UKIN

Instrumen penilaian RPP penskoran holistik untuk penilai guru

pamong/penguji UKIN pada uji coba II dianalisis dengan GRM penskoran 1, 2, 3,

dan 4. Melalui Program R dengan latent trait model (ltm) package diperoleh hasil

analisis berupa karakteristik item sebagai berikut.

Tabel 54. Hasil Analisis Karakteristik Item Instrumen Penilaian RPP


Penskoran Holistik untuk Penilai Guru pamong/penguji UKIN
Item a b1 b2 b3
A1 1,29 -2,18 -1,03 0,71
A2 1,40 -2,22 -0,88 0,53
A3 1,06 -2,70 -1,14 0,99
A4 1,30 -2,64 -0,98 0,66
A5 1,15 -2,68 -1,16 0,65
A6 1,29 -2,62 -0,95 0,53
B7 0,96 -3,40 -1,30 0,81
B8 0,93 -3,66 -1,32 0,80
B9 0,98 -3,38 -1,26 0,67
B10 1,08 -3,50 -1,14 0,62
B11 0,96 -3,34 -1,14 0,67
B12 0,91 -3,94 -1,27 1,01
C13 1,21 -2,89 -0,83 0,90
C14 1,19 -2,83 -1,02 0,84
C15 1,25 -2,81 -0,87 0,99
C16 1,15 -2,90 -0,95 0,96
C17 1,13 -2,97 -1,05 0,86
C18 1,33 -2,78 -0,86 0,75
D19 1,31 -2,98 -1,13 0,61
D20 1,17 -3,23 -1,28 0,62
D21 1,35 -2,82 -1,09 0,56
D22 1,16 -3,38 -1,37 0,56
D23 1,11 -3,33 -1,48 0,51
D24 1,29 -3,18 -1,47 0,50
D25 1,28 -3,17 -1,20 0,60

324
Berdasarkan data hasil analisis yang disajikan pada Tabel 54 diperoleh

informasi bahwa parameter ai setiap item bervariasi dari 0,91 hingga 1,40. Selain

itu, parameter bi sebanyak tiga kelompok atau tiga perpotongan. Hal tersebut

merupakan parameter tingkat kesulitan peserta memperoleh skor tertentu ketika

merespon butir i. Ditinjau dari peluang pencapaian skornya, maka koefisien

parameter bi untuk setiap kategori berbeda-beda. Semakin tinggi kategori

pencapaian maka semakin tinggi koefisien bi.

Hal lain yang dapat dijelaskan berdasarkan hasil analisis item dengan

graded response model adalah kurva karakteristik item. Kurva karakteristik item

digambarkan untuk memudahkan memahami hubungan antara setiap bi yang

merupakan tingkat kesulitan dengan kemampuan peserta untuk mencapai skor

atau kategori tertentu. Berikut ini disajikan salah satu contoh kurva karakteristik

item dari instrumen penilaian rencana pelaksanaan pembelajaran (RPP) penskoran

holistik penilai guru pamong/penguji UKIN pada uji coba II.

Gambar 70. Kurva Karakteristik Item 2 dari Instrumen Penilaian RPP


Penskoran Holistik untuk Penilai Guru pamong/penguji UKIN

325
Gambar 70 adalah salah satu contoh kurva karakteristik item dari

instrumen penilaian rencana pelaksanaan pembelajaran (RPP) penskoran Holistik

untuk penilai guru pamong/penguji UKIN pada uji coba II yaitu item 2. Jika

dikaitkan dengan hasil kaliberasi item pada Tabel 54, dapat dijelaskan bahwa pada

dasarnya item 2 ini memiliki parameter daya beda ai sebesar 1,40 dengan

parameter b1 sebesar -2,25, b2 sebesar -0,88, serta b3 sebesar 0,53. Secara grafis bi

atau tingkat kesulitan dapat diinterpretasikan sebagai perpotongan kurva setiap

kategori. Dari gambar tersebut dapat dijelaskan bahwa untuk mencapai kategori 2

atau untuk memperoleh skor 2 pada item 21 maka diperlukan kemampuan (  )

sekitar -2,25 hingga -0,88. Pada bagian ini hanya diberikan contoh untuk item 2.

Secara lebih jelasnya kurva karakteristik untuk semua item pada instrumen

penilaian rencana pelaksanaan pembelajaran (RPP) penskoran holistik untuk

penilai guru pamong/penguji UKIN dapat diamati pada Lampiran 8 halaman 581.

Lebih lanjut karakteristik instrumen disajikan berdasarkan fungsi informasi

sebagai berikut.

Gambar 71. Fungsi Informasi Instrumen RPP Penskoram Holistik Penilai Guru
Pamong/Penguji UKIN

326
Selain kurva karakteristik item, maka hal lain yang dapat dijelaskan dari

kualitas instrumen penilaian rencana pelaksanaan pembelajaran (RPP) pada uji

coba II penskoran holistik untuk penilai guru pamong/penguji UKIN adalah nilai

fungsi informasi instrumen. Fungsi informasi pada dasarnya menunjukkan

sejauhmana instrumen yang telah dikembangkan dapat memberi informasi

maksimal jika dikenakan pada kemampuan (  ) tertentu. Berikut ini disajikan

fungsi informasi (NIF) instrumen penilaian rencana pelaksanaan pembelajaran

(RPP) penskoran holistik untuk penilai guru pamong/penguji UKIN yang

dihubungkan dengan Standard Error of Measurement (SEM).

Gambar 72. Hubungan timbal balik antara NIF dengan SEM Instrumen Penilaian
RPP Penskoran Holistik untuk Penilai Guru pamong/penguji UKIN

Gambar 72 menyajikan kurva fungsi informasi dari akumulasi 25 item

pada instrumen penilaian RPP penskoran holistik untuk penilai guru

pamong/penguji UKIN. Gambar tersebut menunjukkan grafik nilai informasi

(NIF) dan kesalahan pengukuran (SEM) dimana pada kurva untuk NIF

ditunjukkan oleh garis melengkung ke atas dan SEM ditunjukkan oleh garis

327
putus-putus. Kedua grafik fungsi ini bertemu pada skala kemampuan -3,5 dan 1,3.

Di antara dua kemampuan ini, instrumen memiliki nilai informasi yang lebih

tinggi dibandingkan dengan kesalahan pengukurannya. Sebaliknya, ketika skala

kemampuan kurang dari -3,5 dan lebih dari 1,3, maka instrumen ini memiliki

kesalahan pengukuran yang lebih besar dibandingkan dengan informasi yang

diberikannya.

Hal lain yang dapat dijelaskan dari Gambar 56 tersebut adalah nilai fungsi

informasi instrumen sebesar 14,15 pada skala kemampuan (  ) -1,1. Hambleton,

Swaminathan & Rogers (1991: 94); Retnawati (2014: 19) menyatakan bahwa nilai

fungsi informasi memiliki hubungan yang berbanding terbalik dengan Standard

Error of Measurement (SEM), semakin besar nilai informasi maka SEM akan

semakin kecil atau sebaliknya. Jika berdasar pada pendapat tersebut, maka dapat

dijelaskan bahwa dengan diketahuinya nilai fungsi informasi sebesar 14,15, maka

koefisien kesalahan pengukuran (SEM) diperoleh sebesar 0,26.

Berdasarkan beberapa penyajian hasil karakteristik item dan kurva

karakteristik item untuk instrumen penilaian RPP penskoran parsial dan

penskoran holistik dapat dijelaskan bahwa untuk instrumen penilaian RPP lebih

baik untuk menggunakan penskoran parsial. Hal ini terlihat pada kurva

karakteristik item untuk penskoran parsial yang lebih condong pada theta positif

(lihat Gambar 50) dibandingkan dengan kurva karakteristik item pada penskoran

holistik (lihat Gambar 53). Hal ini juga diperkuat dengan fungsi informasi butir

yang menunjukkan bahwa penskoran parsial lebih memiliki informasi yang tinggi

dan SEM yang lebih rendah dibanding dengan dengan penskoran holistik.

328
b. Karakteristik Instrumen Penilaian Pelaksanaan Pembelajaran (PP)

Pada uji coba II karakteristik instrumen penilaian pelaksanaan

pembelajaran (PP) dibagi menjadi empat kelompok data. Data pertama adalah

instrumen penilaian pelaksanaan pembelajaran (PP) dengan penskoran parsial

untuk penilai dosen. Data kedua adalah instrumen penilaian pelaksanaan

pembelajaran (PP) dengan penskoran parsial untuk penilai guru pamong/penguji

UKIN. Data ketiga adalah instrumen penilaian pelaksanaan pembelajaran (PP)

dengan penskoran holistik untuk penilai dosen, dan data keempat adalah

instrumen penilaian pelaksanaan pembelajaran (PP) dengan penskoran holistik

untuk penilai guru pamong/penguji UKIN. Uraian keempat kelompok data

tersebut pada uji coba II dikemukakan sebagai berikut.

1) Karakteristik Instrumen Penilaian Pelaksanaan Pembelajaran (PP)

Penskoran Parsial untuk Penilai Dosen

Instrumen penilaian pelaksanaan pembelajaran (PP) penskoran parsial

untuk penilai dosen dianalisis dengan menggunakan pendekatan partial credit

model (PCM) dengan penskoran 0, 1, 2, 3, dan 4. Melalui Program R dengan

Extended Rasch Modeling (eRm) package diperoleh hasil analisis berupa

karakteristik item sebagai berikut.

329
Tabel 55. Hasil Analisis Karakteristik Item Instrumen Penilaian Pelaksanaan
Pembelajaran (PP) Penskoran Pasial untuk Penilai Dosen

Item Location Threshold ᵟ1 Threshold ᵟ2 Threshold ᵟ3 Threshold ᵟ4


A1 0,75 -1,50 0,59 0,95 2,97
A2 0,58 -1,27 -0.10 0,87 2,86
A3 0,65 -1,00 -0,15 0,88 2,91
A4 0,69 -1,17 -0,01 1,16 2,79
B5 0,63 -1,44 0,07 1,03 2,88
B6 0,60 -1,26 -0,22 1,14 2,75
B7 0,73 -1,23 0,04 1,22 2,89
B8 0,71 -1,52 0,14 1,13 3,08
B9 0,70 -1,10 -0,12 1,18 2,85
B10 0,68 -1,07 -0,13 1,07 2,87
B11 0,68 -0,90 -0,37 1,09 2,90
C12 0,62 -1,45 0,19 0,77 2,99
C13 0,58 -1,39 0,10 0,78 2,84
C14 0,64 -1,04 -0,13 0,97 2,77
C15 0,64 -1,36 -0,13 1,29 2,78
D16 0,62 -1,26 -0,19 1,05 2,91
D17 0,65 -1,18 0,02 1,10 2,68
D18 0,67 -1,25 0,19 0,93 2,84
D19 0,64 -1,21 -0,30 1,16 2,95
D20 0,85 -0,91 0,17 1,09 3,07

Berdasarkan data hasil analisis yang disajikan pada Tabel 55 diperoleh

informasi bahwa parameter lokasi setiap item bervariasi dari 0,58 hingga 0,85.

Selain itu parameter threshold ᵟi sebanyak empat kelompok atau empat

perpotongan. Hal tersebut merupakan parameter tingkat kesulitan peserta

memperoleh skor tertentu ketika merespon butir i. Ditinjau dari peluang

pencapaian skornya, maka koefisien parameter threshold ᵟi untuk setiap kategori

berbeda-beda. Semakin tinggi kategori pencapaian maka semakin tinggi koefisien

threshold ᵟi. Hal tersebut dijelaskan oleh Embretson (2000) bahwa item location

mencerminkan tentang tingkat kemudahan atau kesukaran item tersebut,

sementara threshold merupakan ambang batas antar kategori tertentu yang akan

330
dicapai. Hal ini berarti bahwa pada instrumen PP semakin tinggi koefisien

location maka semakin sulit item tersebut dengan sebaran threshold yang

merupakan kategori tingkat pencapaiannya. Semakin tinggi threshold maka

semakin sulit dicapai ambang batas tersebut, sehingga peserta yang memiliki

kemampuan rendah tentu hanya mampu mencapai threshold (ambang kategori)

yang rendah pula, peserta yang memiliki kemampuan menengah hanya mampu

mencapai threshold (ambang kategori) yang menengah hingga pada peserta yang

berkemampuan tinggi tentu mampu mencapai kategori ambang batas yang tinggi.

Hal lain yang dapat dijelaskan berdasarkan hasil analisis item dengan

partial credit model adalah kurva karakteristik item. Kurva karakteristik item

digambarkan untuk memudahkan memahami hubungan antara setiap threshold ᵟi

yang merupakan tingkat kesulitan dengan kemampuan peserta untuk mencapai

skor atau kategori tertentu. Berikut ini disajikan salah satu contoh kurva

karakteristik item dari instrumen penilaian pelaksanaan pembelajaran (PP)

penskoran parsial untuk penilai dosen.

Gambar 73. Kurva Karakteristik Item 15 dari Instrumen Penilaian Pelaksanaan


Pembelajaran Penskoran Parsial untuk Penilai Dosen

331
Gambar 73 adalah salah satu contoh kurva karakteristik item dari

instrumen penilaian pelaksanaan pembelajaran (PP) penskoran parsial untuk

penilai dosen yaitu item 15. Jika dikaitkan dengan hasil kaliberasi item pada Tabel

55, dapat dijelaskan bahwa pada dasarnya item 15 ini memiliki parameter lokasi

sebesar 0,64 dengan parameter threshold ᵟ1 sebesar -1,36, threshold ᵟ2 sebesar -

0,13, threshold ᵟ3 sebesar 1,29, serta threshold ᵟ4 sebesar 2,78. Secara grafis

threshold ᵟi dapat diinterpretasikan sebagai perpotongan kurva setiap kategori.

Dari gambar tersebut dapat dijelaskan bahwa untuk mencapai kategori 2 atau

untuk memperoleh skor 2 pada item 15 maka diperlukan kemampuan (  ) sekitar -

0,13 hingga 1,29. Pada bagian ini hanya diberikan contoh untuk item 15. Secara

lebih jelasnya kurva karakteristik untuk semua item pada instrumen penilaian

pelaksanaan pembelajaran (PP) penskoran parsial untuk penilai dosen dapat

diamati pada Lampiran 8 halaman 588. Lebih lanjut karakteristik instrumen

disajikan berdasarkan fungsi informasi sebagai berikut.

Gambar 74. Fungsi Informasi Instrumen Pelaksanaan Pembelajaran Penskoran


Parsial Penilai Dosen

332
Selain kurva karakteristik item, maka hal lain yang dapat dijelaskan dari

kualitas instrumen penilaian pelaksanaan pembelajaran (PP) penskoran parsial

pada uji coba II untuk penilai dosen adalah nilai fungsi informasi instrumen.

Fungsi informasi pada dasarnya menunjukkan sejauhmana instrumen yang telah

dikembangkan dapat memberi informasi maksimal jika dikenakan pada

kemampuan (  ) tertentu. Berikut ini disajikan fungsi informasi (NIF) instrumen

penilaian pelaksanaan pembelajaran (PP) penskoran parsial untuk penilai dosen

yang dihubungkan dengan Standard Error of Measurement (SEM).

Gambar 75. Fungsi Informasi Instrumen Penilaian Pelaksanaan Pembelajaran


(PP) Penskoran Parsial untuk Penilai Dosen

Gambar 75 menyajikan kurva fungsi informasi dari akumulasi 20 item

pada instrumen penilaian pelaksanaan pembelajaran (PP) penskoran parsial uji

coba II untuk penilai dosen. Gambar tersebut menunjukkan grafik nilai informasi

dan kesalahan pengukuran. Kedua grafik fungsi ini bertemu pada skala

kemampuan -2,9 dan 1,8. Di antara dua kemampuan ini, instrumen memiliki nilai

333
informasi yang lebih tinggi dibandingkan dengan kesalahan pengukurannya.

Sebaliknya, ketika skala kemampuan kurang dari -2,9 dan lebih dari 1,8, maka

instrumen ini memiliki kesalahan pengukuran yang lebih besar dibandingkan

dengan informasi yang diberikannya. Hal lain yang dapat dijelaskan dari Gambar

58 tersebut adalah nilai fungsi informasi maksimum instrumen sebesar 13,3 pada

skala kemampuan (  ) -0,6. Hambleton, Swaminathan & Rogers (1991: 94);

Retnawati (2014: 19) menyatakan bahwa nilai fungsi informasi memiliki

hubungan yang berbanding terbalik dengan Standard Error of Measurement

(SEM), semakin besar nilai informasi maka SEM akan semakin kecil atau

sebaliknya. Jika berdasar pada pendapat tersebut, maka dapat dijelaskan bahwa

dengan diketahuinya nilai fungsi informasi sebesar 13,3, maka koefisien

kesalahan pengukuran (SEM) diperoleh sebesar 0,27.

2) Karakteristik Instrumen Penilaian Pelaksanaan Pembelajaran (PP)

Penskoran Parsial untuk Penilai Guru pamong/penguji UKIN

Pada uji coba II, instrumen penilaian pelaksanaan pembelajaran (PP)

penskoran parsial untuk penilai guru pamong/penguji UKIN dianalisis dengan

menggunakan pendekatan partial credit model (PCM) dengan penskoran 0, 1, 2,

3, dan 4. Melalui Program R dengan Extended Rasch Modeling (eRm) package

diperoleh hasil analisis berupa karakteristik item sebagai berikut.

334
Tabel 56. Hasil Analisis Karakteristik Item Instrumen Penilaian Pelaksanaan
Pembelajaran (PP) Penskoran Pasial untuk Penilai Guru
pamong/penguji UKIN

Item Location Threshold ᵟ1 Threshold ᵟ2 Threshold ᵟ3 Threshold ᵟ4


A1 0,69 -1,24 0,28 0,80 2,91
A2 0,63 -0,86 -0,27 0,78 2,90
A3 0,62 -1,17 -0,15 0,85 2,96
A4 0,63 -1,26 -0,09 1,08 2,81
B5 0,65 -1,36 0,05 1,05 2,89
B6 0,60 -1,12 -0,29 1,05 2,76
B7 0,67 -1,33 -0,03 1,15 2,89
B8 0,70 -1,32 -0,01 1,07 3,10
B9 0,66 -1,01 -0,11 0,93 2,87
B10 0,67 -1,01 -0,13 0,98 2,85
B11 0,66 -0,80 -0,44 1,01 2,89
C12 0,61 -1,32 0,13 0,70 2,95
C13 0,62 -0,99 -0,05 0,70 2,83
C14 0,57 1,13 -0,21 0,90 2,73
C15 0,67 -1,11 -0,00 1,04 2,76
D16 0,62 -1,04 -0,38 0,98 2,94
D17 0,64 -1,05 -0,09 1,01 2,71
D18 0,66 -1,09 0,02 0,85 2,88
D19 0,69 -0,80 -0,48 1,08 2,99
D20 0,69 -0,81 -0,40 0,90 3,08

Berdasarkan data hasil analisis yang disajikan pada Tabel 56 diperoleh

informasi bahwa parameter lokasi setiap item bervariasi dari 0,57 hingga 0,70.

Selain itu parameter threshold ᵟi sebanyak empat kelompok atau empat

perpotongan. Hal tersebut merupakan parameter tingkat kesulitan peserta

memperoleh skor tertentu ketika merespon butir i. Ditinjau dari peluang

pencapaian skornya, maka koefisien parameter threshold ᵟi untuk setiap kategori

berbeda-beda. Semakin tinggi kategori pencapaian maka semakin tinggi koefisien

threshold ᵟi. Hal tersebut dijelaskan oleh Embretson (2000) bahwa item location

mencerminkan tentang tingkat kemudahan atau kesukaran item tersebut,

335
sementara threshold merupakan ambang batas antar kategori tertentu yang akan

dicapai. Hal ini berarti bahwa pada instrumen PP semakin tinggi koefisien

location maka semakin sulit item tersebut dengan sebaran threshold yang

merupakan kategori tingkat pencapaiannya. Semakin tinggi threshold maka

semakin sulit dicapai ambang batas tersebut, sehingga peserta yang memiliki

kemampuan rendah tentu hanya mampu mencapai threshold (ambang kategori)

yang rendah pula, peserta yang memiliki kemampuan menengah hanya mampu

mencapai threshold (ambang kategori) yang menengah hingga pada peserta yang

berkemampuan tinggi tentu mampu mencapai kategori ambang batas yang tinggi

pula. Hal lain yang dapat dijelaskan berdasarkan hasil analisis item dengan partial

credit model adalah kurva karakteristik item. Kurva karakteristik item

digambarkan untuk memudahkan memahami hubungan antara setiap threshold ᵟi

yang merupakan tingkat kesulitan dengan kemampuan peserta untuk mencapai

skor atau kategori tertentu. Berikut ini disajikan salah satu contoh kurva

karakteristik item dari instrumen penilaian pelaksanaan pembelajaran (PP)

penskoran parsial pada uji coba II untuk penilai guru pamong/penguji UKIN.

Gambar 76. Kurva Karakteristik Item 10 dari Instrumen Penilaian Pelaksanaan


Pembelajaran Penskoran Parsial Penilai Guru pamong/penguji UKIN

336
Gambar 76 adalah salah satu contoh kurva karakteristik item dari

instrumen penilaian pelaksanaan pembelajaran (PP) penskoran parsial untuk

penilai guru pamong/penguji UKIN yaitu item 10. Jika dikaitkan dengan hasil

kaliberasi item pada Tabel 56, menunjukkan bahwa item 10 ini memiliki

parameter lokasi sebesar 0,67 dengan parameter threshold ᵟ1 sebesar -1,01,

threshold ᵟ2 sebesar -0,13, threshold ᵟ3 sebesar 0,98, serta threshold ᵟ4 sebesar

2,85. Secara grafis threshold ᵟi dapat diinterpretasikan sebagai perpotongan kurva

setiap kategori. Dari gambar tersebut dapat dijelaskan bahwa untuk mencapai

kategori 2 atau untuk memperoleh skor 2 pada item 15 maka diperlukan

kemampuan (  ) sekitar -0,13 hingga 0,98. Pada bagian ini hanya diberikan contoh

untuk item 10. Secara lebih jelasnya kurva karakteristik untuk semua item pada

instrumen penilaian pelaksanaan pembelajaran (PP) penskoran parsial untuk

penilai guru pamong/penguji UKIN dapat diamati pada Lampiran 8 halaman 591.

Selanjutnya karakteristik instrumen disajikan dalam fungsi informasi berikut.

Gambar 77. Fungsi Informasi Instrumen Pelaksanaan Pembelajaran Penskoran


Parsial Penilai Penguji UKIN

337
Selain kurva karakteristik item, maka hal lain yang dapat dijelaskan dari

kualitas instrumen penilaian pelaksanaan pembelajaran (PP) penskoran parsial

untuk penilai guru pamong/penguji UKIN pada uji coba II adalah nilai fungsi

informasi instrumen. Fungsi informasi pada dasarnya menunjukkan sejauhmana

instrumen yang telah dikembangkan dapat memberi informasi maksimal jika

dikenakan pada kemampuan (  ) tertentu. Berikut ini disajikan fungsi informasi

(NIF) instrumen penilaian pelaksanaan pembelajaran (PP) penskoran parsial untuk

penilai guru pamong/penguji UKIN yang dihubungkan dengan Standard Error of

Measurement (SEM).

Gambar 78. Hubungan timbal balik antara NIF dengan SEM Instrumen Penilaian
Pelaksanaan Pembelajaran Penskoran Parsial Penilai Guru
pamong/penguji UKIN

Gambar 78 menyajikan kurva fungsi informasi dari akumulasi 20 item

pada instrumen penilaian pelaksanaan pembelajaran (PP) penskoran parsial untuk

penilai guru pamong/penguji UKIN. Gambar tersebut menunjukkan grafik nilai

informasi (NIF) dan kesalahan pengukuran (SEM) dimana pada kurva untuk NIF

ditunjukkan oleh garis melengkung ke atas dan SEM ditunjukkan oleh garis

338
putus-putus. Kedua grafik fungsi ini bertemu pada skala kemampuan -2,9 dan 1,8.

Di antara dua kemampuan ini, instrumen memiliki nilai informasi yang lebih

tinggi dibandingkan dengan kesalahan pengukurannya. Sebaliknya, ketika skala

kemampuan kurang dari -2,9 dan lebih dari 1,8, maka instrumen ini memiliki

kesalahan pengukuran yang lebih besar dibandingkan dengan informasi yang

diberikannya. Hal lain yang dapat dijelaskan dari Gambar 60 tersebut adalah nilai

fungsi informasi maksimum instrumen sebesar 13,3 pada skala kemampuan (  ) -

0,6. Hambleton, Swaminathan & Rogers (1991: 94); Retnawati (2014: 19)

menyatakan bahwa nilai fungsi informasi memiliki hubungan yang berbanding

terbalik dengan Standard Error of Measurement (SEM), semakin besar nilai

informasi maka SEM akan semakin kecil atau sebaliknya. Jika berdasar pada

pendapat tersebut, maka dapat dijelaskan bahwa dengan diketahuinya nilai fungsi

informasi sebesar 13,3, maka koefisien kesalahan pengukuran (SEM) diperoleh

sebesar 0,27.

3) Karakteristik Instrumen Penilaian Pelaksanaan Pembelajaran Penskoran

Holistik untuk Penilai Dosen

Pada uji coba II, instrumen penilaian pelaksanaan pembelajaran (PP)

penskoran holistik untuk penilai dosen dianalisis dengan menggunakan

pendekatan graded response modeling (GRM) dengan penskoran 1, 2, 3, dan 4.

Melalui Program R dengan latent trait model (ltm) package diperoleh hasil

analisis berupa karakteristik item sebagai berikut.

339
Tabel 57. Hasil Analisis Karakteristik Item Instrumen Penilaian
Pelaksanaan Pembelajaran Penskoran Holistik untuk Penilai
Dosen

Item a b1 b2 b3
A1 1,33 -2,63 -1,33 0,68
A2 1,31 -2,89 -1,36 0,59
A3 1,23 -3,02 -1,43 0,65
A4 1,23 -2,86 -1,24 0,60
B5 1,64 -2,48 -1,11 0,59
B6 1,69 -2,58 -1,08 0,51
B7 1,72 -2,36 -0,93 0,61
B8 1,72 -2,35 -0,97 0,72
B9 1,62 -2,90 -1,18 0,57
B10 1,98 -2,41 -0,99 0,55
B11 1,74 -2,63 -1,05 0,60
C12 1,37 -2,68 -1,35 0,68
C13 1,22 -2,95 -1,51 0,60
C14 1,17 -3,07 -1,41 0,58
C15 1,22 -3,43 -1,32 0,59
D16 1,59 -2,69 -1,16 0,60
D17 1,58 -2,48 -1,12 0,45
D18 1,31 -2,68 -1,31 0,59
D19 1,45 -2,79 -1,13 0,67
D20 1,40 2,84 -1,25 0,75

Berdasarkan data hasil analisis yang disajikan pada Tabel 57 diperoleh

informasi bahwa parameter ai setiap item bervariasi dari 1,17 hingga 1,98. Selain

itu parameter bi sebanyak tiga kelompok atau tiga perpotongan. Hal tersebut

merupakan parameter tingkat kesulitan peserta memperoleh skor tertentu ketika

merespon butir i. Ditinjau dari peluang pencapaian skornya, maka koefisien

parameter bi untuk setiap kategori berbeda-beda. Semakin tinggi kategori

pencapaian maka semakin tinggi koefisien bi.

Hal lain yang dapat dijelaskan berdasarkan hasil analisis item dengan

graded response model adalah kurva karakteristik item. Kurva karakteristik item

340
digambarkan untuk memudahkan memahami hubungan antara setiap bi yang

merupakan tingkat kesulitan dengan kemampuan peserta untuk mencapai skor

atau kategori tertentu. Berikut ini disajikan salah satu contoh kurva karakteristik

item dari instrumen penilaian pelaksanaan pembelajaran (PP) penskoran holistik

untuk penilai dosen pada uji coba II.

Gambar 79. Kurva Karakteristik Item 19 dari Instrumen Penilaian Pelaksanaan


Pembelajaran (PP) Penskoran Holistik untuk Penilai Dosen

Gambar 79 adalah salah satu contoh kurva karakteristik item dari

instrumen penilaian pelaksanaan pembelajaran (PP) penskoran holistik untuk

penilai dosen yaitu item 19. Jika dikaitkan dengan hasil kaliberasi item pada Tabel

48, dapat dijelaskan bahwa pada dasarnya item 19 ini memiliki parameter daya

beda ai sebesar 1,45 dengan parameter b1 sebesar -2,79, b2 sebesar -1,13, serta b3

sebesar 0,67. Secara grafis bi atau tingkat kesulitan dapat diinterpretasikan sebagai

perpotongan kurva setiap kategori. Dari gambar tersebut dapat dijelaskan bahwa

untuk mencapai kategori 2 atau untuk memperoleh skor 2 pada item 10 maka

diperlukan kemampuan (  ) sekitar -2,79 hingga -1,13. Pada bagian ini hanya

diberikan contoh untuk item 19. Secara lebih jelasnya kurva karakteristik untuk

341
semua item pada instrumen penilaian pelaksanaan pembelajaran (PP) penskoran

holistik untuk penilai dosen dapat diamati pada Lampiran 8 halaman 596. Lebih

lanjut karakteristik instrumen dapat disajikan dalam fungsi informasi sebagai

berikut.

Gambar 80. Fungsi Informasi Instrumen Pelaksanaan Pembelajaran Penskoran


Holistik Penilai Dosen

Selain kurva karakteristik item, maka hal lain yang dapat dijelaskan dari

kualitas instrumen penilaian pelaksanaan pembelajaran (PP) penskoran holistik

pada uji coba II untuk penilai dosen adalah nilai fungsi informasi instrumen.

Fungsi informasi pada dasarnya menunjukkan sejauhmana instrumen yang telah

dikembangkan dapat memberi informasi maksimal jika dikenakan pada

kemampuan (  ) tertentu. Berikut ini disajikan fungsi informasi (NIF) instrumen

penilaian pelaksanaan pembelajaran (PP) penskoran holistik untuk penilai dosen

yang dihubungkan dengan Standard Error of Measurement (SEM).

342
Gambar 81. Hubungan timbal balik antara NIF dengan SEM Instrumen Penilaian
Pelaksanaan Pembelajaran (PP) Penskoran Holistik Penilai Dosen

Gambar 81 menyajikan kurva fungsi informasi dari akumulasi 20 item

pada instrumen penilaian pelaksanaan pembelajaran (PP) penskoran holistik untuk

penilai dosen. Gambar tersebut menunjukkan grafik nilai informasi (NIF) dan

kesalahan pengukuran (SEM) dimana pada kurva untuk NIF ditunjukkan oleh

garis melengkung ke atas dan SEM ditunjukkan oleh garis putus-putus. Kedua

grafik fungsi ini bertemu pada skala kemampuan -3,3 dan 1,2. Di antara dua

kemampuan ini, instrumen memiliki nilai informasi yang lebih tinggi

dibandingkan dengan kesalahan pengukurannya. Sebaliknya, ketika skala

kemampuan kurang dari -3,3 dan lebih dari 1,2, maka instrumen ini memiliki

kesalahan pengukuran yang lebih besar dibandingkan dengan informasi yang

diberikannya. Hal lain yang dapat dijelaskan dari Gambar 62 tersebut adalah nilai

fungsi informasi instrumen sebesar 11,4 pada skala kemampuan (  ) -1,1.

Hambleton, Swaminathan & Rogers (1991: 94); Retnawati (2014: 19) menyatakan

bahwa nilai fungsi informasi memiliki hubungan yang berbanding terbalik dengan

343
Standard Error of Measurement (SEM), semakin besar nilai informasi maka SEM

akan semakin kecil atau sebaliknya. Jika berdasar pada pendapat tersebut, maka

dapat dijelaskan bahwa dengan diketahuinya nilai fungsi informasi sebesar 11,4,

maka koefisien kesalahan pengukuran (SEM) diperoleh sebesar 0,29.

4) Karakteristik Instrumen Penilaian Pelaksanaan Pembelajaran (PP)

Penskoran Holistik untuk Penilai Guru pamong/penguji UKIN

Instrumen penilaian pelaksanaan pembelajaran (PP) penskoran holistik

untuk penilai guru pamong/penguji UKIN pada uji coba II diperoleh hasil analisis

berupa karakteristik item sebagai berikut.

Tabel 57. Hasil Analisis Karakteristik Item Instrumen Penilaian Pelaksanaan


Pembelajaran Penskoran Holistik Penilai Guru pamong/penguji
UKIN

Item a b1 b2 b3
A1 1,35 -2,63 -1,33 0,70
A2 1,34 -2,89 -1,34 0,61
A3 1,26 -3,01 -1,41 0,66
A4 1,28 -2,82 -1,21 0,61
B5 1,66 -2,50 -1,11 0,60
B6 1,74 -2,58 -1,07 0,53
B7 1,76 -2,36 -0,93 0,63
B8 1,77 -2,35 -0,96 0,74
B9 1,66 -2,91 -1,17 0,58
B10 1,96 -2,44 -1,01 0,58
B11 1,71 -2,68 -1,07 0,62
C12 1,38 -2,71 -1,36 0,69
C13 1,23 -2,97 -1,53 0,62
C14 1,18 -3,09 -1,42 0,59
C15 1,24 -3,44 -1,32 0,61
D16 1,63 -2,70 -1,15 0,61
D17 1,62 -2,47 -1,11 0,47
D18 1,33 -2,69 -1,31 0,60
D19 1,50 -2,79 -1,12 0,67
D20 1,43 -2,84 -1,24 0,76

344
Berdasarkan data hasil analisis yang disajikan pada Tabel 57 diperoleh

informasi bahwa parameter ai setiap item bervariasi dari 1,18 hingga 1,77. Selain

itu, parameter bi sebanyak tiga kelompok atau tiga perpotongan. Hal tersebut

merupakan parameter tingkat kesulitan peserta memperoleh skor tertentu ketika

merespon butir i. Ditinjau dari peluang pencapaian skornya, maka koefisien

parameter bi untuk setiap kategori berbeda-beda. Semakin tinggi kategori

pencapaian maka semakin tinggi koefisien bi.

Hal lain yang dapat dijelaskan berdasarkan hasil analisis item dengan

graded response model adalah kurva karakteristik item. Kurva karakteristik item

digambarkan untuk memudahkan memahami hubungan antara setiap bi yang

merupakan tingkat kesulitan dengan kemampuan peserta untuk mencapai skor

atau kategori tertentu. Berikut ini disajikan salah satu contoh kurva karakteristik

item dari instrumen penilaian pelaksanaan pembelajaran (PP) penskoran holistik

penilai guru pamong/penguji UKIN pada uji coba II.

Gambar 82. Kurva Karakteristik Item 8 dari Instrumen Penilaian Pelaksanaan


Pembelajaran Penskoran Holistik Penilai Guru pamong/penguji
UKIN

345
Gambar 82 adalah salah satu contoh kurva karakteristik item dari

instrumen penilaian pelaksanaan pembelajaran (PP) penskoran holistik untuk

penilai guru pamong/penguji UKIN pada uji coba II yaitu item 8. Jika dikaitkan

dengan hasil kaliberasi item pada Tabel 57, dapat dijelaskan bahwa pada dasarnya

item 8 ini memiliki parameter daya beda ai sebesar 1,72 dengan parameter b1

sebesar -2,35, b2 sebesar -0,96, serta b3 sebesar 0,74. Secara grafis bi atau tingkat

kesulitan dapat diinterpretasikan sebagai perpotongan kurva setiap kategori. Dari

gambar tersebut dapat dijelaskan bahwa untuk mencapai kategori 2 atau untuk

memperoleh skor 2 pada item 2 maka diperlukan kemampuan (  ) sekitar -2,35

hingga -0,96. Pada bagian ini hanya diberikan contoh untuk item 8. Secara lebih

jelasnya kurva karakteristik untuk semua item pada instrumen penilaian

pelaksanaan pembelajaran (PP) penskoran holistik untuk penilai guru

pamong/penguji UKIN dapat diamati pada Lampiran 8 halaman 599. Lebih lanjut

karakteristik insrtrumen dapat disajikan dalam fungsi informasi sebagai berikut.

Gambar 83. Fungsi Informasi Instrumen Pelaksanaan Pembelajaran Penskoran


holistik Penilai Penguji UKIN

346
Selain kurva karakteristik item, maka hal lain yang dapat dijelaskan dari

kualitas instrumen penilaian pelaksanaan pembelajaran (PP) penskoran holistik

untuk penilai guru pamong/penguji UKIN adalah nilai fungsi informasi instrumen.

Fungsi informasi pada dasarnya menunjukkan sejauhmana instrumen yang telah

dikembangkan dapat memberi informasi maksimal jika dikenakan pada

kemampuan (  ) tertentu. Berikut ini disajikan fungsi informasi (NIF) instrumen

penilaian pelaksanaan pembelajaran (PP) penskoran holistik untuk penilai guru

pamong/penguji UKIN pada uji coba II yang dihubungkan dengan Standard Error

of Measurement (SEM).

Gambar 84. Hubungan timbal balik antara NIF dengan SEM Instrumen Penilaian
PP Penskoran Holistik Penilai Guru pamong/penguji UKIN

Gambar 84 menyajikan kurva fungsi informasi dari akumulasi 20 item

pada instrumen penilaian pelaksanaan pembelajaran (PP) penskoran holistik untuk

penilai guru pamong/penguji UKIN. Gambar tersebut menunjukkan grafik nilai

informasi (NIF) dan kesalahan pengukuran (SEM) dimana pada kurva untuk NIF

347
ditunjukkan oleh garis melengkung ke atas dan SEM ditunjukkan oleh garis

putus-putus. Kedua grafik fungsi ini bertemu pada skala kemampuan -3,3 dan 1,2.

Di antara dua kemampuan ini, instrumen memiliki nilai informasi yang lebih

tinggi dibandingkan dengan kesalahan pengukurannya. Sebaliknya, ketika skala

kemampuan kurang dari -3,3 dan lebih dari 1,2, maka instrumen ini memiliki

kesalahan pengukuran yang lebih besar dibandingkan dengan informasi yang

diberikannya.

Hal lain yang dapat dijelaskan dari Gambar 64 tersebut adalah nilai fungsi

informasi instrumen sebesar 11,4 pada skala kemampuan (  ) -1,1. Hambleton,

Swaminathan & Rogers (1991: 94); Retnawati (2014: 19) menyatakan bahwa nilai

fungsi informasi memiliki hubungan yang berbanding terbalik dengan Standard

Error of Measurement (SEM), semakin besar nilai informasi maka SEM akan

semakin kecil atau sebaliknya. Jika berdasar pada pendapat tersebut, maka dapat

dijelaskan bahwa dengan diketahuinya nilai fungsi informasi sebesar 11,4, maka

koefisien kesalahan pengukuran (SEM) diperoleh sebesar 0,29.

Berdasarkan beberapa penyajian hasil karakteristik item dan kurva

karakteristik item untuk instrumen penilaian pelaksanaan pembelajaran penskoran

parsial dan penskoran holistik dapat dijelaskan bahwa untuk instrumen penilaian

pelaksanaan pembelajaran lebih baik untuk menggunakan penskoran parsial. Hal

ini terlihat pada kurva karakteristik item untuk penskoran parsial yang lebih

condong pada theta positif (lihat Gambar 57) dibandingkan dengan kurva

karakteristik item pada penskoran holistik (lihat Gambar 61). Hal ini juga

diperkuat dengan fungsi informasi butir yang menunjukkan bahwa penskoran

348
parsial lebih memiliki informasi yang tinggi dan SEM yang lebih rendah

dibanding dengan dengan penskoran holistik.

c. Karakteristik Instrumen Penilaian Kompetensi Sosial dan Kompetensi

Kepribadian (KSKK)

Pada uji coba II, karakteristik instrumen penilaian kompetensi sosial dan

kompetensi kepribadian (KSKK) dibagi menjadi empat kelompok data. Data

pertama adalah instrumen KSKK dengan penskoran parsial untuk penilai dosen.

Data kedua adalah instrumen KSKK dengan penskoran parsial untuk penilai guru

pamong/penguji UKIN. Data ketiga adalah instrumen penilaian KSKK dengan

penskoran holistik untuk penilai dosen, dan data keempat adalah instrumen

penilaian KSKK dengan penskoran holistik penilai guru pamong/penguji UKIN.

Uraian keempat kelompok data tersebut pada uji coba II dikemukakan berikut.

1) Karakteristik Instrumen Penilaian Kompetensi Sosial dan Kompetensi

Kepribadian (KSKK) Penskoran Parsial untuk Penilai Dosen

Instrumen penilaian kompetensi sosial dan kompetensi kepribadian

(KSKK) penskoran parsial untuk penilai dosen pada uji coba II dianalisis dengan

menggunakan pendekatan partial credit model (PCM) dengan penskoran 0, 1, 2,

3, dan 4. Melalui Program R dengan Extended Rasch Modeling (eRm) package

diperoleh hasil analisis berupa karakteristik item sebagai berikut.

349
Tabel 58. Hasil Analisis Karakteristik Item Instrumen Penilaian Kompetensi
Sosial dan Kompetensi Kepribadian (KSKK) Penskoran Pasial
Penilai Dosen

Item Location Threshold ᵟ1 Threshold ᵟ2 Threshold ᵟ3 Threshold ᵟ4


A1 0,59 -1,41 0,45 0,96 2,39
A2 0,59 -1,44 0,49 0,95 2,39
A3 0,57 -1,30 0,29 0,93 2,37
A4 0,51 -1,55 0,27 1,02 2,31
A5 0,60 -1,34 0,34 0,94 2,47
B6 0,65 -1,58 0,63 1,14 2,40
B7 0,66 -1,43 0,37 1,20 2,50
B8 0,62 -1,22 0,03 1,25 2,43
B9 0,67 -1,60 0,66 1,19 2,45
B10 0,61 -1,52 0,52 1,23 2,24
C11 0,58 -1,39 0,39 1,01 2,32
C12 0,55 -1,54 0,24 1,02 2,48
C13 0,60 -1,44 0,50 0,92 2,43
C14 0,54 -1,11 0,16 0,60 2,52
C15 0,56 -1,42 0,44 1,04 2,19
D16 0,64 -1,56 0,59 1,19 2,34
D17 0,66 -1,56 0,65 1,01 2,54
D18 0,57 -1,29 0,23 1,05 2,33
D19 0,67 -1,53 0,47 1,33 2,42
D20 0,65 -1,42 0,43 1,98 2,64

Berdasarkan data hasil analisis yang disajikan pada Tabel 58 diperoleh

informasi bahwa parameter lokasi setiap item bervariasi dari 0,51 hingga 0,67.

Selain itu parameter threshold ᵟi sebanyak empat kelompok atau empat

perpotongan. Hal tersebut merupakan parameter tingkat kesulitan peserta

memperoleh skor tertentu ketika merespon butir i. Ditinjau dari peluang

pencapaian skornya, maka koefisien parameter threshold ᵟi untuk setiap kategori

berbeda-beda. Semakin tinggi kategori pencapaian maka semakin tinggi koefisien

threshold ᵟi. Hal tersebut dijelaskan oleh Embretson (2000) bahwa item location

mencerminkan tentang tingkat kemudahan atau kesukaran item tersebut,

350
sementara threshold merupakan ambang batas antar kategori tertentu yang akan

dicapai. Hal ini berarti bahwa pada instrumen SK semakin tinggi koefisien

location maka semakin sulit item tersebut dengan sebaran threshold yang

merupakan kategori tingkat pencapaiannya. Semakin tinggi threshold maka

semakin sulit dicapai ambang batas tersebut, sehingga peserta yang memiliki

kemampuan rendah tentu hanya mampu mencapai threshold (ambang kategori)

yang rendah pula, peserta yang memiliki kemampuan menengah hanya mampu

mencapai threshold (ambang kategori) yang menengah hingga pada peserta yang

berkemampuan tinggi tentu mampu mencapai kategori ambang batas yang tinggi

pula. Hal lain yang dapat dijelaskan berdasarkan hasil analisis item dengan partial

credit model adalah kurva karakteristik item. Kurva karakteristik item

digambarkan untuk memudahkan memahami hubungan antara setiap threshold ᵟi

yang merupakan tingkat kesulitan dengan kemampuan peserta untuk mencapai

skor atau kategori tertentu. Berikut ini disajikan salah satu contoh kurva

karakteristik item dari instrumen penilaian kompetensi sosial dan kompetensi

kepribadian (KSKK) penskoran parsial untuk penilai dosen pada uji coba II.

Gambar 85. Kurva Karakteristik Item 7 dari Instrumen Penilaian Kompetensi


Sosial dan Kompetensi Kepribadian Penskoran Parsial Penilai Dosen

351
Gambar 85 adalah salah satu contoh kurva karakteristik item dari

instrumen penilaian kompetensi sosial dan kompetensi kepribadian (KSKK)

penskoran parsial untuk penilai dosen pada uji coba II yaitu item 7. Jika dikaitkan

dengan hasil kaliberasi item pada Tabel 58, dapat dijelaskan bahwa pada dasarnya

item 7 ini memiliki parameter lokasi sebesar 0,66 dengan parameter threshold ᵟ1

sebesar -1,43, threshold ᵟ2 sebesar 0,37, threshold ᵟ3 sebesar 1,20, serta threshold

ᵟ4 sebesar 2,50. Secara grafis threshold ᵟi dapat diinterpretasikan sebagai

perpotongan kurva setiap kategori. Dari gambar tersebut dapat dijelaskan bahwa

untuk mencapai kategori 2 atau untuk memperoleh skor 2 pada item 7 maka

diperlukan kemampuan (  ) sekitar 0,37 hingga 1,20. Pada bagian ini hanya

diberikan contoh untuk item 7. Secara lebih jelasnya kurva karakteristik untuk

semua item pada instrumen penilaian kompetensi sosial dan kompetensi

kepribadian (KSKK) penskoran parsial untuk penilai dosen dapat diamati pada

Lampiran 8 halaman 603. Lebih lanjut karakteristik instrumen disajikan dalam

fungsi informasi sebagai berikut.

Gambar 86. Fungsi Informasi Instrumen Kompetensi Sosial dan Kompetensi


kepribadian Penskoran Parsial Penilai Dosen

352
Selain kurva karakteristik item, maka hal lain yang dapat dijelaskan dari

kualitas instrumen penilaian kompetensi sosial dan kompetensi kepribadian

(KSKK) penskoran parsial pada uji coba II untuk penilai dosen adalah nilai fungsi

informasi instrumen. Fungsi informasi pada dasarnya menunjukkan sejauhmana

instrumen yang telah dikembangkan dapat memberi informasi maksimal jika

dikenakan pada kemampuan (  ) tertentu. Berikut ini disajikan fungsi informasi

(NIF) instrumen penilaian kompetensi sosial dan kompetensi kepribadian (KSKK)

penskoran parsial untuk penilai dosen yang dihubungkan dengan Standard Error

of Measurement (SEM).

Gambar 87. Hubungan timbal balik antara NIF dengan SEM Instrumen Penilaian
Kompetensi Sosial dan Kompetensi Kepribadian Penskoran Parsial
Penilai Dosen

Gambar 87 menyajikan kurva fungsi informasi dari akumulasi 20 item

pada instrumen penilaian kompetensi sosial dan kompetensi kepribadian (KSKK)

penskoran parsial untuk penilai dosen. Gambar tersebut menunjukkan grafik nilai

informasi dan kesalahan pengukuran. Kedua grafik fungsi ini bertemu pada skala

353
kemampuan -3,8 dan 0,9. Di antara dua kemampuan ini, instrumen memiliki nilai

informasi yang lebih tinggi dibandingkan dengan kesalahan pengukurannya.

Sebaliknya, ketika skala kemampuan kurang dari -3,8 dan lebih dari 0,9, maka

instrumen ini memiliki kesalahan pengukuran yang lebih besar dibandingkan

dengan informasi yang diberikannya. Hal lain yang dapat dijelaskan dari Gambar

66 tersebut adalah nilai fungsi informasi instrumen sebesar 12,9 pada skala

kemampuan (  ) -1,4. Hambleton, Swaminathan & Rogers (1991: 94); Retnawati

(2014: 19) menyatakan bahwa nilai fungsi informasi memiliki hubungan yang

berbanding terbalik dengan Standard Error of Measurement (SEM), semakin

besar nilai informasi maka SEM akan semakin kecil atau sebaliknya. Jika berdasar

pada pendapat tersebut, maka dapat dijelaskan bahwa dengan diketahuinya nilai

fungsi informasi sebesar 12,9, maka koefisien kesalahan pengukuran (SEM)

diperoleh sebesar 0,27.

2) Karakteristik Instrumen Penilaian Kompetensi Sosial dan Kompetensi

Kepribadian Penskoran Parsial Penilai Guru pamong/penguji UKIN

Pada uji coba II, instrumen penilaian kompetensi sosial dan kompetensi

kepribadian (KSKK) penskoran parsial untuk penilai guru pamong/penguji UKIN

dianalisis dengan menggunakan pendekatan partial credit model (PCM) dengan

penskoran 0, 1, 2, 3, dan 4. Melalui Program R dengan Extended Rasch Modeling

(eRm) package diperoleh hasil analisis berupa karakteristik item sebagai berikut.

354
Tabel 59. Hasil Analisis Karakteristik Item Instrumen Penilaian Kompetensi
Sosial dan Kompetensi Kepribadian (KSKK) Penskoran Pasial
untuk Penilai Guru pamong/penguji UKIN

Item Location Threshold ᵟ1 Threshold ᵟ2 Threshold ᵟ3 Threshold ᵟ4


A1 0,61 -1,36 0,50 0,86 2,45
A2 0,55 -1,63 0,53 0,91 2,41
A3 0,60 -1,41 0,57 0,88 2,39
A4 0,58 -1,24 0,25 1,00 2,33
A5 0,60 -1,24 0,32 0,83 2,51
B6 0,60 -1,78 0,73 1,00 2,44
B7 0,67 -1,38 0,38 1,18 2,52
B8 0,58 -1,42 0,06 1,23 2,46
B9 0,62 -1,81 0,74 1,06 2,50
B10 0,63 -1,45 0,49 1,22 2,27
C11 0,59 -1,35 0,49 0,84 2,38
C12 0,57 -1,51 0,29 1,00 2,51
C13 0,57 -0,97 -0,03 0,79 2,49
C14 0,56 -1,05 0,16 0,60 2,54
C15 0,52 -1,61 0,46 1,04 2,21
D16 0,59 -1,69 0,50 1,21 2,37
D17 0,68 -1,47 0,58 1,03 2,57
D18 0,60 -1,28 0,30 1,05 2,35
D19 0,71 -1,69 0,88 1,24 2,41
D20 0,68 -1,43 0,55 0,96 2,65

Berdasarkan data hasil analisis yang disajikan pada Tabel 59 diperoleh

informasi bahwa parameter lokasi setiap item bervariasi dari 0,55 hingga 0,71.

Selain itu parameter threshold ᵟi sebanyak empat kelompok atau empat

perpotongan. Hal tersebut merupakan parameter tingkat kesulitan peserta

memperoleh skor tertentu ketika merespon butir i. Ditinjau dari peluang

pencapaian skornya, maka koefisien parameter threshold ᵟi untuk setiap kategori

berbeda-beda. Semakin tinggi kategori pencapaian maka semakin tinggi koefisien

threshold ᵟi. Hal tersebut dijelaskan oleh Embretson (2000) bahwa item location

mencerminkan tentang tingkat kemudahan atau kesukaran item tersebut,

355
sementara threshold merupakan ambang batas antar kategori tertentu yang akan

dicapai. Hal ini berarti bahwa pada instrumen penilaian kompetensi sosial dan

kepribadian semakin tinggi koefisien location maka semakin sulit item tersebut

dengan sebaran threshold yang merupakan kategori tingkat pencapaiannya.

Semakin tinggi threshold maka semakin sulit dicapai ambang batas tersebut,

sehingga peserta yang memiliki kemampuan rendah tentu hanya mampu mencapai

threshold (ambang kategori) yang rendah pula, peserta yang memiliki kemampuan

menengah hanya mampu mencapai threshold (ambang kategori) yang menengah

hingga pada peserta yang berkemampuan tinggi tentu mampu mencapai kategori

ambang batas yang tinggi pula. Hal lain yang dapat dijelaskan berdasarkan hasil

analisis item dengan partial credit model adalah kurva karakteristik item. Kurva

karakteristik item digambarkan untuk memudahkan memahami hubungan antara

setiap threshold ᵟi yang merupakan tingkat kesulitan dengan kemampuan peserta

untuk mencapai skor atau kategori tertentu. Berikut ini disajikan salah satu contoh

kurva karakteristik item dari instrumen penilaian tersebut untuk penilai guru

pamong/penguji UKIN.

Gambar 88. Kurva Karakteristik Item 18 dari Instrumen Penilaian KSKK


Penskoran Parsial Penilai Guru pamong/penguji UKIN

356
Gambar 88 adalah salah satu contoh kurva karakteristik item dari

instrumen penilaian kompetensi sosial dan kompetensi kepribadian (KSKK)

penskoran parsial untuk penilai guru pamong/penguji UKIN pada uji coba II yaitu

item 18. Jika dikaitkan dengan hasil kaliberasi item pada Tabel 59, dapat

dijelaskan bahwa pada dasarnya item 18 ini memiliki parameter lokasi sebesar

0,60 dengan parameter threshold ᵟ1 sebesar -1,28, threshold ᵟ2 sebesar 0,30,

threshold ᵟ3 sebesar 1,05, serta threshold ᵟ4 sebesar 2,41. Secara grafis threshold ᵟi

dapat diinterpretasikan sebagai perpotongan kurva setiap kategori. Dari gambar

tersebut dapat dijelaskan bahwa untuk mencapai kategori 2 atau untuk

memperoleh skor 2 pada item 18 maka diperlukan kemampuan (  ) sekitar 0,30

hingga 1,05 Pada bagian ini hanya diberikan contoh untuk item 18. Secara lebih

jelasnya kurva karakteristik untuk semua item pada instrumen penilaian rencana

kompetensi sosial dan kompetensi kepribadian (KSKK) penskoran parsial penilai

guru pamong/penguji UKIN dapat diamati pada Lampiran 8 halaman 608. Lebih

lanjut karakteristik instrumen disajikan dalam fungsi informasi sebagai berikut.

Gambar 89. Fungsi Informasi Instrumen kompetensi sosial dan kepribadian


penskoran parsial Penilai Penguji UKIN

357
Selain kurva karakteristik item, maka hal lain yang dapat dijelaskan dari

kualitas instrumen penilaian kompetensi sosial dan kompetensi kepribadian

(KSKK) penskoran parsial untuk penilai guru pamong/penguji UKIN pada uji

coba II adalah nilai fungsi informasi instrumen. Fungsi informasi pada dasarnya

menunjukkan sejauhmana instrumen yang telah dikembangkan dapat memberi

informasi maksimal jika dikenakan pada kemampuan (  ) tertentu. Berikut ini

disajikan fungsi informasi (NIF) instrumen penilaian kompetensi sosial dan

kompetensi kepribadian (KSKK) penskoran parsial untuk penilai guru

pamong/penguji UKIN yang dihubungkan dengan SEM.

Gambar 90. Fungsi Informasi Instrumen Penilaian Kompetensi Sosial


Kepribadian (KSKK) Penskoran Parsial Penilai Guru
pamong/penguji UKIN

Gambar 90 menyajikan kurva fungsi informasi dari akumulasi 20 item

pada instrumen penilaian kompetensi sosial dan kompetensi kepribadian (KSKK)

penskoran parsial untuk penilai guru pamong/penguji UKIN. Gambar tersebut

menunjukkan grafik nilai informasi dan kesalahan pengukuran. Kedua grafik

fungsi ini bertemu pada skala kemampuan -3,8 dan 0,9. Di antara dua kemampuan

358
ini, instrumen memiliki nilai informasi yang lebih tinggi dibandingkan dengan

kesalahan pengukurannya. Sebaliknya, ketika skala kemampuan kurang dari -3,8

dan lebih dari 0,9, maka instrumen ini memiliki kesalahan pengukuran yang lebih

besar dibandingkan dengan informasi yang diberikannya. Hal lain yang dapat

dijelaskan dari Gambar 67 tersebut adalah nilai fungsi informasi instrumen

sebesar 12,9 pada skala kemampuan (  ) -1,4. Hambleton, Swaminathan & Rogers

(1991: 94); Retnawati (2014: 19) menyatakan bahwa nilai fungsi informasi

memiliki hubungan yang berbanding terbalik dengan Standard Error of

Measurement (SEM), semakin besar nilai informasi maka SEM akan semakin

kecil atau sebaliknya. Jika berdasar pada pendapat tersebut, maka dapat dijelaskan

bahwa dengan diketahuinya nilai fungsi informasi sebesar 12,9, maka koefisien

kesalahan pengukuran (SEM) diperoleh sebesar 0,27.

3) Karakteristik Instrumen Penilaian Kompetensi Sosial dan Kompetensi

Kepribadian (KSKK) Penskoran Holistik untuk Penilai Dosen

Pada uji coba II, instrumen penilaian kompetensi sosial dan kompetensi

kepribadian (KSKK) penskoran holistik untuk penilai dosen dianalisis dengan

menggunakan pendekatan graded response modeling (GRM) dengan penskoran 1,

2, 3, dan 4. Melalui Program R dengan latent trait model (ltm) package diperoleh

hasil analisis berupa karakteristik item sebagai berikut.

359
Tabel 60. Hasil Analisis Karakteristik Item Instrumen Penilaian Kompetensi
Sosial dan Kompetensi Kepribadian (KSKK) Pembelajaran
Penskoran Holistik untuk Penilai Dosen

Item a b1 b2 b3
A1 1,31 -2,26 -1,04 0,60
A2 1,19 -2,39 -1.14 0,41
A3 1,38 -2,16 -1,05 0,57
A4 1,22 -2,47 -1,10 0,57
A5 1,17 -2,32 -1,14 0,69
B6 1,19 -2,19 -0,93 0,69
B7 1,25 -2,28 -0,90 0,75
B8 1,18 -2,61 -0,97 0,72
B9 1,17 -2,18 -0,89 0,75
B10 1,55 -1,74 -0,79 0,51
C11 1,51 -2,08 -0,93 0,53
C12 1,48 -2,19 -0,94 0,65
C13 1,27 -2,26 -1,07 0,64
C14 1,30 -2,56 -1,34 0,63
C15 1,57 -2,04 -0,92 0,45
D16 1,72 -1,81 -0,74 0,55
D17 1,54 -1,91 -0,84 0,69
D18 1,53 -1,88 -0,93 0,54
D19 1,72 -1,61 -0,64 0,64
D20 1,61 -1,92 -0,88 0,73

Berdasarkan data hasil analisis yang disajikan pada Tabel 60 diperoleh

informasi bahwa parameter ai setiap item bervariasi dari 1,17 hingga 1,72. Selain

itu parameter bi sebanyak tiga kelompok atau tiga perpotongan. Hal tersebut

merupakan parameter tingkat kesulitan peserta memperoleh skor tertentu ketika

merespon butir i. Ditinjau dari peluang pencapaian skornya, maka koefisien

parameter bi untuk setiap kategori berbeda-beda. Semakin tinggi kategori

pencapaian maka semakin tinggi koefisien bi. Hal lain yang dapat dijelaskan

berdasarkan hasil analisis item dengan graded response model adalah kurva

karakteristik item. Kurva karakteristik item digambarkan untuk memudahkan

memahami hubungan antara setiap bi yang merupakan tingkat kesulitan dengan

360
kemampuan peserta untuk mencapai skor atau kategori tertentu. Berikut ini

disajikan salah satu contoh kurva karakteristik item dari instrumen penilaian

kompetensi sosial dan kompetensi kepribadian (KSKK) penskoran holistik untuk

penilai dosen pada uji coba II.

Gambar 91. Kurva Karakteristik Item 16 dari Instrumen Penilaian Kompetensi


Sosial Kepribadian (KSKK) Penskoran Holistik untuk Penilai Dosen

Gambar 91 adalah salah satu contoh kurva karakteristik item dari

instrumen penilaian kompetensi sosial dan kompetensi kepribadian (KSKK)

penskoran holistik untuk penilai dosen pada uji coba II yaitu item 16. Jika

dikaitkan dengan hasil kaliberasi item pada Tabel 60, dapat dijelaskan bahwa pada

dasarnya item 16 ini memiliki parameter daya beda ai sebesar 1,72 dengan

parameter b1 sebesar -1,81, b2 sebesar -0,74, serta b3 sebesar 0,55. Secara grafis bi

atau tingkat kesulitan dapat diinterpretasikan sebagai perpotongan kurva setiap

kategori. Dari gambar tersebut dapat dijelaskan bahwa untuk mencapai kategori 2

atau untuk memperoleh skor 2 pada item 9 maka diperlukan kemampuan (  )

sekitar -1,81 hingga -0,74. Pada bagian ini hanya diberikan contoh untuk item 16.

361
Secara lebih jelasnya kurva karakteristik untuk semua item pada instrumen

penilaian kompetensi sosial dan kompetensi kepribadian (KSKK) penskoran

holistik untuk penilai dosen dapat diamati pada Lampiran 8 halaman 612. Lebih

lanjut karakteristik instrumen dapat disajikan dalam fungsi informasi sebagai

berikut.

Gambar 92. Fungsi Informasi Instrumen Kompetensi Sosial dan Kompetensi


Kepribadian Penskoran Holistik Penilai Dosen

Selain kurva karakteristik item, maka hal lain yang dapat dijelaskan dari

kualitas instrumen kompetensi sosial dan kompetensi kepribadian (KSKK)

penskoran holistik untuk penilai dosen adalah nilai fungsi informasi instrumen.

Fungsi informasi pada dasarnya menunjukkan sejauhmana instrumen yang telah

dikembangkan dapat memberi informasi maksimal jika dikenakan pada

kemampuan (  ) tertentu. Berikut ini disajikan fungsi informasi (NIF) instrumen

penilaian kompetensi sosial dan kompetensi kepribadian (KSKK) penskoran

holistik untuk penilai dosen pada uji coba II yang dihubungkan dengan Standard

Error of Measurement (SEM).

362
Gambar 93. Hubungan timbal balik antara NIF dengan SEM Instrumen
Penilaian KSKK Penskoran Holistik Penilai Dosen

Gambar 93 menyajikan kurva fungsi informasi dari akumulasi 20 item

pada instrumen penilaian kompetensi sosial dan kompetensi kepribadian (KSKK)

penskoran holistik untuk penilai dosen. Gambar tersebut menunjukkan grafik nilai

informasi (NIF) dan kesalahan pengukuran (SEM) dimana pada kurva untuk NIF

ditunjukkan oleh garis melengkung ke atas dan SEM ditunjukkan oleh garis

putus-putus. Kedua grafik fungsi ini bertemu pada skala kemampuan -3,1 dan 1,2.

Di antara dua kemampuan ini, instrumen memiliki nilai informasi yang lebih

tinggi dibandingkan dengan kesalahan pengukurannya. Sebaliknya, ketika skala

kemampuan kurang dari -3,1 dan lebih dari 1,2, maka instrumen ini memiliki

kesalahan pengukuran yang lebih besar dibandingkan dengan informasi yang

diberikannya. Hal lain yang dapat dijelaskan dari Gambar 69 tersebut adalah nilai

fungsi informasi instrumen sebesar 10,7 pada skala kemampuan (  ) -0,9.

Hambleton, Swaminathan & Rogers (1991: 94); Retnawati (2014: 19) menyatakan

bahwa nilai fungsi informasi memiliki hubungan yang berbanding terbalik dengan

Standard Error of Measurement (SEM), semakin besar nilai informasi maka SEM

363
akan semakin kecil atau sebaliknya. Jika berdasar pada pendapat tersebut, maka

dapat dijelaskan bahwa dengan diketahuinya nilai fungsi informasi sebesar 10,7,

maka koefisien kesalahan pengukuran (SEM) diperoleh sebesar 0,3.

4) Karakteristik Instrumen Penilaian Kompetensi Sosial dan Kompetensi

Kepribadian Penskoran Holistik Penilai Guru pamong/penguji UKIN

Pada uji coba II, instrumen penilaian kompetensi sosial dan kompetensi

kepribadian (KSKK) penskoran holistik untuk penilai guru pamong/penguji UKIN

dianalisis dengan menggunakan pendekatan graded response modeling (GRM)

dengan penskoran 1, 2, 3, dan 4. Melalui Program R dengan latent trait model

(ltm) package diperoleh hasil analisis berupa karakteristik item sebagai berikut.

Tabel 61. Hasil Analisis Karakteristik Item Instrumen Penilaian Kompetensi


Sosial dan Kompetensi Kepribadian Penskoran Holistik untuk
Penilai Guru pamong/penguji UKIN

Item a b1 b2 b3
A1 1,33 -2,25 -1,12 0,60
A2 1,21 -2,37 -1,14 0,64
A3 1,38 -2,16 -1,06 0,57
A4 1,22 -2,48 -1,12 0,57
A5 1,21 -2,33 -1,15 0,69
B6 1,19 -2,20 -1,03 0,69
B7 1,25 -2,28 -0,91 0,75
B8 1,18 -2,61 -0,98 0,72
B9 1,21 -2,14 -0,95 0,74
B10 1,56 -1,73 -0,79 0,52
C11 1,57 -2,05 -1,00 0,53
C12 1,47 -2,20 -0,95 0,65
C13 1,25 -2,41 -1,27 0,65
C14 1,30 -2,56 -1,35 0,64
C15 1,56 -2,05 -0,94 0,45
D16 1,71 -1,81 -0,75 0,56
D17 1,55 -1,91 -0,84 0,70
D18 1,53 -1,88 -0,94 0,55
D19 1,72 -1,61 -0,65 0,64
D20 1,61 -1,92 -0,89 0,73

364
Berdasarkan data hasil analisis yang disajikan pada Tabel 61 diperoleh

informasi bahwa parameter ai setiap item bervariasi dari 1,18 hingga 1,72. Selain

itu, parameter bi sebanyak tiga kelompok atau tiga perpotongan. Hal tersebut

merupakan parameter tingkat kesulitan peserta memperoleh skor tertentu ketika

merespon butir i. Ditinjau dari peluang pencapaian skornya, maka koefisien

parameter bi untuk setiap kategori berbeda-beda. Semakin tinggi kategori

pencapaian maka semakin tinggi koefisien bi. Hal lain yang dapat dijelaskan

berdasarkan hasil analisis item dengan graded response model adalah kurva

karakteristik item. Kurva karakteristik item digambarkan untuk memudahkan

memahami hubungan an+tara setiap bi yang merupakan tingkat kesulitan dengan

kemampuan peserta untuk mencapai skor atau kategori tertentu. Berikut ini

disajikan salah satu contoh kurva karakteristik item dari instrumen penilaian

kompetensi sosial dan kompetensi kepribadian (KSKK) penskoran holistik penilai

guru pamong/penguji UKIN pada uji coba II.

Gambar 94. Kurva Karakteristik Item 12 dari Instrumen Penilaian Kompetensi


Sosial Kepribadian Penskoran Holistik Penilai Guru pamong/penguji
UKIN

365
Gambar 94 adalah salah satu contoh kurva karakteristik item dari

instrumen penilaian kompetensi sosial dan kompetensi kepribadian (KSKK)

penskoran holistik untuk penilai guru pamong/penguji UKIN pada uji coba II

yaitu item 12. Jika dikaitkan dengan hasil kaliberasi item pada Tabel 53, dapat

dijelaskan bahwa pada dasarnya item 12 ini memiliki parameter daya beda ai

sebesar 1,47 dengan parameter b1 sebesar -2,20, b2 sebesar -0,95, serta b3 sebesar

0,65. Secara grafis bi atau tingkat kesulitan dapat diinterpretasikan sebagai

perpotongan kurva setiap kategori. Dari gambar tersebut dapat dijelaskan bahwa

untuk mencapai kategori 2 atau untuk memperoleh skor 2 pada item 2 maka

diperlukan kemampuan (  ) sekitar -2,20 hingga -0,95. Pada bagian ini hanya

diberikan contoh untuk item 12. Secara lebih jelasnya kurva karakteristik untuk

semua item pada instrumen penilaian kompetensi sosial dan kompetensi

kepribadian (KSKK) penskoran holistik untuk penilai guru pamong/penguji UKIN

dapat diamati pada Lampiran 8 halaman 615. Lebih lanjut karakteristik instrumen

dapat disajikan dalam fungsi niformasi sebagai berikut.

Gambar 95. Fungsi Informasi Instrumen kompetensi sosial dan kompetensi


kepribadian Penskoran Holistik Penilai Guru Pamong/Penguji UKIN

366
Selain kurva karakteristik item, maka hal lain yang dapat dijelaskan dari

kualitas instrumen penilaian kompetensi sosial dan kompetensi kepribadian

(KSKK) penskoran holistik untuk penilai guru pamong/penguji UKIN adalah nilai

fungsi informasi instrumen. Fungsi informasi pada dasarnya menunjukkan

sejauhmana instrumen yang telah dikembangkan dapat memberi informasi

maksimal jika dikenakan pada kemampuan (  ) tertentu. Berikut ini disajikan

fungsi informasi (NIF) instrumen penilaian kompetensi sosial dan kompetensi

kepribadian (KSKK) penskoran holistik untuk penilai guru pamong/penguji UKIN

pada uji coba II yang dihubungkan dengan SEM.

Gambar 96. Hubungan timbal balik antara NIF dengan SEM Instrumen Penilaian
KSKK Penskoran Holistik Penilai Guru pamong/penguji UKIN

Gambar 96 menyajikan kurva fungsi informasi dari akumulasi 20 item

pada instrumen penilaian kompetensi sosial dan kompetensi kepribadian (KSKK)

penskoran holistik untuk penilai guru pamong/penguji UKIN pada uji coba II.

Gambar tersebut menunjukkan grafik nilai informasi (NIF) dan kesalahan

pengukuran (SEM) dimana pada kurva untuk NIF ditunjukkan oleh garis

367
melengkung ke atas dan SEM ditunjukkan oleh garis putus-putus. Kedua grafik

fungsi ini bertemu pada skala kemampuan -3,1 dan 1,2. Di antara dua kemampuan

ini, instrumen memiliki nilai informasi yang lebih tinggi dibandingkan dengan

kesalahan pengukurannya. Sebaliknya, ketika skala kemampuan kurang dari -3,1

dan lebih dari 1,2, maka instrumen ini memiliki kesalahan pengukuran yang lebih

besar dibandingkan dengan informasi yang diberikannya.

Hal lain yang dapat dijelaskan dari Gambar 72 tersebut adalah nilai fungsi

informasi instrumen sebesar 10,7 pada skala kemampuan (  ) -0,9. Hambleton,

Swaminathan & Rogers (1991: 94); Retnawati (2014: 19) menyatakan bahwa nilai

fungsi informasi memiliki hubungan yang berbanding terbalik dengan Standard

Error of Measurement (SEM), semakin besar nilai informasi maka SEM akan

semakin kecil atau sebaliknya. Jika berdasar pada pendapat tersebut, maka dapat

dijelaskan bahwa dengan diketahuinya nilai fungsi informasi sebesar 10, maka

koefisien kesalahan pengukuran (SEM) diperoleh sebesar 0,3.

Berdasarkan beberapa penyajian hasil karakteristik item dan kurva

karakteristik item untuk instrumen penilaian kompetensi sosial kepribadian

penskoran parsial dan penskoran holistik dapat dijelaskan bahwa untuk instrumen

penilaian kompetensi sosial kepribadian lebih baik untuk menggunakan penskoran

parsial. Hal ini terlihat pada kurva karakteristik item untuk penskoran parsial yang

lebih condong pada theta positif (lihat Gambar 65) dibandingkan dengan kurva

karakteristik item pada penskoran holistik (lihat Gambar 68). Hal ini juga

diperkuat dengan fungsi informasi butir yang menunjukkan bahwa penskoran

368
parsial lebih memiliki informasi yang tinggi dan SEM yang lebih rendah

dibanding dengan dengan penskoran holistik.

D. Kajian Produk Akhir

Pada sub-bab sebelumnya telah diuraikan hasil penelitian ini secara detil.

Untuk memaknai hasil penelitian tersebut, maka pada sub-bab ini dilakukan

pembahasan hasil penelitian. Pembahasan hasil penelitian ini juga mengacu pada

permasalahan yang telah dirumuskan dibagian awal penelitian ini. Permasalahan

tersebut terkait dengan konstruk instrumen model penilaian PPG dengan

penskoran parsial dan holistik, validitas dan reliabilitas dari model penilaian PPG

dengan penskoran parsial dan holistik, instrumen model penilaian PPG dengan

penskoran parsial dan holistik, serta hasil penskoran parsial dan holistik dalam

pengembangan model penilaian PPG pada praktik mengajar. Pembahasan terkait

hasil penelitian tersebut diuraikan sebagai berikut.

1. Konstruk Model Penilaian PPG dengan Penskoran Parsial dan Holistik

Hasil penelitian ini telah mendeskripsikan bahwa terdapat tiga instrumen

yang telah dikembangkan pada model penilaian PPG. Ketiga instrumen tersebut

antara lain: instrumen penilaian RPP, instrumen penilaian pelaksanaan

pembelajaran, serta instrumen penilaian kompetensi sosial dan kompetensi

kepribadian. Pada instrumen penilaian RPP telah menghasilkan konstruk dengan

empat indikator yang diukur oleh 25 buah item penilaian.

Indikator perumusan indikator pencapaian kompetensi dan capaian

pembelajaran (PIPKC) diukur oleh enam item. Item tesebut terdiri atas:

369
kelengkapan penulisan identitas RPP, kelengkapan penilisan KI, kesesesuaian dan

kejelasan rumusan indikator pencapaian kompetensi dengan kompetensi dasar

(KD), Kejelasan rumusan indikator pencapaian kompetensi menggunakan kata

kerja yang dapat diukur dan/atau diamati, kesesuaian dan kejelasan rumusan

tujuan pembelajaran dengan indikator pencapaian kompetensi, serta kelengkapan

rumusan tujuan pembelajaran memenuhi kriteria ABCD (Audience, Behavior,

Condition, Degree).

Hasil penelitian ini relevan dengan pendapat Archer & Hughes (2011)

bahwa secara eksplisit guru perlu memiliki kemampuan memilih materi belajar

yang harus diajarkan serta menetapkan kriteria keberhasilan pembelajaran dan

memberitahukan kriteria tersebut kepada peserta didik. Pandangan ini

menunjukkan bahwa salah satu kemampuan yang harus dimiliki oleh guru adalah

kemampuan dalam merumuskan kompetensi serta menetapkan capaian

pembelajaran. Hal ini bermakna bahwa untuk mengetahui kualitas perencanaan

pembelajaran yang dilakukan oleh guru, maka perlu mengukur kemampuan guru

dalam merumuskan kompetensi serta menetapkan capaian pembelajaran.

Indikator pengorganisasian materi, metode, media dan sumber belajar

(PMMMS) diukur oleh enam item. Item tersebut terdiri atas: kesesuaian dan

kejelasan materi dengan tujuan pembelajaran, ketepatan dan kelengkapan

penyusunan materi dan bahan ajar, kesesuaian pemilihan metode pembelajaran

dengan KD, karakteristik materi dan karakteristik peserta didik, kesesuaian

langkah-langkah/sintaks pembelajaran dengan strategi pembelajaran dan materi

yang diajarkan, kesesuaian media dan sumber belajar dengan tujuan pembelajaran,

370
materi, kondisi kelas dan ketepatan pemilihan spesifikasinya, serta kelayakan

media dan sumber belajar yang digunakan.

Hasil penelitian tersebut didukung oleh Orazbayeva (2016) bahwa

idealnya guru harus memiliki kemampuan effective teaching practices yaitu

melaksanakan praktik mengajar yang efektif dengan cara: 1) mengidentifikasi,

memilih dan menerapkan berbagai strategi mengajar yang dapat membantu

peserta didik terlibat aktif dalam pembelajaran, 2) melakukan aktivitas

pembelajaran secara bervariasi atau tidak monoton, 3) mengidentifikasi masalah

yang dihadapi peserta didik dan membantunya dalam memecahkannya, 4)

membantu peserta didik menggunakan sumber belajar, 5) memberikan banyak

kesempatan kepada peserta didik untuk bertanya, mempraktekkan dan berinterkasi

dengan peserta didik lainnya. Kedua dimensi ini memiliki keterkaitan satu sama

lain dalam menunjang keberhasilan pembelajaran yang dilaksanakan guru.

Pandangan tersebut menunjukkan pentingnya pengorganisasian materi,

metode, media dan sumber belajar. Guru yang ideal adalah mereka yang mampu

mengorganisasikan materi dengan baik, memilih metode pembelajaran dengan

tepat serta menentukan sumber belajara yang dapat mendukung ketercapaian

tujuan pembelajaran. Oleh karena itu, untuk mengetahui kualitas perencanaan

pembelajaran yang dilakukan oleh guru, maka perlu mengukur kemampuannya

dalam mengorganisasikan materi , memilih metode pembelajaran serta menetukan

sumber belajar secara tepat.

Indikator pengorganisasian proses, penilaian dan evaluasi pembelajaran

(PPPEP) diukur oleh enam item. Item tersebut terdiri atas: kelengkapan dan

371
kejelasan langkah-langkah kegiatan pembelajaran, kejelasan skenario

pembelajaran menggambarkan active learning, kejelasan skenario pembelajaran

mencerminkan saintific learning, kesesuaian teknik penilaian dengan indikator

pencapaian kompetensi dan kejelasan lingkup penilaian, kelengkapan komponen

penilaian yang digunakan, serta kejelasan rencana kegiatan pengayaan dan/atau

remedial.

Secara teoretik hasil penelitian tersebut didukung oleh pandangan Sanders,

et. al., (1990) mengemukakan bahwa menurut American Federation of Teachers

(AFT), National Council on Measurement in Education (NCME), dan National

Education Association (NEA) terdapat 7 (tujuh) standar lingkup peran dan

tanggung jawab guru dalam penilaian peserta didik yaitu: 1) terampil dalam

memilih metode penilaian, 2) terampil dalam mengembangkan metode penilaian,

3) terampil dalam merancang dan menafsirkan hasil penilaian, 4) terampil

menggunakan hasil penilaian, 5) terampil dalam mengembangkan prosedur

penilaian, 6) terampil dalam mengkomunikasikan atau menyampaikan hasil

penilaian, 7) terampil dalam mengenali metode penilaian yang tidak pantas, tidak

etis, illegal, dan menggunakan informasi penilaian.

Secara ringkas, pandangan Sanders, et. al., (1990) tersebut menegaskan

pentingnya pengorganisasian proses, penilaian dan evaluasi pembelajaran dalam

sebuah perencanaan pembelajaran. Hal ini sangat penting karena pengorganisasian

penilaian yang tepat tentu akan melahirkan hasil, informasi dan keputusan yang

tepat pula. Jika sejak awal pengorganiasasian penilaian sudah keliru, maka

keputusan terkait hasil penilaian yang dilakukan oleh guru juga suda pasti akan

372
keliru. Hal tersebut mendasari pentingnya pengorganisasian penilaian dan evaluasi

untuk menjadi indikator ukur dalam sebuah penilaian kualitas perencanaan

pembelajaran yang dikembangkan oleh guru.

Indikator lain pada konstruk instrumen penilaian RPP adalah penerapan

prinsip techno pedagogical content knowledge (PTPCK) diukur oleh tujuh item.

Item tersebut terdiri atas: kejelasan technological knowledge, kejelasan

pedagogical knowledge, kejelasan content knowledge, kejelasan technological

pedagogical knowledge, kejelasan technological content knowledge, kejelasan

pedagogical content knowledge, serta kejelasan technological pedagogical

content knowledge.

Hasil penelitian ini relevan dengan pandangan Widiawati & Hayati (2015);

Kemenristekdikti (2017b: 9) bahwa salah satu prinsip yang harus dipenuhi dalam

dalam perencanaan pembelajaran adalah berorientasi pada TPACK

(Technological Pedagogical and Content Knowledge) yaitu integrasi teknologi

informasi, pedagogi, dan content knowledge dalam proses pembelajaran. Selama

pengembangan perangkat pembelajaran perlu memastikan guru menerapkan

TPACK, ketika memilih dan menetapkan strategi, pendekatan ataupun model dan

media pembelajaran, harus memperhatikan karakteristik peserta didik, materi, dan

tujuan pembelajaran (Kemenristekdikti, 2017b: 12-13). Dosen juga perlu

memastikan mahasiswa untuk memanfaatkan IT untuk meningkatkan efektivitas

pembelajaran. Dosen perlu memberikan contoh bagaimana mengakomodasi

TPACK dalam pembelajaran. Untuk melaksanakan sistem pembelajaran tersebut

perlu memperhatikan prinsip-prinsip pembelajaran yang mendasarinya yaitu

373
belajar dengan melakukan, keaktifan, berpikir tingkat tinggi, dampak pengiring,

mekanisme balikan secara teratur, pemanfaatan teknologi informasi, pembelajaran

kontekstual, penggunaan multistrategi dan aneka sumber belajar, serta berorientasi

pada TPACK. Jika sistem dan prinsip-prinsip pembelajaran pada PPG

dilaksanakan secara sistematis dan teratur, maka kompetensi capaian

pembelajaran program PPG akan tercapai.

Pandangan tersebut, maka dapat dijelaskan bahwa integrasi teknologi

informasi, pedagogi, dan content knowledge dalam proses pembelajaran memiliki

peranan yang sangat penting sehingga hal tersebut harus dituangkan dalam

perencanaan pembelajaran. Oleh karena itu untuk mengetahui kualitas

perencanaan pembelajaran yang dikembangkan oleh guru, maka perlu mengukur

indikator Technological Pedagogical and Content Knowledge.

Berdasarkan beberapa uraian sebelumnya menunjukkan bahwa baik secara

empirik dalam hasil penelitian ini, maupun secara teoretik atau konsep yang telah

dirumuskan oleh temuan relevan sebelumnya maka dapat disimpulkan bahwa

untuk melakukan penilaian perencanaan pembelajaran maka konstruk indikator

ukur yang digunakan antara lain: perumusan indikator pencapaian kompetensi dan

capaian pembelajaran (PIPKC), pengorganisasian materi, metode, media dan

sumber belajar (PMMMS), pengorganisasian proses, penilaian dan evaluasi

pembelajaran (PPPEP), serta penerapan prinsip techno pedagogical content

knowledge (PTPCK).

Temuan lainnya yang diperoleh dalam pelaksanaan penelitian ini adalah

instrumen penilaian pelaksanaan pembelajaran. Secara empirik hasil penelitian ini

374
telah diperoleh instrumen penilaian pelaksanaan pembelajaran yang diukur oleh

empat indikator antara lain: melaksanakan pembelajaran yang mendidik (MPMD),

melaksanakan pembelajaran yang mencerdaskan (MPMC), memfasilitasi

pengembangan potensi diri dan karakter peserta didik (MPDK), serta menilai dan

mengevaluasi pembelajaran (MDMP).

Indikator melaksanakan pembelajaran yang mendidik (MPMD) diukur

oleh empat item. Item tersebut antara lain: menyiapkan peserta didik secara fisik

dan mental, memotivasi peserta didik, melakukan kegiatan appersepsi, serta

menyampaikan tujuan pembelajaran dan cakupan materi. Indikator melaksanakan

pembelajaran yang mencerdaskan (MPMC) diukur oleh tujuh item. Item tersebut

antara lain: menunjukkan penguasaan materi pembelajaran, mengaitkan materi

dengan sains, lingkungan, teknologi dan realitas kehidupan, melaksanakan

pembelajaran yang menggambarkan pendekatan active learning, melaksanakan

pembelajaran yang mencerminkan pendekatan saintific learning, melaksanakan

pembelajaran yang mencerminkan pendekatan problem based learning,

Menggunakan alat/bahan, media dan TIK secara efektif dan efisien, serta

menggunakan alat/bahan, media dan TIK yang menghasilkan pesan menarik.

Temuan penelitian tersebut didukung oleh pandangan Archer & Hughes

(2011) bahwa salah satu kemampuan yang harus dimiliki oleh guru ialah

menunjukkan kepada peserta didik belajar menggunakan pengetahuan dan

keterampilannya melalui pemodelan. Pandangan ini pada dasarnya mendukung

bahwa pelaksanaan pembelajaran harus mendidik dan mencerdaskan bagi peserta

didik. Temuan tersebut juga didukung oleh Orazbayeva (2016) bahwa guru harus

375
memiliki technology skill yaitu memiliki keterampilan dalam menggunakan

teknologi. Guru harus mengetahui kapan dan bagaimana menggunakan teknologi

pendidikan saat ini, serta mampu mengidentifikasi dan memilih yang paling

sesuai dengan materi yang diajarkan dan mampu memaksimalkan dengan waktu

pembelajaran yang ada. Hal ini menunjukkan bahwa menjadi seorang guru yang

berkualitas harus mampu menggunakan teknologi dalam pembelajaran.

Temuan penelitian selanjutnya pada instrumen penilaian pelaksanaan

pembelajaran adalah indikator memfasilitasi pengembangan potensi diri dan

karakter peserta didik (MPDK) yang diukur oleh empat item. Item tersebut antara

lain: menunjukkan sikap terbuka dan respon terhadap peserta didik, menunjukkan

hubungan yang kondusif dan kerjasama antar peserta didik, menggunakan bahasa

yang santun, serta menyampaikan pesan dengan gaya (gesture) yang sesuai.

Temuan tersebut didukung oleh Robinson & Campbell (2010); Yasin (2011); Nur,

(2014) bahwa kompetensi pedagogik secara khas mencirikan dan membedakan

profesi guru dengan profesi lainnya yaitu fokus pada penguasaan terhadap teori

perkembangan (termasuk memahami perkembangan peserta didik) dan teori-teori

belajar mutlak ada pada guru. Artinya untuk menjadi seorang guru yang memiliki

kompetensi pedagogik harus menyadari tujuan dalam pembelajaran dan mampu

mengelola proses pembelajaran. Beberapa padangan tersebut mendasari

pentingnya indikator memfasilitasi pengembangan potensi diri dan karakter

peserta didik (MPDK) diukur dalam aspek pelaksanaan pembelajaran.

Indikator terakhir pada instrumen pelaksanaan pembelajaran adalah

menilai dan mengevaluasi pembelajaran (MDMP). Hal tersebut tidak bisa

376
dinafikkan lagi bahwa salah satu komponen penting dalam pelaksanaan

pembelajaran adalah penilaian dan evaluasi pembelajaran. Indikator ini diukur

dengan lima item. Item tersebut antara lain: memantau kemajuan belajar peserta

didik selama proses pembelajaran, melakukan penilaian proses dan hasil sesuai

rencana dan tujuan pembelajaran, menindaklanjuti hasil penilaian selama

pembelajaran, melakukan refleksi, serta melakukan tindak lanjut.

Temuan tersebut didukung oleh Archer & Hughes (2011) bahwa secara

eksplisit guru perlu memiliki kemampuan melakukan evaluasi terhadap peserta

didik serta memberikan kesempatan perbaikan untuk memperoleh

pengetahuan/keterampilan jika diperlukan. Pandangan serupa juga didukung oleh

Orazbayeva (2016) yang mengemukakan bahwa idealnya guru harus menguasai

dimensi effective assessment yaitu melaksanakan penilaian yang efektif dengan

cara: 1) menyusun alat penilaian yang sesuai dengan tujuan pembelajaran, 2)

melaksanakan penilaian dengan berbagai jenis dan teknik penilaian, 3) melibatkan

peserta didik dalam kegiatan penilaian untuk membantu mereka menjadi sadar

akan kekuatan dan kelemahan mereka, 4) mendorong peserta didik memiliki

keinginan prestasi belajar yang tinggi, 5) memanfaatkan hasil penilaian dari

peserta didik dan merefleksikannya untuk meningkatkan pembelajaran

selanjutnya.

Berdasarkan beberapa uraian sebelumnya menunjukkan bahwa baik secara

empirik dalam hasil penelitian ini, maupun secara teoretik atau konsep yang telah

dirumuskan oleh temuan relevan sebelumnya maka dapat disimpulkan bahwa

untuk melakukan penilaian pelaksanaan pembelajaran maka konstruk indikator

377
ukur yang digunakan antara lain: melaksanakan pembelajaran yang mendidik

(MPMD), melaksanakan pembelajaran yang mencerdaskan (MPMC),

memfasilitasi pengembangan potensi diri dan karakter peserta didik (MPDK),

serta menilai dan mengevaluasi pembelajaran (MDMP).

Instrumen ke-tiga yang menjadi temuan pada penelitian ini adalah

instrumen penilaian kompetensi sosial dan kompetensi kepribadian. Berdasarkan

hasil penelitian ini, secara empirik telah diperoleh instrumen penilaian kompetensi

sosial dan kompetensi kepribadian yang diukur oleh empat indikator antara lain:

bekerjasama dan memiliki jiwa kepemimpinan (BMJK), bersikap inklusif, toleran

dan peduli (BITP), berkomunikasi dengan sesama (BKDS), bersikap sopan/

santun, mandiri, kreatif dan disiplin (BSMKD).

Secara konstruk berdasarkan temuan penelitian ini bahwa indikator

bekerjasama dan memiliki jiwa kepemimpinan (BMJK) diukur oleh lima item.

Item tersebut antara lain: menunjukkan sikap bekerjasama, menunjukkan sikap

berpartisipasi aktif, menunjukkan sikap dapat mengatur dan mau diatur orang lain,

menunjukkan sikap aktif dan bijaksana, serta menunjukkan perilaku yang

demokratis. Temuan tersebut didukung oleh Pahrudin, et.al., (2016) bahwa

kompetensi sosial adalah kompetensi yang berkaitan dengan hubungan antara

guru dan lingkungan atau kepentingan umum, orang-orang yang di sekolah atau

di luar sekolah, berkomunikasi dan berinteraksi dengan warga sekolah dan

memiliki nilai, perilaku dan etika. Ini berarti bahwa guru seharusnya memiliki

jiwa kepemimpinan yang berlandaskan pada nilai, perilaku dan etika. Hal tersebut

mendasari bahwa salah satu indikator penting dalam penilaian kompetensi sosial

378
kepribadian guru adalah kerjasama dan jiwa kepemimpinan yang telah

dikembangkan dan diuji dalam penelitian ini.

Indikator bersikap inklusif, toleran dan peduli (BITP) diukur oleh lima

item. Item tersebut antara lain: menunjukkan sikap menghargai perbedaan,

menunjukkan sikap empati terhadap sesama, menunjukkan sikap adil dan objektif,

menunjukkan sikap respon cepat tanggap, serta menunjukkan sikap suka

menolong. Indikator ini menitik beratkan pada inklusif, toleran dan kepedulian

guru. Temuan penelitian ini sejalan dengan temuan Piri et.al., (2016) bahwa

terdapat hubungan yang signifikan antara kompetensi kepribadian guru dengan

kinerja peserta didik. Jika guru ramah, perhatian, baik, teliti, terbuka, dan tidak

mudah emosi dapat meningkatkan kinerja belajar peserta didik. Dengan demikian

kompetensi kepribadian (termasuk inklusif, toleran dan peduli) menjadi sangat

penting untuk dinilai pada penguasaan kompetensi lulusan PPG. Adanya penilaian

pada kompetensi ini akan mampu membekali mereka memiliki kemampuan yang

berhubungan dengan sikap dan kepribadian yang harus dimiliki sebagai calon

guru.

Indikator lainnya yang menjadi temuan pada instrumen penilaian

kompetensi sosial kepribadian adalah berkomunikasi dengan sesama (BKDS)

diukur oleh lima item. Item tersebut antara lain: menunjukkan sikap santun dalam

berkomunikasi, menunjukkan sikap lemah lembut dalam berbicara, menunjukkan

kemampuan berbicara yang efektif, menunjukkan sikap supel dalam pergaulan,

serta menunjukkan sikap ramah dalam pergaulan. Temuan penelitian ini didukung

oleh pandangan Russian Federation Education Act dalam konsep Federal

379
Education Development Target Program for 2011-2015 disebutkan

perkembangan tuntutan pada guru meningkat, terutama kepribadian dari seorang

guru, tanggung jawab dan memiliki kemampuan yang komunikatif ditetapkan

sebagai prioritas dari pendidikan guru yang profesional (Olesova & Borisova,

2016). Hal serupa didukung oleh Cooper & Sawaf (1998: 227) bahwa

kemampuan guru ditentukan oleh cara berinteraksi dengan lingkungan melalui

komunikasi. Komunikasi sangat penting untuk bersosialisasi dan beradaptasi

dengan lingkungan sekitar dan situasi sosial. Temuan tersebut menunjukkan

bahwa guru yang ideal adalah mereka yang memiliki kemampuan berkomunikasi

dengan baik.

Indikator terakhir dalam instrumen penilaian kompetensi sosial

kepribadian adalah bersikap sopan/ santun, mandiri, kreatif dan disiplin

(BSMKD) diukur oleh lima item. Item tersebut antara lain: menunjukkan

kesopanan dalam berpakaian dan berpenampilan, menunjukkan kesantunan dalam

berperilaku dengan sesama, menunjukkan kemandirian dalam pembelajaran,

menunjukkan kreativitas dalam pembelajaran, serta menunjukkan kedisiplinan

dalam pembelajaran. Temuan penelitian ini sejalan dengan pendapat Pahrudin,

et.al., (2016) bahwa dalam melaksanakan tugasnya guru harus menjunjung nilai,

perilaku dan etika yang baik. Hal ini berarti bahwa perilaku, etika dan

kedisiplinan adalah komponen yang sangat penting diukur dalam kompetensi

sosial kepribadian guru.

Model penilaian PPG yang telah dikembangkan dalam penelitian ini

dituangkan dalam bentuk buku pedoman penilaian. Buku panduan penilaian ini

380
memuat 5 bab dan 1 set lampiran. Bab I membahas tentang pendahuluan. Pada

pendahuluan ini diuraikan latar belakang pentingnya penilaian PPG, landasan

hukum PPG, tujuan dan manfaat PPG, ruang lingkup penilaian PPG, dan sasaran

pengguna model yang dikembangkan.

Pada Bab II membahas tentang sistem penilaian program PPG. Pada

bagian ini diuraikan tentang konsep penilaian, prinsip penilaian, acuan penilaian,

dan teknik penilaian yang digunakan. Pembahasan konsep ini dimaksudkan untuk

memberi pemahaman kepada sasaran pengguna terkait dengan konsep sistem

penilaian yang ideal dalam pelaksanaan pengukuran dan penilaian.

Hal selanjutnya adalah Bab III yang membahas tentang mekanisme

penilaian. Bagian ini lebih banyak membahas tentang bagaimana menerapkan

model penilaian PPG secara praktis. Untuk memberikan pemahaman kepada

sasaran pengguna, maka pada bagian ini diuraikan tentang lingkup penilaian,

teknik penilaian, bentuk penilaian, dan kelulusan peserta. Bab ini yang menjadi

pedoman bagaimana menerapkan model ini di lapangan dari proses hingga akhir.

Bab IV membahas tentang penskoran dan interpretasi. Penskoran adalah

sala satu bagian yang paling penting dalam sebuah pelaksanaan penilaian, karena

pada penskoran penilai mulai melakukan kuantifikasi. Untuk memaknai hasil

penskoran tersebut maka dibutuhkan pedoman interpretasi. Pada bagian ini

disajikan tentang penskoran parsial. Selain itu, di bab ini juga disajikan tentang

penskoran holistik. Dua bentuk penskoran tersebut yang mendasari model

penilaian PPG ini secara umum.

381
Bagian terakhir adalah Bab V. Pada bagian ini diuraikan pernyataan secara

umum tentang penilaian PPG, serta saran pengembang model terhadap sasaran

pengguna untuk menggunakan model penilaian PPG yang telah dikembangkan

ini. Selain itu, untuk memudahkan pengguna memahami model penilaian yang

telah dikembangkan, maka disertakan contoh lampiran instrumen penilaian yang

dapat dipelajari dan digunakan oleh pengguna. Secara umum inti dari buku

panduan ini adalah untuk memudahkan pengguna untuk menerapkan model

penilaian ini meskipun tidak bertemu langsung dengan pengembang model.

Secara keseluruhan model ini telah diberikan kepada expert untuk dinilai

relevansi dan kelayakannya. Expert atau ahli yang dilibatkan untuk menilai model

ini secara keseluruhan sebanyak 7 orang yang telah dipilih secara purposive

berdasarkan keahliannya. Indikator penilaian meliputi ketepatan pendahuluan,

relevansi sistem penilaian program PPG, kejelasan mekanisme penilaian program

PPG, ketepatan penskoran dan interpretasi, kejelasan hasil penilaian program

PPG, pendukung penyajian, akurasi dan kemutakhiran. Hasil penilaian terkait

dengan kelayakan model penilaian PPG disajikan sebagai berikut.

382
Gambar 97. Hasil Penilaian Buku Panduan Model Penilaian PPG

Keterangan:
Indikator 1 : Ketepatan pendahuluan
Indikator 2 : Relevansi sistem penilaian program PPG
Indikator 3 : Kejelasan mekanisme penilaian program PPG
Indikator 4 : Ketepatan penskoran dan interpretasi
Indikator 5 : Kejelasan hasil penilaian program PPG
Indikator 6 : Pendukung penyajian
Indikator 7 : Akurasi dan kemutakhiran

Gambar 97 menyajikan informasi bahwa dari tujuh pakar menunjukkan

kecenderungan untuk sepakat pada tujuh indikator penilaian dan menyimpulkan

bahwa buku panduan yang telah dikembangkan sebagai bagian yang tidak

terpisahkan dari model penilaian PPG yang telah dikembangkan telah memenuhi

unsur relevansi dan kelayakan. Hal ini dapat dilihat dari rata-rata penilaian pakar

berada pada skor 4 ke atas. Temuan empirik tersebut menjadi dasar untuk

menyatakan bahwa model penilaian PPG yang telah dikembangkan baik dari

aspek instrumen, maupun dari aspek buku panduan telah layak digunakan dan

disebarkan pada sasaran pengguna.

383
Berdasarkan pembahasan penelitian terkait dengan konstruk model

penilaian PPG, maka dapat dijelaskan bahwa baik secara empirik maupun secara

teoretik pada penelitian ini dapat mendukung asumsi pengembangan yang telah

dirumuskan sebelumnya yakni jika teori yang relevan digunakan untuk membuat

konstruk, indikator yang dinilai dapat diukur dan diamati, maka model penilaian

PPG dengan penskoran parsial dan holistik yang dikembangkan telah memiliki

acuan kerangka teoretik yang cocok dan sesuai dengan kebutuhan.

2. Validitas dan Reliabilitas Model Penilaian PPG dengan Penskoran

Parsial dan Holistik

Salah satu hal yang menjadi kajian dalam pengembangan model penilaian

PPG pada penelitian ini adalah validitas dan reliabilitas dari model penilaian PPG.

Validitas yang dimaksud adalah validitas isi yang diperoleh dari penilaian ahli

melalui perhitungan Aiken Index serta validtas konstruk melalui analisis faktor

konfirmatori. Adapun reliabilitas diperoleh dengan reliabilitas  dengan berbasis

pada muatan faktor.

Temuan penelitian ini menunjukkan bahwa ditinjau dari aspek validitas isi

semua item-item untuk instrumen penilaian RPP, instrumen penilaian pelaksanaan

pembelajaran dan instrumen penilaian kompetensi sosial dan kompetensi

kepribadian telah valid secara isi berdasarkan penilaian oleh ahli/pakar. Hal ini

menunjukkan bahwa seluruh item yang adalah dalam instrumen pada model

penilaian PPG telah mengukur kontennya atau item-item tersebut telah mengukur

indikator-indikatornya berdasarkan penilaian pakar melalui pertimbangan

keahliannya.

384
Validitas isi secara teoretis, menunjukkan ketepatan sampling butir dapat

mengukur isi (content) pengujiannya, mengukur derajat kesepakatan para ahli dari

satu item yang dapat menggambarkan tingkat validitas isi melalui (Lawshe, 1975).

Artinya, jika item memenuhi validitas isi, maka item tersebut dapat dikatakan

sudah mengukur aspek isi substansi secara tepat. Hal serupa dijelaskan oleh

Nunally (1978); Fernandes (1984); Retnawati (2017) yang mengemukakan bahwa

validitas isi suatu instrumen menunjukkan sejauh mana butir-butir instrumen

mewakili komponen-komponen dalam kawasan isi objek yang hendak diukur dan

sejauh mana butir-butir itu mencerminkan ciri perilaku yang hendak diukur.

Jika pandangan tersebut dikaitkan dengan temuan hasil penelitian ini,

maka dapat disimpulkan bahwa instrumen pada model penilaian PPG telah

memiliki butir-butir yang dapat mewakili komponen-komponen dalam kawasan

kemampuan yang hendak diukur yang meliputi: kemampuan merencanakan

pembelajaran, kemampuan melaksanakan pembelajaran, serta komptensi sosial

dan kompetensi kepribadian. Selain itu juga dapat dijelaskan bahwa insrumen

pada model penilaian PPG telah mencerminkan perilaku guru yang hendak diukur.

Aspek selanjutnya yang menjadi unit analisis pada penelitian ini adalah

kualitas instrumen model penilaian PPG ditinjau berdasarkan validitas konstruk.

Hasil penelitian ini menunjukkan bahwa seluruh item-item dalam instrumen yang

dikembangkan, baik instrumen penilaian RPP, instrumen penilaian pelaksanaan

pembelajaran, maupun instrumen penilaian kompetensi sosial dan kompetensi

kepribadian telah valid secara konstruk berdasarkan kriteria-kriteria validitas

konstruk suatu instrumen. Secara konseptual Nunally (1978); Fernandes (1984);

385
Retnawati (2017) mengemukakan bahwa validitas konstruk menunjukkan sejauh

mana instrumen mengungkap suatu kemampuan atau konstruk teoretis tertentu

yang hendak diukur. Jika pandangan tersebut dikaitkan dengan temuan penelitian

ini maka dapat dijelaskan bahwa instrumen model penilaian PPG yang telah

dikembangkan ini telah mampu mengungkap konstruk teoretis dari kemampuan

PPG yang hendak diukur.

Temuan penelitian ini juga didukung oleh pendapat Furr & Bacharach

(2013: 221) mengemukakan bahwa validitas konstruk mengacu pada sejauh mana

skor hasil pengukuran mencerminkan konstruk psikologis yang diukur. Artinya

jika suatu instrumen telah terbukti valid secara konstruk, maka instrumen tersebut

telah mencerminkan konstruk psikologi yang ingin diukur. Pada kaitannya dengan

penelitian ini, maka instrumen pada model PPG sudah mampu mencerminkan

kemampuan guru atau peserta PPG yang hendak diukur seperti kemampuan

merencanakan pembelajaran, kemampuan melaksanakan pembelajaran serta

kompetensi sosial dan kompetensi kepribadian yang diharapkan.

Aspek lain yang menjadi unit analisis pada model penilaian PPG adalah

reliabilitas instrumen. Berdasarkan hasil penelitian ini menunjukkan temuan

bahwa seluruh instrumen yang telah dikembangkan pada penelitian ini (instrumen

penilaian RPP, instrumen penilaian pelaksanaan pembelajaran, maupun instrumen

penilaian kompetensi sosial dan kompetensi kepribadian) telah reliabel. Temuan

ini didukung oleh pendapat Ziegler and Detje (2013) menjelaskan bahwa

reliabilitas menggambarkan konsistensi keseluruhan pengukuran meskipun

diberikan beberapa kali. Pengukuran yang memiliki realibilitas tinggi dikatakan

386
sebagai pengukuran yang reliabel. Reliabilitas sendiri mempunyai nama lain

seperti keterpercayaan, keterandalan, keajegan, kestabilan, konsistensi, dan

sebagainya. Namun demikian, ide pokok yang terkandung dalam konsep

realibilitas adalah sejauhmana hasil suatu pengukuran dapat dipercaya.

Hal serupa didukung oleh Mehrens & Lehmann (1973) dan Retnawati

(2017) bahwa alat ukur yang reliabel akan memberikan hasil pengukuran yang

stabil dan konsisten. Artinya suatu alat ukur dikatakan memiliki koefisien

reliabilitas tinggi manakala digunakan digunakan untuk mengukur hal yang sama

pada waktu berbeda dan hasilnya sama atau mendekati sama. Berdasarkan temuan

penelitian ini dapat dijelaskan bahwa koefisien reliabilitas untuk semua instrumen

berada pada rentang sekitar 0,93 hingga 0,97. Hal tersebut menjadi bukti bahwa

instrumen yang telah dikembangkan telah menunjukkan suatu kestabilan serta

konsistensi hasil pengukuran.

Lebih lanjut Retnawati (2017) berpendapat bahwa reliabilitas juga terkait

dengan kesalahan pengukuran. Reliabilitas tinggi menunjukkan kesalahan

pengukuran yang kecil dalam memperoleh hasil pengukuran. Semakin besar

reliabilitas suatu instrumen, akan semakin kecil kesalahan pengukurannya

demikian pula sebaliknya. Jika pendapat tersebut dikaitkan dengan hasil penelitian

ini yang menunjukkan koefisien reliabilitas untuk semua instrumen berada pada

rentang sekitar 0,93 hingga 0,97, maka dapat disimpulkan bahwa reliabilitas

instrumen model penilaian PPG cukup tinggi sehingga kesalahan pengukurannya

pun sangat kecil. Ini menunjukkan suatu hal yang positif dalam hal

pengembangan instrumen serta hal ini salah satu yang mendasari peneliti untuk

387
menyimpulkan bahwa instrumen telah baku dan layak digunakan lebih lanjut

dengan kualitas yang baik.

Berdasarkan pembahasan tersebut yakni melalui hubungan antara hasil

penelitian secara empirik serta dukungan-dukungan konsep secara teoretik maka

asumsi pengembangan sebelumnya pada penelitian ini semakin terbukti bahwa

jika model penilaian PPG dengan penskoran parsial dan holistik yang

dikembangkan dari penelitian ini dapat dibuktikan validitas dan diestimasi

reliabilitas instrumennya, maka model penilaian PPG tersebut mampu menilai

penguasaan kemampuan akademik dan penguasaan kemampuan profesional

peserta yaitu kompetensi pedagogik, kompetensi profesional, kompetensi

kepribadian dan kompetensi sosial.

3. Karakteristik Model Penilaian PPG dengan Penskoran Parsial dan

Holistik

Hasil penelitian ini telah mengembangkan instrumen model penilaian

PPG berdasarkan pada dua teknik penskoran. Kedua teknik penskoran tersebut

yang dimaksud adalah instrumen dengan penskoran parsial dan instrumen dengan

penskoran holistik. Pada penskoran parsial menggunakan skala penilaian 0, 1, 2,

3, dan 4, sementara untuk penskoran holistik menggunakan skala penilaian 1, 2, 3,

dan 4. Lebih lanjut pada penskoran parsial dianalisis dengan menggunakan

pendekatan partial credit model, sementara untuk holistik dianalisis dengan

menggunakan graded response model.

Temuan penelitian ini secara empirik dibahas berdasarkan karakteristik

setiap item berdasarkan kelompok instrumen. Karakteristik yang dimaksud

388
tersebut yaitu tingkat kesukaran dan fungsi informasi. Selain itu pembahasan juga

ditinjau dari ketiga kelompok instrumen yaitu: instrumen penilaian perencanaan

pembelajaran, instrumen penilaian pelaksanaan pembelajaran, serta instrumen

penilaian kompetensi sosial dan kompetensi kepribadian.

Temuan penelitian pada tingkat kesukaran item diperoleh tingkat

kesukaran yang bervariasi disetiap item dan disetiap kategori. Pada instrumen

penilaian RPP untuk penskoran parsial temuan penelitian menunjukkan bahwa

terdapat empat kategori atau empat perpotongan yang merupakan tingkat

kesukaran. Temuan penelitian menunjukkan bahwa kategori yang paling mudah

berada pada skala kemampuan -2,06 (kategori 1 pada item 2) sedangkan kategori

yang paling sulit berada pada skala kemampuan 3,0 (kategori 4 pada item 15). Hal

ini menunjukkan bahwa tingkat kesukaran pada instrumen penilaian RPP ini

bergerak pada rentang kemampuan tersebut.

Temuan penelitian pada instrumen penilaian pelaksanaan pembelajaran

untuk penskoran parsial menunjukkan bahwa terdapat empat kategori atau empat

perpotongan yang merupakan tingkat kesukaran. Temuan penelitian menunjukkan

bahwa kategori yang paling mudah berada pada skala kemampuan -1,52 (kategori

1 pada item 8) sedangkan kategori yang paling sulit berada pada skala

kemampuan 3,1 (kategori 4 pada item 8). Hal ini menunjukkan bahwa tingkat

kesukaran pada instrumen penilaian pelaksanaan pembelajaran ini bergerak pada

rentang kemampuan tersebut.

Temuan penelitian pada instrumen penilaian kompetensi sosial dan

kompetensi kepribadian untuk penskoran parsial menunjukkan bahwa terdapat

389
empat kategori atau empat perpotongan yang merupakan tingkat kesukaran.

Temuan penelitian menunjukkan bahwa kategori yang paling mudah berada pada

skala kemampuan -1,78 (kategori 1 pada item 6) sedangkan kategori yang paling

sulit berada pada skala kemampuan 2,65 (kategori 4 pada item 20). Hal ini

menunjukkan bahwa tingkat kesukaran pada instrumen penilaian kompetensi

sosial dan kompetensi kepribadian ini bergerak pada rentang kemampuan tersebut.

Berdasarkan pandangan Verhelst and Verstralen (2008) bahwa parameter

item dalam parsial kredit model ditafsirkan sebagai kesulitan di setiap langkah-

langkah yang harus diselesaikan. Semakin tinggi langkah tersebut, maka semakin

sulit pula langkah tersebut atau semakin besar kemampuan yang diperlukan untuk

mencapainya. Hasil penelitian ini juga terkait dengan pandangan Masters and

Wright (1997) bahwa penskoran parsial kredit model didesain untuk memahami

berbagai kemampuan peserta serta membedakan atau mengelompokkan peserta

berdasarkan tingkat respon mereka terhadap item. Artinya melalui parsial kredit

model yang digunakan dalam instrumen model penilaian PPG ini, penilai dapat

membedakan dan mengelompokkan secara jelas peserta PPG berdasarkan

responnya di setiap tahapan yang dinilai.

Pandangan tersebut juga didukung oleh Retnawati (2014) yang

menjelaskan bahwa skor kategori pada partial credit model menunjukkan

banyaknya langkah untuk menyelesaikan item dengan benar. Mengingat pada

penelitian ini terdapat empat kategori, maka dapat dijelaskan bahwa terdapat

empat langkah dalam setiap item tersebut untuk mencapai skor tertinggi. Lebih

lanjut, Retnawati (2014) menjelaskan bahwa skor kategori yang lebih tinggi

390
membutuhkan kemampuan yang lebih besar untuk mencapainya, begitu pula

sebalikanya pada skor kategori yang rendah hanya membutuhkan kemampuan

yang rendah pula untuk mencapainya. Jika sebuah butir mengikuti pola parsial

kredit model, maka kemampuan individu lebih tinggi diharapkan memiliki skor

yang lebih tinggi daripada individu yang memiliki kemampuan rendah.

Jika temuan penelitian tersebut dikaitkan dengan konsep teoretik serta

temuan sebelumnya, maka dapat dijelaskan bahwa instrumen penilaian PPG yang

diskor dengan parsial telah dapat kita gunakan untuk mengukur kemampuan

peserta PPG baik dari segi perencanaan pembelajaran, pelaksanaan pembelajaran

serta kompetensi sosial dan kompetensi kepribadian.Melalui penskoran parsial

instrumen ini dapat kita gunakan untuk membedakan serta mengelompokkan

capaian peserta PPG berdasarkan kemampuannya masing-masing. Misalnya jika

ingin mencapai tahapan tinggi atau kategori tinggi dalam sebuah item tentu

dibutuhkan pula kemampuan yang tinggi untuk mencapainya, begitu pula

sebaliknya. Hasil penelitian ini telah menguraikan secara jelas pengelompokan

tingkat kesulitan disetiap kategori pada setiap item untuk semua instrumen dalam

penilaian PPG.

Selain instrumen penskoran parsial, pada penelitian ini dihasilkan pula

instrumen dengan penskoran holistik Penskoran holistik ini dianalisis dengan

menggunakan pendekatan graded response model (GRM). Hasil penelitian secara

empirik dari instrumen penilaian RPP dengan penskoran holistik diperoleh

temuan bahwa peskoran terdapat tiga tingkat kesukaran item bervasiasi di setiap

item dengan -3,9 sebagai tingkat kesukaran langkah yang termudah serta 1,01

391
untuk tahapan yang paling sulit. Selain itu pada instrumen penilaian pelaksanaan

pembelajaran juga diperoleh temuan tingkat kesukaran bervariasi antara -3,44

sebagai tingkat kesukaran tahapan yang termudah hingga 0,76 sebagai tinggkat

kesukaran yang tersulit. Temuan lainnya pada instrumen penilaian kompetensi

sosial dan kompetensi kepribadian diperoleh tingkat kesukaran antara -2,61

sebagai tahapan yang termudah hingga 0,75 pada tahapan yang tersulit.

Jika temuan tersebut dikaitkan dengan konsep teoretik yang

dikemukakan oleh Retnawati (2014) bahwa pada graded response model skor

kategori yang merupakan banyaknya langkah atau tahapan yang diminta oleh item

tersebut mengandung indeks kesukaran dalam setiap langkah yang berurutan.

Artinya jika pandangan ini dikaitkan dengan temuan penelitian ini, maka dapat

dijelaskan bahwa pada instrumen model penilaian PPG yang telah dikembangkan

terkhusus pada penskoran holistik, indeks kesukaran di setiap kategori berurutan

mulai dari -3,9 hingga 1,01. Pada dasarnya temuan penelitian ini menunjukkan

bahwa instrumen model penilaian PPG dengan penskoran holistik lebih cocok

untuk peserta yang berkemampuan menengah ke bawah.

Temuan penelitian ini juga memiliki keterkaitan dengan pandangan

Kubiszyn & Borich (2003: 154) bahwa penskoran holistik digunakan ketika

penilai lebih tertarik dalam memperkirakan kualitas keseluruhan dari kinerja dan

menetapkan angka nilai pada kualitas tersebut daripada menerapkan penambahan

atau pengurangan poin atas aspek kinerja tertentu. Instrumen penilaian PPG

dengan penskoran holistik yang telah dikembangkan ini akan digunakan untuk

memperkirakan kualitas kinerja peserta PPG yang ditinjau dari aspek kualitas

392
perencanaan pembelajarannya, kualitas pelaksanaan pembelajarannya hingga

kualitas kompetensi sosial dan kepribadiannya. Dengan demikian, melalui

instrumen holistik yang dikembangkan ini pengguna dapat menerapkan instrumen

yang telah dikembangkan pada penelitian ini.

Lebih lanjut Brookhart (2013: 6) menyatakan penskoran holistik

merupakan rubrik yang menerapkan semua kriteria pada waktu yang sama dan

memungkinkan penilaian keseluruhan tentang kualitas pekerjaan. Penskoran

holistik merupakan penetapan atau pemberian angka untuk menilai berdasarkan

kesan keseluruhan atau kombinasi semua kriteria dari aspek atau objek yang

dinilai. Pandangan tersebut sangat relevan dengan hasil penelitian ini, dimana

salah satu fokus utama pada instrumen holistik ini adalah kualitas rubrik

penilaian. Rubrik penilaian merupakan hal yang sangat penting dalam instrumen

karena erat kaitannya dengan konsistensi penilaian. Suatu penilaian akan

konsisiten jika ditunjang dengan rubrik penilaian yang berkualitas yang mampu

mencerminkan kompetensi yang ingin diukur secara jelas.

Temuan penelitian ini menunjukkan bahwa semua produk instrumen

yang dihasilkan baik untuk instrumen perencanaan pembelajaran, pelaksanaan

pembelajaran serta kompetensi sosial dan kompetensi kepribadian telah

dibuktikan memenuhi asumsi unidimensi (lihat Lampiran Hasil Analisis Scree

Plot). Temuan tersebut sesuai dengan pernyataan Retnawati (2014: 1) bahwa pada

praktiknya asumsi unidimensi tidak dapat dipenuhi secara ketat karena adanya

berbagai faktor yang turut mempengaruhi seperti kognitif, kepribadian,

kecemasan, motivasi dan faktor lainnya, sehingga asumsi unidimensi dapat

393
ditunjukkan hanya jika instrumen mengandung satu saja komponen dominan yang

mengukur kemampuan subjek. Jika pandangan tersebut dikaitkan dengan temuan

penelitian ini maka model penilaian PPG yang telah dikembangkan melalui

penelitian ini telah memenuhi asumsi unidimensi yang dapat diartikan setiap item

hanya mengukur satu kemampuan.

Lebih lanjut pendekatan item response theory harus memenuhi asumsi

independensi lokal. Independensi lokal terpenuhi jika respon peserta pada suatu

item tidak mempengaruhi respon peserta pada item lainnya. Hanya saja jika

merujuk pada pernyataan DeMars (2000); Retnawati (2014) bahwa independensi

lokal dapat terdeksi jika asumsi unidimensi terpenuhi. Oleh karena itu dapat

dijelaskan bahwa model penilaian PPG yang telah dikembangkan memenuhi

asumsi independensi lokal.

Selain aspek tingkat kesukaran pada penskoran holistik, temuan

penelitian ini juga menunjukkan hasil terkait daya beda. Pada instrumen penilaian

perencanaan pembelajaran, pelaksanaan pembelajaran serta kompetensi sosial dan

kompetensi kepribadian diperoleh temuan daya beda setiap item untuk semua

penilai menunjukkan hasil yang positif. Artinya baik instrumen yang dinilai oleh

dosen maupun instrumen yang dinilai oleh guru pamong/penguji UKIN semuanya

menunjukkan koefisien daya beda yang positif. Hal tersebut dapat di lihat pada

gambar 89 berikut ini.

394
Gambar 98. Sebaran Daya Beda Item Instrumen Penilaian RPP

Gambar 98 tersebut menujukkan sebaran daya beda item berdasarkan

hasil penelitian pada instrumen RPP. Pada dasarnya hal ini menunjukkan

konsistensi dan invariansi intrumen penilaian RPP. Artinya karateristik item tidak

bergantung pada siapa yang meresponnya. Pada kasus ini karakteristik item tidak

menunjukkan perbedaan meskipun direspon oleh orang yang berbeda yaitu dosen

dan guru penilai ukin. Selain itu, temuan penelitian ini menunjukkan bahwa pada

penilaian RPP yang dikembangkan telah memiliki daya beda yang positif yang

terletak antara 0,8 hingga 1,4. Secara konseptual Retnawati (2014) menjelaskan

bahwa parameter daya beda merupakan kemiringan (slope) pada kurva di titik

tingkat kesukaran pada skala kemampuan tertentu. Temuan penelitian ini

didukung oleh Hambleton dan Swaminathan (1985: 37) yang menjelaskan bahwa

daya beda item yang baik terletak antara 0 s/d 2. Oleh karena itu, dapat

dikemukakan bahwa seluruh item yang dikembangkan dalam instrumen penilaian

RPP telah memiliki daya beda yang baik.

395
Hal lain yang dapat dijelaskan bahwa pada Gambar 82 tersebut terlihat

daya beda instrumen untuk data yang dinilai oleh dosen dan data yang dinilai oleh

guru pamong/penguji UKIN cenderung sama dan tidak menunjukkan perbedaan

yang signifikan. Hal tersebut menunjukkan bahwa adanya konsistensi antar

penilai baik untuk dosen maupun untuk guru pamong/penguji UKIN. Selain

instrumen penilaian RPP, hal serupa juga dilakukan pada instrumen penilaian

pelaksanaan pembalajaran. Berikut ini disajikan sebaran daya beda untuk

instrumen pelaksanaan pembelajaran.

Gambar 99. Sebaran Daya Beda Instrumen Penilaian Pelaksanaan Pembelajaran

Gambar 99 menunjukkan hal yang sama dengan instrumen penilaian RPP.

Pada dasarnya gambar tersebut menunjukkan konsistensi dan invariansi intrumen

penilaian pelaksanaan pembelajaran. Artinya karateristik item tidak bergantung

pada siapa yang meresponnya. Pada kasus ini karakteristik item tidak

menunjukkan perbedaan meskipun direspon oleh orang yang berbeda yaitu dosen

dan guru penilai ukin. Selain itu, pada instrumen penilaian pelaksanaan

pembelajaran juga tidak menunjukkan kofisien daya beda yang positif dan terletak

antara 1,2 hingga 1,9. Temuan penelitian ini didukung oleh Hambleton,

396
Swaminathan dan Rogers, (1991: 37) bahwa koofisien daya beda (a i) yang negatif

menunjukkan bahwa butir tersebut memiliki daya beda buruk, begitupula

sebaliknya bahwa koefisien daya beda (ai) yang positif menunjukkan bahwa butir

tersebut memiliki daya beda baik. Hal tersebut sebagai dasar untuk menjelaskan

bahwa seluruh item yang ada pada instrumen penilaian pelaksanaan pembelajaran

telah memiliki daya beda yang baik. Selain itu temuan penelitian ini menunjukkan

daya beda yang cenderung sama baik untuk penilai dosen maupun untuk penilai

guru pamong/penguji UKIN. Hal ini berarti bahwa adanya konsistensi antar

penilai baik oleh dosen maupun oleh guru pamong/penguji UKIN pada instrumen

penilaian pelaksanaan pembelajaran. Lebih lanjut pada instrumen penilaian

kompetensi sosial dan kepribadian. Berdasarkan hasil penelitian diperoleh temuan

sebagai berikut.

Gambar 100. Sebaran Daya Beda Instrumen Kompetensi Sosial Kepribadian

Gambar 100 menunjukkan temuan yang diperoleh pada instrumen

penilaian kompetensi sosial dan kompetensi kepribadian. Pada dasarnya gambar

tersebut menunjukkan konsistensi dan invariansi intrumen penilaian kompetensi

397
sosial dan kepribadian. Artinya karateristik item tidak bergantung pada siapa yang

meresponnya. Pada kasus ini karakteristik item tidak menunjukkan perbedaan

meskipun direspon oleh orang yang berbeda yaitu dosen dan guru penilai ukin.

Lebih lanjut temuan ini menunjukkan bahwa seluruh koefisien daya beda adalah

positif yang terletak antara 1,1 hingga 1,7. Temuan ini didukung oleh Hambleton,

Swaminathan dan Rogers, (1991: 37) bahwa koefisien daya beda yang terlalu

tinggi juga tidak dapat dijadikan tolok ukur untuk membedakan kemampuan

peserta. Koefisien daya beda yang baik atau ideal berkisar 0 s/d 2.

Jika temuan penelitian ini khususnya pada instrumen model penilaian PPG

dikaitkan dengan konsep secara teoretik maka dapat dijelaskan bahwa instrumen

model penilaian PPG telah memiliki daya beda yang baik. Hal ini dibuktikan

melalui koefisien daya beda item yang telah menunjukkan hasil positif. Hal ini

juga bermakna bahwa instrumen model penilaian PPG ini telah layak digunakan

karena telah memiliki kemampuan untuk membedakan peserta yang

berkemampuan tinggi dengan peserta yang berkemampuan rendah.

Lebih lanjut melalui penelitian ini diperoleh temuan bahwa pada

instrumen penilaian PPG untuk penskoran parsial (RPP, pelaksanaan

pembelajaran dan kompetensi sosial dan kepribadian) menunjukkan bahwa

berdasarkan fungsi karakteristik item terdapat empat kategori atau empat

perpotongan yang merupakan tingkat kesukaran dengan kategori yang paling

mudah berada pada skala kemampuan -2,06 sedangkan kategori yang paling sulit

berada pada skala kemampuan 3,1. Jika temuan tersebut dikaitkan dengan

pendapat Retnawati (2014: 38) bahwa skor kategori pada parsial model

398
menunjukkan banykanya langkah untuk menyelesaikan/melaksanakan item

tersebut. Skor kategori yang lebih tinggi menunjukkan kemampuan yang lebih

besar dari skor kategori yang lebih rendah. Oleh karena itu berdasarkan temuan

penelitian ini ada empat kategori sedangkan kemampuan maksimum yang

dibutuhkan untuk menyelesaikan setiap item adalah (theta) 3,1.

Hal serupa juga dilakukan pada instrumen dengan penskoran holistik.

Pada kasus tersebut diperoleh temuan empirik bahwa berdasarkan fungsi

karakteristik yang berbasis graded model terdapat tiga kategori tingkat kesukaran

item bervariasi di setiap item dengan -3,9 sebagai tingkat kesukaran atau langkah

yang termudah serta 1,01 untuk tahapan yang paling sulit. Menurut Retnawati

(2014: 34) bahwa respon peserta pada model graded merupakan banyaknya

langkah dalam menyelesaikan item dan langkah tersebut juga harus terurut. Jika

pandangan tersebut dikaitkan dengan temuan empirik penelitian ini maka dapat

dijelaskan bahwa pada instrumen penelitian PPG dengan penskoran holistik

melalui tiga kategori yang terurut dimulai dari kesukaran -3,9 sebagai langkah

termudah kemudian terurut hingga pada 1,01 sebagai langkah tersulit.

Selain temuan tentang karakteristik item pada penelitian ini diperoleh

pula temuan berdasarkan fungsi informasi instrumen. Secara empirik fungsi

informasi dari instrumen yang telah dikembangkan disajikan sebagai berikut.

399
Gambar 101. Fungsi Informasi Instrumen Model Penilaian PPG

Gambar 101 menyajikan informasi secara empirik pada temuan

penelitian ini dapat disimpulkan bahwa fungsi informasi instrumen penilaian PPG

dengan penskoran parsial lebih tinggi dibandingkan dengan fungsi informasi

instrumen penilaian PPG dengan penskoran holistik. Hal tersebut juga

berhubungan secara langsung dengan estimasi kesalahan pengukuran. Berikut ini

disajikan temuan penelitian ini ditinjau dari Standard Error of Measurement

instrumen penilaian PPG.

Gambar 102. Standard Error of Measurement Instrumen Model Penilaian PPG

400
Gambar 102 merupakan Standard Error of Measurement instrumen

model penilaian PPG yang memiliki keterkaitan dengan temuan sebelumnya. Hal

tersebut berbanding terbalik. Temuan penelitian ini menyimpulkan bahwa ditinjau

dari estimasi kesalahan pengukuran instrumen penilaian PPG dengan penskoran

parsial memiliki eror yang paling kecil.

Jika temuan empirik tersebut dikaitkan dengan pandangan Retnawati

(2014) bahwa fungsi informasi merupakan cara untuk menjelaskan kekuatan suatu

perangkat instrumen dalam mengungkap laten trait yang ingin diukur. Hal ini

bermakna bahwa jika ditinjau dari temuan fungsi informasi dapat disimpulkan

bahwa instrumen penilaian PPG dengan penskoran parsial memiliki kekuatan

yang lebih tinggi dalam mengungkap laten trait yang ingin diukur yaitu

kemampuan peserta PPG. Aspek lain yang memiliki keterkaitan dan menjadi

pertimbangan adalah Standard Error of Measurement, Hambleton, Swaminathan

& Rogers (1991) menjelaskan bahwa fungsi informasi dengan kesalahan

pengukuran memiliki hubungan yang berbanding terbalik, semakin besar nilai

fungsi informasi, maka semakin kecil nilai kesalahan pengukuran begitu pula

sebaliknya. Pandangan ini sejalan dengan temuan penelitian ini dimana nilai

informas yang paling tinggi yaitu instrumen penilaian PPG dengan penskoran

parsial, serta kesalahan pengukuran yang terkecil juga pada instrumen penilaian

PPG dengan penskoran parsial.

Untuk menentukan akurasi kedua bentuk penskoran dalam model

penilaian PPG yang telah dikembangkan, maka diperlukan perbandingan antara

keduanya ditinjau dari beberapa aspek atau karakteristik. Aspek yang

401
dibandingkan pada penelitian ini adalah aspek nilai fungsi informasi dan nilai

kesalahan pengukuran (Standard Error of Measurement). Berikut ini disajikan

perbandingan akurasi antara model penilaian dengan penskoran parsial dengan

model penilaian dengan penskoran holistik.

Tabel 62. Perbandingan Akurasi Model Penilaian dengan Penskoran Parsial


dengan Model Penilaian dengan Penskoran Holistik

Instrumen Parsial Holistik


Keterangan
Penilaian NIF SEM NIF SEM
Perencanaan
16,36 0,24 14,1 0,26 Parsial lebih akurat
Pembelajaran
Pelaksanaan
13,3 0,27 11,4 0,29 Parsial lebih akurat
Pembelajaran
Kompetensi Sosial
12,9 0,27 10,7 0,3 Parsial lebih akurat
Kepribadian

Tabel 62 menyajikan data perbandingan akurasi antara model penilaian

dengan penskoran parsial dengan model penilaian dengan penskoran holistik

ditinjau dari nilai fungsi informasi dan kesalahan pengukuran. Berdasarkan

informasi yang diproleh dari penyajian tersebut dapat dikemukakan bahwa secara

umum jika ditinjau dari aspek nilai fungsi informasi penilaian dengan penskoran

parsial lebih akurat dibandingkan dengan penskoran holistik. Hal tersebut didasari

atas temuan baik pada intrumen penilaian RPP, instrumen penilaian perencanaan

pembelajaran, serta instrumen penilaian kompetensi sosial kepribadian seluruhnya

menunjukkan bahwa penskoran parsial lebih akurat.

Hal serupa juga didukung pada aspek kesalahan pengukuran (Standard

Error of Measurement). Pada aspek ini menunjukkan kesalahan pengukuran pada

instrumen penilaian dengan penskoran parsial lebih kecil dibandingkan dengan

instrumen penilaian dengan penskoran holistik. Ini menunjukkan bahwa

402
penskoran parsial lebih akurat dibandingkan dengan penskoran holistik untuk

kasus penilaian peserta PPG yang dalam hal ini terdiri atas penilaian RPP,

pelaksanaan pembelajaran serta kompetensi sosial kepribadian.

4. Deskripsi Hasil Penilaian dengan Model Penilaian PPG dengan

Penskoran Parsial dan Holistik

Salah satu hal yang menjadi temuan pada pelaksanaan penelitian ini adalah

hasil penilaian dengan model penilaian PPG yang telah dikembangkan dengan

penskoran parsial dan holistik. Hal tersebut dilakukan untuk memperoleh hasil

penilaian atau gambaran kemampuan peserta PPG dengan menggunakan

instrumen model penilaian PPG yang telah dikembangkan pada penelitian ini.

Secara empirik hasil penilaian kemampuan peserta dengan menggunakan

instrumen pada model penilaian PPG menunjukkan bahwa kemampuan peserta

PPG pada hasil penilaian RPP dengan menggunakan penskoran parsial didominasi

pada kemampuan (theta) 1 hingga 3. Kemampuan peserta PPG pada hasil

penilaian RPP dengan menggunakan penskoran holistik didominasi pada

kemampuan (theta) -2 hingga 1. Kemampuan peserta PPG pada hasil penilaian

pelaksanaan pembelajaran dengan menggunakan penskoran parsial didominasi

pada kemampuan (theta) 1 hingga 3. Kemampuan peserta PPG pada hasil

penilaian pelaksanaan pembelajaran dengan menggunakan penskoran holistik

didominasi pada kemampuan (theta) -1 hingga 1. Kemampuan peserta PPG pada

hasil penilaian kompetensi sosial dan kompetensi kepribadian dengan

menggunakan penskoran parsial didominasi pada kemampuan (theta) 1 hingga 3.

Kemampuan peserta PPG pada hasil penilaian kompetensi sosial dan kompetensi

403
kepribadian dengan menggunakan penskoran holistik didominasi pada

kemampuan (theta) -1 hingga 1.

Jika hasil empirik tersebut dikaitkan dengan pandangan Baker (2001)

bahwa pada item response theory salah satu tujuan pengukuran adalah

menemukan posisi peserta berdasarkan skala kemampuan. Melalui informasi

tersebut penilai dapat mengetahui seberapa besar kemampuan peserta yang sedang

dinilai. Selain itu, penilai juga dapat membandingkan kemampuan antara peserta

satu dengan peserta lainnya dalam penentuan nilai berdasarkan skala kemampuan

tersebut (θ). Hal ini bermakna bahwa jika model penilaian PPG yang telah

dikembangkan ini diterapkan, penilai dapat secara langsung menentukan posisi

kemampuan peserta PPG melalui skala kemampuan baik dengan menggunakan

penskoran parsial, maupun dengan menggunakan penskoran holistik.

Lebih lanjut Retnawati & Munadi (2013) menyatakan bahwa parameter

kemampuan yang ideal adalah minimal 1 atau lebih, maka dapat disimpulkan

bahwa pada instrumen penilaian PPG untuk penskoran parsial kemampuan peserta

menunjukkan hasil yang baik. Namun hal berbeda ditemukan pada penskoran

holistik yang menunjukkan bahwa kemampuan peserta PPG masih rendah jika

diskor dengan pendekatan holistik sehingga masih perlu ditingkatkan.

Hasil penilaian yang dimaksudkan adalah berupa kemampuan (θ) peserta

PPG menyusun perencanaan pembelajaran, kemampuan melaksanakan

pembelajaran dan kemampuan terkait penguasaan kompetensi sosial kepribadian,

sebagaimana terlampir pada Lampiran 9 halam 618. Kemampuan pertama adalah

kemampuan yang terkait dengan penyusunan perencanaan pembelajaran. Setelah

404
menerapkan penilaan perencanaan pembelajaran, maka diperoleh parameter

kemampuan (θ). Berikut ini disajikan profil kemampuan peserta PPG berdasarkan

penskoran parsial dan penskoran holistik.

Gambar 103. Profil Kemampuan Menyusun RPP untuk Peserta LPTK UNY

Gambar 103 Menyajikan sebaran kemampuan peserta PPG dalam

menyusun RPP untuk peserta di LPTK UNY. Peserta di LPTK UNY berjumlah

158 peserta yang menjadi subjek uji coba II pada kelompok PPG Dalam Jabatan

tahap 1 tahun 2019 dengan Program Studi PGSD, Pendidikan Matematika, dan

PJKR. Berdasarkan temuan tersebut menunjukkan bahwa kemampuan peserta

PPG yang dinilai menggunakan instrumen penilaian dengan penskoran parsial

cenderung didominasi oleh kemampuan sekitar 1 hingga 3. Sebaliknya untuk

kemampuan peserta PPG yang dinilai menggunakan instrumen penilaian dengan

penskoran holistik didominasi oleh kemampuan -1 hingga 1. Data kemampuan

peserta PPG selanjutnya diperoleh dari LPTK UNG sebagai berikut.

405
Gambar 104. Profil Kemampuan Menyusun RPP untuk Peserta LPTK UNG

Peserta PPG yang menjadi subjek uji coba di LPTK UNG berjumlah 119

peserta yang menjadi subjek uji coba II pada Kelompok PPG Dalam Jabatan tahap

I tahun 2019 dengan Prodi PGSD, Bahasa Inggris, dan PJKR. Temuan yang

diperoleh menunjukkan bahwa pada penskoran parsial kemampuan peserta PPG

dalam menyusun RPP didominasi oleh kemampuan 1 hingga 3. Sedangkan pada

penskoran holistik kemampuan peserta didominasi oleh kemampuan -1 hingga 1.

Data kemampuan peserta PPG selanjutnya diperoleh dari lokasi ketiga yang

dilaksanakan LPTK UINAM. Berikut ini disajikan profil kemampuan tersebut.

406
Gambar 105. Profil Kemampuan Menyusun RPP untuk Peserta LPTK UINAM

Peserta PPG yang menjadi subjek uji coba II di LPTK UINAM berjumlah

239 orang pada kelompok PPG Dalam Jabatan Bersubsidi tahun 2018/2019

dengan Program Studi/Mata Pelajaran diantaranya: Fikih, Qur’an Hadis, Akidah

Akhlak, Bahasa Arab, Sejarah Kebudayaan Islam dan Guru Kelas Madrasah

Ibtidaiyah (MI). Pada Gambar 70 diperoleh informasi bahwa kemampuan

menyusun RPP untuk peserta di UIN Alaluddin Makassar bergerak antara 1

hingga 3. Selain itu untuk penskoran parsial diperoleh kemampuan yang

didominasi pada nilai -1 hingga 1. Berdasarkan temuan yang diperoleh di tiga

lokasi menunjukkan bahwa kemampuan peserta PPG cenderung lebih tinggi pada

penilaian dengan penskoran parsial.

Kemampuan kedua yang menjadi unit analisis adalah kemampuan

pelaksanaan pembelajaran. Seperti halnya kemampuan menyusun RPP, pada

kemampuan ini juga diperoleh nilai parameter kemampuan atau theta serta

dilaksanakan pada tiga lokasi yang berbeda. Berikut ini disajikan profil

kemampuan peserta dalam melaksanakan pembelajaran di LPTK UNY.

407
Gambar 106. Profil Kemampuan Pelaksanaan Pembelajaran Peserta LPTK UNY

Hasil penelitian yang disajikan pada Gambar 75 menunjukkan bahwa

kemampuan peserta dalam pelaksanaan pembelajaran di LPTK UNY memusat

pada kemampuan sekitar 2 hingga 3. Hal lain diperoleh pada instrumen penilaian

holistik menunjukkan kemampuan yang didominasi oleh nilai 0 hingga 1. Lebih

lanjut, hal serupa juga penilaian kemampuan peserta dalam pelaksanaan

pembelajaran dilaksanakan pada LPTK UNG sebagai berikut.

Gambar 107. Profil Kemampuan Pelaksanaan Pembelajaran Peserta LPTK UNG

408
Profil kemampuan peserta PPG dalam pelaksanaan pembelajaran yang

diperoleh di LPTK UNG menunjukkan hal yang tidak jauh berbeda dengan

sebelumnya. Temuan tersebut adalah adanya kecenderungan kemampuan peserta

PPG pada penilaian dengan penskoran parsial lebih tinggi dibandingkan dengan

penskoran holistik. Ini jelas terlihat pada Gambar 76 yang menunjukkan

kemampuan peserta berkisar 1 hingga 3 pada penskoran parsial. Sedangkan pada

penskoran holistik bergerak antara -1 hingga 1. Lebih lanjut hasil penilaian

kemampuan peserta PPG dalam pelaksanaan pembelajaran di LPTK UINAM

diuraikan sebagai berikut.

Gambar 108. Profil Kemampuan Pelaksanaan Pembelajaran Peserta LPTK


UINAM

Profil kemampuan peserta PPG dalam pelaksanaan pembelajaran yang

diperoleh di LPTK UINAM menunjukkan bahwa kemampuan peserta didominasi

pada nilai 1 hingga 3 pada penilaian dengan penskoran parsial. Selain itu, nilai

kemampuan yang bergerak antara -1 hingga 0 ditemukan pada hasil penilaian

409
dengan penskoran holistik. Inin menunjukkan kecenderungan tingginya

kemampuan pada penskoran parsial.

Kemampuan peserta PPG ketiga yang menjadi unit analisis adalah

penguasaan kompetensi sosial dan kompetensi kepribadian. Data ini juga

diperoleh berdasarkan instrumen parsial dan instrumen holistik. Selain itu, data ini

juga diterapkan di tiga lokasi yaitu LPTK UNY, LPTK UNG dan LPTK UINAM.

Berikut ini disajikan hasil yang diperoleh terkait penguasaan kompetensi sosial

dan kompetensi kepribadian peserta PPG di LPTK UNY.

Gambar 109. Profil Kompetensi Sosial Kepribadian untuk Peserta LPTK UNY

Gambar 109 menyajikan sebaran penguasaan kompetensi sosial

kepribadian peserta PPG di LPTK UNY yang berjumlah 158 peserta. Berdasarkan

temuan diperoleh bahwa kemampuan peserta PPG yang dinilai menggunakan

instrumen penilaian dengan penskoran parsial cenderung didominasi oleh

kemampuan sekitar 1 hingga 3. Sebaliknya untuk kemampuan peserta PPG yang

dinilai menggunakan instrumen penilaian dengan penskoran holistik didominasi

oleh kemampuan sekitar 0 dan 1. Data selanjutnya diperoleh dari lokasi kedua

410
yaitu penilaian penguasaan kompetensi sosial dan kompetensi kepribadian peserta

PPG di LPTK UNG sebagai berikut.

Gambar 110. Profil Kompetensi Sosial Kepribadian untuk Peserta LPTK UNG

Gambar 110 menyajikan sebaran penguasaan kompetensi sosial

kepribadian peserta PPG di LPTK UNG yang berjumlah 119 peserta. Hasil

penelitian yang diperoleh menunjukkan bahwa pada penskoran parsial

kemampuan peserta PPG dalam penguasaan kompetensi sosial kepribadian

didominasi oleh kemampuan 1 hingga 3. Sedangkan peserta PPG yang dinilai

dengan penskoran holistik kemampuan peserta didominasi oleh nilai -2 hingga 0.

Temuan tersebut adalah adanya kecenderungan kemampuan penguasaan

kompetensi sosial kepribadian peserta PPG pada penilaian dengan penskoran

parsial lebih tinggi dibandingkan dengan penskoran holistik. Data selanjutnya

diperoleh dari lokasi ketiga yaitu penilaian penguasaan kompetensi sosial dan

kompetensi kepribadian peserta PPG di LPTK UINAM dengan profil kemampuan

sebagai berikut.

411
Gambar 111. Profil Kompetensi Sosial Kepribadian untuk Peserta LPTK UINAM

Penyajian pada Gambar 81 tersebut adalah sebaran kompetensi sosial dan

kompetensi kepribadian peserta PPG LPTK UINAM yang berjumlah 239 peserta.

Berdasarkan penyajian tersebut diperoleh informasi bahwa kemampuan

penguasaan kompetensi sosial dan kompetensi kepribadian dari peserta PPG

untuk penskoran parsial didominasi pada rentang kemampuan 1 hingga 3. Hal

berbeda diperoleh pada penskoran holistik, kemampuan peserta PPG berada

diantara -1, 0 dan 1 atau didominasi pada kemampuan 0 hingga 1. Seperti halnya

pada kemampuan sebelumnya (menyusun RPP dan pelaksanaan pembelajaran)

pada penguasaan kompetensi sosial dan kompetensi kepribadian dari peserta PPG

ini, menunjukkan kemampuan peserta pada penskoran parsial menunjukkan nilai

yang lebih tinggi dibandingkan dengan penskoran holistik.

Secara deskriptif dapat dijelaskan bahwa kemampuan peserta dalam

menyusun RPP, melaksanakan pembelajaran serta kompetensi sosial dan

kompetensi kepribadian cenderung tinggi pada kelompok penilaian dengan

412
menggunakan instrumen penilaian penskoran parsial yang menggunakan 5

kategori dibandingkan penskoran holistik yang menggunakan 4 kategori.

Hasil penelitian ini mendukung temuan sebelumnya yang dilakukan oleh

Wasis (2011) bahwa semakin banyak jumlah kategori dalam penskoran partial

credit, semakin akurat estimasi kemampuan yang dihasilkan. Pandangan ini telah

dibuktikan oleh hasil penelitian empiris maupun simulasi. Jika kategori digunakan

lebih banyak, maka dihasilkan fungsi informasi tes yang lebih tinggi dan

kesalahan baku estimasi yang lebih kecil. Semakin banyak kategori yang

digunakan, semakin kecil simpangan baku yang diperoleh. Fungsi informasi tes

semakin tinggi, kesalahan baku estimasi semakin kecil, dan RMSE semakin kecil

menunjukkan bahwa estimasi kemampuan yang dihasilkan semakin akurat.

Hal tersebut juga didukung oleh Bond & Fox (2007: 221) bahwa

reliabilitas pengukuran dapat ditingkatkan dengan penambahan jumlah kategori

dalam penskoran akan, bila penambahan tersebut tidak dilakukan secara

sembarangan. Kategori baru yang ditambahkan harus menunjukkan perbedaan

tingkat kesukaran yang signifikan dengan kategori sebelumnya, sehingga tidak

tumpang tindih atau saling meniadakan. Pendapat Bond & Fox (2007: 221)

tersebut relevan dengan hasil penelitian ini yang menemukan bahwa penskoran

parsial menunjukkan nilai informasi yang lebih tinggi dibandingkan dengan

penskoran holistik berdasarkan banyaknya kategori yang digunakan pada saat

penskoran.

Berdasarkan hasil temuan yang diperoleh dalam mengembangkan model

penilaian PPG dengan penskoran parsial dan holistik menunjukkan kedua

413
penskoran tersebut dapat meningkatkan akurasi pengukuran capaian kompetensi

peserta PPG yaitu kompetensi pedagogik, kompetensi sosial dan kepribadian yang

dikuasai peserta PPG. Selain itu, dibuktikan dengan adanya keakuratan kedua

penskoran tersebut yang diukur dan fungsi informasi tes dan kesalahan baku

estimasi. Hal ini sejalan dengan pendapat dinyatakan Baker (2001: 105) jika dapat

memperkirakan parameter dengan teliti, maka akan dapat mengetahui informasi

tentang nilai parameter, dibandingkan dengan memperkirannya dengan kurang

teliti. Hal ini menjadi cukup penting untuk bagi pengembang instrumen atau tes,

karena presisi yang memperkirakan posisi kemampuan yang diperkirakan

tergantung dimana kemampuan peserta tes berada pada skala kemampuan. Oleh

karena itu, kecenderungan pengembangan model penilaian PPG harus diarahkan

pada model penskoran politimus baik penskoran parsial maupun penskoran

holistik dengan menggunakan banyak kategori, karena kemampuan peserta PPG

merentang sebagai suatu kontinum, mulai dari yang mudah hingga sulit. Bila

peserta PPG berusaha memahami atau menguasai kompetensi pedagogik, sosial

dan kompetensi kepribadian, maka penguasaanya akan berada pada satu posisi

diantara seluruh posisi yang ada dalam kontinum itu. Posisi kemampuan peserta

PPG tersebut, dapat berada dimanapun diantara rentangan kontinum, tidak

terbatas hanya pada posisi kemampuan terendah atau tertinggi. Oleh karena itu,

kemampuan peserta tersebut diukur, maka hasil pengukurannya sangat mungkin

kemampuan seorang peserta PPG berada diantara batas terendah dan tertinggi

dalam suatu kontinum.

414
Pertimbangan pemilihan penskoran parsial maupun penskoran holistik

dalam penilaian capaian kompetensi peserta PPG, setidaknya memperhatikan

bahwa setiap peserta PPG memiliki tingkat kesukaran yang tidak selalu sama

dalam menguasai capaian kompetensi yang diharapkan, baik kompetensi

pedagogik, kompetensi sosial maupun kompetensi kepribadian yang dinilai dalam

penelitian ini, karena ketika seorang peserta PPG menunjukkan kemampuannya

dalam penguasaan kompetensi tersebut, tentu saja respons yang diberikan

berbeda-beda tergantung pada tingkat kesulitan yang dihadapinya, sehingga bila

respons peserta PPG diskor dengan penskoran parsial maupun penskoran holistik,

maka skor yang diberikan harus memperhatikan tingkat kesukaran dari setiap

komponen yang dinilai dari masing-masing kompetensi. Mengingat setiap

komponen yang dinilai dalam mengukur capaian kompetensi peserta PPG

memiliki serangkaian tahapan dan skor seharusnya diberikan pada setiap tahapan

tersebut, sehingga jika kemampuan peserta PPG diukur dengan penskoran parsial

ataupun holistik, pengukurannya seharusnya tidak hanya memperhatikan hasil

akhir, melainkan harus memperhatikan seluruh tahapan-tahapan untuk

mendapatkan capaian penguasaan kompetensi yang dinilai dari peserta PPG

secara komprehensif. Selain itu, kenyataan di lapangan menunjukkan kebanyakan

respons peserta PPG bersifat partial corret, benar dilangkah tertentu, tetapi salah

di langkah lain. Untuk respons semacam ini, penskoran parsial merupakan pilihan

yang dianjutkan dan berpeluang menentukan batas-batas partial corret dalam

mengukur capaian kompetensi peserta PPG, karena penskoran parsial dibangun

dengan dua parameter, yaitu kemampuan dan tingkat kesukaran item serta tidak

415
mensyaratkan threshold yang semakin besar dari suatu kategori ke kategori

berikutnya.

Keberhasilan pengembangan model penilaian PPG dengan penskoran

parsial dan holistik dalam penelitian ini dipengaruhi oleh beberapa faktor, antara

lain: 1) Semua item yang terdapat pada instrumen penilaian rencana pelaksanaan

pembelajaran dan pelaksanaan pembelajaran saat workshop, PPL dan praktik

UKIN untuk mengukur capaian penguasaan kompetensi pedagogik serta semua

item yang ada pada instrumen penilaian kompetensi sosial dan kepribadian

dikembangkan berdasarkan prosedur pengembangan instrumen yang harus

dilakukan, 2) Semua item yang dikembangkan pada instrumen penilaian rencana

pelaksanaan pembelajaran, instrumen penilaian pelaksanaan pembelajaran, dan

instrumen penilaian kompetensi sosial dan kepribadian dikembangkan dari

indikator yang ada pada Buku Pedoman Penyelenggaraan Pendidikan Profesi

Guru Kemenristekdikti, 3) Instrumen penilaian rencana pelaksanaan

pembelajaran, instrumen penilaian pelaksanaan pembelajaran, dan instrumen

penilaian kompetensi sosial dan kepribadian dikembangkan dari instrumen

penilaian yang telah dikembangkan oleh Kemenristekdikti, 4) Instrumen penilaian

yang dikembangkan dilengkapi dengan buku panduan penilaian yang telah

melalui uji valitiditas isi oleh 7 expert judgment, 5) peserta PPG yang menjadi

subjek uji coba sungguh-sungguh dalam melaksanakan tahapan PPG mulai dari

workshop, PPL dan praktik UKIN karena melihatkan dosen dan guru

pamong/penguji UKIN/penguji UKIN, 6) berdasarkan fungsi informasi yang

diperoleh baik menggunakan penskoran parsial maupun holistik telah memiliki

416
informasi yang tinggi, sehingga instrumen penilaian yang dikembangkan dapat

digunakan untuk menggali informasi mengenai kemampuan peserta PPG dengan

tepat. Dengan demikian, model penilaian PPG yang dikembangkan dengan

penskoran parsial dan holistik ini, jika diterapkan dalam penilaian PPG akan

mampu mengukur capaian kompetensi peserta PPG, terutama penguasaan pada

kompetensi pedagogik, kompetensi sosial dan kepribadian. Selain itu, dapat

digunakan sebagai bahan evaluasi dalam melakukan perbaikan atau tindak lanjut

perbaikan penguasaan kompetensi peserta/mahasiswa Program PPG selama dan

setelah mengikuti program pembelajaran.

5. Kepraktisan Model Penilaian PPG dengan Penskoran Parsial dan

Holistik

Setelah menerapkan model penilaian PPG dengan penskoran parsial dan

holistik yang telah dikembangkan melalui prosedur pengembangan, maka pada

penelitian ini peneliti juga menilai kepraktisan model penilaian PPG yang telah

dikembangkan tersebut melalui respon dari pengguna/penilai (dosen/guru

pamong/penguji UKIN) yang telah menggunakan model penilaian PPG ini pada

saat pelaksanaan workshop/lokakarya, PPL dan UKIN Program PPG sebanyak 71

orang menggunakan teknik purposive sampling yaitu untuk penilai dosen

sebanyak 35 orang dengan rincian dosen penilai pada LPTK UNY sebanyak 12

orang, LPTK UNG sebanyak 10 orang dan LPTKI UINAM sebanyak 13 orang.

Selanjutnya untuk penilai guru pamong/penguji UKIN sebanyak 36 orang dengan

rincian guru pamong/penguji UKIN pada LPTK UNY sebanyak 12 orang, LPTK

417
UNG sebanyak 11 orang dan LPTKI UINAM sebanyak 13 orang. Untuk

keperluan tersebut diperlukan, setelah pengguna menggunakan model penilaian

PPG yang dikembangkan diberikan instrumen untuk mengukur kepraktisan model

penilaian PPG tersebut.

Kepraktisan model penilaian PPG yang dimaksud dalam penelitian ini

adalah pencapaian tujuan model penilaian PPG secara tepat atau keberhasilan

model penilaian PPG dengan penskoran parsial dan holistik yang dikembangkan

dalam pencapaian tujuan-tujuannya dan dapat digunakan dengan baik oleh

pengguna (dosen/guru pamong/penguji UKIN). Untuk mengukur kepraktisan

model Penilaian PPG ini, maka dilakukan survey terhadap pengguna atau penilai

PPG yang telah menggunakan model penilaian ini. Adapun indikator yang

digunakan antara lain: mampu dipahami oleh pengguna, dapat diterapkan di

lapangan, relevansi dengan Program PPG, memberi manfaat pada kegiatan PPG,

efisien dalam penggunaannya. Berdasarkan hasil penelusuran survey dari

pengguna diperoleh data hasil penilaian kepraktisan model penilaian PPG

sebagaimana disajikan pada Gambar 112 berikut:

418
Gambar 112. Hasil Penilaian Kepraktisan Model Penilaian Oleh Pengguna

Keterangan:
Indikator_1: Mampu dipahami oleh pengguna
Indikator_2: Dapat diterapkan di lapangan
Indikator_3: Relevansi dengan Program PPG
Indikator_4: Memberi manfaat pada peserta PPG
Indikator_5: Efektif dan efisien dalam penggunaannya
Berdasarkan data yang disajikan pada Gambar 112 tersebut, maka dapat

dijelaskan bahwa pada dasarnya kelima indikator yang digunakan berada pada

rentang antara Setuju hingga Sangat Setuju. Hal tersebut menunjukkan bahwa

secara umum pengguna model penilaian PPG dengan penskoran parsial dan

holistik di lapangan dapat memahami dengan baik maksud, tujuan dan isi model

penilaian PPG dan menerapkan pada pelaksanaan penilaian di lapangan. Selain

itu, tampak bahwa pengguna merasakan adanya manfaat dari model penilaian

PPG tersebut, memiliki relevansi dengan Program PPG dan relevan terhadap

penilaian kompetensi guru yang dikembangkan dalam Program PPG, serta

dipandang efektif karena mudah digunakan dan efisien dari segi waktu dan tenaga

419
untuk diterapkan secara berkesinambungan pada pelaksanaan penilaian Peserta

PPG.

Berdasarkan hasil penilaian tersebut, maka dapat disimpulkan bahwa

model penilaian PPG dengan penskoran parsial dan holistik yang telah

dikembangkan pada penelitian ini telah memenuhi aspek kepraktisan berdasarkan

penilaian oleh pengguna. Hal ini ditunjukkan dari kecenderungan pengguna

menyatakan bahwa model penilaian PPG mampu dipahami oleh pengguna, dapat

diterapkan di lapangan, relevansi dengan Program PPG, memberi manfaat pada

peserta PPG, efektif dan efisien dalam penggunaannya. Oleh karena itu model ini

dapat disarankan untuk diterapkan secara berkesinambungan pada penilaian

peserta PPG di masa yang akan datang.

Adapun kendala terkait dengan instrumen penilaian PPG yang berbasis

penskoran parsial dan holistik masih dirasakan oleh pengguna (Penilai UKIN)

berdasarkan temuan di lapangan. Kendala pertama kususnya pada instrumen

penskoran parsial. Pada dasarnya kendala pada instrumen penskoran parsial yang

dirasakan pengguna ada pada saat pelaksanaan penskoran. Hal tersebut

disebabklan karena pada penskoran parsial, skor berbasis pada kemunculan setiap

deskriptor yang menjadi aspek amatan oleh pengguna, sehingga pada saat

menskor penilai perlu mengingat semua deskriptor yang memungkinkan

muncul/tampak. Ternyata hal tersebut dirasa sebagai kendala oleh pengguna

sehingga memerlukan pembiasaan secara berkesinambungan dalam mengenali

setiap deskriptor dan menerapkan instrumen parsial tersebut agar dapat terbiasa

dengan dekriptor amatan yang menjadi dasar pemberian skor.

420
Kendala selanjutnya dirasakan pengguna pada instrumen model penskoran

holistik. Pada kasus ini, pengguna merasakan kendala pada urutan kriteria yang

menjadi dasar pemberian skor. Berbeda dengan penskoran parsial sebelumnya

yang berbasis pada kemunculan deskriptor, pada penskoran holistik ini

menekankan pada urutan kriteria yang dicapai dari objek penilaian (peserta PPG).

Hal tersebut sangat penting, karena kekeliruan dalam mengamati urutan kriteria

tentu akan berdampak pada pemberian skor yang kurang tepat sehingga

membutuhkan ketelitian dalam mengamati urutan kriteria-kriteria yang

ditampakkan oleh objek penilaian (mahasiswa PPG). Namun kembali lagi bahwa

semua kendala tersebut sama-sama berakar dari permasalahan pembiasaan.

Semakin dibiasakan dalam menggunakan model penilaian ini maka kendala-

kendala tersebut akan teratasi dengan baik.

Berdasarkan temuan di lapangan bahwa model penilaian dengan penskoran

parsial dan holistik ini merupakan hal baru bagi pengguna, maka tentu dibutuhkan

pemahaman terlebih dahulu terkait model penilaian PPG yang telah

dikembangkan utamanya pemahaman tentang konsep penskoran parsial dan

holistik. Oleh karena itu, dibutuhkan sosialisasi produk yang lebih mendalam

untuk mengenalkan produk yang telah dikembangkan ini termasuk sosialisasi

bagaimana cara menggunakannya agar produk yang telah dikembangkan dapat

digunakan oleh sasaran pengguna secara tepat.

421
E. Keterbatasan Penelitian

Pada dasarnya penelitian ini telah didesain dengan sebaik-baiknya, baik

dari segi perencanaan maupun pada tahap proses pelaksanaan. Namun peneliti

menyadari bahwa terdapat beberapa hal yang sebenarnya tercakup di dalam

keluasan lingkup penelitian tapi karena kesulitan-kesulitan jangkauan peneliti

ataupun prosedural tertentu sehingga tidak dapat dicakup di dalam penelitian ini.

Hal yang pertama yang dinyatakan sebagai keterbatasan penelitian ini adalah pada

penelitian ini telah melibatkan tiga lembaga penyelenggara PPG yaitu Universitas

Negeri Yogyakarta, Universitas Islam Negeri Alauddin Makassar, dan Universitas

Negeri Gorontalo. Peneliti menyadari untuk pengembangan hasil penelitian ini di

masa yang akan datang, produk penelitian ini juga perlu diterapkan di LPTK

lainnya agar informasi terkait kualitas Model Penilaian PPG yang telah

dikembangkan bisa dianalisis untuk kasus atau tempat lain.

Keterbatasan lainnnya adalah model penilaian PPG yang dikembangkan

dengan penskoran parsial dan holistik, belum mampu mengungkap penguasaan

kompetensi guru yang dipersyaratkan secara utuh dari peserta PPG, karena dalam

penelitian ini hanya mengembangkan tiga kompetensi yaitu kompetensi

pedagogik, kompetensi sosial dan kompetensi kepribadian yang difokuskan pada

performance assesment dari peserta PPG saat praktik mengajar pada kegiatan

lokakarya/workshop, PPL dan UKIN, sehingga untuk penilaian kompetensi

profesional tidak dikembangkan dan tidak dinilai dalam penelitian ini.

422
Rumusan capaian pembelajaran lulusan Program PPG dalam penelitian ini

meskipun hanya memuat penilaian yang mengestimasi capaian penguasaan

kompetensi pedagogik, kompetensi sosial dan kepribadian yang harus dimiliki

oleh peserta PPG beserta sub kompetensi dan indikatornya yang tertera dalam

Lampiran Permenristekdikti Nomor 55 tahun 2017 tentang StandarDikgu, namun

telah sesuai dengan capaian pembelajaran dalam KKNI memuat 7 capaian

pembelajaran yang harus dikuasai oleh guru sebagai pendidik profesional yang

berakhlak mulia dengan tugas mendidik, mengajar, membimbing, mengarahkan,

melatih, dan mengevaluasi peserta didik dengan kompetensi sebagai berikut.

Pertama, mampu melaksanakan tugas keprofesian sebagai pendidik yang

memesona, yang dilandasi sikap cinta tanah air, berwibawa, tegas, disiplin, penuh

panggilan jiwa, samapta, disertai dengan jiwa kesepenuhhatian dan

kemurahhatian. Kedua, mampu merumuskan indikator capaian pembelajaran,

berpikir tingkat tinggi yang harus dimiliki peserta didik mencakup pengetahuan,

keterampilan, dan sikap secara utuh dan berorientasi masa depan. Ketiga,

menguasai materi ajar termasuk advance materials bermakna yang dapat

menjelaskan aspek “apa” (konten), “mengapa” (filosofi), dan “bagaimana”

(penerapan) dalam kehidupan sehari-hari. Keempat, mampu merancang

pembelajaran dengan menerapkan prinsip yang memadukan pengetahuan materi

ajar, pedagogik, serta teknologi informasi dan komunikasi atau Technological

Pedagogical and Content Knowledge dan pendekatan lain yang relevan. Kelima,

mampu melaksanakan pembelajaran yang mendidik dengan menerapkan teknologi

informasi dan komunikasi untuk membangun pengetahuan, keterampilan, dan

423
sikap (karakter Indonesia) peserta didik dalam memecahkan masalah secara kritis

dan humanis, inovatif, kreatif, kolaboratif, dan komunikatif dengan menggunakan

model pembelajaran dan sumber belajar yang mendukung hasil penelitian.

Keenam, mampu mengevaluasi masukan, proses, dan hasil pembelajaran

mencakup sikap, pengetahuan, dan keterampilan peserta didik dengan

menerapkan asesmen otentik, serta memanfaatkan hasil evaluasi untuk perbaikan

kualitas pembelajaran. Ketujuh, mampu mengembangkan diri secara

berkelanjutan sebagai guru profesional melalui penelitian, refleksi diri, pencarian

informasi baru, dan inovasi. Oleh karena itu, dibutuhkan pengembangan model

penilaian PPG lebih lanjut dengan mengacu pada ketujuh rumusan capaian

pembelajaran tersebut baik dalam penyelenggaraan PPG Kemenristekdikti

maupun Kementerian Agama RI.

Hal lainnya yang dianggap sebagai keterbatasan penelitian ini adalah

model Penilaian PPG yang dikembangkan pada penelitian ini telah diterapkan

pada mahasiswa dengan profesi di jenjang SD, SMP, SMA/SMK, MI, MTs, dan

MA. Namun pada penelitian ini tidak dapat menjangkau pada mahasiswa PPG

dengan profesi di jenjang PAUD dan PIAUD. Hal tersebut disebabkan karena

adanya perbedaan komponen penilaian yang dituntut pada mahasiswa PPG di

jenjang PAUD dan PIAUD jika dibandingkan dengan mahasiswa dengan profesi

di jenjang SD, SMP, SMA/SMK, MI, MTs, dan MA secara umum.

Selain itu, keterbatasan jangkauan juga dinyatakan pada level SMK untuk

Prodi Teknik Elektro. Produk penelitian ini tidak diterapkan pada Prodi Teknik

Elektro tersebut disebabkan karena adanya kekhususan kompetensi pada Prodi

424
Teknik Elektro yang berbeda dengan prodi lainnya pada Program PPG. Untuk

mengukur kemampuan mahasiswa PPG pada Prodi Teknik Elektro diperlukan

penambahan komponen penilaian lain (khusus) yang tidak dijelaskan pada produk

yang telah dikembangkan di penelitian ini. Hal ini perlu mendapat perhatian pada

penerapan produk penelitian ini dan pengembangan hasil penelitian ini di masa

yang akan datang.

Selanjutnya hal utama yang perlu dijelaskan pada pelaksanaan penelitian

ini adalah kendala pengguna atau dalam hal ini guru (penguji ukin) yang

merupakan sasaran pengguna model penilaian ini. Berdasarkan temuan di

lapangan bahwa model penilaian dengan penskoran parsial dan holistik ini

merupakan hal baru bagi pengguna, maka tentu dibutuhkan pemahaman terlebih

dahulu. Namun jika dibandingkan dengan model penilaian yang ada saat ini,

model penilaian yang telah dikembangkan pada penelitian ini telah memenuhi

aspek kepraktisan berdasarkan penilaian oleh pengguna. Hal ini ditunjukkan dari

kecenderungan pengguna menyatakan bahwa model penilaian PPG mampu

dipahami oleh pengguna, dapat diterapkan di lapangan, relevansi dengan Program

PPG, memberi manfaat pada peserta PPG, efektif dan efisien dalam

penggunaannya. Oleh karena itu, dibutuhkan sosialisasi produk yang lebih

meluas untuk mengenalkan produk yang telah dikembangkan ini termasuk

sosialisasi bagaimana cara menggunakannya agar produk yang telah

dikembangkan dapat digunakan oleh sasaran pengguna secara luas.

425
BAB V

SIMPULAN DAN SARAN

A. Simpulan tentang Produk

Berdasarkan hasil penelitian dan pembahasan, maka dapat disimpulkan

beberapa hal sebagai berikut.

1. Konstruk instrumen model penilaian PPG dengan penskoran parsial dan

holistik yang dikembangkan dalam penelitian ini menghasilkan tiga instrumen

yaitu: a) instrumen penilaian RPP yang diukur oleh empat indikator (PIPKC,

PMMMS, PPPEP, dan PTPCK) dengan sebaran 25 item, b) instrumen

penilaian pelaksanaan pembelajaran yang diukur oleh empat indikator

(MPMD, MPMC, MPDK, MDMP) dengan sebaran 20 item, dan c) instrumen

penilaian kompetensi sosial dan kompetensi kepribadian yang diukur oleh

empat indikator (BMJK, BITP, BKDS, BSMKD) dengan sebaran 20 item.

2. Model penilaian PPG yang dikembangkan dengan penskoran parsial dan

holistik akurat dan terpercaya. Hal ini dibuktikan dari konstruk instrumen yang

dihasilkan, validitas isi berdasarkan penilaian ahli dan validitas konstruk

berdasarkan analisis faktor konfirmatori menunjukkan seluruh instrumen pada

model penilaian PPG valid. Selain itu, instrumen model penilaian PPG reliabel

berdasarkan muatan-muatan faktornya.

3. Model penilaian PPG pada penskoran parsial menggunakan skala penilaian 0,

1, 2, 3, dan 4, sementara untuk penskoran holistik menggunakan skala

penilaian 1, 2, 3, dan 4 dengan simpulan sebagai berikut.

426
a. Pada instrumen penilaian PPG (RPP, pelaksanaan pembelajaran dan

kompetensi sosial dan kepribadian) untuk penskoran parsial temuan

penelitian menunjukkan bahwa terdapat empat kategori atau empat

perpotongan yang merupakan tingkat kesukaran dengan kategori yang

paling mudah berada pada skala kemampuan -2,06 sedangkan kategori yang

paling sulit berada pada skala kemampuan 3,1.

b. Pada instrumen penilaian PPG (RPP, pelaksanaan pembelajaran dan

kompetensi sosial dan kepribadian) dengan penskoran holistik diperoleh

temuan bahwa peskoran terdapat tiga tingkat kesukaran item bervariasi di

setiap item dengan -3,9 sebagai tingkat kesukaran langkah yang termudah

serta 1,01 untuk tahapan yang paling sulit.

c. Instrumen model penilaian PPG baik untuk penskoran parsial maupun untuk

penskoran holistik telah memiliki nilai informasi yang bergerak antara 10,7

hingga 16,3 dengan estimasi kesalahan pengukuran yaitu sekitar 0,24 hingga

0,3.

4. Hasil penilaian dengan menggunakan instrumen model penilaian PPG

menunjukkan bahwa penilaian dengan penskoran parsial lebih akurat

dibandingkan dengan penilaian dengan penskoran holistik dalam

mengestimasi kemampuan peserta PPG.

5. Model penilaian PPG dengan penskoran parsial dan holistik yang telah

dikembangkan telah memenuhi aspek kepraktisan berdasarkan penilaian

oleh pengguna yaitu mampu dipahami oleh pengguna, dapat diterapkan di

427
lapangan, relevansi dengan Program PPG, memberi manfaat pada peserta

PPG, efektif dan efisien dalam penggunaannya.

B. Saran Pemanfaatan Produk

Berdasarkan kesimpulan penelitian yang diperoleh, maka disarankan

beberapa hal sebagai berikut.

1. Pada praktik penilaian peserta PPG, maka disarankan menggunakan model

instrumen yang telah dikembangkan pada penelitian ini, karena telah teruji baik

secara empirik maupun secara teoretik, serta telah memenuhi beberapa aspek

kelayakan model instrumen penilaian antara lain: valid, reliabel, goodness of fit

model serta telah diskalakan berdasarkan penskoran parsial dan holistik.

2. Model penilaian PPG dengan penskoran parsial dan holistik pada penelitian ini

diharapkan diterapkan secara berkesinambungan di masa yang akan datang

untuk melakukan penilaian kemampuan peserta PPG baik oleh LPTK/LPTKI

maupun lembaga lain yang relevan dan memiliki kepentingan serupa untuk

meningkatkan akurasi dan konsistensi penilaian pada Program PPG.

3. Model penilaian PPG dengan penskoran parsial dan holistik dilengkapi dengan

panduan penilaian diharapkan dapat membantu pengguna menguasai

pencapaian kompetensi peserta/mahasiswa Program PPG dengan penskoran

parsial dan holistik, baik konsep, pengembangan dan penerapannya sesuai

bidang studi. Selain itu, semoga pengguna mudah memahaminya dan mampu

menerapkannya untuk melakukan pelaporan hasil penilaian secara lebih rinci

dan detail.

428
4. Hasil penilaian ini dapat digunakan sebagai bahan evaluasi dalam melakukan

perbaikan model penilaian PPG yang ada selama ini dalam menilai penguasaan

kompetensi peserta Program PPG selama dan setelah mengikuti program

pembelajaran.

5. Model penilaian PPG yang telah dikembangkan dengan penskoran parsial dan

holistik praktis digunakan oleh pengguna/penilai, sehingga model ini dapat

disarankan untuk diterapkan secara berkesinambungan pada penilaian peserta

PPG di masa yang akan datang dalam mengestimasi capaian kompetensinya

secara utuh dan terpadu.

C. Diseminasi dan Pengembangan Produk Lebih Lanjut

Berdasarkan kesimpulan dan saran penelitian ini maka diperlukan

diseminasi serta pengembangan produk lebih lanjut sebagai penyempurnaan

produk dimasa yang akan datang. Pengembangan produk tersebut diuraikan

sebagai berikut.

1. Produk penelitian ini yaitu model penilaian PPG dengan penskoran parsial dan

holistik telah diterapkan pada mahasiswa/peserta PPG dengan profesi di

jenjang SD, SMP, SMA/SMK, MI, MTs, dan MA. Oleh karena itu, perlu

pengembangan hingga pada mahasiswa/peserta PPG dengan profesi di jenjang

PAUD dan PIAUD. Hal tersebut dirasa penting karena adanya kompetensi

tertentu yang tuntut khusus untuk mahasiswa/peserta PPG pada Program Studi

PAUD dan PIAUD.

429
2. Pengembangan produk lebih lanjut perlu dilakukan pada mahasiswa PPG

dengan profesi di jenjang SMK khususnya pada Program Studi Teknik Elektro.

Hal ini juga penting karena adanya kompetensi tertentu yang tuntut khusus

untuk mahasiswa PPG pada Program Studi Teknik Elektro.

3. Temuan produk penelitian ini telah disebarkan dan digunakan pada tiga

lembaga penyelenggara PPG yaitu Universitas Negeri Yogyakarta, Universitas

Islam Negeri Makassar, dan Universitas Negeri Gorontalo. Sebagai upaya

pengembangan produk lebih lanjut, maka Model Penilaian PPG ini perlu

disebarluaskan pada LPTK/LPTKI sehingga dapat memiliki nilai kemanfaatan

di masa yang akan datang dalam meningkatkan capaian penguasaan

kompetensi guru yang dipersyaratkan.

4. Temuan produk ini mampu mengungkap penguasaan kompetensi pedagogik,

kompetensi sosial dan kompetensi kepribadian dari mahasiswa/peserta PPG.

Sebagai upaya pengembangan produk lebih lanjut, maka model penilaian PPG

ini perlu dikembangkan untuk penilaian kompetensi profesional. Hal ini

merupakan prasyarat mutlak untuk melakukan penilaian PPG yang tidak hanya

mengukur sejauhmana penguasaan akademik mahasiswa/peserta Program PPG

terkuasai, tetapi sampai kepada capaian pembelajaran mahasiswa/peserta

Program PPG menguasai kompetensi yang dipersyaratkan sesuai dengan

ketentuan peraturan perundang-undangan yaitu kompetensi pedagogik,

kompetensi kepribadian, kompetensi sosial, dan kompetensi profesional.

430
DAFTAR PUSTAKA

Aburezeq, I. M., & Ishtaiwa, F. F. (2013). The impact of WhatsApp on interaction


in an Arabic language teaching course. International Journal of Arts &
Sciences, 6(3), 165–180.
Aiken, L. R. (1980). Content validity and reliability of single items or
questionnaires. Educational and psychological measurement, 40(4), 955-
959. doi: 10.1177/001316448004000419
Aiken, L. R. (1985). Three coefficients for analyzing the reliability and validity of
ratings. Educational and psychological measurement, 45(1), 131-142.
Allen, M., & Yen, W. (1979). Principles of test construction. Monterey, CA:
Brooks/Cole Publishing Company.
Amadi, M. N. (2013). In-service training and professional development of
teachers in Nigeria: Through open and distance education. Paper
presented at the Bulgarian Comparative Education Society, Paper
presented at the Annual Meeting of the Bulgarian Comparative Education
Society
American Educational Research Association, & National Council on
Measurement in Education. (2014). Standards for educational and
psychological testing: American Educational Research Association.
Anggraeni, A. A. (2019). Pembelajaran daring PPG dalam jabatan. Yogyakarta:
Tim Avenger SPADA Universitas Negeri Yogyakarta.
Anisa, A. A. (2017). Students’ literature achievement: Predictors investigation
research. REiD (Research and Evaluation in Education), 3(2), 144-151.
doi: 10.21831/reid.v3i2.17498
Anita, N., & Rahman, A. (2013). Penilaian peserta PPG SM-3T Prodi PPKN
Unesa terhadap pelaksanaan program pendidikan profesi guru (PPG) tahun
2013. Kajian Moral dan Kewarganegaraan, 3(1), 409-423.
Antoro, B. (2017). Gerakan literasi sekolah dari pucuk hingga akar: sebuah
refleksi. Jakarta: Direktorat Jenderal Pendidikan Dasar dan Menengah
Kementerian Pendidikan dan Kebudayaan.
Archer, A., & Hughes, C. (2011). Explicit instruction: Efficient and effective
teaching. New York: NY: Guilford Publications.
Athar, M. R., & Jamal, N. (2017). Academic achievement of students associated
with professional education of teacher. Journal of Research, 11(2), 94-99.
Azwar, S. (2017). Penyusunan skala psikologi. Yogyakarta: Pustaka pelajar.
Bahcivan, E., & Cobern, W. W. (2016). Investigating coherence among Turkish
elementary science teachers' teaching belief systems, pedagogical content

431
knowledge and practice. Australian Journal of Teacher Education
(Online), 41(10), 63-86. doi: 10.14221/ajte.2016v41n10.5
Bainer, D. L., & Porter, F. (1992). Teacher concerns with the implementation of
holistic scoring. Paper presented at the Paper presented at the Annual
Meeting of theMidwestern Educational Research Association Chicago, IL.
Baker, F. B. (2001). The basics of item response theory. ERIC: Clearinghouse on
Assessment and Evaluation.
Baker, F. B., & Kim, S.-H. (2017). The basics of item response theory using R.
Switzerland: Springer International Publishing.
Baswedan, A. R. (2014). Gawat darurat pendidikan di Indonesia. Paper presented
at the The Emergency of Indonesian Education. A paper delivered at the
meeting between Ministry and Head of Education Offices Indonesia-wide
in Jakarta, on December.
Bhakti, C. P., & Maryani, I. (2017). Peran LPTK dalam pengembangan
kompetensi pedagogik calon guru. Jurnal Pendidikan (Teori dan Praktik),
1(2), 98-106. doi: 10.26740/jp.v1n2.p98-106
Biktagirova, G. F., & Valeeva, R. A. (2014). Development of the teachers'
pedagogical reflection. Life Science Journal, 11(9), 60-63.
Bond, T. G., & Fox, C. M. (2007). Applying the Rasch model: Fundamental
measurement in the human sciences . Mahwah, NJ, US. Mahwah, New
Jersey: Lawrence Erlbaum Associates Publishers.
Borg, W. R., & Gall, M. (1989). Education Research: An Introduction (4th
Edition). New York: Longman publisher.
Borich, G. D., & Kubiszyn, T. (2003). Educational testing and measurement:
classroom application and practice. United States of America: John Wiley
& Sons, Inc.
Brennan, R. (2006). Educational measurement . Westport: An Imprint of
Greenwood Publishing Group (Vol. Imprint of Greenwood Publishing
Group. Inc). Westport: Inc.
Brookfield, S. (1984). Adult learners, adult education and the community. New
York: Teaches College Press.
Brookhart, S. M. (2013). How to create and use rubrics for formative assessment
and grading. Alexandria, Vriginia USA: ASCD.
Brookhart, S. M., & Nitko, A. J. (2008). Assessment and grading in classrooms.
Columbus, Ohio: Pearson Merrill Prentice Hall.
Bruce, C. D., Esmonde, I., Ross, J., Dookie, L., & Beatty, R. (2010). The effects
of sustained classroom-embedded teacher professional learning on teacher
efficacy and related student achievement. Teaching and Teacher
Education, 26(8), 1598-1608. doi: 10.1016/j.tate.2010.06.011

432
Büyükkidik, S., & Anil, D. (2015). Investigation of reliability in generalizability
theory with different designs on performance-based assessment. Egitim ve
Bilim, 40(177), 285-296. doi: 10.15390/EB.2015.2454
Caena, F. (2011). Literature review Quality in Teachers’ continuing professional
development. Education and training, 20, 2-20.
Calvert, L. (2016). Moving from compliance to agency: What teachers need to
make professional learning work. Oxford, OH, USA: Learning Forward
and NCTAF.
Chamorro-Premuzic, T., & Furnham, A. (2006). Intellectual competence and the
intelligent personality: A third way in differential psychology. Review of
General Psychology, 10(3), 251-267.
Chamorro-Premuzic, T., & Furnham, A. (2014). Personality and intellectual
competence. New York: Psychology Press.
Chan, S. (2010). Applications of andragogy in multi-disciplined teaching and
learning. Journal of adult education, 39(2), 25-35.
Chen, I.-J., Chang, C.-C., & Yen, J.-C. (2012). Effects of presentation mode on
mobile language learning: A performance efficiency perspective.
Australasian Journal of Educational Technology, 28(1), 122-137.
Cober, R., Tan, E., Slotta, J., So, H.-J., & Könings, K. D. (2015). Teachers as
participatory designers: Two case studies with technology-enhanced
learning environments. Instructional Science, 43(2), 203-228.
Cooper, J. M. (2013). Classroom teaching skills. Wadsworth: Cengage Learning.
Cooper, R. K., & Sawaf, A. (1998). Executive EQ: Emotional intelligence in
leadership and organizations. New York: Perigee Books.
Copriady, J. (2013). The implementation of lesson study programme for
developing professionalism in teaching profession. Asían social science,
9(12), 176.
Cranton, P. (2016). Continuing professional education for teachers and university
and college faculty. New directions for adult and continuing education,
2016(151), 43-52. doi: 10.1002/ace.20194
Creemers, B., Kyriakides, L., & Antoniou, P. (2012). Teacher professional
development for improving quality of teaching. New York: Springer
Science & Business Media.
Crocker, L., & Algina, J. (1986). Introduction to classical and modern test theory.
New York: Holt, Rinehart and Winston, Inc.
Darling-Hammond, L., Hyler, M. E., & Gardner, M. (2017). Effective teacher
professional development. Palo Alto, CA: Learning Policy Institute.

433
de Ayala, R. J. (2009). The theory and practice of item response theory. New
York: Guilford Publications.
DeMars, C. (2010). Item response theory. New York: Oxford University Press.
Departement of Education. (2016). Standard for teachers’ professional
development: Implementation guidance for school leaders, teachers, and
organisations that offer professional development for teachers. London:
The National Archives, Kew.
Dewey, J. (1997). Experience and education. New York: Simon & Schuster Inc.
Dewi, R. P. (2018). Analisis kesalahan penyusunan perangkat pembelajaran
Bahasa Indonesia mahasiswa Program Profesi Guru SM3T tahun 2018.
Paper presented at the Pertemuan Ilmiah Bahasa Dan Sastra Indonesia
(PIBSI) 2018, Yogyakarta.
Disas, E. P. (2017). Analisis kebijakan pendidikan mengenai pengembangan dan
peningkatan profesi guru. Jurnal Penelitian Pendidikan, 17(2), 158-166.
Dogan, C. D., & Uluman, M. (2017). A comparison of rubrics and graded
category rating scales with various methods regarding raters' reliability.
Educational Sciences: Theory and Practice, 17(2), 631-651.
Du Toit, M. (2003). IRT from SSI: Bilog-MG, multilog, parscale, testfact. North
Lincoln Avenue: Scientific Software International.
Dzheksembekova, M. I., Ibrayeva, K. E., Akhmetova, A. K., Urazalieva, M. A.,
Sultangaliyeva, E. S., & Issametova, K. I. (2016). Specific features of
social competence development in the future music teachers working at
universities. International Journal of Environmental and Science
Education, 11(9), 3001-3011. doi: 10.12973/ijese.2016.731a
Ebel, R. L. (1972). Essentials of educational measurement. Englewood Cliffts,
NJ: Prentice Hall Inc.
Embretson, S. E., & Reise, S. P. (2000). Item response theory for psychologists.
Maheah. Mahwah, New Jersey: Lawrence Erlbaum Associates, Publishers.
Fahdini, R., Mulyadi, E., Suhandani, D., & Julia, J. (2014). Identifikasi
kompetensi guru sebagai cerminan profesionalisme tenaga pendidik di
Kabupaten Sumedang. Mimbar Sekolah Dasar, 1(1), 33-42.
Fahmi, M., Maulana, A., & Yusuf, A. A. (2011). Teacher certification in
Indonesia: A confusion of means and ends. Center for Economics and
Development Studies (CEDS) Padjadjaran University, 3(1), 1-18.
Fauzan, F., & Bahrissalim, B. (2017). Curriculum analysis teacher Professional
Education Program (PPG) of Islamic Education in Indonesia. TARBIYA:
Journal of Education in Muslim Society, 4(2), 148-161. doi:
10.15408/tjems.v4i2.6400

434
Fernandes, H. (1984). Evaluation of educational programs. Jakarta: National
Education Planning, Evaluating and Curriculum Development.
French, D. (2017). The future is performance assessment. Voices in Urban
Education, 46, 6-13.
Fuadi, K., Sudjanto, B., & Kamaluddin, K. (2018). Studi evaluasi pelaksanaan
kebijakan sertifikasi guru di Kementerian Agama. Jurnal Akuntabilitas
Manajemen Pendidikan, 6(2), 139-149.
Furr, R., & Bacharach, V. (2013). Psychometrics and the importance of
psychological measurement. Thousand Oaks, CA: Sage Publications Inc.
Galih, A., & Iriani, C. (2018). Persepsi mahasiswa program pendidikan profesi
puru (PPG) Pendidikan Sejarah terhadap program PPG. Jurnal Pendidikan
Sejarah, 7(1), 66-83.
Gareis, C. R., & Grant, L. W. (2014). The efficacy of training cooperating
teachers. Teaching and Teacher Education, 39, 77-88. doi:
10.1016/j.tate.2013.12.007
Geldhof, G. J., Preacher, K. J., & Zyphur, M. J. (2014). Reliability estimation in a
multilevel confirmatory factor analysis framework. Psychological
methods, 19(1), 72-91.
Gerdeman, D., Garrett, R., & Monahan, B. (2018). Teacher professional learning
through teacher network programs: A multiple case study investigation.
American Institutes for Research, 1-28.
Gerritsen, S., Plug, E., & Webbink, D. (2017). Teacher quality and student
achievement: evidence from a sample of Dutch twins. Journal of applied
econometrics, 32(3), 643-660.
Ghozali, I., & Fuad. (2014). Structural equation modeling: Teori, konsep, dan
aplikasi dengan program Lisrel 9.10. Semarang: Badan Penerbit
Universitas Diponegoro.
Giannoukos, G., Besas, G., Galiropoulos, C., & Hioctour, V. (2015). The
andragogy, the social change and the transformative learning educational
approaches in adult education. Journal of Education and Practice, 6(10),
46-50.
Good, T. L. (2008). 21st century education: A reference handbook (Vol. 1).
California: Sage Publications.
Goodwin, A. L. (2010). Globalization and the preparation of quality teachers:
Rethinking knowledge domains for teaching. Teaching Education, 21(1),
19-32. doi: https://doi.org/10.1080/10476210903466901
Griffin, P., & Care, E. (2014). Assessment and teaching of 21st century skills:
Methods and approach. London New York: Springer Dordrecht
Heidelberg.

435
Gronlund, N. E., & Linn, R. L. (1965). Measurement and evaluation in teaching.
New York: Macmillan.
Hakim, A. (2015). Contribution of competence teacher (pedagogical, personality,
professional competence and social) on the performance of learning. The
International Journal Of Engineering And Science (IJES), 4(2), 1-12.
Hambleton, R. K. (2004). Theory, methods, and practices in testing for the 21st
century. Psicothema, 16(4), 696-701.
Hambleton, R. K., Jones, R. W., & Rogers, H. J. (1993). Influence of item
parameter estimation errors in test development. Journal of Educational
Measurement, 30(2), 143-155. doi: 10.1111/j.1745-3984.1993.tb01071.x
Hambleton, R. K., & Swaminathan, H. (1985). Item response theory: Principles
and applications. New York: Springer Science Business Media, LLC
Hambleton, R. K., Swaminathan, H., & Rogers, H. J. (1991). Fundamentals of
item response theory. Newbury Park, CA: Sage Publication Inc.
Harsch, C., & Martin, G. (2013). Comparing holistic and analytic scoring
methods: Issues of validity and reliability. Assessment in Education:
Principles, Policy & Practice, 20(3), 281-307. doi:
10.1080/0969594X.2012.742422
Hasli, R. (2016). Pengembangan instrumen kompetensi pedagogik guru kelas
Sekolah Dasar di Kecamatan Marioriwawo Kabupaten Soppeng. Riset
Assesmen, 1(1), 1-7.
Hatton, M. J. (1997). Lifelong learning: Policies, practices, and programs.
Canada: APEC.
Hendriks, M. A., Luyten, H., Scheerens, J., Sleegers, P., & Steen, R. (2010).
Teachers' professional development: Europe in international comparison:
Europe in international comparison. University of Twente: Faculty of
Behavioural, Management and Social Sciences.
Henschke, J. A. (2011). Considerations regarding the future of andragogy. Adult
Learning, 22(1), 34-37.
Hidayah, I. (2013). Implementation review of professional education of teachers
(PPG) as the implementation of quality management function. Procedia-
Social and Behavioral Sciences, 103, 467-472. doi:
10.1016/j.sbspro.2013.10.361
Horby, A., & Cowie, A. (2000). Oxford advanced learner’s dictionary of current
English. Oxford: Oxford University Press.
Hotimah, H., & Suyanto, T. (2017). Strategi pendidikan profesi guru (PPG) Unesa
dalam mengembangkan kompetensi pedagogik dan profesional peserta
PPG Pasca SM-3T. Kajian Moral dan Kewarganegaraan, 5(01), 242-256.

436
Hu, B., Qin, L., Sullivan, M., & Templin, J. (2017). Contemporary approaches to
psychometrics: item response theory and diagnostic classification
models/enfoques contemporáneos sobre psicometría: los modelos de la
teoría de respuesta al ítem y los modelos de clasificación de diagnósticos.
Cultura y Educación, 29(3), 461-491.
Indriyani, S., & Ismandari, D. (2015). Persepsi mahasiswa kependidikan Fakultas
Ekonomi Universitas Negeri Yogyakarta terhadap Pendidikan Profesi
Guru (PPG). Pelita-Jurnal Penelitian Mahasiswa UNY, X(1), 1-10.
Istiyono, E., Mardapi, D., & Suparno, S. (2014a). Penerapan partial credit model
pada tes pilihan ganda termodifikasi merupakan model alternatif asesmen
fisika yang adil. Paper presented at the Prosiding Kongres dan Konferensi
Ilmiah Himpunan Evaluasi Pendidikan (HEPI) Tahun 2014, Bali.
Istiyono, E., Mardapi, D., & Suparno, S. (2014b). Pengembangan tes kemampuan
berpikir tingkat tinggi fisika (pysthots) peserta didik SMA. Jurnal
Penelitian dan Evaluasi Pendidikan, 18(1), 1-12.
Jarvis, P. (2004). Adult education and lifelong learning: Theory and practice.
London: Routledge Falmer.
Jones, M., & Vickers, D. (2011). Considerations for performance scoring when
designing and developing next generation assessments. The Assessment &
Information group of Pearson.
Jordan, M. E. (2011). Personality traits: Theory, testing and influences. New
York: Nova Science Publishers, Inc.
Joreskog, K. G., & Sorbom, D. (2006). LISREL 8.70 for windows (Computer
Software). Lincolnwood, IL: Scientific Software International.
Jurčić, M. (2014). Teacher’s competence–pedagogical and didactical dimensions.
Pedagogijska istraživanja, 11(1), 92-92.
Kamerilova, G. S., Kartavykh, M. A., Ageeva, E. L., Gordeeva, I. A., Astashina,
N. I., & Ruban, E. M. (2018). Communicative teaching models: The
formation of the professional pedagogical competence among health and
safety school teachers. Espacios, 39(29), 7.
Kane, T., Kerr, K., & Pianta, R. (2014). Designing teacher evaluation systems:
New guidance from the measures of effective teaching project. San
Francisco: John Wiley & Sons, Inc.
Kartowagiran, B. (2010). Uji kompetensi dalam PPG. Paper presented at the
Makalah disampaikan dalam Workshop Penyusunan Soal Uji Kompetensi
dalam PPG.
Kartowagiran, B. (2011). Kinerja guru profesional (Guru pasca sertifikasi). Jurnal
Cakrawala Pendidikan, 3(3).

437
Kartowagiran, B. (2012a). Model penilaian kinerja guru. Paper presented at the
Seminar Nasional HEPI Penelitian dan Evaluasi Pendidikan, Pascasarjana
Universitas Negeri Yogyakarta.
Kartowagiran, B. (2012b). Revitalisasi sertifikasi guru model penilaian kinerja
guru. Paper presented at the Prosiding Seminar Nasional Pendidikan
Teknik Mesin, Universitas Negeri Yogyakarta.
Kartowagiran, B., & Jaedun, A. (2016). Model asesmen autentik untuk menilai
hasil belajar siswa sekolah menengah pertama (SMP): Implementasi
asesmen autentik di SMP. Jurnal Penelitian dan Evaluasi Pendidikan,
20(2), 131-141. doi: 10.21831/pep.v20i2.10063
Kartowagiran, B., Jaedun, A., & Hamdi, S. (2017). Developing authentic
assessment design. Paper presented at the International Conference on
Ethics of Business, Economics, and Social Science (ICEBESS)
Proceeding.
Kartowagiran, B., & Maddini, H. (2015). Evaluation model for Islamic education
learning in junior high school and its significance to students’ behaviours.
American Journal of Educational Research, 3(8), 990-995. doi:
10.12691/education-3-8-7
Kartowagiran, B., & Retnawati, H. (2008). The probability difference indices and
empirical sampling distribution for DIF indices for identifying item bias in
multidimensional item response theory. Paper presented at the Paper on
International Conference on Matemathics 3th.
Keller, L. A., Swaminathan, H., & Sireci, S. G. (2003). Evaluating scoring
procedures for context-dependent item sets1. Applied Measurement in
Education, 16(3), 207-222. doi: 10.1207/S15324818AME1603_3
Kemenag. (2012). Panduan penyelenggaraan program pendidikan profesi guru
(PPG) dalam jabatan di Lingkungan Kementerian Agama RI. Jakarta:
Direktorat Pendidikan Tinggi Islam Direktorat Jenderal Pendidikan Islam.
Kemenristekdikti. (2017). Pedoman penyelenggaraan pendidikan profesi guru.
Jakarta: Direktorat Jenderal Pembelajaran dan Kemahasiswaan Direktorat
Jenderal Kelembagaan.
Kemenristekdikti. (2018a). Panduan LMS brightspace SPADA Indonesia. Jakarta:
Direktorat Jenderal Pembelajaran dan Kemahasiswaan Direktorat Jenderal
Kelembagaan.
Kemenristekdikti. (2018b). Pedoman penyelenggaraan pendidikan profesi guru
tahun 2018. Jakarta: Direktorat Jenderal Pembelajaran dan
Kemahasiswaan Direktorat Jenderal Kelembagaan.
Khaerudin. (2019). Persepsi guru tentang pendidikan profesi guru mode daring:
kasus di Indonesia (Teachers’ perceptions of the teacher profession
training of online mode: case in Indonesia). Paper presented at the

438
International Conference on Educational Technology, Universitas Negeri
Jakarta.
Kim, B.-H., & Kim, J. (2016). Development and validation of evaluation
indicators for teaching competency in STEAM education in Korea.
Eurasia Journal of Mathematics, Science & Technology Education, 12(7),
1909-1924. doi: 10.12973/eurasia.2016.1537a
Knowles, M. S., Holton, E., & Swanson, R. (2015). The adult learner: the
definitive classic in adult education and human resource development
(8th). New York: Routledge.
König, J., & Pflanzl, B. (2016). Is teacher knowledge associated with
performance? On the relationship between teachers’ general pedagogical
knowledge and instructional quality. European Journal of Teacher
Education, 39(4), 419-436.
Krahenbuhl, K. S. (2016). Student-centered education and constructivism:
Challenges, concerns, and clarity for teachers. The Clearing House: A
Journal of Educational Strategies, Issues and Ideas, 89(3), 97-105.
Krisna, F. N. a. (2017). Alternatif kebijakan permasalahan ketidakmerataan
penyebaran guru (Policy alternatives to address teacher distribussion
inequality). Jurnal Analisis Kebijakan, 1(2), 1-11.
Lacey, C. (2012). The socialization of teachers Londor: Routledge Library
Editions.
Lawshe, C. H. (1975). A quantitative approach to content validity 1. Personnel
psychology, 28(4), 563-575.
Le Cornu, R. (2016). Professional experience: Learning from the past to build the
future. Asia-Pacific Journal of Teacher Education, 44(1), 80-101. doi:
10.1080/1359866X.2015.1102200
Lewin, L., & Shoemaker, B. J. (2011). Great performances: Creating classroom-
based assessment tasks. Alexandria, VA: ASCD.
Liu, K. (2015). Critical reflection as a framework for transformative learning in
teacher education. Educational Review, 67(2), 135-157. doi:
10.1080/00131911.2013.839546
Liu, Y., & Thissen, D. (2014). Comparing score tests and other local dependence
diagnostics for the graded response model. British Journal of
Mathematical and Statistical Psychology, 67(3), 496-513.
Lord, F. M. (1190). Applications of item response theory to practical testing
problems. New Jersey: LawrenceErlbaum Associates, Publishers.
Lord, F. M. (2008). Application of item response theory to practical testing
problems. New York: Routledge.

439
Lord, F. M. (2012). Applications of item response theory to practical testing
problems. New York: Routledge Taylor and Francis Group.
Lutasari, S., & Kartowagiran, B. (2019). Developing instruments for student
performance assessment in physics practicum: A case study of state senior
high school of Magelang. International Online Journal of Education and
Teaching, 6(1), 104-114.
Mangkunegara, A. A. P., & Puspitasari, M. (2015). Kecerdasan emosi guru, stres
kerja, dan kinerja guru SMA. Jurnal Kependidikan: Penelitian Inovasi
Pembelajaran, 45(2), 142-155. doi: 10.21831/jk.v45i2.7491
Mardapi, D. (2017). Pengukuran, penilaian, dan evaluasi pendidikan.
Yogyakarta: Parama Publishing.
Martínez, F. L. (2010). Vocación docente versus profesión docente en las
organizaciones educativas. Revista electrónica interuniversitaria de
formación del profesorado, 13(4), 43-51.
Marzano, R. J., & Toth, M. D. (2013). Teacher evaluation that makes a
difference: A new model for teacher growth and student achievement.
Alexandria, Virginia USA: ASCD.
Masters, G., & Wright, B. (1997). The partial credit model. New York: Springer
Verlag.
Matthews, G., Deary, I. J., & Whiteman, M. C. (2009). Personality traits. New
York: Cambridge University Press.
McDiarmid, G. W., & Caprino, K. (2017). Lessons from the Teachers for a New
Era project: Evidence and accountability in teacher education. New York:
Routledge.
Mehrens, W. A., & Lehmann, I. J. (1973). Measurement and evaluation in
education and psychology. New York: Hold, Rinehart and Wiston, Inc.
Merkt, M. (2017). The importance of academic teaching competence for the
career development of university teachers: A comment from higher
education pedagogy. GMS journal for medical education, 34(4). doi:
10.3205/zma001125
Merriam, S. B. (2001). Andragogy and self‐directed learning: Pillars of adult
learning theory. New directions for adult and continuing education,
2001(89), 3-14. doi: 10.1002/ace.3
Merriam, S. B., & Bierema, L. L. (2013). Adult learning: Linking theory and
practice. San Fransisco: John Wiley & Sons.
Metruk, R. (2018). Comparing Holistic and Analytic Ways of Scoring in the
Assessment of Speaking Skills. Journal of Teaching English for Specific
and Academic Purposes, 6(1), 179-189. doi: 10.22190/JTESAP1801179M

440
Mirzagitova, A. L., & Akhmetov, L. G. (2015). Self-development of pedagogical
competence of future teacher. International Education Studies, 8(3), 114-
121.
Mizell, H. (2010). Why professional development matters (Vol. Learning
Forward). Oxford: ERIC.
Mkpanang, J. T. (2015). Personality profile of teachers and their students’
performance in post-basic modern physics. African Research Review, 9(1),
159-168.
Moore, T. W. (2010). Philosophy of education (International library of the
philosophy of education volume 14): An Introduction. London: Routledge.
Moskal, B. M. (2000). Scoring rubrics: How? ERIC Clearinghouse on Assessment
and Evaluation, 7(3), 1-5.
Naga, D. S. (2013). Teori sekor pada pengukuran mental. Jakarta: Nagarani
Citrayasa.
National Education Association. (2010). Teacher assessment and evaluation: The
national education association’s framework for transforming education
systems to support effective teaching and improve student learning.
Retrieved from National Education Association website:
http://www.nea.org/home/41858.htm.
Nering, M. L., & Ostini, R. (2011). Handbook of polytomous item response theory
models. New York: Taylor and Francis Group, LLC.
Nicholson, I. A. (2003). Inventing personality: Gordon Allport and the science of
selfhood. Washington, DC: American Psychological Association.
Ningrum, E. (2012). Membangun sinergi pendidikan akademik (S1) dan
pendidikan profesi guru (PPG). Jurnal Geografi Gea, 12(2), 49-55.
Ningsih, M. P., Fatchan, A., & Susilo, S. (2016). Program PPG untuk membangun
kompetensi guru Geografi (Studi kasus di Universitas Negeri Malang).
Jurnal Pendidikan: Teori, Penelitian, dan Pengembangan, 1(10), 2031-
2039.
Nunnally, J. C., Bernstein, Ira H (1994). Psychometric theory New Delhi: Tata
McGraw-Hill Education.
Nur, A. A. (2014). Meningkatkan kompetensi pedagogik guru di SD Yayasan
Mutiara Gambut. Jurnal Bahana Manajemen Pendidikan, 2(1), 65-72. doi:
https://doi.org/10.23036/bmp.v2i1.3735
Nurcahyo, F. A. (2016). Aplikasi IRT dalam analisis aitem tes kognitif. Buletin
Psikologi, 24(2), 64–75. doi: 10.22146/buletinpsikologi.25218
Nurmaliah, C. (2018). Analisis kemampuan peserta program pendidikan profesi
guru (PPG) dalam workshop subject specific pedagogy (SSP) di FKIP
Unsyiah. Paper presented at the Prosiding Seminar Nasional Biotik,

441
Program Studi Pendidikan Biologi Universitas Islam Negeri Ar-Raniry
Banda Aceh. .
O'Malley, J. M. (1977). Research perspective on social competence. Merrill-
Palmer Quarterly of Behavior and Development, 23(1), 29-44.
O’Meara, J. (2011). Australian teacher education reforms: reinforcing the problem
or providing a solution? Journal of Education for Teaching, 37(4), 423-
431.
Ofianto, O., & Suhartono, S. (2015). An assessment model of historical thinking
skills by means of the RASCH model. REiD (Research and Evaluation in
Education), 1(1), 73-83. doi: https://doi.org/10.21831/reid.v1i1.4899
Olesova, A. P., & Borisova, U. S. (2016). Formation of professional-
communicative competence of the future teachers in the conditions of the
Yakut-Russian Bilingualism. International Electronic Journal of
Mathematics Education, 11(10), 3435-3445.
Orazbayeva, K. O. (2016). Professional Competence of Teachers in the Age of
Globalization. International Journal of Environmental and Science
Education, 11(9), 2659-2672.
Ounis, M. (2017). A Comparison between holistic and analytic assessment of
speaking. Journal of Language Teaching and Research, 8(4), 679-690.
doi: 10.17507/jltr.0804.06
Oviyanti, F. (2016). Tantangan pengembangan pendidikan keguruan di era global.
Nadwa, 7(2), 267-282.
Ozuah, P. O. (2016). First, there was pedagogy and then came andragogy.
Einstein journal of Biology and Medicine, 21(2), 83-87. doi:
10.23861/EJBM20052190
P4TKN. (2018). Pendidikan profesi guru Universitas Negeri Yogyakarta.
Yogyakarta: Pusat Pengembangan Profesi Pendidik Tenaga Kependidikan
dan Non Kependidikan.
Pahrudin, P., Martono, T., & Murtini, W. (2016). The effect of pedagogic
competency, personality, professional and social competency teacher to
study achievement of economic lesson in state senior high school of east
Lombok district academic year 2015/2016. Paper presented at the
Proceeding of the International Conference on Teacher Training and
Education.
Pamungkas, A. S., Novalitasari, N., Setiani, Y., & Yuhana, Y. (2019). Kajian
persepsi, interaksi dan capaian mahasiswa PPG dalam jabatan ada
platform pembelajaran Brightspace. Paper presented at the Seminar
Nasional Matematika dan Pendidikan Matematika (4th SENATIK)
Program Studi Pendidikan Matematika FPMIPATI-Universitas PGRI
Semarang.

442
Paterson, R. W. K. (2010). Values, education and the adult. London: Routledge.
Peters, R. S. (2010). The concept of education (international library of the
philosophy of education volume 17) (Vol. 17). London: Routledge.
Petrie, K., & McGee, C. (2012). Teacher professional development: Who is the
learner? Australian Journal of Teacher Education, 37(2), 59-72.
Piri, E., Keshtiaray, N., & Saadatmand, Z. (2016). Designing a model of
personality traits desirable for teacher training courses for student teachers.
Turk Psikoloji Dergisi, 31(77), 125-133.
Pollard, A. (2014). Reflective teaching: in schools. London: Bloomsbury
Publishing.
Popham, W. J. (1999). Classroom assessment: What teachers need to know. Allyn
& Bacon: A Viacom Company.
Prasojo, L. D., Wibowo, U. B., & Hastutiningsih, A. D. (2017). Manajemen
kurikulum program profesi guru untuk daerah terdepan, terluar, dan
tertinggal di Universitas Negeri Yogyakarta. Jurnal Pendidikan dan
Kebudayaan, 2(1), 39-53.
Pring, R. (2005). Philosophy of education. London: Bookend, Ltd.
Rabadi-Raol, A. (2019). Quality of teacher education and learning: theory and
practice. Journal of Education for Teaching, 45(1), 115-117. doi:
10.1080/02607476.2018.1541342
Ratnaningrum, D. (2016). Persepsi siswa tentang kompetensi guru mahasiswa
peserta program pendidikan profesi guru (PPG) di SMA Negeri 1 Wates
Tahun 2015/2016. Universitas Negeri Yogyakarta, Yogyakarta.
Reise, S. P., & Revicki, D. A. (2014). Handbook of item response theory
modeling: Applications to typical performance assessment. New York:
Routledge.
Retnawati, H. (2011). Mengestimasi kemampuan peserta tes uraian Matematika
dengan pendekatan teori respons butir dengan penskoran politomus
dengan generalized partial credit model. Prosiding Semnas Penelitian
Pendidikan dan Penerapan MIPA. UNY, 53-62.
Retnawati, H. (2014). Teori respons butir dan penerapannya: untuk peneliti,
praktisi pengukuran dan pengujian, mahasiswa pascasarjana.
Yogyakarta: Nuha Medika.
Retnawati, H. (2016a). Analisis kuantitatif instrumen penelitian. Yogyakarta:
Parama publising.
Retnawati, H. (2016b). Validitas reliabilitas dan karakteristik butir. Yogyakarta:
Parama Publishing.

443
Retnawati, H. (2018). The Dif identification in constructed response items using
partial credit model. International Journal of Assessment Tools in
Education, 5(1), 73-90. doi: 10.21449/ijate.347956
Retnawati, H., Apino, E., & Anazifa, R. D. (2018). Impact of character education
implementation: A goal-free evaluation. Problems of Education in the 21st
Century, 76(6), 881-899.
Retnawati, H., Djidu, H., Apino, E., & Anazifa, R. D. (2018). Teachers'
knowledge about higher-order thinking skills and its learning strategy.
Problems of Education in the 21st Century, 76(2), 216-230.
Retnawati, H., Hadi, S., & Nugraha, A. C. (2016). Vocational high school
teachers' difficulties in implementing the assessment in curriculum 2013 in
Yogyakarta Province of Indonesia. International Journal of Instruction,
9(1), 33-48.
Retnawati, H., Kartowagiran, B., Arlinwibowo, J., & Sulistyaningsih, E. (2017).
Why are the mathematics national examination items difficult and what is
teachers' strategy to overcome It? International Journal of Instruction,
10(3), 257-276.
Retnawati, H., & Munadi, S. (2013). Mengestimasi parameter butir dan
kemampuan guru menggunakan model parsial kredit dan parsial kredit
tergeneralisasi. from Lumbung Pustaka Universitas Negeri Yogyakarta
http://eprints.uny.ac.id/id/eprint/22874
Retnawati, H., Munadi, S., Arlinwibowo, J., Wulandari, N. F., & Sulistyaningsih,
E. (2017). Teachers’ difficulties in implementing thematic teaching and
learning in elementary schools. The New Educational Review, 48, 201-
212. doi: 10.15804/tner.2017.48.2.16
Ridlo, S. (2012). Pengembangan tes pengetahuan praktikum biologi berdasarkan
Graded Response dan Generalized Partial Credit. Jurnal Penelitian dan
Evaluasi Pendidikan, 16, 166-182. doi: 10.21831/pep.v16i0.1111
RISE. (2018). Perkembangan hasil studi evaluasi program PPG prajabatan studi
tahun pertama (2018). from Research on Improving Systems of Education
http://rise.smeru.or.id/id/publikasi/perkembangan-hasil-studi-evaluasi-
program-ppg-prajabatan
Robertson, S. (2017). A class act: Changing teachers work, the state, and
globalisation. New York: Routledge.
Robinson, W., & Campbell, J. (2010). Effective teaching in gifted education:
Using a whole school approach. London: Routledge.
Rose‐Krasnor, L. (1997). The nature of social competence: A theoretical review.
Social development, 6(1), 111-135. doi: 10.1111/j.1467-
9507.1997.tb00097.x

444
Sadtyadi, H., & Kartowagiran, B. (2014). Pengembangan instrumen penilaian
kinerja guru sekolah dasar berbasis tugas pokok dan fungsi. Jurnal
Penelitian dan Evaluasi Pendidikan, 18(2), 290-304. doi:
10.21831/pep.v18i2.2867
Samejima, F. (1974). Normal ogive model on the continuous response level in the
multidimensional latent space. Psychometrika, 39(1), 111-121.
Sanders, J. R., Nitko, A. J., Merwin, J. C., Trice, C., Dianda, M., & Schneider, J.
(1999). Standars for teacher competence in educational assessment of
students: Collaborating Professional Associations: NCME, American
Association of Colleges for Teacher Education, American Federation of
Teachers, and National Education Association.
Sax, G. (1980). Principles of educational and psychological measurement and
evaluation. Belmont, CA: Wadsworth Publishing Co.inc.
Selvi, K. (2010). Teachers’ competencies. Cultura International Journal of
Philosophy of Culture and Axiology, 7(1), 167-175. doi:
10.5840/cultura20107133
Shulman, L. S. (2005). Signature pedagogies in the professions. Daedalus, 134(3),
52-59.
Smylie, M. A. (2014). Teacher evaluation and the problem of professional
development. Mid-Western Educational Researcher, 26(2), 98-111.
Steinberg, M. P., & Garrett, R. (2016). Classroom composition and measured
teacher performance: What do teacher observation scores really measure?
Educational Evaluation and Policy Analysis, 38(2), 293-317. doi:
10.3102/0162373715616249
Stiggins, R., & Chappuis, J. (2005). Using student-involved classroom assessment
to close achievement gaps. Theory into practice, 44(1), 11-18.
Stronge, J. H. (2018). Qualities of effective teachers. Alexandria: ASCD.
Suciu, A. I., & Mata, L. (2011). Pedagogical competences–The key to efficient
education. International online journal of educational sciences, 3(2), 411-
423.
Sudaryono, S. (2011). Implementasi teori responsi butir (item response theory)
pada penilaian hasil belajar akhir di sekolah. Jurnal Pendidikan dan
Kebudayaan, 17(6), 719-732.
Sulisworo, D., Nasir, R., & Maryani, I. (2017). Identification of teachers’
problems in Indonesia on facing global community. International Journal
of Research Studies in Education, 6(2), 81-90. doi:
10.5861/ijrse.2016.1519

445
Sumintono, B., & Widhiarso, W. (2014). Aplikasi model Rasch untuk penelitian
ilmu-ilmu sosial (edisi revisi). Cimahi: Trim Komunikata Publishing
House.
Suparji. (2008). Pengembangan instrumen kompetensi bidang keguruan
mahasiswa calon guru. Program Pascasarjana Universitas Negeri
Yogyakarta, Yogyakarta.
Surya, P. (2014). Model Program Pendidikan Guru Prajabatan: Dari Penghapusan
Akta IV Menuju Sertifikat Profesi. Dinamika Pendidikan, 21(01), 91-102.
Suryawati, E., & Osman, K. (2018). Contextual learning: innovative approach
towards the development of students’ scientific attitude and natural science
performance. Eurasia Journal of Mathematics, Science and Technology
Education, 14(1), 61-76.
Susongko, P. (2010). Perbandingan keefektifan bentuk tes uraian dan testlet
dengan penerapan graded response model (GRM). Jurnal Penelitian dan
Evaluasi Pendidikan, 14(2), 269-288. doi: 10.21831/pep.v14i2.1082
Suswantar, I. S. D., & Retnawati, H. (2016). Penilaian kinerja guru SMA swasta
di Kabupaten Sukoharjo dan faktor-faktor yang mempengaruhi. Jurnal
Evaluasi Pendidikan., 4(1), 36-44.
Suyata, P., Mardapi, D., Kartowagiran, B., & Retnawati, H. (2011). Model
pengembangan bank soal berbasis guru dan mutu pendidikan. Jurnal
Kependidikan: Penelitian Inovasi Pembelajaran, 41(2), 120-128. doi:
10.21831/jk.v41i2.2218
Tekkumru Kisa, M., & Stein, M. K. (2015). Learning to see teaching in new
ways: A foundation for maintaining cognitive demand. American
Educational Research Journal, 52(1), 105-136.
Templin, J., & Hoffman, L. (2013). Obtaining diagnostic classification model
estimates using MPlus. Educational Measurement: Issues and Practice,
32(2), 37-50.
The Teaching Council. (2012). The code of professional conduct for teachers. An
Chomhairle Mhúinteoireachta Teaching Council Acts.
Tyler, F. B. (1978). Individual psychosocial competence: A personality
configuration. Educational and psychological measurement, 38(2), 309-
323. doi: 10.1177/001316447803800212
Van Driel, J. H., & Berry, A. (2012). Teacher professional development focusing
on pedagogical content knowledge. Educational researcher, 41(1), 26-28.
doi: 10.3102/0013189X11431010
Vangrieken, K., Meredith, C., Packer, T., & Kyndt, E. (2017). Teacher
communities as a context for professional development: A systematic
review. Teaching and Teacher Education, 61, 47-59. doi:
10.1016/j.tate.2016.10.001

446
Verhelst, N. D., & Verstralen, H. (2008). Some considerations on the partial credit
model. Psicologica, 29(2), 229-254.
Villanueva, J. P. (2010). Personality traits: classifications, effects and changes.
New York: Nova Science Publishers, Inc.
Wahyudin, D. (2016). Manajemen Kurikulum dalam Pendidikan Profesi Guru
(Studi Kasus Di Universitas Pendidikan Indonesia). Jurnal Kependidikan:
Penelitian Inovasi Pembelajaran, 46(2), 259-270.
Wakhinuddin, S. (2012). Pengaruh pembobotan dan jenis penilai terhadap fungsi
informasi tes performansi. Jurnal Penelitian dan Evaluasi Pendidikan,
16(1), 384-406. doi: 10.21831/pep.v16i1.1123
Wardoyo, C. (2015). The measurement of teacher's personality competence and
performance using embedded model. Journal of Education and Practice,
6(26), 18-23.
Wasidi, W., & Mardapi, D. (2016). Pengembangan instrumen bakat keguruan.
Jurnal Penelitian dan Evaluasi Pendidikan, 20(1), 98-110. doi:
10.21831/pep.v20i1.7519
Widhiarso, W. (2010). Model politomi dalam teori respons butir. Yogyakarta:
Psikologi UGM.
Widiati, U., & Hayati, N. (2015). Teacher professional education in Indonesia and
ASEAN 2015: Lessons learned from English language teacher education
programs. Stroupe, R., & Kimura, K.(Eds.), ASEAN integration and the
role of English language teaching, 121-148.
Wilson, M. (2005). Constructing measures: An item response modeling approach.
Mahwah, New Jersey: Lawrence Erlbaum Associates, Inc.
Winch, C., Oancea, A., & Orchard, J. (2015). The contribution of educational
research to teachers’ professional learning: Philosophical understandings.
Oxford Review of Education, 41(2), 202-216. doi:
10.1080/03054985.2015.1017406
Wiseman, C. S. (2012). A comparison of the performance of analytic vs. holistic
scoring rubrics to assess L2 writing. Iranian Journal of Language Testing,
2(1), 59-92.
Yahya, M., Abdal, N. M., Setialaksana, W., & Putri, D. R. A. (2019). Evaluasi
tingkat prestasi belajar mahasiswa PPG Universitas Negeri Makassar.
Paper presented at the Prosiding Seminar Nasional Fakultas Teknik
Universitas Negeri Makassar.
Yasin, A. F. (2012). Pengembangan kompetensi pedagogik guru pendidikan
agama Islam di madrasah (studi kasus di MIN Malang I). el-Qudwah, 1(5),
157-181.

447
Yueh, H.-P., Lin, W., Jo-Yi, H., & Sheen, H.-J. (2012). Effect of student
engagement on multimedia-assisted instruction. Knowledge Management
& E-Learning, 4(3), 346.
Zenisky, A. L., Hambleton, R. K., & Sired, S. G. (2002). Identification and
evaluation of local item dependencies in the Medical College Admissions
Test. Journal of Educational Measurement, 39(4), 291-309. doi:
10.1111/j.1745-3984.2002.tb01144.x
Zhu, X., Goodwin, A. L., & Zhang, H. (2017). Quality of teacher education and
learning: Theory and practice. Singapore: Springer Nature.
Zięba, A. (2013). The item information function in one and two-parameter logistic
models–A comparison and use in the analysis of the results of school tests.
Didactics of Mathematics, 10(14), 87-96.
Ziegler, J., & Detje, F. (2013). Application of empirical methodology to evaluate
information fusion approaches. Paper presented at the Proceedings of the
16th International Conference on Information Fusion.
Zinn, B. (2017). Technology teachers and their professional competence–
peculiarities and starting points for subject-specific didactical research.
Journal of Technical Education (JOTED), 5(1), 1-13.

448

Anda mungkin juga menyukai